CS Knowledge Base

#

quantization-aware-training

Here are 110 public repositories matching this topic...

intel / neural-compressor

SOTA low-bit LLM quantization (INT8/FP8/MXFP8/INT4/MXFP4/NVFP4) & sparsity; leading model compression techniques on PyTorch, TensorFlow, and ONNX Runtime

sparsity pruning quantization knowledge-distillation auto-tuning int8 low-precision quantization-aware-training post-training-quantization awq int4 large-language-models gptq smoothquant sparsegpt fp4 mxformat

Updated Jun 26, 2026
Python

666DZY666 / micronet

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、reg…

Updated May 6, 2025
Python

openvinotoolkit / nncf

Neural Network Compression Framework for enhanced OpenVINO™ inference

nlp sparsity compression deep-learning tensorflow transformers pytorch classification pruning object-detection quantization semantic-segmentation bert onnx openvino mixed-precision-training quantization-aware-training llm genai

Updated Jun 24, 2026
Python

alibaba / TinyNeuralNetwork

TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.

deep-neural-networks deep-learning pytorch pruning model-compression model-converter quantization-aware-training post-training-quantization

Updated Mar 3, 2026
Python

SpursLipu / YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone

YOLO ModelCompression MultidatasetTraining

yolo pruning object-detection modelcompression mobilenetv3 quantization-aware-training multidataset

Updated Jun 21, 2022
Python

hls4ml-tutorial

fastmachinelearning / hls4ml-tutorial

Tutorial notebooks for hls4ml

machine-learning tutorial fpga pruning quantization-aware-training hls4ml

Updated Jun 22, 2026
Jupyter Notebook

megvii-research / Sparsebit

A model compression and acceleration toolbox based on pytorch.

deep-learning sparse pruning quantization tensorrt quantization-aware-training post-training-quantization

Updated Jan 12, 2024
Python

Beomi / BitNet-Transformers

0️⃣1️⃣🤗 BitNet-Transformers: Huggingface Transformers Implementation of "BitNet: Scaling 1-bit Transformers for Large Language Models" in pytorch with Llama(2) Architecture

transformers quantization quantization-aware-training llm

Updated Mar 17, 2024
Python

THU-MIG / torch-model-compression

针对pytorch模型的自动化模型结构分析和修改工具集，包含自动分析模型结构的模型压缩算法库

pytorch pruning quantization tensorrt model-compression qat onnx reparameterization tensorrt-conversion quantization-aware-training acnet

Updated Apr 19, 2023
Python

IST-DASLab / llmq

Quantized LLM training in pure CUDA/C++.

cuda quantization-aware-training llm-training

Updated Jun 3, 2026
C++

codelion / ellora

Enhancing LLMs with LoRA

Updated Oct 20, 2025
Jupyter Notebook

IST-DASLab / qutlass

QuTLASS: CUTLASS-Powered Quantized BLAS for Deep Learning

cuda blackwell quantization-aware-training post-training-quantization

Updated Nov 11, 2025
C++

sayakpaul / Adventures-in-TensorFlow-Lite

This repository contains notebooks that show the usage of TensorFlow Lite for quantizing deep neural networks.

inference pruning tensorflow-lite tensorflow-2 on-device-ml tf-hub model-quantization model-optimization quantization-aware-training post-training-quantization tf-lite-model

Updated Jan 23, 2023
Jupyter Notebook

hkproj / quantization-notes

Notes on quantization in neural networks

deep-learning pytorch neural-networks quantization quantization-aware-training post-training-quantization

Updated Dec 14, 2023
Jupyter Notebook

clovaai / frostnet

FrostNet: Towards Quantization-Aware Network Architecture Search

computer-vision deep-learning pytorch style-transfer classification object-detection quantization network-architecture semantic-segmentation optimizers quantization-aware-training int8-quantization post-quantization quantization-efficient-network

Updated May 3, 2024
Python

jahongir7174 / YOLOv8-qat

Quantization Aware Training

python pytorch object-detection int8-inference quantization-aware-training int8-quantization yolov8

Updated Jan 13, 2024
Python

openvinotoolkit / mmdetection

OpenVINO Training Extensions Object Detection

sparsity compression computer-vision deep-learning pytorch ssd faster-rcnn object-detection instance-segmentation mask-rcnn retinanet onnx openvino cascade-rcnn fcos onnxruntime atss quantization-aware-training nncf

Updated Mar 8, 2023
Python

jeshraghian / QSNNs

Quantization-aware training with spiking neural networks

deep-learning neuroscience networks spiking-neural-networks quantization backpropagation neural snn spiking quantization-aware-training

Updated Feb 18, 2022
Python

mlzxy / qsparse

Train neural networks with joint quantization and pruning on both weights and activations using any pytorch modules

neural-network pytorch pruning model-compression quantization-aware-training

Updated Sep 19, 2022
Python

DeadAt0m / LSQFakeQuantize-PyTorch

FakeQuantize with Learned Step Size(LSQ+) as Observer in PyTorch

lsq pytorch quantization qat quantization-aware-training learned-step-size torchlsq fakequantize

Updated Dec 18, 2021
C++

Improve this page

Add a description, image, and links to the quantization-aware-training topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the quantization-aware-training topic, visit your repo's landing page and select "manage topics."