11 packages found

torchao

Package for applying ao techniques to GPU models

brrr
cuda
dtypes
float8
inference
llama
mx
offloading
optimizer
pytorch
quantization
sparsity
training
transformer

neural-compressor

Repository of Intel® Neural Compressor

quantization
auto-tuning
post-training
static
dynamic
quantization-aware
training
awq
fp4
gptq
int4
int8
knowledge-distillation
large-language-models
low-precision
mxformat
post-training-quantization
pruning
quantization-aware-training
smoothquant
sparsegpt
sparsity

sparseml

Libraries for applying sparsification recipes to neural networks with a few lines of code, enabling faster and smaller models

neural-compressor-3x-tf

Repository of Intel® Neural Compressor

quantization
auto-tuning
post-training
static
dynamic
quantization-aware
training
awq
fp4
gptq
int4
int8
knowledge-distillation
large-language-models
low-precision
mxformat
post-training-quantization
pruning
quantization-aware-training
smoothquant
sparsegpt
sparsity

neural-solution

Repository of Intel® Neural Compressor

quantization
auto-tuning
post-training
static
dynamic
quantization-aware
training
awq
fp4
gptq
int4
int8
knowledge-distillation
large-language-models
low-precision
mxformat
post-training-quantization
pruning
quantization-aware-training
smoothquant
sparsegpt
sparsity

deepsparse

An inference runtime offering GPU-class performance on CPUs and APIs to integrate ML into your application

sparsezoo

Neural network model repository for highly sparse and sparse-quantized models with matching sparsification recipes

nncf

Neural Networks Compression Framework

bert
classification
compression
hawq
mixed-precision-training
mmdetection
nas
nlp
object-detection
pruning
quantization
quantization-aware-training
semantic-segmentation
sparsity
transformers
deep-learning
genai
llm
onnx
openvino
pytorch
tensorflow

neural-insights

Repository of Intel® Neural Compressor

quantization
auto-tuning
post-training
static
dynamic
quantization-aware
training
awq
fp4
gptq
int4
int8
knowledge-distillation
large-language-models
low-precision
mxformat
post-training-quantization
pruning
quantization-aware-training
smoothquant
sparsegpt
sparsity

paddleslim

A toolkit for generating small model.

PaddleSlim
paddlepaddle
model-optimize
compression
bert
detection
distillation
ernie
nas
pruning
quantization
segmentation
sparsity
tensorrt
transformer
yolov5
yolov6
yolov7

Showing 1 to 10 of 11 results