Model Compression Resources Save

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape

Overview
Reviews
Resources

No resources for this project.

Add resource

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/model-compression"><img src="https://www.opensourceagenda.com/projects/model-compression/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Resource Articles, Courses, Videos

From the blog

Dec 11, 2022

Model Compression Resources Save

Open Source Agenda Badge

From the blog

How to Choose Which Programming Language to Learn First?