开源项目 `model-compression` 使用教程

2024-09-19 21:40:54作者：冯爽妲Honey

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape

项目地址：https://gitcode.com/gh_mirrors/mic/micronet

1. 项目目录结构及介绍

model-compression/
├── README.md
├── requirements.txt
├── setup.py
├── src/
│   ├── __init__.py
│   ├── main.py
│   ├── config.py
│   ├── models/
│   │   ├── __init__.py
│   │   ├── base_model.py
│   │   ├── compression_model.py
│   ├── utils/
│   │   ├── __init__.py
│   │   ├── data_loader.py
│   │   ├── metrics.py
├── tests/
│   ├── __init__.py
│   ├── test_data_loader.py
│   ├── test_metrics.py
├── docs/
│   ├── index.md
│   ├── installation.md
│   ├── usage.md

目录结构说明

README.md: 项目介绍和基本使用说明。
requirements.txt: 项目依赖的Python包列表。
setup.py: 项目的安装脚本。
src/: 项目的主要源代码目录。
- main.py: 项目的启动文件。
- config.py: 项目的配置文件。
- models/: 存放模型相关的代码。
- utils/: 存放工具函数和辅助代码。
tests/: 存放项目的测试代码。
docs/: 存放项目的文档文件。

2. 项目的启动文件介绍

`src/main.py`

main.py 是项目的启动文件，负责初始化配置、加载数据、训练模型和保存结果。以下是该文件的主要功能模块：

import argparse
from src.config import Config
from src.models.compression_model import CompressionModel
from src.utils.data_loader import DataLoader

def main():
    parser = argparse.ArgumentParser(description="Model Compression")
    parser.add_argument('--config', type=str, default='config.json', help='Path to the configuration file')
    args = parser.parse_args()

    config = Config(args.config)
    data_loader = DataLoader(config)
    model = CompressionModel(config)

    model.train(data_loader)
    model.save(config.save_path)

if __name__ == "__main__":
    main()

主要功能

参数解析: 通过 argparse 解析命令行参数，获取配置文件路径。
配置加载: 使用 Config 类加载配置文件。
数据加载: 使用 DataLoader 类加载训练数据。
模型训练: 使用 CompressionModel 类进行模型训练。
模型保存: 训练完成后，将模型保存到指定路径。

3. 项目的配置文件介绍

`src/config.py`

config.py 文件负责加载和管理项目的配置参数。配置文件通常是一个 JSON 文件，包含模型训练所需的各种参数。

import json

class Config:
    def __init__(self, config_path):
        with open(config_path, 'r') as f:
            self.config = json.load(f)

        self.learning_rate = self.config['learning_rate']
        self.batch_size = self.config['batch_size']
        self.num_epochs = self.config['num_epochs']
        self.save_path = self.config['save_path']
        self.data_path = self.config['data_path']

    def __getitem__(self, key):
        return self.config[key]

主要功能

配置加载: 从指定的 JSON 文件中加载配置参数。
参数管理: 将配置参数存储在类的属性中，方便在项目中使用。
动态访问: 通过 __getitem__ 方法，可以像字典一样访问配置参数。

配置文件示例

{
    "learning_rate": 0.001,
    "batch_size": 32,
    "num_epochs": 100,
    "save_path": "models/compressed_model.pth",
    "data_path": "data/train_data.csv"
}