training-code 的项目扩展与二次开发

2025-05-19 04:31:19作者：曹令琨Iris

项目的基础介绍

training-code 是一个开源项目，旨在提供一种基于 HuggingFace's Trainer 类的代码框架，用于执行监督或无监督的微调（fine-tuning）因果语言模型。该项目包含了一些额外的特性，例如可选的 xFormers 和 LoRA 训练。

项目的核心功能

支持监督和无监督微调
集成了 xFormers 和 LoRA 训练
使用 HuggingFace 的 Trainer 类作为训练入口
支持自定义训练参数和优化器配置
提供了数据预处理和 tokenize 工具

项目使用了哪些框架或库？

HuggingFace: 用于构建和训练模型的核心库。
xFormers: 用于实现内存高效的注意力机制的库。
LoRA: 用于在微调过程中调整模型参数的库。
其他可能用到的库：pip install -r requirements.txt 中的所有库，例如 wandb、deepspeed 等。

项目的代码目录及介绍

training-code/
├── preparation/       # 数据预处理脚本
│   ├── tokenize_data_sft.py
│   └── tokenize_data_uft.py
├── scripts/           # 辅助脚本
├── training/          # 训练相关的脚本和代码
│   └── hf_trainer.py  # 主训练脚本
├── .gitignore         # 忽略的文件列表
├── LICENSE            # 项目许可证
├── README.md          # 项目说明文件
├── requirements-recommended.txt
└── requirements.txt   # 项目依赖

对项目进行扩展或者二次开发的方向

增加新的训练模式：可以在现有基础上增加新的训练模式，例如半监督学习、迁移学习等。
集成更多框架或库：根据需要集成更多的深度学习框架或库，如 TensorFlow、PyTorch 等。
扩展数据预处理功能：增强数据预处理的能力，支持更多类型的数据格式和预处理流程。
优化训练效率：通过调整参数、使用更高效的算法等方式，提高训练效率。
增加模型评估和监控：集成模型性能评估和监控工具，如 TensorBoard、MLflow 等。
扩展模型应用场景：将微调后的模型应用于更多的自然语言处理任务，如文本分类、情感分析、机器翻译等。
社区支持与文档完善：建立社区，吸引更多的开发者参与，同时完善项目文档，方便用户使用和二次开发。

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。