Swift项目中的Grounding微调参数错误解析

2025-05-31 05:56:23作者：蔡怀权

魔搭大模型训练推理工具箱，支持LLaMA、千问、ChatGLM、BaiChuan等多种模型及LoRA等多种训练方式(The LLM training/inference framework of ModelScope community, Support various models like LLaMA, Qwen, Baichuan, ChatGLM and others, and training methods like LoRA, ResTuning, NEFTune, etc.)

项目地址：https://gitcode.com/GitHub_Trending/swift1/swift

在使用Swift项目进行Grounding微调时，用户可能会遇到ValueError: remaining_argv: ['--sft_type', 'lora']的错误提示。这个错误通常与参数设置不当有关，需要特别注意训练类型的指定方式。

错误原因分析

该错误的核心在于参数解析失败，系统无法识别--sft_type这个参数。在Swift项目中，正确的参数应该是--train_type而不是--sft_type。这种参数命名的差异是导致错误的主要原因。

解决方案

正确的做法是使用--train_type参数来指定训练类型。例如：

python your_training_script.py --train_type lora

参数详解

Swift项目中的训练类型参数--train_type支持多种选项，其中常见的有：

lora：使用LoRA（Low-Rank Adaptation）方法进行微调
full：进行全参数微调
freeze：冻结部分参数进行微调

深度学习的微调方法比较

在深度学习模型微调中，不同的训练类型各有特点：

全参数微调(full)：
- 更新模型所有权重参数
- 需要大量计算资源
- 可能在小数据集上过拟合
LoRA微调：
- 仅训练低秩适配矩阵
- 显著减少可训练参数数量
- 保持原始模型权重不变
- 适合资源有限的情况
冻结微调(freeze)：
- 固定部分层参数
- 只训练特定层
- 计算效率高但灵活性较低

最佳实践建议

对于大型语言模型，推荐优先尝试LoRA方法
在资源充足且数据量大的情况下，可以考虑全参数微调
使用前务必查阅项目文档确认参数名称和格式
建议在测试环境中先进行小规模训练验证参数设置

通过正确理解和使用Swift项目的训练参数，可以避免这类参数解析错误，更高效地完成模型微调任务。

swift

项目地址：https://gitcode.com/GitHub_Trending/swift1/swift

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781