Modelscope/Swift项目中如何关闭Chat模板进行基础模型推理

2025-05-31 18:19:24作者：董斯意

Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.6, DeepSeek-V4, GLM-5.1, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Gemma4, Llava, Phi4, ...) (AAAI 2025).

项目地址：https://gitcode.com/GitHub_Trending/swift1/swift

在基于Modelscope/Swift框架进行大模型推理时，开发者有时需要直接使用基础模型(base model)进行推理，而不希望受到预设聊天模板(chat template)的影响。本文将详细介绍如何实现这一需求。

基础模型与Chat模板的区别

基础模型是指未经特定对话格式调整的原始语言模型，而Chat模板是为优化对话交互体验设计的格式化处理模块。Chat模板通常会：

自动添加系统提示词
规范用户和AI的对话格式
处理多轮对话历史

但在某些场景下，如：

需要原始模型输出
自定义特殊格式
非对话型任务处理开发者可能需要绕过这些预设模板。

关闭Chat模板的方法

在Modelscope/Swift框架中，可以通过设置--use_chat_template false参数来禁用Chat模板功能。这一参数会指示框架：

跳过自动添加的对话格式标记
直接使用原始prompt作为模型输入
输出未经模板处理的原始结果

典型应用场景

模型能力基准测试：评估基础模型在无模板干预下的真实表现
自定义格式处理：当需要实现特殊交互协议时
非对话型任务：如文本生成、摘要等不需要对话格式的任务
模型微调研究：观察基础模型对原始输入的响应模式

注意事项

关闭模板后，需要自行处理输入输出的格式规范
某些依赖模板功能的特性可能无法正常工作
对于Qwen等经过对话优化的模型，关闭模板可能导致输出风格变化
建议在测试环境中验证效果后再应用于生产环境

通过合理使用这一功能，开发者可以更灵活地控制模型行为，满足多样化的应用需求。

Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.6, DeepSeek-V4, GLM-5.1, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Gemma4, Llava, Phi4, ...) (AAAI 2025).

项目地址：https://gitcode.com/GitHub_Trending/swift1/swift

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。