OpenSPG/KAG项目中Qwen3模型思考功能的关闭方法解析

2025-06-01 00:35:51作者：魏侃纯Zoe

在OpenSPG/KAG项目中使用Qwen3系列大语言模型时，开发者可能会遇到需要关闭模型"思考"功能的需求。本文将详细介绍这一功能的技术实现原理和具体操作方法。

思考功能的技术背景

Qwen3模型内置了一种称为"思考"的功能机制，这是模型在生成响应时展示其内部推理过程的一种方式。当启用时，模型会在最终回答前输出中间推理步骤，类似于人类解决问题时的思考过程。这种机制对于调试和理解模型行为很有帮助，但在生产环境中有时需要关闭以提高响应速度和简化输出。

关闭思考功能的实现方法

通过分析Qwen3的技术文档和实际项目经验，关闭思考功能需要修改模型调用时的参数配置。具体实现方式是在模型请求的extra_body参数中设置：

{
  "enable_thinking": false
}

这个参数会直接影响模型的行为，使其跳过中间推理步骤的展示，直接输出最终结果。对于使用vLLM等推理框架部署的Qwen3模型，这一配置方法同样适用。

实际应用建议

性能考量：关闭思考功能可以略微提升模型的响应速度，特别是在高并发场景下。
输出控制：当需要简洁的API响应时，禁用思考功能可以使输出更加结构化。
调试模式：建议在开发调试阶段保持思考功能开启，便于理解模型行为；在生产环境根据需求决定是否关闭。
参数位置：注意该参数需要放在请求的extra_body部分，而不是顶层参数中。

兼容性说明

此配置方法适用于Qwen3系列的不同规模模型，包括Qwen3-32B等版本。对于未来可能的模型更新，建议持续关注官方文档的参数变更说明。

通过合理配置这一参数，开发者可以更好地控制Qwen3模型在OpenSPG/KAG项目中的行为，平衡可解释性和性能需求。

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

515

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

284