Twinny项目中对Qwen2.5-Coder模型FIM支持的探索与实践

2025-06-24 10:56:38作者：卓艾滢Kingsley

The most no-nonsense locally hosted AI code completion plugin for vscode, like Github Copilot but 100% free and 100% private.

项目地址：https://gitcode.com/gh_mirrors/tw/twinny

在代码补全工具Twinny的开发过程中，社区用户发现Qwen2.5-Coder模型（包括1.5b和7b版本）的FIM（Fill-in-the-Middle）功能存在异常。当使用该模型时，输出中会出现类似<fim_suffix>的特殊标记，而预期的代码补全效果未能正常实现。

经过技术团队的深入分析，发现问题根源在于模型模板的特殊性。Qwen2.5-Coder模型采用了独特的FIM模板结构：

<|fim_prefix|>{{ .Prompt }}<|fim_suffix|>{{ .Suffix }}<|fim_middle|>

这与常见的FIM实现方式有所不同。当用户未提供suffix参数时，模型会输出解释性文本而非预期的代码补全结果。

技术团队通过多种方式验证了解决方案的有效性：

直接调用API时，必须显式设置suffix参数才能获得正确的代码补全
通过创建自定义模型文件(modelfile)覆盖默认模板
在Twinny中配置专用的FIM模板

最终解决方案在Twinny v3.17.12版本中正式发布。该版本针对Qwen2.5-Coder系列模型进行了专门优化，用户现在可以直接使用基础模型（如qwen2.5-coder:7b-base）而无需任何额外配置。关键在于移除了原始模板中对suffix参数的额外上下文处理，使FIM功能能够正常工作。

对于开发者而言，这一案例展示了：

不同LLM模型在FIM实现上的差异性
模型模板对功能实现的关键影响
在实际应用中处理特殊模型需求的方法论

技术团队推荐用户在使用类似模型时，可以优先考虑Codellama-code或Deepseek-base等经过充分测试的模型，这些模型在Twinny中的表现更为稳定可靠。同时，也展示了开源社区协作解决技术问题的典型流程：从问题报告、方案探讨到最终实现。

这一改进使得Twinny对Qwen系列模型的支持更加完善，为开发者提供了更多高质量的代码补全选择。

The most no-nonsense locally hosted AI code completion plugin for vscode, like Github Copilot but 100% free and 100% private.

项目地址：https://gitcode.com/gh_mirrors/tw/twinny

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。