Void项目中的模型模板标准化方案

2025-05-19 19:17:31作者：傅爽业Veleda

背景与需求

在代码生成和补全领域，不同的大语言模型有着各自独特的提示词(prompt)结构和特殊标记(token)系统。Void项目团队发现，虽然主流模型数量有限(约15种)，但每种模型都有其特定的交互方式，这给开发者带来了不小的适配负担。

核心问题

项目面临的主要挑战是：

模型识别问题：不同来源的同一模型可能有不同的命名(如openrouter/deepseek-r1、deepseek-reasoner和deepseek-r1实际上都是Deepseek-R1模型)
特殊标记处理：各模型对填充中间(FIM)等特殊任务使用不同的标记(如<|fim_hole|>)
提示词标准化：当模型不支持某些功能时，需要自动转换为自然语言描述

解决方案

Void项目借鉴了Ollama的模板系统思路，实现了以下功能：

模型自动检测：通过规范化模型名称，识别出实际的底层模型
模板系统：为每种主流模型创建专用模板，包含：
- 正确的特殊标记使用方式
- 模型偏好的提示词结构
- 功能降级方案(如将FIM标记转换为自然语言描述)
统一接口：开发者无需关心底层模型差异，统一使用相同的API

技术实现要点

模型指纹识别：建立模型名称到标准模板的映射关系
功能适配层：
- 对于支持FIM的模型，使用原生特殊标记
- 对于不支持FIM的模型，自动生成类似"请完成以下代码片段的中间部分..."的自然语言提示
模板扩展机制：方便未来添加对新模型的支持

项目意义

该方案显著提升了开发体验：

开发者无需记忆各模型的特殊语法
代码补全等功能在不同模型间表现更加一致
降低了集成新模型的技术门槛

未来展望

随着AI模型的快速发展，Void项目的模板系统将持续演进，支持更多新兴模型和功能，为开发者提供更加智能、统一的代码生成体验。

登录后查看全文

热门内容推荐

最新内容推荐

项目优选

收起

openHiTLS-examples

本仓将为广大高校开发者提供开源实践和创新开发平台，收集和展示openHiTLS示例代码及创新应用，欢迎大家投稿，让全世界看到您的精巧密码实现设计，也让更多人通过您的优秀成果，理解、喜爱上密码技术。

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

ohos_react_native

React Native鸿蒙化仓库

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

deepin linux kernel

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

harmony-utils 一款功能丰富且极易上手的HarmonyOS工具库，借助众多实用工具类，致力于助力开发者迅速构建鸿蒙应用。其封装的工具涵盖了APP、设备、屏幕、授权、通知、线程间通信、弹框、吐司、生物认证、用户首选项、拍照、相册、扫码、文件、日志，异常捕获、字符、字符串、数字、集合、日期、随机、base64、加密、解密、JSON等一系列的功能和操作，能够满足各种不同的开发需求。

CangjieCommunity

为仓颉编程语言开发者打造活跃、开放、高质量的社区环境