SillyTavern 1.13.0版本深度解析:AI聊天平台的重要升级
SillyTavern是一个基于Web的AI聊天平台,它为用户提供了与AI角色进行自然对话的能力。作为一个开源项目,SillyTavern支持多种AI模型后端,并提供了丰富的自定义功能,包括角色创建、对话管理、提示工程等。1.13.0版本是该平台的一个重要更新,带来了多项功能增强和用户体验改进。
核心架构变更
本次更新引入了两项重要的架构变更,开发者需要特别注意:
-
模型推理控制重构:原有的"Request model reasoning"开关现在仅控制推理令牌的可见性,而新增的"Reasoning Effort"设置则负责控制模型推理请求本身。这一变更使推理控制更加精细,建议大多数用户使用"Auto"选项以获得最佳体验。
-
样式处理统一化:角色卡中"Creator's Notes"字段的CSS样式现在与聊天消息中的样式处理方式保持一致。这意味着样式类会被自动添加前缀,外部媒体偏好会被尊重,且样式会被限制在Creator's Note块内。同时新增了角色级别的设置,允许样式应用到Creator's Note块之外。
后端服务增强
1.13.0版本对多个AI模型后端进行了功能增强:
-
Claude:新增了Claude 4模型支持,加入了
extendedTTL参数来延长提示缓存的生存时间,并支持后端提供的网络搜索工具。 -
Google AI服务:重新组织了模型列表,标记了被重定向的模型,并重新引入了推理令牌可见性控制。
-
新增后端支持:引入了Google Vertex AI(Express模式)和Pollinations作为新的聊天完成源。
-
模型优化:在llama.cpp中启用了
nsigma采样器控制并添加了min_keep设置;在Mancer中启用了DRY和XTC采样器控制。
用户体验改进
本次更新在用户体验方面做出了多项重要改进:
-
全新欢迎界面:完全重新设计了欢迎屏幕,新增了最近对话显示、永久助手自动创建功能,以及设置默认助手角色的能力。
-
临时对话增强:现在可以通过导入之前保存的对话文件来恢复临时对话。
-
扩展管理:在扩展安装对话框中新增了分支选择功能,用户也可以在"管理扩展"菜单中切换分支。
-
UI主题定制:解耦了"点击编辑"主题与"文档模式"样式的关联,新增了设置Toast通知位置的功能,并加入了圆角方形头像样式。
-
世界信息匹配:新增了按条目匹配角色卡字段的开关。
技术功能增强
-
聊天完成优化:
- 新增源特定的推理力度选项(Auto/Minimum/Maximum)
- "Prompt Post-Processing"现在可用于所有聊天完成源
- 新增"合并为单一用户消息"的后处理选项
- 新增控制聊天完成预设与API连接绑定的开关
-
提示管理器:
- 新增提示来源显示
- 新增相同注入深度的提示优先级设置(类似世界信息排序行为)
-
文本完成:
- 在系统提示设置中新增后历史指令字段
- 新增GLM-4模板,修复了Lightning 1.1模板
-
高级格式化:非Markdown字符串不再自动包含对话和示例分隔符,需使用
{{chatStart}},{{chatSeparator}}来恢复经典行为。
扩展功能更新
-
图像生成:为OpenAI新增gpt-image-1模型支持,并添加了
{{charPrefix}}和{{charNegativePrefix}}全局宏。 -
图像标注:新增Pollinations作为源,添加了文本完成源的二级端点URL控制,修复了llama.cpp标注支持。
-
向量存储:新增Cohere的embed-v4.0模型。
STscript命令增强
-
新增
/test和/match命令用于字符串的正则表达式操作。 -
在消息发送命令(如
/send,/sendas)中新增raw=false参数来控制引号保留。 -
新增
/chat-jump命令快速滚动到指定ID的消息。 -
在
/sys命令中新增name参数来设置消息显示名称。 -
新增
/clipboard-get和/clipboard-set命令读写系统剪贴板。
重要问题修复
-
修复了KoboldCpp生成的向量保存不正确的问题。
-
修复了重命名群组成员时群组元数据丢失的问题。
-
修复了聊天完成预设重命名时的视觉重复问题。
-
修复了IME组合期间按Enter键发送消息的问题。
-
修复了指令模式中继续后缀解析不正确的情况。
-
修复了工具定义与DeepSeek后端的兼容性问题。
-
修复了xAI选定模型未保存到预设的问题。
-
修复了服务器在提取损坏ZIP存档时崩溃的问题。
-
修复了"隐藏静音精灵"开关未按群组保存的问题。
-
修复了使用自动解析推理时的logprobs令牌重新滚动问题。
技术实现亮点
-
样式处理架构:通过统一角色卡和聊天消息的样式处理机制,提高了样式应用的可靠性和一致性,同时保持了足够的灵活性。
-
推理控制分离:将推理请求和推理显示分离为两个独立的控制维度,提供了更精细的模型行为控制能力。
-
扩展系统增强:分支选择功能的加入使扩展管理更加灵活,支持更复杂的开发和部署场景。
-
性能优化:通过改进向量保存、元数据处理等底层机制,提升了系统的稳定性和响应速度。
-
兼容性扩展:新增的后端支持和模型模板使平台能够适应更广泛的AI模型和应用场景。
SillyTavern 1.13.0版本通过上述改进,显著提升了平台的稳定性、功能丰富度和用户体验,为开发者和用户提供了更强大、更灵活的AI聊天环境。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0204- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
awesome-zig一个关于 Zig 优秀库及资源的协作列表。Makefile00