SillyTavern 1.13.0版本深度解析:AI聊天平台的重要升级
SillyTavern是一个基于Web的AI聊天平台,它为用户提供了与AI角色进行自然对话的能力。作为一个开源项目,SillyTavern支持多种AI模型后端,并提供了丰富的自定义功能,包括角色创建、对话管理、提示工程等。1.13.0版本是该平台的一个重要更新,带来了多项功能增强和用户体验改进。
核心架构变更
本次更新引入了两项重要的架构变更,开发者需要特别注意:
-
模型推理控制重构:原有的"Request model reasoning"开关现在仅控制推理令牌的可见性,而新增的"Reasoning Effort"设置则负责控制模型推理请求本身。这一变更使推理控制更加精细,建议大多数用户使用"Auto"选项以获得最佳体验。
-
样式处理统一化:角色卡中"Creator's Notes"字段的CSS样式现在与聊天消息中的样式处理方式保持一致。这意味着样式类会被自动添加前缀,外部媒体偏好会被尊重,且样式会被限制在Creator's Note块内。同时新增了角色级别的设置,允许样式应用到Creator's Note块之外。
后端服务增强
1.13.0版本对多个AI模型后端进行了功能增强:
-
Claude:新增了Claude 4模型支持,加入了
extendedTTL参数来延长提示缓存的生存时间,并支持后端提供的网络搜索工具。 -
Google AI服务:重新组织了模型列表,标记了被重定向的模型,并重新引入了推理令牌可见性控制。
-
新增后端支持:引入了Google Vertex AI(Express模式)和Pollinations作为新的聊天完成源。
-
模型优化:在llama.cpp中启用了
nsigma采样器控制并添加了min_keep设置;在Mancer中启用了DRY和XTC采样器控制。
用户体验改进
本次更新在用户体验方面做出了多项重要改进:
-
全新欢迎界面:完全重新设计了欢迎屏幕,新增了最近对话显示、永久助手自动创建功能,以及设置默认助手角色的能力。
-
临时对话增强:现在可以通过导入之前保存的对话文件来恢复临时对话。
-
扩展管理:在扩展安装对话框中新增了分支选择功能,用户也可以在"管理扩展"菜单中切换分支。
-
UI主题定制:解耦了"点击编辑"主题与"文档模式"样式的关联,新增了设置Toast通知位置的功能,并加入了圆角方形头像样式。
-
世界信息匹配:新增了按条目匹配角色卡字段的开关。
技术功能增强
-
聊天完成优化:
- 新增源特定的推理力度选项(Auto/Minimum/Maximum)
- "Prompt Post-Processing"现在可用于所有聊天完成源
- 新增"合并为单一用户消息"的后处理选项
- 新增控制聊天完成预设与API连接绑定的开关
-
提示管理器:
- 新增提示来源显示
- 新增相同注入深度的提示优先级设置(类似世界信息排序行为)
-
文本完成:
- 在系统提示设置中新增后历史指令字段
- 新增GLM-4模板,修复了Lightning 1.1模板
-
高级格式化:非Markdown字符串不再自动包含对话和示例分隔符,需使用
{{chatStart}},{{chatSeparator}}来恢复经典行为。
扩展功能更新
-
图像生成:为OpenAI新增gpt-image-1模型支持,并添加了
{{charPrefix}}和{{charNegativePrefix}}全局宏。 -
图像标注:新增Pollinations作为源,添加了文本完成源的二级端点URL控制,修复了llama.cpp标注支持。
-
向量存储:新增Cohere的embed-v4.0模型。
STscript命令增强
-
新增
/test和/match命令用于字符串的正则表达式操作。 -
在消息发送命令(如
/send,/sendas)中新增raw=false参数来控制引号保留。 -
新增
/chat-jump命令快速滚动到指定ID的消息。 -
在
/sys命令中新增name参数来设置消息显示名称。 -
新增
/clipboard-get和/clipboard-set命令读写系统剪贴板。
重要问题修复
-
修复了KoboldCpp生成的向量保存不正确的问题。
-
修复了重命名群组成员时群组元数据丢失的问题。
-
修复了聊天完成预设重命名时的视觉重复问题。
-
修复了IME组合期间按Enter键发送消息的问题。
-
修复了指令模式中继续后缀解析不正确的情况。
-
修复了工具定义与DeepSeek后端的兼容性问题。
-
修复了xAI选定模型未保存到预设的问题。
-
修复了服务器在提取损坏ZIP存档时崩溃的问题。
-
修复了"隐藏静音精灵"开关未按群组保存的问题。
-
修复了使用自动解析推理时的logprobs令牌重新滚动问题。
技术实现亮点
-
样式处理架构:通过统一角色卡和聊天消息的样式处理机制,提高了样式应用的可靠性和一致性,同时保持了足够的灵活性。
-
推理控制分离:将推理请求和推理显示分离为两个独立的控制维度,提供了更精细的模型行为控制能力。
-
扩展系统增强:分支选择功能的加入使扩展管理更加灵活,支持更复杂的开发和部署场景。
-
性能优化:通过改进向量保存、元数据处理等底层机制,提升了系统的稳定性和响应速度。
-
兼容性扩展:新增的后端支持和模型模板使平台能够适应更广泛的AI模型和应用场景。
SillyTavern 1.13.0版本通过上述改进,显著提升了平台的稳定性、功能丰富度和用户体验,为开发者和用户提供了更强大、更灵活的AI聊天环境。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
compass-metrics-modelMetrics model project for the OSS CompassPython00