Py-Shiny v1.3.0发布:增强聊天组件与UI交互体验
项目简介
Py-Shiny是一个基于Python的Web应用框架,它允许开发者使用纯Python代码构建交互式Web应用,无需掌握前端技术栈。该框架特别适合数据科学家和Python开发者快速创建数据可视化仪表盘和交互式应用。最新发布的v1.3.0版本带来了多项重要更新,特别是在聊天组件和用户交互方面有显著增强。
核心更新内容
1. Markdown流式渲染组件
新引入的ui.MarkdownStream()组件为处理流式Markdown/HTML内容提供了高效解决方案。这一特性特别适合生成式AI应用场景,能够实现文本内容的渐进式渲染,提升用户体验。
技术实现上,该组件采用异步处理机制,可以分块接收和处理文本数据,避免了传统一次性渲染大段文本可能导致的界面卡顿问题。
2. 聊天组件功能增强
ui.Chat()组件在本版本中获得了多项重要改进:
输入建议功能:
- 开发者现在可以通过两种方式为用户提供输入建议:
- 使用
.suggestionCSS类标记建议元素 - 使用
data-suggestion属性指定建议内容
- 使用
- 支持自动提交功能,可通过
.submit类或data-suggestion-submit属性实现 - 提供快捷键支持:Cmd/Ctrl+点击自动提交,Alt/Opt+点击仅填充不提交
其他改进:
- 新增
.on_user_submit()装饰器方法,简化用户输入获取 - 支持自定义助手图标,可通过
ui.chat_ui()全局配置或单个消息单独设置 - 新增
latest_message_stream属性,便于跟踪流式消息状态 .append_message_stream()方法现在返回reactive.extended_task实例.update_user_input()方法新增submit和focus选项
3. 客户端数据访问
新增的session.clientdata接口允许服务器端Python代码访问客户端数据,如URL信息、输出尺寸等。这一特性极大增强了前后端交互能力,例如可以通过session.clientdata.url_search()响应式读取URL搜索参数。
4. 输入控件更新策略
文本类输入控件(ui.input_text()、ui.input_text_area()等)新增update_on选项:
"change"(默认):值变化时立即更新"blur":仅在失去焦点或按Enter时更新
这一改进减少了不必要的服务器通信,特别适合处理敏感或计算密集型的输入场景。
技术细节与最佳实践
聊天组件模板优化
新版本提供了改进的ui.Chat()模板选项,这些模板深度集成了chatlas包,为LLM交互提供了开箱即用的解决方案。开发者可以基于这些模板快速构建AI聊天应用,同时保持高度可定制性。
Sass层文件支持
ui.Theme新增的.add_sass_layer_file()方法支持读取带有层边界注释的Sass文件,这一特性与Quarto的Sass处理方式兼容,使得主题定制更加灵活和模块化。
测试工具增强
shiny.pytest.create_app_fixture()现在支持多应用文件路径参数化测试,简化了多场景测试的编写过程。
向后兼容性说明
- 导航栏相关样式选项已整合到
ui.navbar_options()辅助函数中,旧参数仍可使用但会显示弃用警告 ui.navset_bar()现在默认启用underline=True以保持与页面变体的一致性shiny.ui.Chat()不再包含.ui()方法(Express版本仍保留)
升级建议
对于现有项目,建议重点关注以下升级点:
- 检查并更新导航栏相关代码以使用新的
ui.navbar_options() - 评估聊天组件的新功能是否适用于现有应用
- 考虑在文本输入控件中使用
update_on="blur"优化性能 - 利用
session.clientdata简化客户端数据访问逻辑
v1.3.0版本的这些改进使Py-Shiny在构建现代交互式Web应用,特别是AI聊天类应用方面变得更加强大和易用。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00