Converse.js 11.0.0 版本发布:现代化即时通讯框架的重大升级
Converse.js 是一个基于 XMPP/Jabber 协议的现代化 Web 即时通讯客户端框架,它提供了完整的聊天功能实现,包括一对一聊天、群组聊天、文件传输等。作为一个开源项目,Converse.js 以其高度可定制性和丰富的功能集在开发者社区中广受欢迎。
核心功能增强
用户界面与体验优化
本次 11.0.0 版本对用户界面进行了全面升级,采用了最新的 Bootstrap 5 框架,带来了更现代化的视觉效果和更好的响应式设计。新增了 Cyberpunk 和 Nordic 两种主题风格,同时移除了过时的 Concord 主题。
群聊功能方面,现在支持在侧边栏中添加参与者过滤器,方便用户在大型群聊中快速定位特定成员。群聊参与者的徽章显示也进行了优化,现在会显示简洁的标签,同时保留完整标签作为提示信息。
消息处理机制改进
消息历史记录现在支持列表虚拟化技术,大幅提升了包含大量消息的聊天窗口性能。对于引用消息的多行嵌套显示问题进行了修复,确保复杂引用结构能够正确呈现。
新增了对 XEP-0424 和 XEP-0425(消息撤回和消息审核)最新版本的支持,需要注意的是,这一变更可能需要同步升级 XMPP 服务器的实现才能完全兼容。
多媒体与集成功能
引人注目的是新增了对音频流的渲染支持,开发者可以通过新的 fetch_url_headers 配置选项自定义获取音频流时的请求头。同时集成了 Spotify 播放器,当聊天中出现 Spotify 音轨链接时,可以直接在聊天界面中嵌入播放器。
技术架构演进
配置系统调整
默认配置方面有几个重要变化:fullscreen 成为默认的 view_mode;auto_register_muc_nickname 现在默认设置为 'unregister',使得用户在离开群聊时会自动注销昵称;allow_non_roster_messaging 现在默认启用,允许与非联系人通信。
新增了多个实用配置选项,包括 stanza_timeout 用于设置 stanza 超时时间,lazy_load_vcards 实现电子名片的延迟加载,以及 enable_roster_versioning 支持花名册版本控制等。
API 与架构重构
本次版本进行了多项架构层面的重构,移除了 _converse.BootstrapModal,转而采用基于 Web 组件的 _converse.BaseModal。连接对象不再直接暴露在 _converse 上,而是需要通过 api.connection.get() 获取。
新增了 _converse.exports 属性,为第三方插件提供访问 converse.js 内部代码的标准方式。同时移除了多个已弃用的 API 方法,包括 api.settings.update,开发者应改用 api.settings.extend。
安全与隐私增强
安全方面,现在默认启用 reuse_scram_keys 配置,提高了认证过程的安全性。新增了对 XEP-0191 阻止命令的支持,为用户提供了更完善的隐私控制能力。
OMEMO 端到端加密功能得到增强,现在可以显示指纹的 QR 码形式,方便用户进行安全验证。同时实现了 XEP-0392 一致的色彩生成规范,为匿名用户提供更可靠的视觉标识。
开发者注意事项
升级到 11.0.0 版本需要注意几个重大变更:移除了 autocomplete_add_contact 配置,自动完成功能现在总是启用;windowStateChanged 事件已被移除,应改用标准的 visibilitychange 事件;api.modal.create 的调用方式发生了变化,现在需要传入自定义 DOM 元素的名称而非类。
对于群聊功能,getAssignableRoles 和 getAssignableAffiliations 方法现在位于 Occupant 实例上而非 _converse 对象。同时移除了 chatBoxFocused 和 chatBoxBlurred 事件,开发者需要调整相关代码逻辑。
总结
Converse.js 11.0.0 版本代表了该项目发展的重要里程碑,不仅在功能上进行了大量增强,还在架构现代化方面迈出了坚实步伐。从用户体验到开发者API,从安全功能到性能优化,这个版本为构建企业级Web即时通讯应用提供了更加强大和灵活的基础。对于现有用户,建议仔细阅读变更说明并进行充分测试后再进行升级;对于新用户,这个版本提供了开始使用Converse.js的最佳起点。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00