首页
/ Xorbits Inference 1.4.0 版本发布:多模态与函数调用能力全面升级

Xorbits Inference 1.4.0 版本发布:多模态与函数调用能力全面升级

2025-06-08 21:52:50作者:秋泉律Samson

Xorbits Inference 是一个开源的模型推理框架,旨在为开发者提供高效、灵活的模型部署和推理解决方案。该项目支持多种主流模型架构,包括文本生成、视觉理解等多模态能力,并提供了丰富的API接口和工具链,帮助开发者快速构建AI应用。

核心功能增强

Gemma-3 多模态支持

本次1.4.0版本最重要的更新之一是对Gemma-3系列模型的全面支持。Gemma-3是Google推出的新一代开源大模型,具有强大的文本理解和生成能力。Xorbits Inference现在不仅支持Gemma-3的纯文本版本(gemma-3 text),还特别增加了对Gemma-3-it视觉版本的支持,这意味着开发者现在可以利用Gemma-3处理包含图像的复杂多模态任务。

Gemma-3-it视觉模型的集成使得Xorbits Inference在图像理解、图文生成等场景下的能力得到显著提升。开发者可以构建更丰富的多模态应用,如智能客服、内容审核、教育辅助等。

Deepseek V3 函数调用能力

另一个重要特性是新增了对Deepseek V3模型的函数调用支持。函数调用是大语言模型(LLM)领域的一项重要技术,它允许模型在执行过程中调用外部函数或工具,从而扩展模型的能力边界。

Xorbits Inference 1.4.0版本中,开发者现在可以利用Deepseek V3模型实现:

  • 动态工具调用:模型可以根据上下文自动选择合适的工具
  • 结构化输出:以标准化的格式返回函数调用结果
  • 复杂任务分解:将复杂问题拆解为多个函数调用步骤

这一特性特别适合构建需要与外部系统交互的AI应用,如数据分析、自动化流程等场景。

性能与稳定性优化

推理后端改进

在底层推理引擎方面,1.4.0版本对xllamacpp后端进行了重要改进,现在当推理过程出现错误时会明确抛出异常,帮助开发者更快定位和解决问题。同时修复了vLLM后端中enable_prefix_caching参数的兼容性问题,提升了缓存机制的可靠性。

流式API支持

针对Deepseek模型,新版本增加了流式API支持,这意味着开发者可以实时获取模型的生成结果,而不必等待整个响应完成。这一特性对于构建实时交互应用至关重要,如聊天机器人、实时翻译等场景。

开发者体验提升

文档完善

1.4.0版本在文档方面做了大量补充,特别是新增了xllamacpp后端的使用指南和HTTP请求的身份验证说明。这些文档帮助开发者更快上手Xorbits Inference的各种功能,减少集成过程中的障碍。

用户界面优化

在Web界面方面,修复了暗黑模式下的显示问题,并调整了GPU资源配置的表述方式,使其更加清晰易懂。同时移除了对llama.cpp模型在GPU数量上的不必要限制,提供了更灵活的部署选项。

技术细节与使用建议

对于希望升级到1.4.0版本的开发者,以下是一些技术建议:

  1. 多模态应用开发:当使用Gemma-3-it视觉模型时,建议预先处理好输入图像的大小和格式,以获得最佳性能。

  2. 函数调用实践:在使用Deepseek V3的函数调用功能时,建议先定义清晰的工具规范,包括工具名称、描述和参数格式,这将显著提升模型调用工具的准确性。

  3. 性能调优:对于生产环境部署,可以尝试调整enable_prefix_caching等参数以获得更好的吞吐量,特别是在处理大量相似前缀的请求时。

Xorbits Inference 1.4.0版本的发布标志着该项目在多模态支持和功能性扩展方面迈出了重要一步。随着这些新特性的加入,开发者现在能够构建更加复杂、功能更丰富的AI应用,同时得益于框架本身的稳定性和易用性提升,开发效率也将得到显著提高。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
896
532
KonadoKonado
Konado是一个对话创建工具,提供多种对话模板以及对话管理器,可以快速创建对话游戏,也可以嵌入各类游戏的对话场景
GDScript
21
13
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
85
4
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
372
387
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
94
15
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
625
60
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
402
377