首页
/ Xorbits Inference 1.6.0版本发布:多模态与量化模型能力全面升级

Xorbits Inference 1.6.0版本发布:多模态与量化模型能力全面升级

2025-06-08 02:23:34作者:宣海椒Queenly

Xorbits Inference是一个开源的AI模型推理框架,它提供了高效、灵活的模型部署方案,支持从文本生成到多模态处理的各类AI任务。本次1.6.0版本的发布带来了多项重要更新,特别是在多模态处理能力、模型量化支持以及推理性能优化方面有显著提升。

多模态处理能力增强

1.6.0版本在多模态处理方面取得了重要进展:

  • 图像到视频转换:新增了image_to_video功能,可以将静态图像转换为动态视频,为内容创作提供了新的可能性。这项功能在UI界面中得到了良好支持,用户可以直观地进行操作。

  • 音频处理界面:专门为音频模型设计了新的用户界面,使得音频生成和处理变得更加便捷。这一改进大大提升了音频相关任务的用户体验。

  • 视觉语言模型支持:新增了Qwen2.5-VL-32B-Instruct等视觉语言模型,增强了系统处理图像与文本联合任务的能力。

模型支持扩展

本次更新引入了多个新模型,显著扩展了框架的能力范围:

  • 大语言模型:新增了XiYanSQL-QwenCoder-2504、HuatuoGPT-o1、DianJin-R1等专业领域模型,特别强化了在医疗、金融等垂直领域的处理能力。

  • 量化模型支持:针对Qwen3系列模型(包括235B等大参数模型)提供了GPTQ量化支持,包括Int4和Int8两种量化精度。这种量化技术可以在保持模型性能的同时大幅减少内存占用和计算资源需求。

  • Skywork系列支持:新增了对Skywork-OR1模型的支持,包括32B参数的GPTQ量化版本,为用户提供了更多模型选择。

推理性能优化

在推理性能方面,1.6.0版本做出了多项改进:

  • 异步处理优化:使用xo.wait_for替代asyncio.wait_for进行actor调用,提高了异步任务的执行效率和稳定性。

  • 推理内容解析:改进了推理内容的解析逻辑,特别是对思考标签()的自动补全功能,使得模型输出更加规范可靠。

  • 停止词处理:优化了停止词处理逻辑,解决了在vllm模型生成配置中可能出现的停止词处理问题,提高了生成文本的质量。

开发者体验提升

针对开发者体验,本次更新也做出了多项改进:

  • 环境隔离:实现了Worker环境隔离,确保不同模型运行环境的独立性,提高了系统的稳定性和安全性。

  • 依赖管理:将autoawq和GPTQModel等特定功能分离到单独的安装包中,使得核心框架更加轻量,用户可以根据需要选择安装特定功能。

  • 配置加载:支持通过函数加载模型配置,提供了更灵活的模型管理方式。

  • 文档与UI改进:在侧边菜单中添加了文档链接和版本信息显示,方便用户快速获取帮助和了解系统状态。

总结

Xorbits Inference 1.6.0版本在多模态处理、模型支持和推理性能等方面都取得了显著进步。特别是新增的图像到视频转换功能和专业领域模型支持,使得框架能够应对更加多样化的AI应用场景。量化技术的广泛应用也为资源受限环境下的模型部署提供了更多可能性。这些改进共同推动了Xorbits Inference作为一个全面、高效的AI推理解决方案的成熟度。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
166
2.05 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
85
563
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
60
17
apintoapinto
基于golang开发的网关。具有各种插件,可以自行扩展,即插即用。此外,它可以快速帮助企业管理API服务,提高API服务的稳定性和安全性。
Go
22
0
cjoycjoy
一个高性能、可扩展、轻量、省心的仓颉应用开发框架。IoC,Rest,宏路由,Json,中间件,参数绑定与校验,文件上传下载,OAuth2,MCP......
Cangjie
94
15
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
199
279
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
954
564