One-API v0.7.1版本发布:新增群组限速与OpenRouter余额更新功能
One-API是一个开源的API管理平台,它允许开发者通过统一的接口访问多个AI服务提供商的API。该项目通过抽象化不同API提供商的差异,为用户提供了便捷的多模型管理能力。最新发布的v0.7.1版本带来了一些实用功能改进和问题修复。
核心功能更新
群组限速功能
v0.7.1版本引入了群组级别的速率限制功能。这一改进使得管理员能够为特定的用户组设置独立的请求速率限制,而不再仅限于全局或用户级别的限制。在实际应用中,这意味着:
- 企业可以为不同部门设置差异化的API访问配额
- 教育机构可以给教师组和学生组分配不同的调用频率
- 开发者能够更精细地控制API资源分配
群组限速的实现采用了令牌桶算法,确保限流平滑且公平,避免了突发流量导致的系统过载问题。
OpenRouter余额自动更新
对于使用OpenRouter作为后端的用户,新版本增加了余额自动更新机制。系统现在会定期同步OpenRouter账户的余额信息,确保:
- 用户能够实时了解API调用剩余额度
- 避免因余额不足导致的意外服务中断
- 管理员可以更准确地监控资源消耗情况
这一功能通过后台定时任务实现,更新频率可根据实际需求进行配置。
技术优化与问题修复
SSE连接稳定性增强
针对服务器发送事件(SSE)连接,开发团队修复了一个可能导致连接不稳定的问题。现在系统会确保在接收上游响应前发送必要的ping数据包,这一改进:
- 减少了长连接意外断开的情况
- 提高了流式数据传输的可靠性
- 特别优化了大模型生成内容时的用户体验
图片请求格式修正
项目中存在的图片价格数据格式化问题得到了修复。现在系统能够正确处理图片相关的定价信息,确保:
- 计费系统准确反映图片生成成本
- 管理员可以正确配置图片生成的价格策略
- 用户账单更加精确透明
工作者节点HTTP图片请求支持
新增了允许工作者节点直接发起HTTP图片请求的配置选项。这一特性为需要处理图片内容的场景提供了更多灵活性:
- 支持从外部URL获取图片进行处理
- 简化了图片相关功能的开发流程
- 可通过配置灵活控制安全性策略
跨平台兼容性
v0.7.1版本继续保持了良好的跨平台支持,提供了针对不同操作系统的预编译二进制文件:
- Linux (x86_64和ARM64架构)
- Windows
- macOS
这种广泛的平台覆盖确保了用户可以在各种环境中轻松部署和使用One-API服务。
总结
One-API v0.7.1版本通过引入群组限速、OpenRouter余额同步等新功能,进一步提升了API管理的灵活性和可用性。同时,对SSE连接、图片处理等核心功能的优化,使得系统更加稳定可靠。这些改进使得One-API继续成为管理多模型API访问的理想选择,特别适合需要同时对接多个AI服务提供商的企业和开发者。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00