Truss项目v0.9.64版本发布：模型服务框架的重要更新

2025-07-07 22:18:00作者：蔡丛锟

Truss是一个开源的模型服务框架，它简化了机器学习模型的打包、部署和服务化过程。通过提供标准化的接口和工具链，Truss让开发者能够轻松地将训练好的模型转化为生产就绪的服务。最新发布的v0.9.64版本带来了一系列功能增强和优化改进，进一步提升了框架的可用性和功能性。

Python版本支持调整

本次更新对Python版本支持进行了重要调整。Truss现在明确要求最低Python版本为3.9，这反映了现代Python生态的发展趋势。不过考虑到实际生产环境中的兼容性需求，服务器端代码仍然保持对Python 3.8的支持。这种版本策略既确保了能够利用Python 3.9及更高版本的新特性，又兼顾了现有系统的兼容性需求。

WebSocket端点支持增强

在API功能方面，新版本增加了对WebSocket端点的显式配置支持。通过is_websocket_endpoint配置项，开发者可以明确指定哪些API端点需要支持WebSocket协议。这一改进使得构建实时交互式模型服务变得更加简单直接，特别是在需要持续数据流处理的场景下，如实时语音识别或视频分析等应用。

配置系统重构

配置系统是本版本的重点改进领域之一。开发团队对模型量化相关的配置进行了重构，移除了旧的gemm_plugin配置项，引入了更加结构化的量化配置选项，包括校准数据集大小的设置。这种重构使得模型量化配置更加清晰和灵活，便于开发者精确控制量化过程。

安全与权限管理改进

在安全方面，v0.9.64版本移除了API中的is_trusted参数，这一变更反映了权限管理策略的简化。同时，框架现在会在用户环境(TrussUserEnv)中传递必要的上下文信息，为后续的细粒度权限控制奠定了基础。这些改进既减少了配置复杂度，又为未来的安全扩展保留了灵活性。

开发者体验优化

针对开发者体验，本次更新包含多项优化。AWS凭证相关的环境变量处理更加完善，避免了敏感信息的意外泄露。健康检查机制也得到了增强，支持自定义的健康检查逻辑，使得运维监控更加灵活。此外，项目正式废弃了truss-utils包，将相关功能整合到主代码库中，简化了依赖管理。

总结

Truss v0.9.64版本通过一系列有针对性的改进，进一步巩固了其作为模型服务框架的定位。从Python版本支持到WebSocket端点配置，从量化参数重构到安全策略简化，每个变更都体现了框架对生产环境需求的深入理解。这些改进不仅提升了框架的稳定性和功能性，也为开发者构建和部署机器学习服务提供了更加顺畅的体验。

truss

The simplest way to serve AI/ML models in production

项目地址：https://gitcode.com/gh_mirrors/tr/truss

登录后查看全文