ONNX 1.16.2版本发布的技术决策与挑战

2025-05-12 04:33:05作者：明树来

在开源机器学习交换格式ONNX的版本迭代过程中，开发团队近期面临一个重要决策：是否应该发布1.16.2版本以包含一些关键修复，还是等待即将到来的1.17.0大版本更新。经过深入讨论和技术评估，团队最终决定推进1.16.2版本的发布工作。

技术团队最初考虑将几个重要修复合并到1.16分支，包括形状推断崩溃修复和Windows平台相关问题的解决方案。然而，在尝试将这些变更从主分支cherry-pick到1.16.1基础分支时，遇到了显著的兼容性挑战，特别是在持续集成测试环节。

最突出的问题来自于NumPy 2.0的兼容性。由于主分支已经添加了对NumPy 2.0的支持，但相关修改涉及范围广泛，不适合作为补丁版本的一部分。团队评估了三种可能的解决方案：完整cherry-pick NumPy 2.0支持、选择性合并并手动解决冲突，或者修改CI配置避免问题依赖项。考虑到前两种方案的工作量和风险，团队倾向于第三种更保守的方法。

Windows平台的问题相对容易解决，通过合并两个特定的修复提交即可。但Linux CI测试暴露了更复杂的依赖关系问题，不仅涉及NumPy，还包括protobuf和pillow等关键依赖项的版本冲突。团队特别注意到，简单地限制NumPy版本可能导致pillow出现新的兼容性问题。

在评估过程中，团队还考虑了其他重要修复的合并可能性，包括形状推断相关的关键修复。然而，这些修复依赖于主分支上的新数据类型支持功能，超出了补丁版本的范围。最终决定将这些更复杂的改进保留给1.17.0大版本。

经过全面评估，技术团队认为尽管存在挑战，但发布1.16.2版本的价值在于：