DeltaLake在ARM架构Kubernetes环境中的SSL证书问题分析

2025-06-29 06:03:34作者：戚魁泉Nursing

A native Rust library for Delta Lake, with bindings into Python

项目地址：https://gitcode.com/gh_mirrors/de/delta-rs

问题背景

DeltaLake是一个开源的数据湖存储解决方案，其Python绑定deltalake在0.20.0版本后出现了一个特定环境下的兼容性问题。当用户在AWS EKS（Elastic Kubernetes Service）环境中使用ARM架构节点运行Python作业时，会遇到"invalid peer certificate: BadSignature"的错误。

问题表现

用户在Python 3.10环境下，通过Kubernetes服务账户获取AWS IAM策略访问S3存储时，DeltaLake版本0.19.2可以正常工作，但升级到0.20.0及更高版本（包括0.22.0、0.24.0和0.25.1）后会出现证书验证失败的问题。

错误日志显示AWS STS服务在尝试获取Web身份令牌时，遇到了证书签名验证失败的问题。具体表现为：

连接AWS STS服务时证书签名验证失败
Web身份令牌提供程序无法提供凭据
默认凭据链也失败
最终导致DeltaTable初始化失败

环境特点

这个问题具有特定的环境依赖性：

仅出现在Linux ARM架构的Kubernetes Pod中
本地开发环境（Mac M3或Windows）无法复现
使用服务账户和IAM角色进行AWS认证的场景
仅影响DeltaLake 0.20.0及以上版本

技术分析

从错误堆栈和依赖关系来看，问题可能出在以下几个方面：

TLS实现差异：DeltaLake底层使用Rust实现的AWS SDK，而AWS SDK又依赖hyper-rustls作为HTTP客户端。在0.20.0版本后，可能更新了rustls或相关依赖的版本，导致ARM架构下的证书验证行为发生变化。
证书链验证：错误信息表明服务端证书的签名验证失败，这可能是由于：
- ARM架构下的加密算法实现差异
- 证书链中的中间证书处理方式变化
- 系统根证书库的兼容性问题
构建环境差异：测试发现使用Manylinux_2_28构建的wheel可以解决问题，而Manylinux_2_17构建的则不行，这表明构建环境中的系统库版本对TLS处理有重要影响。

解决方案

经过测试验证，以下方法可以解决该问题：

使用特定构建的wheel：Manylinux_2_28构建的版本可以正常工作，这表明更新构建环境中的系统库可以解决兼容性问题。
等待官方修复：项目维护者已经确认将在0.25.2版本中发布修复方案，使用更高版本的构建环境来解决ARM架构下的SSL握手问题。

临时解决方案

对于急需解决问题的用户，可以考虑以下临时方案：

降级使用0.19.2版本：虽然这不是长期解决方案，但可以暂时恢复功能。
使用x86架构节点：如果环境允许，切换到x86架构的Kubernetes节点可以避免此问题。

最佳实践建议

测试环境一致性：在生产环境升级前，确保在相同架构的测试环境中充分验证。
关注构建环境：对于跨平台应用，特别是涉及加密和认证的场景，构建环境的选择至关重要。
依赖管理：对于关键业务系统，考虑锁定依赖版本，避免自动升级带来的意外问题。

总结

这个案例展示了开源软件在特定环境组合下可能出现的兼容性问题，特别是在ARM架构逐渐普及的背景下，跨平台兼容性测试显得尤为重要。DeltaLake维护团队已经定位到问题并将在后续版本中修复，体现了开源社区响应问题的效率。

对于企业用户来说，这提醒我们需要：

建立完善的升级测试流程
关注特定架构下的兼容性问题
与开源社区保持良好沟通，及时反馈问题

A native Rust library for Delta Lake, with bindings into Python

项目地址：https://gitcode.com/gh_mirrors/de/delta-rs

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库