Apache DataFusion项目中的S3凭证获取问题分析与解决方案

2025-06-13 16:51:08作者：冯梦姬Eddie

在Apache DataFusion项目中，最近出现了一个与S3对象存储凭证获取相关的测试失败问题。这个问题发生在合并某个PR之后，导致多个测试用例在执行时无法正确获取AWS S3的访问凭证。

问题现象

测试失败的主要表现为三个测试用例在执行时都遇到了相同的错误信息："Error getting credentials from provider: an error occurred while loading credentials"。更详细的错误日志显示，系统尝试从IMDS(Instance Metadata Service)获取会话令牌时失败。

具体受影响的测试包括：

外部对象存储的复制操作测试
S3位置查询测试
S3对象存储构建器默认配置测试

问题根源分析

经过深入调查，发现问题的根本原因在于凭证获取机制的变更。在之前的代码实现中，凭证提供者只有在实际需要时才会被获取，而在测试环境中并不需要真实的凭证。但是合并的PR修改了这一行为，导致测试运行时系统会主动尝试从环境中获取凭证。

当系统尝试从IMDS获取凭证时，由于测试环境并非运行在AWS EC2实例上，自然无法获取到有效的会话令牌，从而导致测试失败。这与另一个开源项目delta-io/delta-rs曾经遇到的问题非常相似。

解决方案

针对这个问题，可以考虑以下几种解决方案：

调整环境凭证获取：修改测试配置，在测试环境中调整从环境获取凭证的机制。这是最直接的解决方案，因为测试本身并不需要真实的S3访问权限。
测试凭证提供者：为测试环境提供一个测试用的凭证提供者，返回固定的测试凭证，而不实际尝试从环境中获取。
条件化凭证获取：修改代码逻辑，只有在明确需要访问S3时才尝试获取凭证。

最终采用的解决方案是第一种方法，即通过配置调整来避免测试环境尝试获取真实凭证。这种方法改动最小，且能有效解决问题，同时不影响生产环境中的正常功能。

技术启示

这个问题给我们带来了一些重要的技术启示：

测试隔离性：单元测试应该尽可能与外部依赖隔离，特别是像云服务凭证这样的环境相关配置。
延迟加载原则：对于资源密集型或环境依赖的操作，采用延迟加载策略往往能提高代码的灵活性和可测试性。
错误处理：对于可能失败的外部依赖操作，应该提供清晰的错误信息和适当的回退机制。

通过这次问题的分析和解决，DataFusion项目在云存储集成方面又获得了一次宝贵的经验积累，为后续的开发和测试工作提供了更好的实践参考。

arrow-datafusion

Apache Arrow DataFusion SQL Query Engine

项目地址：https://gitcode.com/gh_mirrors/arr/arrow-datafusion

登录后查看全文

Apache DataFusion项目中的S3凭证获取问题分析与解决方案

问题现象

问题根源分析

解决方案

技术启示

项目优选