Apache Arrow C++模块中AES加密函数仅支持128位密钥的问题分析

2025-05-18 12:54:57作者：齐冠琰

Apache Arrow is a multi-language toolbox for accelerated data interchange and in-memory processing

项目地址：https://gitcode.com/gh_mirrors/arrow13/arrow

问题背景

在Apache Arrow项目的C++模块中，Gandiva执行引擎提供了AES加密和解密功能。然而，用户发现这些函数存在一个关键限制：无论输入的密钥长度如何，系统实际上只使用了前128位(16字节)进行加密操作。

问题现象

通过测试用例可以观察到以下现象：

当使用超过16字符的密钥(如"mypassword1234567890")加密数据时，系统实际上只使用了前16个字符("mypassword123456")
使用16字符的不同密钥(如"mypassword123459")解密时会导致段错误(SigSev异常)
使用少于16字符的密钥(如"mypassword12345")也会导致段错误

技术分析

深入代码分析后发现，问题根源在于Gandiva实现中硬编码使用了OpenSSL的EVP_aes_128_ecb方法。这种方法固定使用128位(16字节)密钥长度，导致：

对于超过16字节的密钥，系统会截断只使用前16字节
对于不足16字节的密钥，由于没有适当的填充处理，会导致内存访问越界，引发段错误

标准对比

根据OpenSSL规范和Hive等大数据系统的实现：

AES加密标准支持三种密钥长度：128位(16字节)、192位(24字节)和256位(32字节)
规范的实现应该严格检查密钥长度，对于不符合要求的密钥应返回错误而非截断或崩溃
Hive等系统在遇到非法长度密钥时会返回NULL值，而不是产生未定义行为

解决方案

该问题已通过Pull Request修复，主要改进包括：

增加密钥长度验证，只接受16、24或32字节的密钥
对于非法长度的密钥返回明确的错误而非未定义行为
根据密钥实际长度选择适当的加密算法(EVP_aes_128_ecb、EVP_aes_192_ecb或EVP_aes_256_ecb)

安全建议

在使用加密功能时，开发者应当注意：

始终使用标准长度的加密密钥
避免使用简单字符串作为密钥，推荐使用加密安全的随机数生成器产生密钥
在生产环境中使用前充分测试加密功能的边界情况
及时更新到包含此修复的Arrow版本，以获得更安全的加密实现

此问题的修复提升了Apache Arrow加密功能的健壮性和安全性，使其更符合行业标准和用户预期。

Apache Arrow is a multi-language toolbox for accelerated data interchange and in-memory processing

项目地址：https://gitcode.com/gh_mirrors/arrow13/arrow

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力