首页
/ Apache Druid 集成 Pure Storage S3 存储的解决方案

Apache Druid 集成 Pure Storage S3 存储的解决方案

2025-05-16 15:22:14作者:冯爽妲Honey

背景介绍

Apache Druid 作为一款高性能的实时分析数据库,通常需要与对象存储服务集成来持久化数据。在实际生产环境中,用户可能会选择不同的对象存储解决方案,其中 Pure Storage FlashBlade 是一种高性能的存储系统,提供了兼容 S3 协议的接口。然而,在将 Druid 与 Pure Storage S3 集成时,用户可能会遇到写入失败的问题。

问题现象

当配置 Druid 使用 Pure Storage 作为后端存储时,系统会出现以下错误:

java.lang.RuntimeException: java.io.IOException: com.amazonaws.services.s3.model.AmazonS3Exception: 
A header you provided implies functionality that is not implemented.
(Service: Amazon S3; Status Code: 501; Error Code: NotImplemented)

具体表现为:

  1. 能够从 Pure Storage S3 读取数据段(get操作)
  2. 能够将数据保存到本地目录
  3. 但无法将数据段写入(push操作)到 Pure Storage S3

根本原因分析

这个问题的本质在于 Pure Storage 的 S3 实现与标准 AWS S3 服务存在一些功能差异。错误信息中的"501 Not Implemented"状态码表明,Druid 尝试使用的某些 S3 API 功能在 Pure Storage 的实现中尚未支持。

经过深入分析,问题主要出在 Druid 默认会尝试使用 S3 的访问控制列表(ACL)功能,而 Pure Storage 的 S3 实现可能不完全支持这些 ACL 操作。

解决方案

要解决这个问题,需要在 Druid 的配置中显式禁用 ACL 功能。具体配置如下:

对于主存储:

druid_storage_disableAcl: "true"

对于索引器日志存储:

druid_indexer_logs_disableAcl: "true"

完整配置建议

除了禁用 ACL 外,针对 Pure Storage S3 的完整推荐配置还包括:

druid_storage_type: s3
druid_storage_baseKey: warehouse
druid_storage_bucket: druid
druid_storage_storageDirectory: s3a://druid/warehouse/
druid_indexer_logs_type: s3
druid_indexer_logs_directory: s3a://druid/logs/
druid_indexer_logs_s3Bucket: druid
druid_indexer_logs_s3Prefix: logs
druid_storage_useS3aSchema: "true"
druid_s3_disableChunkedEncoding: "true"
druid_s3_credential: "your-credential"
druid_s3_secret: "your-secret"
druid_s3_protocol: http
druid_s3_enablePathStyleAccess: "true"
druid_s3_endpoint_signingRegion: us-east-1
druid_s3_endpoint_url: http://your-pure-storage-endpoint
druid_s3_forceGlobalBucketAccessEnabled: "true"
druid_storage_disableAcl: "true"
druid_indexer_logs_disableAcl: "true"

技术原理

禁用 ACL 后,Druid 将不再尝试设置对象级别的访问权限,而是依赖存储桶级别的权限控制。这种模式与许多非 AWS 的 S3 兼容存储服务更加匹配,特别是那些不完全实现 S3 ACL 功能的存储系统。

验证与测试

在实际环境中验证该解决方案时,需要注意:

  1. 确保 Pure Storage S3 服务正常运行
  2. 验证配置中的 endpoint URL 和认证信息正确无误
  3. 检查存储桶的权限设置是否允许 Druid 进行读写操作
  4. 监控初始数据写入过程,确认没有其他兼容性问题

总结

通过禁用 S3 ACL 功能,Druid 可以成功与 Pure Storage FlashBlade S3 服务集成。这个解决方案不仅适用于 Pure Storage,对于其他不完全兼容标准 S3 API 的对象存储服务也有参考价值。在实际部署时,建议先在小规模环境中验证配置,确认一切正常后再推广到生产环境。

对于企业用户来说,理解不同存储服务的 API 兼容性差异非常重要,这有助于在架构设计阶段就做出合理的技术选型,避免后期集成时遇到类似问题。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
261
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
860
511
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
596
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K