AWS SDK for pandas中Timestream数据库创建失败的解决方案

2025-06-16 19:12:13作者：裘晴惠Vivianne

pandas on AWS - Easy integration with Athena, Glue, Redshift, Timestream, Neptune, OpenSearch, QuickSight, Chime, CloudWatchLogs, DynamoDB, EMR, SecretManager, PostgreSQL, MySQL, SQLServer and S3 (Parquet, CSV, JSON and EXCEL).

项目地址：https://gitcode.com/gh_mirrors/aw/aws-sdk-pandas

在使用AWS SDK for pandas（awswrangler）操作Amazon Timestream服务时，开发者可能会遇到"EndpointDiscoveryRefreshFailed"错误。本文将深入分析这一问题的成因，并提供完整的解决方案。

问题现象

当开发者尝试使用awswrangler创建Timestream数据库和表时，执行以下代码会抛出异常：

import awswrangler as wr
import boto3

region = "指定区域"
database_name = "数据库名"
table_name = "表名"

boto3.setup_default_session(region_name=region)
client = boto3.client('timestream-influxdb')

wr.timestream.create_database(database_name)
wr.timestream.create_table(database_name, table_name, 
                          memory_retention_hours=1, 
                          magnetic_retention_days=1)

错误信息显示为"EndpointDiscoveryRefreshFailed: Endpoint Discovery failed to refresh the required endpoints"，表明SDK无法发现和刷新所需的终端节点。

问题根源分析

该问题主要由以下几个因素导致：

区域配置冲突：通过boto3.setup_default_session显式设置的区域可能与Timestream服务的终端节点发现机制不兼容
服务终端点发现机制：Timestream使用特殊的终端点发现机制，当区域配置不正确时，SDK无法找到对应的服务终端点
服务名称混淆：代码中使用了'timestream-influxdb'客户端，这可能不是创建常规Timestream数据库的正确服务名称

解决方案

正确配置区域

避免直接覆盖默认会话的区域设置，而是采用以下推荐方式：

import awswrangler as wr

# 推荐方式1：通过环境变量设置区域
# 在运行代码前设置AWS_DEFAULT_REGION环境变量

# 推荐方式2：在awswrangler函数中直接指定区域
wr.timestream.create_database(database_name, boto3_session=boto3.Session(region_name="us-west-2"))

使用正确的服务客户端

创建Timestream数据库应使用标准的'timestream-write'客户端，而非'timestream-influxdb'：

client = boto3.client('timestream-write', region_name="us-west-2")

完整示例代码

import awswrangler as wr
import boto3

# 配置参数
region = "us-west-2"  # 替换为你的目标区域
database_name = "sample-db"
table_name = "sample-table"

# 创建带有正确区域配置的会话
session = boto3.Session(region_name=region)

# 创建数据库和表
try:
    wr.timestream.create_database(database_name, boto3_session=session)
    wr.timestream.create_table(
        database_name, 
        table_name,
        memory_retention_hours=1,
        magnetic_retention_days=1,
        boto3_session=session
    )
    print("数据库和表创建成功")
except Exception as e:
    print(f"操作失败: {str(e)}")

注意事项

权限配置：确保执行代码的IAM角色或用户具有操作Timestream的必要权限
服务可用性：确认目标区域是否支持Timestream服务
SDK版本：保持awswrangler和boto3为最新版本，以避免已知问题
网络连接：检查网络配置，确保可以访问AWS服务终端点

通过以上方法，开发者可以成功解决Timestream操作中的终端点发现问题，顺利创建所需的数据库和表结构。

aws-sdk-pandas