PandasAI 项目中 Agent 与 Connector 的集成实践

2025-05-11 22:59:29作者：彭桢灵Jeremy

Chat with your database (SQL, CSV, pandas, polars, mongodb, noSQL, etc). PandasAI makes data analysis conversational using LLMs (GPT 3.5 / 4, Anthropic, VertexAI) and RAG.

项目地址：https://gitcode.com/gh_mirrors/pan/pandas-ai

PandasAI 作为一个强大的数据分析工具，提供了灵活的数据连接方式，其中 Agent 与 Connector 的集成是其核心功能之一。本文将深入探讨如何实现这一集成，并展示其在实际应用中的价值。

基本集成原理

PandasAI 的 Agent 类可以直接接受 Connector 实例作为数据源。这种设计使得开发者能够轻松地将各种外部数据源接入到 PandasAI 的分析流程中。Connector 作为数据访问层，封装了与特定数据源的交互细节，而 Agent 则负责高级的数据处理和智能分析。

单数据源集成示例

以 Airtable 为例，我们可以创建一个 AirtableConnector 实例，并将其直接传递给 Agent：

from pandasai import Agent
from pandasai.connectors import AirtableConnector

airtable_connector = AirtableConnector(
    config={
        "token": "YOUR_API_TOKEN",
        "table": "TABLE_NAME",
        "base_id": "BASE_ID",
        "where": [["Status", "=", "In progress"]]
    }
)

agent = Agent(airtable_connector)
response = agent.chat("数据中有多少行记录？")

这种方式简洁明了，Connector 会自动处理数据获取和转换，使 Agent 能够专注于数据分析任务。

多数据源关联分析

PandasAI 更强大的功能在于支持多数据源关联分析。通过定义表间关系，可以实现跨数据源的复杂查询：

from pandasai.agent.base import Agent
from pandasai.connectors.sql import PostgreSQLConnector
from pandasai.ee.connectors.relations import ForeignKey, PrimaryKey

# 定义订单表连接器
orders_connector = PostgreSQLConnector(
    config={
        "host": "localhost",
        "database": "sales_db",
        "table": "orders"
    },
    connector_relations=[
        PrimaryKey("id"),
        ForeignKey("customer_id", "customers", "id")
    ]
)

# 定义客户表连接器
customers_connector = PostgreSQLConnector(
    config={
        "host": "localhost",
        "database": "sales_db",
        "table": "customers"
    },
    connector_relations=[PrimaryKey("id")]
)

# 创建支持多表关联的Agent
agent = Agent([orders_connector, customers_connector])

# 执行跨表查询
response = agent.chat("按国家统计订单数量")