解决PandasAI中SemanticAgent生成文本输出时的JSON解析错误

2025-05-11 19:38:55作者：宣海椒Queenly

在使用PandasAI项目的SemanticAgent进行文本输出时，开发者可能会遇到JSON解析错误。这类错误通常表现为JSONDecodeError: Expecting value，表明系统在尝试解析JSON数据时遇到了格式问题。

问题背景

SemanticAgent是PandasAI中一个强大的组件，它能够处理结构化数据并生成语义化的输出。当开发者尝试获取文本格式的输出时，系统内部需要将数据处理为JSON格式，但有时输入数据可能不符合JSON规范，导致解析失败。

错误原因分析

JSON解析错误通常由以下几个原因引起：

输入数据不是有效的JSON字符串
数据中包含JSON规范不允许的特殊字符
数据格式虽然正确，但存在编码问题
空字符串或None值被当作JSON处理

解决方案

PandasAI的SemanticAgent类提供了validate_and_convert_json方法，专门用于处理JSON数据的验证和转换。这个方法能够：

自动检测输入是否为有效的JSON字符串
将Python字典转换为JSON字符串
处理包含多个JSON对象的列表
在数据无效时抛出明确的异常

实现示例

以下是一个完整的使用示例，展示了如何正确处理JSON数据以避免解析错误：

import pandas as pd
from pandasai.ee.agents.semantic_agent import SemanticAgent

# 准备示例数据
data_frame = pd.DataFrame({
    '产品名称': ['笔记本', '手机', '平板'],
    '销售额': [5000, 3000, 2000]
})

# 初始化SemanticAgent
agent = SemanticAgent(dfs=[data_frame])

# 准备需要验证的JSON数据
json_input = [
    '{"分析类型": "销售趋势"}',
    '{"时间范围": "最近30天"}'
]

try:
    # 验证并转换JSON数据
    validated_json = agent.validate_and_convert_json(json_input)
    
    # 使用验证后的数据进行处理
    result = agent.chat(
        prompt="分析销售数据",
        output_type="text",
        validated_data=validated_json
    )
    
    print("分析结果:", result)
    
except ValueError as e:
    print("数据处理错误:", e)
except Exception as e:
    print("发生未知错误:", e)