PandasAI项目中的SSL证书验证问题分析与解决方案

2025-05-11 16:09:08作者：史锋燃Gardner

Chat with your database (SQL, CSV, pandas, polars, mongodb, noSQL, etc). PandasAI makes data analysis conversational using LLMs (GPT 3.5 / 4, Anthropic, VertexAI) and RAG.

项目地址：https://gitcode.com/gh_mirrors/pan/pandas-ai

问题背景

在使用PandasAI项目进行机器学习模型训练时，部分用户遇到了SSL证书验证失败的问题。具体表现为当调用.train函数时，系统抛出SSLCertVerificationError错误，提示"certificate verify failed: self-signed certificate in certificate chain"。

问题本质

这个问题的核心在于SSL/TLS握手过程中证书验证失败。现代Python环境默认会验证SSL证书的有效性，而当遇到以下情况时会导致验证失败：

服务器使用了自签名证书
证书链不完整
系统证书存储中缺少必要的根证书
企业网络环境中存在中间人代理

技术分析

在PandasAI项目中，当使用自定义LLM进行训练时，系统会通过HTTPS与API服务器建立安全连接。默认情况下，Python的requests库会验证服务器证书的有效性。当证书链中包含自签名证书或证书不被信任时，就会触发安全异常。

解决方案

临时解决方案（开发环境）

对于开发测试环境，可以临时禁用SSL验证：

import requests
from pandasai import Agent

class CustomAgent(Agent):
    def _make_request(self, url, data):
        response = requests.post(url, json=data, verify=False)
        return response.json()

注意：这种方法会降低安全性，不建议在生产环境中使用。

企业环境特殊处理

在企业网络环境中，通常会遇到以下特殊情况：

代理拦截：企业防火墙可能拦截HTTPS连接
内部CA：使用内部证书颁发机构

解决方案包括：

配置系统信任企业根证书
设置代理参数：

proxies = {
    'http': 'http://proxy.example.com:8080',
    'https': 'http://proxy.example.com:8080'
}
response = requests.post(url, json=data, verify=False, proxies=proxies)