Google Generative AI Python SDK 多线程使用问题分析与解决方案

2025-07-03 06:37:24作者：吴年前Myrtle

问题背景

在使用Google Generative AI Python SDK进行批量处理时，开发者经常遇到多线程环境下的稳定性问题。特别是在处理大量数据或并发请求时，客户端会出现连接超时、远程断开等不可恢复的错误。

核心问题分析

SDK客户端在多线程环境下表现不稳定主要表现在以下几个方面：

连接超时问题：大多数调用会在60秒后超时失败
不可恢复性：一旦出现错误，后续所有调用都会失败
文档缺失：官方文档未明确说明线程安全假设和使用限制

根本原因

经过分析，这些问题主要源于：

客户端线程安全性不足：共享的客户端实例在多线程环境下内部状态容易损坏
连接池管理问题：底层HTTP连接在多线程竞争下可能出现资源争用
重试机制缺失：默认配置缺乏有效的重试策略处理临时性网络问题

解决方案

方案一：直接使用HTTP API

绕过SDK客户端，直接调用REST API端点：

import requests
import google.auth
from google.oauth2 import service_account

class GoogleHTTPClient:
    def __init__(self):
        self.access_token = self._get_access_token()
    
    def generate_content(self, messages):
        url = "API端点URL"
        headers = {
            'Authorization': f'Bearer {self.access_token}',
            'Content-Type': 'application/json'
        }
        response = requests.post(url, headers=headers, json=messages)
        return response.json()
    
    def _get_access_token(self):
        credentials = service_account.Credentials.from_service_account_file(
            'credentials.json',
            scopes=['https://www.googleapis.com/auth/cloud-platform']
        )
        credentials.refresh(google.auth.transport.requests.Request())
        return credentials.token

每个工作线程使用独立的HTTP客户端实例，避免资源共享导致的冲突。

方案二：配置重试策略

如果仍希望使用SDK，可以配置更健壮的重试策略：

from google.api_core import retry

retry_policy = retry.Retry(
    initial=1.0,
    maximum=60.0,
    multiplier=2.0,
    deadline=600.0,
    predicate=retry.if_exception_type(
        Exception
    )
)

response = model.generate_content(
    prompt,
    request_options={"retry": retry_policy}
)