yfinance库获取股票数据时JSON解析错误的深度解析

2025-05-13 22:39:29作者：齐冠琰

问题现象

在使用yfinance库批量下载股票数据时，许多开发者遇到了"Expecting value: line 1 column 1 (char 0)"的JSON解析错误。这个错误通常出现在尝试获取某些特定股票代码的数据时，表现为部分股票数据能正常获取，而部分则失败。

错误原因分析

经过深入调查，发现这个问题的根源主要有以下几个方面：

Yahoo Finance API的限流机制：当请求频率过高时，Yahoo服务器会返回429(Too Many Requests)状态码，而yfinance库在特定情况下未能正确处理这种响应。
时区请求处理缺陷：yfinance在获取数据时会先发送一个获取时区的请求，当这个请求被限流时，库未能正确解析返回的429响应，导致JSON解析错误。
特殊日期数据缺失：对于某些市场假日或非交易日，Yahoo服务器可能返回空数据，这也可能触发解析错误。

解决方案

针对这一问题，开发者可以采取以下几种解决方案：

1. 使用明确的起止日期

避免使用period参数，转而明确指定start和end参数：

import yfinance as yf
import datetime as dt

end = dt.datetime.now()
start = end - dt.timedelta(days=180)  # 6个月数据

data = yf.download("AXON", interval='1wk', start=start, end=end)

2. 分批处理请求

将大批量请求分成小批次处理，避免触发Yahoo的限流机制：

import numpy as np

tickers = [...]  # 你的股票代码列表
batch_size = 10  # 每批处理10个股票

for i in np.arange(0, len(tickers), batch_size):
    batch = tickers[i:i+batch_size]
    data = yf.download(batch, interval="1d", start="2024-10-03", end="2024-10-04")

3. 使用最新开发版

yfinance的dev分支已经修复了时区请求处理缺陷，可以尝试安装开发版本：

pip install git+https://github.com/ranaroussi/yfinance.git@dev

4. 错误重试机制

实现一个简单的重试逻辑来处理临时性的限流问题：

import time
from requests.exceptions import RequestException

max_retries = 3
retry_delay = 5  # 秒

for attempt in range(max_retries):
    try:
        data = yf.download(tickers, interval="1d", start="2024-10-03", end="2024-10-04")
        break
    except RequestException:
        if attempt == max_retries - 1:
            raise
        time.sleep(retry_delay)