PyBroker项目中YFinance数据源日志格式化问题分析

2025-07-01 12:21:46作者：吴年前Myrtle

问题背景

在使用PyBroker框架的YFinance数据源组件时，开发者可能会遇到日志格式化异常的问题。具体表现为当调用YFinance.query()方法获取股票数据时，系统会抛出"not all arguments converted during string formatting"的日志格式化错误。

问题现象

当执行以下典型代码时：

import pybroker
from pybroker import YFinance

yfinance = YFinance()
pybroker.enable_data_source_cache("yfinance")
df = yfinance.query(["AAPL", "MSFT"], start_date="3/1/2021", end_date="3/1/2022")

系统会在日志记录过程中产生格式化错误，错误信息显示日志消息与提供的参数不匹配。

问题根源

通过分析PyBroker源码可以发现，问题出在log.py文件中的info_loaded_bar_data方法实现上。该方法在构造日志消息时存在两个潜在问题：

字符串拼接方式不一致：部分使用f-string直接插值，部分又采用参数传递方式
参数分隔不当：在f-string表达式后误加了逗号，导致字符串被分割为多个参数

具体问题代码如下：

def info_loaded_bar_data(self, symbols, start_date, end_date, timeframe):
    self._info(
        "Loaded:\n"
        f"namespace={self._scope.data_source_cache_ns}\n"
        f"{start_date} to {end_date}\n",  # 此处逗号导致问题
        f"timeframe: {timeframe}\n", 
        f"{sorted(symbols)}",
    )

解决方案

对于开发者而言，可以采取以下两种解决方案：

升级依赖库：确保yfinance库更新到最新版本(0.2.55或更高)，因为旧版本可能存在兼容性问题

pip install -U yfinance

临时修改源码：如果急需解决问题，可以自行修改PyBroker的log.py文件，统一日志消息的构建方式：

def info_loaded_bar_data(self, symbols, start_date, end_date, timeframe):
    msg = (
        "Loaded:\n"
        f"namespace={self._scope.data_source_cache_ns}\n"
        f"{start_date} to {end_date}\n"
        f"timeframe: {timeframe}\n"
        f"{sorted(symbols)}"
    )
    self._info(msg)