AKShare项目股票实时行情接口优化实践
2025-05-20 19:13:43作者:农烁颖Land
问题背景
在使用AKShare项目的stock_zh_a_spot_em()接口获取沪深京A股实时行情数据时,发现该接口默认只能返回200条数据,无法获取完整的市场数据。这对于需要全量市场数据的分析场景存在明显限制。
技术分析
通过分析AKShare项目源代码,发现该接口底层调用了东方财富网的API,其核心问题在于:
- 接口默认只请求第一页数据(pn=1)
- 未实现分页获取机制
- 对空数据情况处理不够完善
解决方案实现
我们通过以下技术手段解决了这个问题:
1. 接口参数优化
修改原始函数,增加page参数控制请求页码:
def stock_zh_a_spot_em(page=1) -> pd.DataFrame:
url = "https://82.push2.eastmoney.com/api/qt/clist/get"
params = {
"pn": page, # 关键修改:增加分页参数
"pz": "20000", # 每页数量设为最大值
# 其他参数保持不变...
}
2. 空数据处理机制
增加对空数据的判断,当无数据时抛出特定异常:
data_json = r.json()
if data_json["data"] is None:
raise EOFError("end of page") # 自定义异常标识数据结束
3. 完整数据获取方案
编写循环逻辑自动获取所有分页数据:
try:
page = 1
while True:
df = stock_zh_a_spot_em(page)
# 处理或保存数据
page += 1
except EOFError:
print("所有数据获取完成")
技术要点说明
-
分页参数:东方财富API通过pn参数控制页码,pz控制每页数量
-
性能优化:将每页数量设为最大值20000,减少请求次数
-
异常处理:使用自定义EOFError优雅地处理数据结束情况
-
数据完整性:确保获取所有分页数据,不遗漏任何股票信息
应用场景
该优化方案特别适用于以下场景:
- 全市场实时监控系统
- 量化交易策略的股票池构建
- 市场整体行情分析
- 数据仓库的每日数据采集
注意事项
- 高频请求可能导致IP被封禁,建议添加适当延时
- 数据量较大时注意内存管理
- 生产环境建议增加重试机制和异常日志
- 定期检查API参数有效性,防止接口变更导致失败
通过这种优化方式,我们不仅解决了原始接口的数据量限制问题,还建立了一套健壮的数据获取机制,为后续的股票数据分析工作奠定了良好基础。
登录后查看全文
热门项目推荐
相关项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00
项目优选
收起
deepin linux kernel
C
28
15
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
663
4.27 K
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.54 K
894
Ascend Extension for PyTorch
Python
506
612
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
392
290
暂无简介
Dart
909
219
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
69
21
昇腾LLM分布式训练框架
Python
142
168
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
940
867
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
1.33 K
108