AkShare项目新增股本批量数据接口的技术实现
功能概述
在金融数据分析领域,获取上市公司股本变动数据对于投资者和分析师具有重要意义。AkShare项目近期新增了一个重要功能接口——stock_hold_change_cninfo,该接口能够从巨潮资讯网批量获取上市公司股本变动数据,包括总股本、流通股本等关键指标。
技术实现细节
该接口通过访问巨潮资讯的公开API获取数据,主要实现了以下技术要点:
-
市场分类参数处理:接口支持多种市场分类查询,包括深市主板、沪市、创业板、科创板、北交所以及全部市场。通过建立symbol_map字典实现了市场代码的映射转换。
-
请求头构造:为了绕过网站的反爬机制,接口使用了JavaScript代码生成动态的mcode验证参数,这是通过py_mini_racer库执行预置的JavaScript代码实现的。
-
数据清洗与转换:获取的原始JSON数据经过以下处理步骤:
- 转换为Pandas DataFrame格式
- 重命名列使其更具可读性
- 对日期字段进行标准化处理
- 对数值字段进行类型转换
-
字段说明:接口返回的数据包含以下重要字段:
- 证券代码和简称
- 交易市场信息
- 公告日期和变动日期
- 变动原因说明
- 总股本、已流通股份、流通受限股份等量化指标
- 已流通比例百分比数据
使用场景
这一功能接口特别适用于以下分析场景:
-
股本变动趋势分析:通过批量获取多家公司的股本变动数据,可以分析市场整体的股本变化趋势。
-
个股研究:研究特定股票的流通股比例变化,评估其流动性和潜在的市场影响。
-
市场比较:比较不同市场板块(如主板与创业板)在股本结构上的差异。
-
事件研究:结合变动原因字段,分析特定事件(如增发、配股等)对公司股本结构的影响。
技术优势
相比自行爬取或处理原始数据,这一接口具有以下优势:
-
数据标准化:返回的数据已经过清洗和格式化,省去了用户自行处理的时间。
-
性能优化:通过API直接获取数据,比网页爬取更高效稳定。
-
完整性保障:接口设计考虑了各种异常情况,如日期格式异常、数值转换错误等。
-
易用性:简单的参数设计和清晰的返回结构降低了使用门槛。
实现启示
这一功能的实现展示了金融数据接口开发的几个重要原则:
-
参数灵活性:通过symbol参数支持多种查询条件,提高了接口的适用范围。
-
数据完整性:不仅返回数值数据,还保留了变动原因等文本信息,为后续分析提供了更多维度。
-
类型安全:对所有字段进行严格的类型转换,确保后续计算的准确性。
-
文档完整性:函数文档字符串详细说明了参数选项和返回内容,便于用户理解和使用。
这一功能的加入进一步丰富了AkShare项目在股本数据分析方面的能力,为金融数据分析师和研究者提供了又一实用工具。
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
unified-cache-managementUnified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。Python03
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
Spark-Scilit-X1-13B科大讯飞Spark Scilit-X1-13B基于最新一代科大讯飞基础模型,并针对源自科学文献的多项核心任务进行了训练。作为一款专为学术研究场景打造的大型语言模型,它在论文辅助阅读、学术翻译、英语润色和评论生成等方面均表现出色,旨在为研究人员、教师和学生提供高效、精准的智能辅助。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile014
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00