Bilimiao2项目中的B站分区视频历史数据获取API解析
在Bilimiao2开源项目中,开发者实现了一个名为"时光机"的功能,用于获取B站(Bilibili)各分区过去特定时间范围内的视频数据。本文将深入分析该项目使用的B站API接口及其技术实现细节。
旧版Web端API接口
Bilimiao2主要使用了B站旧版Web端的搜索API来获取分区历史视频数据。该API端点位于s.search.bilibili.com域名下,采用GET请求方式,无需任何认证即可调用。
核心请求参数
该API包含多个关键参数,开发者需要正确组合这些参数才能获取到有效数据:
- main_ver:固定值为"v3",表示API版本
- search_type:固定为"video",指定搜索类型为视频
- view_type:固定为"hot_rank",表示热度排名视图
- copy_right:固定为"-1",版权相关参数
- cate_id:数字类型,指定要查询的分区ID
- order:排序方式,可选值包括click(点击量)、scores(评分)、stow(收藏)、coin(硬币)、dm(弹幕)
- page:页码,用于分页查询
- pagesize:每页返回的视频数量
- time_from:起始时间,格式为YYYYMMDD
- time_to:结束时间,格式为YYYYMMDD
典型请求示例
一个完整的API请求示例如下:查询动画分区(分区ID为24)在2024年5月25日至2024年6月24日期间按点击量排序的视频数据,返回第一页的30条记录。
新版Web端API接口
B站还提供了新版Web端API,位于api.bilibili.com域名下。该接口与旧版功能相似,但增加了一个new_web_tag参数,值为1,表示使用新版接口。其他参数与旧版基本一致。
APP端搜索API
B站移动端也提供了相关搜索API,采用gRPC协议,接口名为bilibili.polymer.app.search.v1.SearchAll。这个接口同样支持按时间范围搜索,但需要额外提供搜索关键字参数,不如Web端API灵活。
技术实现分析
在Bilimiao2项目的代码结构中,相关API调用逻辑主要实现在RegionAPI.kt文件中。开发者通过构建包含上述参数的HTTP请求,向B站服务器获取数据,然后解析返回的JSON格式响应,最终呈现给用户。
值得注意的是,这类API通常没有公开文档,是开发者通过分析B站网页和APP的网络请求逆向工程得出的。这种实现方式虽然有效,但存在一定风险,因为B站可能会随时更改API接口或参数要求。
使用建议
对于需要批量获取B站历史视频数据的开发者,建议:
- 合理设置分页参数,避免单次请求数据量过大
- 控制请求频率,防止被B站服务器限制访问
- 做好异常处理,应对API变更或不可用情况
- 考虑使用官方提供的开放API(如果有)作为替代方案
通过Bilimiao2项目的实现,我们可以看到如何有效地利用B站的未公开API来获取特定时间范围内的分区视频数据,为视频分析和数据挖掘提供了便利。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0231
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
JoyAI-VL-Interaction-Preview京东开源首个开源、视觉驱动的实时交互模型——它能实时监控视频流,并自主决定何时发言、保持沉默或委托任务。Jinja00
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0152
kornia🐍 空间人工智能的几何计算机视觉库Python02
PaddleParallel Distributed Deep Learning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署)C++02