BilibiliHistoryFetcher：数据掌控与隐私保护的B站观看历史管理工具

2026-04-07 11:44:23作者：齐冠琰

你是否曾在深夜刷到一个优质科普视频，半年后想重温却发现淹没在历史记录的海洋中？是否担心平台数据政策变更导致多年观看记录丢失？这些痛点背后，是我们对个人数据主权的渴望。BilibiliHistoryFetcher正是为解决这些问题而生——一个将B站观看数据完全掌控在你手中的开源工具，让每一条观看记录都成为可追溯、可分析、可传承的个人数字资产。

解锁数据自主权：从平台依赖到本地掌控

在这个数据为王的时代，你的观看历史远不止是浏览记录，更是个人兴趣图谱与知识体系的珍贵映射。BilibiliHistoryFetcher通过本地数据库存储技术，将原本分散在云端的观看数据完整保存到你的设备中，实现真正意义上的数据主权回归。

与平台自带的历史记录功能相比，本地存储带来三大核心优势：永久保存不会因平台政策调整而丢失、离线访问不受网络限制、数据格式开放支持自由导出。某用户使用后反馈："找回了三年前看过的绝版纪录片，这种失而复得的感觉难以言喻。"

📊 实操小贴士：定期通过"数据完整性检查"功能（scripts/check_data_integrity.py）验证本地数据库状态，建议每月执行一次全量备份。

构建个人知识图谱：跨设备观看记录无缝衔接

现代人的观看行为早已跨越单一设备，手机通勤时刷番、平板午餐时看教程、电脑睡前看直播成为常态。BilibiliHistoryFetcher的智能同步系统打破设备边界，实现观看记录的无缝衔接。

系统采用增量同步算法，仅更新变化的记录，比传统全量同步效率提升80%。无论你在哪个设备观看，数据都会自动汇总到中央数据库，形成完整的个人观看时间线。更支持按内容类型、UP主、观看日期等多维度检索，让寻找特定视频不再像大海捞针。

⚙️ 实操小贴士：在config/scheduler_config.yaml中设置每日凌晨2点自动同步，既不影响使用体验，又能确保数据及时更新。

深度内容挖掘：从观看记录到个性化洞察

仅仅保存数据远远不够，更重要的是从中发掘价值。BilibiliHistoryFetcher提供的分析模块如同你的私人数据分析师，将枯燥的观看记录转化为 actionable insights：

时间分配雷达图：直观显示你在不同类型内容上的时间投入比例
兴趣演化曲线：追踪半年内观看偏好的变化趋势
UP主关系网络：发现你常看的创作者之间的关联

这些分析结果不仅帮助你更好地了解自己，还能基于历史数据推荐相似优质内容，形成"观看-分析-发现"的良性循环。

🔍 实操小贴士：尝试结合"标题模式发现"功能（routers/title_pattern_discovery.py），挖掘你潜意识中的内容偏好关键词。

实施路径：从安装到数据掌控的三步进阶

环境准备与部署

目标：搭建完整运行环境
方法：

克隆项目仓库

git clone https://gitcode.com/gh_mirrors/bi/BilibiliHistoryFetcher

安装依赖包
```
pip install -r requirements.txt
```
配置认证信息
- 复制config/config.yaml.example为config/config.yaml
- 填入B站SESSDATA（获取方法：B站网页端F12→Application→Cookies→SESSDATA）

验证：执行python scripts/check_data_integrity.py，显示"环境检查通过"即完成准备。

⚠️ 技术参数：

最低配置：Python 3.10+, SQLite 3.36+

推荐配置：4GB内存，5GB可用磁盘空间（用于存储视频缓存）

首次数据同步

目标：获取历史观看记录
方法：

启动主程序
```
python main.py
```
访问本地服务
- 打开浏览器访问http://localhost:8899
- 点击"数据同步"→"全量同步"

验证：同步完成后，在"数据统计"页面查看总观看条数与总时长。

个性化配置

目标：定制符合个人习惯的使用方式
方法：

设置自动同步任务
- 编辑config/scheduler_config.yaml
- 设置sync_interval: 1（每日同步）
配置导出偏好
- 在"设置"→"导出选项"中勾选Excel和JSON格式
- 设置自动导出路径

验证：等待24小时后检查是否自动生成当日观看报告。

进阶技巧：释放工具全部潜力

点击展开高级功能设置

视频自动存档系统

通过配置collection_download.py，可实现"收藏即下载"的自动化流程：

# 在config.yaml中添加
auto_download:
  enable: true
  quality: 80  # 1080P
  path: ./downloads
  max_size: 5  # GB

AI内容摘要生成

利用DeepSeek API为观看视频生成智能摘要：

在routers/deepseek.py中填入API密钥
开启"自动摘要"功能
摘要结果将存储在video_summary表中

多设备同步方案

通过网络共享数据库实现多设备数据统一：

服务端：设置数据库共享路径
客户端：配置remote_db_path指向共享地址

价值升华：从数据管理到数字生活方式

当我们将观看历史从平台的临时存储转变为个人的永久数字资产，本质上是在构建属于自己的知识管理系统。BilibiliHistoryFetcher不仅是一个工具，更是一种数字生活方式的实践——它让我们在信息爆炸的时代保持对个人数据的掌控力，将碎片化的观看行为转化为系统化的知识积累。

随着使用时间的增长，你会发现这个工具逐渐成为数字生活的记忆锚点：重温某个视频时，你能看到当时的观看日期和心境；回顾年度报告时，能清晰感知兴趣的变迁轨迹。这种数据连续性带来的自我认知提升，正是数字时代最珍贵的个人财富。

BiliFetcher用户交流群

加入用户社区，与 thousands of 数据掌控者一起探索更多可能性。你的每一条观看记录，都值得被妥善保存和深度发掘。

BilibiliHistoryFetcher

项目地址：https://gitcode.com/gh_mirrors/bi/BilibiliHistoryFetcher

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

458

453

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。