首页
/ 三步构建智能数据管理中心:BilibiliHistoryFetcher全方位使用指南

三步构建智能数据管理中心:BilibiliHistoryFetcher全方位使用指南

2026-04-30 10:13:49作者:裘旻烁

一、功能解析:打造个人B站数据中枢

1.1 核心能力矩阵

BilibiliHistoryFetcher为您提供从数据采集到智能分析的全流程解决方案,主要功能模块包括:

功能类别 关键特性 实现文件
数据采集 观看历史全量获取、视频详情存储、动态内容抓取 fetch_bili_history.pydynamic.py
智能分析 观看行为统计、年度报告生成、内容偏好识别 viewing_analytics.pytitle_analytics.py
内容管理 视频批量下载、收藏夹同步、图片资源归档 download.pyimage_downloader.py
自动化任务 定时数据同步、邮件日志推送、任务调度管理 scheduler.pysend_log.py

1.2 AI增强功能

项目深度集成智能分析能力,通过deepseek.py模块实现:

  • 视频内容智能摘要生成
  • 观看兴趣图谱构建
  • 个性化内容推荐

二、快速上手指南:从零开始的部署之旅

2.1 环境准备

基础依赖安装

确保您的系统已安装以下组件:

  • Python 3.10+
  • SQLite 3
  • FFmpeg

🔧 执行以下命令克隆项目并安装依赖:

git clone https://gitcode.com/gh_mirrors/bi/BilibiliHistoryFetcher
cd BilibiliHistoryFetcher
pip install -r requirements.txt

2.2 核心配置

认证信息设置

🔧 编辑config/config.yaml配置B站认证信息:

SESSDATA: "您的Cookie中的SESSDATA值"
server:
  host: "0.0.0.0"
  port: 8899

⚠️ 安全提示:SESSDATA是您的个人身份凭证,请勿分享给他人或上传至公共仓库

数据库选择

项目支持多种数据库后端,通过修改配置文件切换:

2.3 服务启动

基础部署

🔧 直接运行主程序启动服务:

python main.py

容器化部署

🔧 使用Docker快速部署(CPU版本):

docker build -t bilibili-data:latest -f docker/Dockerfile.cpu .
docker run -d -v ./config:/app/config -v ./output:/app/output -p 8899:8899 --name bilibili-service bilibili-data:latest

服务启动后可访问:

  • API服务:http://localhost:8899
  • 接口文档:http://localhost:8899/docs

三、场景化应用:释放数据价值

3.1 个人数据管理中心

历史记录备份与恢复

通过export.py实现数据备份:

# 导出数据库到JSON文件
python scripts/export_to_excel.py --output ./backup/history_2023.json

数据迁移指南

只需复制整个output目录即可完成迁移,包含:

  • 主数据库文件(bilibili_history.db)
  • 视频详情数据(video_details.db)
  • 已下载的媒体资源(download_video/)

3.2 内容资源管理

批量视频下载

使用collection_download.py下载收藏夹内容:

# 下载指定收藏夹
python scripts/yutto_runner.py --fav-id 123456 --quality 80

图片资源归档

项目自动保存视频封面与UP主头像,存储路径:

  • 图片缓存:output/image_downloads/
  • 数据库记录:output/image_downloads.db

3.3 智能分析应用

年度观看报告

系统自动生成多维度统计报告,包括:

  • 观看时长与频率分析
  • 热门UP主排行
  • 观看时段分布

内容偏好挖掘

通过title_pattern_discovery.py分析观看内容特征,识别您的兴趣偏好。

四、高级配置:定制专属数据管家

4.1 核心参数优化

任务调度配置

编辑scheduler_config.yaml设置自动任务:

scheduler:
  task_timeout: 600
  retry_delay: 300
  max_retries: 3
  jobs:
    - name: daily_sync
      func: data_sync.sync_history
      trigger: cron
      hour: 3
      minute: 0

邮件通知设置

配置邮件服务接收系统通知:

email:
  smtp_server: smtp.qq.com
  smtp_port: 587
  sender: "your_email@example.com"
  password: "your_authorization_code"
  receiver: "recipient@example.com"

4.2 高级功能开关

AI分析功能启用

在配置文件中启用DeepSeek AI能力:

deepseek:
  enable: true
  api_key: "您的API密钥"
  default_model: "deepseek-reasoner"

4.3 数据安全与备份

自动备份策略

配置定时备份任务,确保数据安全:

# 添加到crontab实现每日备份
0 2 * * * zip -r /backup/bilibili_data_$(date +\%Y\%m\%d).zip /path/to/BilibiliHistoryFetcher/output

敏感数据保护

项目自动处理配置文件中的敏感信息,通过环境变量注入敏感参数:

# 运行时注入SESSDATA
SESSDATA=your_session_data python main.py

五、社区支持与资源

遇到问题或需要技术支持,欢迎加入用户交流群:

BiliFetcher用户交流群

通过以上三步,您已构建完成个人B站数据管理中心。无论是数据备份、内容管理还是智能分析,BilibiliHistoryFetcher都能为您提供全方位的解决方案,让您的B站数据资产发挥最大价值。

登录后查看全文
热门项目推荐
相关项目推荐