3分钟搞定B站字幕提取与SRT转换:BiliBiliCCSubtitle工具实操指南
还在为提取B站字幕烦恼?手动复制耗时费力,格式不兼容主流播放器?BiliBiliCCSubtitle工具提供免费B站字幕下载与批量字幕转换解决方案,让你轻松获取视频字幕内容。无论是外语学习、视频二次创作还是内容收藏,这款轻量级工具都能帮你高效处理字幕问题。
🔍 哪些场景需要用到字幕提取工具?
外语学习:导出双语字幕制作学习资料
观看日语动漫或英语教程时,通过提取双语字幕制作对照笔记,能显著提升学习效率。例如下载《BBC纪录片》的中英文字幕,导入Anki制作单词卡片,实现沉浸式语言学习。
视频创作:快速获取素材字幕
二次创作UP主可提取原视频字幕作为剪辑参考,避免手动听抄错误。某游戏解说UP主使用该工具批量获取游戏攻略视频字幕,将关键台词作为视频剪辑的时间轴标记。
内容存档:永久保存珍贵字幕资源
部分B站视频因版权问题下架后,字幕也会随之消失。通过提前下载字幕,可永久保存课程、讲座等珍贵内容的文字资料。
📝 从零开始的字幕提取流程
准备工作:搭建本地运行环境
# 克隆项目代码库
git clone https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle
# 进入项目目录
cd BiliBiliCCSubtitle
# 编译项目(需提前安装cmake和g++)
cmake . && make
[!TIP] 编译失败时检查是否安装依赖:sudo apt-get install cmake g++ libcurl4-openssl-dev
基础操作:单视频字幕下载
# 基本用法:下载指定URL的字幕
./BiliBiliCCSubtitle --url "https://www.bilibili.com/video/BV1xx4y1z789"
# 带格式转换:直接输出SRT文件
./BiliBiliCCSubtitle --url "https://www.bilibili.com/video/BV1xx4y1z789" --format srt
[!TIP] 成功运行后,字幕文件会保存在当前目录,命名格式为"视频标题_字幕语言.srt"
⚙️ 进阶技巧:释放工具全部潜力
如何批量下载分P字幕?
通过脚本循环调用工具实现多P下载:
# 创建批量下载脚本(保存为batch_download.sh)
for i in {1..5}; do
./BiliBiliCCSubtitle --url "https://www.bilibili.com/video/BV1xx4y1z789/?p=$i" --output "part_$i.srt"
done
# 赋予执行权限并运行
chmod +x batch_download.sh && ./batch_download.sh
如何导出双语对照字幕?
利用工具的多语言下载功能,配合文本处理工具合并字幕:
# 分别下载中文字幕和英文字幕
./BiliBiliCCSubtitle --url "视频URL" --lang zh-CN --output chinese.srt
./BiliBiliCCSubtitle --url "视频URL" --lang en-US --output english.srt
# 使用sed命令简单合并(实际使用建议用专业字幕合并工具)
paste -d '|' chinese.srt english.srt > bilingual.srt
如何设置字幕保存路径?
通过--output参数指定保存位置和文件名:
# 保存到指定目录并自定义文件名
./BiliBiliCCSubtitle --url "视频URL" --output "/home/user/subtitles/lecture_01.srt"
❌ 常见操作误区与解决方案
误区1:直接使用视频播放页URL导致下载失败
B站视频有播放页URL和真实视频URL之分,需使用包含BV号的标准播放页链接,如"https://www.bilibili.com/video/BV1xx4y1z789",而非带有额外参数的URL。
误区2:忽略字幕语言参数导致下载错误语言
部分视频默认返回中文简体字幕,如需其他语言需明确指定:
# 下载日语字幕示例
./BiliBiliCCSubtitle --url "视频URL" --lang ja-JP
误区3:未处理特殊字符导致文件保存失败
当视频标题包含特殊字符时,建议使用--output参数手动指定文件名:
# 避免标题特殊字符导致的保存问题
./BiliBiliCCSubtitle --url "视频URL" --output "safe_filename.srt"
🧩 技术原理简明解析
字幕解析原理就像快递分拣系统:工具首先向B站服务器发送请求获取视频信息(相当于查询快递单号),服务器返回包含字幕地址的数据包(相当于快递物流信息),工具再根据地址下载原始字幕文件(相当于收取包裹),最后通过内置转换器将JSON格式转换为SRT格式(相当于拆包整理)。
整个过程中,CURL库负责网络请求(相当于快递员),JSON解析模块处理原始数据(相当于包裹分拣员),格式转换引擎则完成最终的格式转换工作(相当于物品整理员)。
📌 使用注意事项
- 本工具仅用于个人学习研究,下载字幕请遵守B站用户协议和版权法规
- 遇到API变更导致工具失效时,可通过项目仓库获取更新
- 转换后的SRT文件建议用Notepad++等编辑器检查编码,确保显示正常
- 批量下载时建议设置适当间隔,避免给服务器造成过大负担
通过以上步骤,你已经掌握了BiliBiliCCSubtitle工具的核心用法。无论是简单的单视频字幕下载,还是复杂的批量处理需求,这款工具都能提供稳定高效的解决方案,让字幕提取工作不再成为创作或学习的障碍。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust079- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
Hy3-previewHy3 preview 是由腾讯混元团队研发的2950亿参数混合专家(Mixture-of-Experts, MoE)模型,包含210亿激活参数和38亿MTP层参数。Hy3 preview是在我们重构的基础设施上训练的首款模型,也是目前发布的性能最强的模型。该模型在复杂推理、指令遵循、上下文学习、代码生成及智能体任务等方面均实现了显著提升。Python00