yt-dlp项目解析：GetCourseRu视频提取器URL更新问题深度分析

2025-04-28 02:28:16作者：裘旻烁

背景概述

近期yt-dlp项目中的GetCourseRu视频提取器出现了一个关键问题：该平台将视频播放器的域名从player02.getcourse.ru迁移到了cf-api-2.vhcdn.com。这一变更直接影响了yt-dlp对该平台视频内容的抓取能力。作为一款流行的开源视频下载工具，yt-dlp需要及时适应这类第三方平台的API变更。

技术问题本质

GetCourseRu是一个在线教育平台，其视频内容采用加密播放机制。yt-dlp原本通过解析特定格式的播放器URL来获取视频流，具体表现为：

原有效URL模式： https://player02.getcourse.ru/sign-player/?json=[JWT参数]
新URL模式：
https://cf-api-2.vhcdn.com/sign-player/?json=[JWT参数]

这种域名变更导致提取器无法识别新的视频地址格式，进而触发"Unsupported URL"错误。

解决方案实现

通过分析新老URL结构，技术人员发现虽然域名发生了变化，但核心参数结构和获取逻辑保持不变。解决方案主要涉及两个方面：

正则表达式更新：修改提取器的_VALID_URL正则模式，使其匹配新域名：
```
_VALID_URL = r'https?://cf-api-2\.vhcdn\.com/sign-player/?\?(?:[^#]+&)?json=[^#&]+'
```
播放列表获取逻辑：新域名下的播放器页面仍然包含关键信息：
- window.configs.masterPlaylistUrl：提供M3U8播放列表地址
- JWT令牌：用于验证用户身份和权限

深入技术细节

内容获取流程：
- 首先访问课程页面获取嵌入的播放器iframe
- 解析iframe中的sign-player URL
- 从响应中提取masterPlaylistUrl
- 最终通过M3U8播放列表下载视频分片
认证机制：平台采用JWT(JSON Web Token)进行双重验证：
- 第一层：sign-player URL中的JWT，包含用户ID等信息
- 第二层：masterPlaylistUrl中的JWT，仅包含用户ID
性能考量：实际测试表明，平台可能对下载速度进行了限制（约1.5-3MB/s），这可能是出于保护流媒体内容的考虑。