Jellyfin MetaShark 元数据刮削全面攻略:高效解决中文影视信息获取难题
Jellyfin MetaShark 是一款专为中文用户打造的元数据刮削插件,能够智能整合豆瓣和 TMDB 数据源,为中文影视作品提供精准的元数据支持,解决非英语媒体库信息混乱、匹配错误等核心痛点。
工具定位介绍
MetaShark 作为 Jellyfin 生态中的中文优化插件,专注于解决中文影视元数据获取难题。通过双数据源智能融合技术,它能精准识别中文影视作品信息,包括片名、演职员表、剧情简介、海报等关键元数据,让中文媒体库管理变得高效而精准。
MetaShark 插件的标志性设计,融合了科技感与速度感,象征其高效的元数据刮削能力
核心优势分析
🔧 双数据源智能整合技术
创新性地将豆瓣的中文元数据优势与 TMDB 的结构化数据相结合,实现优势互补。当豆瓣数据不完整时,自动调用 TMDB 补充剧集信息,确保元数据的全面性和准确性。
📌 中文影视识别优化引擎
针对中文影视命名特点开发的专用解析算法,能够处理各种复杂命名格式,包括别名、系列作品、年份标注等特殊情况,大幅提高中文影视作品的识别准确率。
⚡ 多维度匹配机制
通过名称、年份、演员等多维度信息进行综合匹配,有效解决同名作品识别难题。内置的 JaroWinkler 字符串相似度算法,能够在名称不完全匹配的情况下找到最佳结果。
🛡️ 防封禁与网络优化
内置请求频率控制和代理支持功能,可有效避免因频繁请求导致的 IP 封禁问题,同时优化网络请求策略,确保在复杂网络环境下的稳定运行。
常见应用场景与解决方案
经典影视作品识别错误问题
问题描述:当文件夹命名为"红楼梦 (1987)"时,普通刮削工具可能错误匹配到其他版本或同名作品。
解决方案:
- 确保文件夹名称包含准确年份信息,如"红楼梦 (1987)"
- 在插件设置中启用"严格年份匹配"选项
- 如仍有问题,可在文件名中添加豆瓣ID,格式为"红楼梦 (1987) [tt0093565]"
动画作品信息缺失问题
问题描述:许多动画作品尤其是日本动漫,在常规数据源中缺乏中文信息或匹配混乱。
解决方案:
- 利用 MetaShark 内置的 AnitomySharp 动画命名解析引擎
- 保持动画文件命名规范,包含年份、集数等信息
- 在插件配置中优先启用豆瓣动画数据源
批量刮削效率低下问题
问题描述:媒体库中存在大量未刮削文件,手动处理耗时费力。
解决方案:
- 使用 MetaShark 的批量刮削功能,在"计划任务"中设置自动刮削
- 配置合理的并发请求数量,避免服务器负载过高
- 启用增量刮削模式,仅处理新增文件
分步骤操作指南
1. 插件安装
git clone https://gitcode.com/gh_mirrors/je/jellyfin-plugin-metashark
cd jellyfin-plugin-metashark
dotnet build --configuration Release
将生成的插件文件复制到 Jellyfin 插件目录,通常位于:
- Linux:
/var/lib/jellyfin/plugins/ - Windows:
C:\ProgramData\Jellyfin\Server\plugins\
2. 基础配置
- 登录 Jellyfin 管理界面,进入"控制台" → "插件"
- 找到 MetaShark 插件并点击"配置"
- 配置数据源优先级:
- 主数据源:豆瓣
- 辅助数据源:TMDB
- 设置 API 请求间隔(建议设为 2-3 秒)
- 点击"保存"应用配置
新手注意事项:首次使用前请确保 Jellyfin 服务器能够访问互联网,特别是豆瓣和 TMDB 网站。如访问受限,需配置代理服务器。
3. 媒体库设置
- 进入"控制台" → "媒体库"
- 选择需要应用 MetaShark 的媒体库,点击"编辑"
- 在"元数据下载器"部分:
- 勾选"MetaShark"
- 将其移至优先级最高位置
- 在"内容类型"中选择正确的媒体类型
- 保存设置并刷新媒体库
4. 手动刮削操作
- 进入媒体库,找到未正确刮削的项目
- 点击"..." → "识别"
- 在弹出窗口中:
- 确认或修改识别信息
- 如需要,可手动输入豆瓣ID或TMDBID
- 点击"确定"开始刮削
高级应用技巧
自定义命名规则
通过修改配置文件自定义命名解析规则:
{
"NamingPatterns":
"^(?<title>.+?)[ \\.\\[\\([ \\.\\]\\)]",
"^(?<title>.+?) \\."
]
}
提示:自定义命名规则需要一定的正则表达式知识,建议先备份原始配置。
数据源优先级精细调整
在高级设置中,可以针对不同媒体类型设置不同的数据源优先级:
- 电影:豆瓣 > TMDB
- 电视剧:TMDB > 豆瓣
- 动画:豆瓣 > TMDB
API 密钥配置
为提高访问速率和稳定性,建议配置各数据源的 API 密钥:
- 豆瓣 API:无需密钥(使用模拟浏览器请求)
- TMDB API:在 TMDB 网站 注册获取 API 密钥
- 在插件配置页面填入 API 密钥
批量修正元数据
使用插件提供的命令行工具进行批量操作:
# 重新刮削所有电影
dotnet MetaShark.Cli.dll --action refresh --type movie
# 修复特定目录下的剧集信息
dotnet MetaShark.Cli.dll --action fix --path /media/tvshows/
未来发展展望
MetaShark 团队计划在未来版本中重点优化以下功能:
多语言支持增强
将增加对粤语、日语等多语言影视内容的识别支持,解决方言影视作品的刮削难题。
AI 辅助识别
引入机器学习模型,通过分析海报、剧情简介等多维度信息提高识别准确率,特别是针对稀有或小众作品。
社区元数据贡献
建立用户贡献机制,允许用户提交和共享元数据修正,形成社区驱动的元数据优化生态。
深度集成 Jellyfin
与 Jellyfin 核心功能更深度整合,包括实时元数据更新、智能推荐等功能,提升整体用户体验。
通过持续优化和迭代,MetaShark 致力于成为中文用户管理媒体库的首选工具,让每一位用户都能轻松拥有完美组织的中文媒体库。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0101- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
