Jellyfin MetaShark 元数据刮削全面攻略:高效解决中文影视信息获取难题
Jellyfin MetaShark 是一款专为中文用户打造的元数据刮削插件,能够智能整合豆瓣和 TMDB 数据源,为中文影视作品提供精准的元数据支持,解决非英语媒体库信息混乱、匹配错误等核心痛点。
工具定位介绍
MetaShark 作为 Jellyfin 生态中的中文优化插件,专注于解决中文影视元数据获取难题。通过双数据源智能融合技术,它能精准识别中文影视作品信息,包括片名、演职员表、剧情简介、海报等关键元数据,让中文媒体库管理变得高效而精准。
MetaShark 插件的标志性设计,融合了科技感与速度感,象征其高效的元数据刮削能力
核心优势分析
🔧 双数据源智能整合技术
创新性地将豆瓣的中文元数据优势与 TMDB 的结构化数据相结合,实现优势互补。当豆瓣数据不完整时,自动调用 TMDB 补充剧集信息,确保元数据的全面性和准确性。
📌 中文影视识别优化引擎
针对中文影视命名特点开发的专用解析算法,能够处理各种复杂命名格式,包括别名、系列作品、年份标注等特殊情况,大幅提高中文影视作品的识别准确率。
⚡ 多维度匹配机制
通过名称、年份、演员等多维度信息进行综合匹配,有效解决同名作品识别难题。内置的 JaroWinkler 字符串相似度算法,能够在名称不完全匹配的情况下找到最佳结果。
🛡️ 防封禁与网络优化
内置请求频率控制和代理支持功能,可有效避免因频繁请求导致的 IP 封禁问题,同时优化网络请求策略,确保在复杂网络环境下的稳定运行。
常见应用场景与解决方案
经典影视作品识别错误问题
问题描述:当文件夹命名为"红楼梦 (1987)"时,普通刮削工具可能错误匹配到其他版本或同名作品。
解决方案:
- 确保文件夹名称包含准确年份信息,如"红楼梦 (1987)"
- 在插件设置中启用"严格年份匹配"选项
- 如仍有问题,可在文件名中添加豆瓣ID,格式为"红楼梦 (1987) [tt0093565]"
动画作品信息缺失问题
问题描述:许多动画作品尤其是日本动漫,在常规数据源中缺乏中文信息或匹配混乱。
解决方案:
- 利用 MetaShark 内置的 AnitomySharp 动画命名解析引擎
- 保持动画文件命名规范,包含年份、集数等信息
- 在插件配置中优先启用豆瓣动画数据源
批量刮削效率低下问题
问题描述:媒体库中存在大量未刮削文件,手动处理耗时费力。
解决方案:
- 使用 MetaShark 的批量刮削功能,在"计划任务"中设置自动刮削
- 配置合理的并发请求数量,避免服务器负载过高
- 启用增量刮削模式,仅处理新增文件
分步骤操作指南
1. 插件安装
git clone https://gitcode.com/gh_mirrors/je/jellyfin-plugin-metashark
cd jellyfin-plugin-metashark
dotnet build --configuration Release
将生成的插件文件复制到 Jellyfin 插件目录,通常位于:
- Linux:
/var/lib/jellyfin/plugins/ - Windows:
C:\ProgramData\Jellyfin\Server\plugins\
2. 基础配置
- 登录 Jellyfin 管理界面,进入"控制台" → "插件"
- 找到 MetaShark 插件并点击"配置"
- 配置数据源优先级:
- 主数据源:豆瓣
- 辅助数据源:TMDB
- 设置 API 请求间隔(建议设为 2-3 秒)
- 点击"保存"应用配置
新手注意事项:首次使用前请确保 Jellyfin 服务器能够访问互联网,特别是豆瓣和 TMDB 网站。如访问受限,需配置代理服务器。
3. 媒体库设置
- 进入"控制台" → "媒体库"
- 选择需要应用 MetaShark 的媒体库,点击"编辑"
- 在"元数据下载器"部分:
- 勾选"MetaShark"
- 将其移至优先级最高位置
- 在"内容类型"中选择正确的媒体类型
- 保存设置并刷新媒体库
4. 手动刮削操作
- 进入媒体库,找到未正确刮削的项目
- 点击"..." → "识别"
- 在弹出窗口中:
- 确认或修改识别信息
- 如需要,可手动输入豆瓣ID或TMDBID
- 点击"确定"开始刮削
高级应用技巧
自定义命名规则
通过修改配置文件自定义命名解析规则:
{
"NamingPatterns":
"^(?<title>.+?)[ \\.\\[\\([ \\.\\]\\)]",
"^(?<title>.+?) \\."
]
}
提示:自定义命名规则需要一定的正则表达式知识,建议先备份原始配置。
数据源优先级精细调整
在高级设置中,可以针对不同媒体类型设置不同的数据源优先级:
- 电影:豆瓣 > TMDB
- 电视剧:TMDB > 豆瓣
- 动画:豆瓣 > TMDB
API 密钥配置
为提高访问速率和稳定性,建议配置各数据源的 API 密钥:
- 豆瓣 API:无需密钥(使用模拟浏览器请求)
- TMDB API:在 TMDB 网站 注册获取 API 密钥
- 在插件配置页面填入 API 密钥
批量修正元数据
使用插件提供的命令行工具进行批量操作:
# 重新刮削所有电影
dotnet MetaShark.Cli.dll --action refresh --type movie
# 修复特定目录下的剧集信息
dotnet MetaShark.Cli.dll --action fix --path /media/tvshows/
未来发展展望
MetaShark 团队计划在未来版本中重点优化以下功能:
多语言支持增强
将增加对粤语、日语等多语言影视内容的识别支持,解决方言影视作品的刮削难题。
AI 辅助识别
引入机器学习模型,通过分析海报、剧情简介等多维度信息提高识别准确率,特别是针对稀有或小众作品。
社区元数据贡献
建立用户贡献机制,允许用户提交和共享元数据修正,形成社区驱动的元数据优化生态。
深度集成 Jellyfin
与 Jellyfin 核心功能更深度整合,包括实时元数据更新、智能推荐等功能,提升整体用户体验。
通过持续优化和迭代,MetaShark 致力于成为中文用户管理媒体库的首选工具,让每一位用户都能轻松拥有完美组织的中文媒体库。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0171
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook092
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
BitCPM-CANN-8BBitCPM-CANN 是首个基于华为昇腾 NPU 原生构建的端到端 1.58 位(三值化)大语言模型训练系统。该系统将量化感知训练(QAT)集成到 Megatron-LM 框架中,并结合 MindSpeed 加速,覆盖了从自定义三值算子到基于昇腾 910B 的分布式并行训练的完整训练栈。Python00
MiniCPM5-1BMiniCPM5-1B,这是 MiniCPM5 系列的首款模型。它是一个专为端侧、本地部署和资源受限场景打造的 10 亿参数密集型 Transformer 模型,达到了 10 亿参数级开源模型的 SOTA 水平Jinja00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0239
