Plex-Meta-Manager中正则表达式标签属性过滤问题的分析与解决

2025-06-28 12:36:17作者：宣海椒Queenly

Python script to update metadata information for items in plex as well as automatically build collections and playlists. The Wiki Documentation is linked below.

项目地址：https://gitcode.com/gh_mirrors/pl/Plex-Meta-Manager

问题背景

在Plex-Meta-Manager项目的最新nightly版本(1.20.0-nightly43)中，发现使用正则表达式(regex)对标签属性进行过滤时存在功能异常。具体表现为当对标签(label)或语言(language)属性应用正则过滤时，系统生成的过滤条件与预期不符，导致过滤结果不正确。

问题详细分析

标签名称过滤问题

当用户尝试使用正则表达式过滤标签名称时，例如配置如下YAML过滤条件：

filters:
  - label.regex: '(?i)Language.*'

系统内部会生成一个基于标签ID的过滤条件，如： Collection Filter label.regex: ['191386']

然后尝试将这个标签ID与标签名称进行匹配，这显然逻辑上是错误的。正确的做法应该是直接使用正则表达式匹配标签名称本身。

语言名称过滤问题

类似的问题也出现在语言过滤场景中。例如配置：

filters:
  - audio_language.regex: '(?i)\bJapanese\b'

系统会生成基于2字母语言代码的过滤条件： Collection Filter episodes: {'audio_language.regex': ['ja'], 'percentage': 50}

然后尝试将这个2字母代码与完整的语言名称(如"Japanese")和3字母语言代码(如"jpn")进行匹配。这不仅逻辑错误，还因为大小写敏感问题导致匹配失败。

问题根源

通过代码分析，发现问题出在builder.py文件的第2648-2652行。这段代码负责处理正则表达式过滤条件，但在生成最终过滤值时错误地使用了键(key)而非名称(name)。

解决方案

代码修正方案

修改builder.py中的相关代码，将最后一行中的key替换为name：

for reg in util.validate_regex(data, self.Type, validate=validate):
    for name, key in names:
        if name not in used and re.compile(reg).search(name):
            used.append(name)
            valid_list.append((name, key) if plex_search else name)  # 修改此处

语言过滤优化建议

进一步分析发现，语言过滤时检查3字母代码(languageCode)是不必要的，因为：

常规过滤(非正则)只检查完整语言名称
完整语言名称(如"Japanese")永远不会与3字母代码(如"jpn")匹配

因此可以优化plex.py中的相关代码，移除对languageCode的检查：

if filter_attr == "audio_language":
    for a in part.audioStreams():
        attrs.extend([a.language])  # 移除了a.languageCode
if filter_attr == "subtitle_language":
    for s in part.subtitleStreams():
        attrs.extend([s.language])  # 移除了s.languageCode