gallery-dl中如何针对不同服务配置独立的后处理器规则

2025-05-17 17:50:26作者：尤辰城Agatha

Command-line program to download image galleries and collections from several image hosting sites

项目地址：https://gitcode.com/GitHub_Trending/ga/gallery-dl

在gallery-dl下载工具的实际使用中，用户可能会遇到需要为不同服务(如kemono和boosty)配置不同后处理规则的情况。本文将通过一个典型配置案例，深入解析如何实现服务专属的后处理器配置。

问题背景

当用户在gallery-dl配置文件中同时定义全局后处理器和服务专属后处理器时，可能会出现重复处理的问题。例如在kemono配置中，boosty服务的文件会被应用两次后处理规则：既匹配了boosty专属的后处理器，又匹配了全局的后处理器。

解决方案

通过在全局后处理器中添加黑名单过滤，可以排除特定服务的处理。具体实现方式是：

在boosty服务配置中保留专属后处理器
在全局后处理器中添加"blacklist": "*:boosty"参数

优化后的配置示例如下：

"boosty": {
    "filename": "{date:%Y-%m-%d}_{id}_{title[:190]}_{num:>02}_{filename[:190]}.{extension}",
    "postprocessors": [
        {
            "name": "metadata",
            "event": "post",
            "filename": "{date:%Y-%m-%d}_{id}.txt",
            "mode": "custom",
            "format": "{content}\n{embed[url]:?/\n/}"
        }
    ]
},
"postprocessors": [
    {
        "name": "metadata",
        "event": "post",
        "filename": "{id}.txt",
        "mode": "custom",
        "format": "{content}\n{embed[url]:?/\n/}",
        "blacklist": "*:boosty"
    }
]

技术原理

gallery-dl的后处理器执行遵循以下规则：

服务级配置优先于全局配置
未指定黑名单/白名单时，后处理器会应用于所有匹配内容
黑名单语法支持通配符模式匹配

通过这种配置方式，可以实现：

boosty服务使用专属的日期前缀元数据格式
其他服务使用全局的简洁元数据格式
避免任何服务的重复处理

最佳实践建议

对于需要特殊处理的平台，建议使用服务专属后处理器
全局后处理器应添加适当的黑名单过滤
可以通过event参数进一步控制处理时机
复杂场景可以组合使用白名单和黑名单

这种配置方式不仅适用于metadata后处理器，也同样适用于其他类型的后处理器，如exec、zip等。理解这种配置模式可以帮助用户构建更灵活高效的下载工作流。

Command-line program to download image galleries and collections from several image hosting sites

项目地址：https://gitcode.com/GitHub_Trending/ga/gallery-dl

登录后查看全文

项目优选

收起

deepin linux kernel

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

昇腾LLM分布式训练框架

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter