dupeGuru插件架构设计：基于接口的模块化扩展

2026-02-05 04:54:31作者：柯茵沙

还在为重复文件管理而烦恼？dupeGuru的插件架构让你轻松扩展扫描能力，精准识别各类重复文件！

读完本文你将掌握：

dupeGuru的模块化插件架构设计原理
三大核心扫描引擎的工作原理
如何基于接口规范开发自定义插件
插件系统的扩展性和维护性优势

架构概览：模块化的设计哲学

dupeGuru采用基于接口的模块化架构，将核心功能与具体实现分离。整个系统由以下几个关键模块组成：

核心框架 (core/app.py)：提供统一的应用程序接口和生命周期管理
扫描引擎接口 (core/scanner.py)：定义扫描行为的抽象规范
具体实现模块：PE（图片）、ME（音乐）、SE（标准）三大引擎

三大扫描引擎详解

1. 图片扫描引擎 (PE - Picture Edition)

位于 core/pe/ 目录，专门处理图片文件重复检测：

# 核心扫描器类
class PictureScanner(Scanner):
    def _getmatches(self, files, j):
        # 实现基于图片内容的相似度匹配
        pass

支持功能：

图像内容特征提取
EXIF元数据分析
视觉相似度计算

2. 音乐扫描引擎 (ME - Music Edition)

位于 core/me/ 目录，专注音频文件处理：

# 音乐文件专用扫描
class MusicScanner(Scanner):
    def get_scan_options(self):
        # 提供音乐特有的扫描选项
        return super().get_scan_options() + [
            ('match_album', False),
            ('match_artist', False)
        ]

3. 标准扫描引擎 (SE - Standard Edition)

位于 core/se/ 目录，提供通用文件扫描：

# 基础文件扫描实现
class StandardScanner(Scanner):
    def _key_func(self, dupe):
        # 基于文件名、大小等基础属性进行匹配
        return str(dupe.path).lower()

基于接口的插件开发规范

扫描器接口定义

所有扫描引擎都必须实现 core/scanner.py 中定义的接口：

class Scanner:
    def get_scan_options(self):
        """返回扫描配置选项"""
        pass
    
    def _getmatches(self, files, j):
        """核心匹配算法实现"""
        pass

文件系统接口

每个引擎需要提供对应的文件系统处理类：

# 示例：图片文件处理
class PhotoFile(File):
    def get_display_info(self, group, delta):
        # 提供图片特有的显示信息
        info = super().get_display_info(group, delta)
        info['dimensions'] = self._get_dimensions()
        return info

插件加载机制

应用程序通过动态模块加载机制选择适当的扫描引擎：

# 在 core/app.py 中的引擎选择逻辑
def _recreate_result_table(self):
    if self.app_mode == AppMode.PICTURE:
        self.result_table = pe.result_table.ResultTable(self)
    elif self.app_mode == AppMode.MUSIC:
        self.result_table = me.result_table.ResultTable(self)
    else:
        self.result_table = se.result_table.ResultTable(self)