Hydrus Network v615版本发布：自动重复文件处理系统详解

2025-06-18 00:01:21作者：房伟宁

项目简介

Hydrus Network是一款开源的媒体文件管理工具，专注于帮助用户高效组织和检索大量数字媒体文件。最新发布的v615版本引入了一个重要功能——自动重复文件处理系统，该系统能够智能识别并处理用户库中的重复文件。

v615版本的核心更新是自动重复文件处理系统的初步实现。该系统允许高级用户通过预设规则自动识别和处理重复文件。目前系统提供了一个简单的静态规则，用于识别像素级相同的JPEG和PNG文件对。

规则引擎：系统采用基于元数据的条件判断机制（MetadataConditional）来定义处理规则。开发者已为这一机制编写了完整的单元测试，确保其稳定性和可靠性。
处理流程：
- 搜索阶段：系统首先执行大规模搜索以识别潜在重复文件对
- 预览阶段：提供两阶段搜索优化，先获取总数再进行抽样预览
- 处理阶段：采用分块处理策略（8192个文件对为一组），提高处理效率
性能表现：在测试环境中，系统处理约800,000个潜在文件对时，识别出约6,000个JPEG/PNG像素级重复对，最终处理约4,700个实际重复对。处理速度达到约20,000文件/秒的搜索速度和10文件/秒的处理速度。

预览面板优化：
- 支持双击或回车键打开文件对查看
- 改进了列表滚动行为（每滚动一次移动一行）
- 优化了大缩略图情况下的显示效果
- 增强了搜索结果变更时的界面响应
操作选项：
- 新增"在空闲/正常时间处理这些规则"选项
- 考虑移除"强制处理"功能（因系统自动处理效率已足够）

跨平台兼容性改进：
- 针对Linux/X11系统下mpv窗口缩放崩溃问题，增加了调试选项
- 针对Wayland环境下的UI问题，建议通过设置环境变量强制使用XWayland
数据库维护：
- 修复了潜在重复文件对搜索重置任务的bug
- 清理了与自动重复处理相关的冗余数据库初始化项
文档完善：
- 新增了详细的自动重复文件处理帮助文档
- 添加了关于无扩展名文件的FAQ说明

开发团队为系统的核心组件编写了全面的单元测试，包括：

对于想要尝试这一新功能的用户，建议：

这一版本的发布标志着Hydrus Network在智能媒体管理方面迈出了重要一步，为用户处理大规模重复文件提供了更高效的解决方案。

登录后查看全文