Hydrus Network v619版本更新：标签清理与重复文件自动处理优化

2025-06-18 20:52:51作者：劳婵绚Shirley

项目简介

Hydrus Network是一款开源的媒体文件管理工具，专注于帮助用户高效组织、检索和分类大量数字媒体文件。它提供了强大的元数据管理、智能标签系统和高级搜索功能，特别适合收藏家、研究人员和数字内容管理专业人士使用。

本次更新对标签系统进行了重大改进，通过引入更严格的Unicode字符过滤机制来提升标签质量：

无效字符过滤：系统现在会自动排除控制字符、右到左格式化标记、零宽度空格、代理对等特殊Unicode字符。这种清理有助于解决历史遗留的标签解析问题，如包含隐藏字节顺序标记(BOM)的标签或输入法错误产生的标签。
例外处理：
- 保留了零宽度非连接符(ZWNJ)和零宽度连接符(ZWJ)，除非标签仅包含扩展拉丁字符
- 允许使用韩文填充字符，前提是标签中包含其他韩文字符
升级影响：所有客户端在更新时将自动执行标签清理过程。对于同步PTR的用户，这一过程大约需要20分钟，预计会清理约30,000个不良标签。系统会记录详细的清理日志，方便用户追溯处理过程。

v619版本正式启用了重复文件自动处理UI，并增强了其功能：

新增比较规则：
- 媒体属性比较：支持基于文件大小、宽度、高度、像素数、时长和帧数的比较，可设置等于、不等于、大于、小于等条件
- 文件类型比较：新增"相同文件类型"和"不同文件类型"两种硬编码规则
- 元数据比较：支持EXIF、ICC配置文件和人类可读元数据的测试
预设规则优化：
- 新增"保留EXIF或ICC数据"规则，解决像素相同但元数据不同的情况
- 新增"消除冗余"规则，自动删除像素相同但体积较大的文件
UI改进：
- 操作列现在显示完整文本提示
- 预览面板中的"通过"列表现在能正确排序多个规则的结果

本次更新显著提升了Hydrus Network的标签质量和重复文件处理能力，为用户提供了更高效、更精确的媒体管理体验。开发团队将继续优化自动比较算法，未来可能引入像素级比较功能来更好地区分相似但不完全相同的媒体文件。

登录后查看全文