PyGlossary项目中StarDict文本格式对资源文件的支持分析

2025-07-02 06:13:19作者：霍妲思

在词典转换工具PyGlossary中，StarDict文本格式（StardictTextual）目前存在一个功能限制：无法保留原始词典中的资源文件。本文将从技术角度分析这一问题的背景、现状及可能的解决方案。

问题背景

当用户使用PyGlossary将Babylon BGL格式词典转换为不同输出格式时，发现资源文件的处理方式存在差异：

资源文件类型：
- 图标文件（.ico/.bmp）：通常用于词典软件界面显示
- 其他媒体文件：可能被嵌入在词条定义中使用
格式支持差异：
- AppleDict格式：通过专门的OtherResources目录完整保留所有资源
- StarDict二进制格式：支持"res"目录存放资源文件
- StarDict文本格式：目前完全不支持资源文件
GoldenDict兼容性：主流词典软件GoldenDict对StarDict词典图标有特定命名要求，需要与主词典文件同名并放置在同一目录。

基础支持方案：为StarDict文本格式添加资源目录支持，类似二进制格式的"res"目录，至少保留原始资源文件不丢失。
智能图标处理：
- 自动识别可能的词典图标文件（通过文件名特征或大小判断）
- 按照GoldenDict规范输出图标文件
多图标处理策略：当遇到多个候选图标文件时，可采用以下策略之一：
- 优先选择.bmp格式（GoldenDict首选）
- 按文件大小选择最可能的主图标
- 保留所有图标但添加数字后缀

从技术实现角度看，建议分阶段实施：

目前临时解决方案：

该功能的完整实现将显著提升PyGlossary在格式转换过程中的资源保留能力，特别是对于依赖视觉元素的词典转换场景。

登录后查看全文