首页
/ BooruDatasetTagManager:图像标签管理工具全面解析

BooruDatasetTagManager:图像标签管理工具全面解析

2026-02-04 04:35:30作者:仰钰奇

工具概述

BooruDatasetTagManager是一款专为AI训练数据集设计的标签编辑工具,特别适合处理Booru风格标签的数据集。该工具能够帮助用户从零开始创建数据集,或编辑已有的自动标注数据集(如使用wd14-tagger或stable-diffusion-webui生成的数据集)。

核心功能

数据集管理

  • 支持标准数据集结构:图片文件与同名文本文件配对存储
  • 可视化界面展示图片缩略图与对应标签
  • 支持批量选择和编辑多张图片标签

标签编辑

  • 提供完整的标签列表视图
  • 支持权重标签编辑(使用方括号表示权重)
  • 多语言标签翻译功能
  • 自动补全标签功能

自动标注

  • 集成interrogator_rpc服务
  • 支持多种模型同时标注
  • 可配置标注参数和结果合并方式

使用指南

基础操作

  1. 加载数据集

    • 通过"文件->加载文件夹"选择数据集目录
    • 工具会自动识别图片和对应的标签文件
  2. 编辑标签

    • 在中央面板直接修改选中图片的标签
    • 使用右侧面板的标签列表快速添加常用标签
  3. 保存修改

    • 完成编辑后通过"文件->保存更改"保存

高级功能

自动标注服务配置

  1. 安装Python依赖:
pip install -r requirements.txt
  1. 启动服务:
python main.py

权重标签编辑

  • 选中标签后使用"权重"滑块调整
  • 每个刻度对应一个方括号层级

界面自定义

  • 在"选项->设置"中可调整:
    • 配色方案(支持经典和暗黑主题)
    • 快捷键配置
    • 翻译服务选择

技术细节

翻译功能实现

  • 翻译结果存储在Translations目录下
  • 支持手动编辑翻译文件,手动翻译需以"*"标记
  • 示例翻译文件格式:
black hair=黑发
*solo=单人
1girl=1女孩

性能优化

  • 标签自动补全数据使用专用格式缓存
  • 多图选择时优化标签显示性能

开发与扩展

界面翻译

开发者可通过以下步骤添加新语言支持:

  1. 在Languages目录创建语言代码文件(如zh-CN.txt)
  2. 按照"原字符串=翻译"格式添加内容
  3. 提交翻译文件

编译说明

项目使用Visual Studio开发(非VS Code),编译步骤:

  1. 克隆项目仓库
  2. 打开BooruDatasetTagManager.sln解决方案
  3. 生成解决方案(Ctrl+Shift+B)
  4. 启动调试(Ctrl+F5)

最佳实践

  1. 数据集组织

    • 保持图片和标签文件同名
    • 建议使用有意义的文件名便于管理
  2. 标签编辑

    • 对相似图片使用多选功能批量编辑
    • 合理使用权重标签提高训练效果
  3. 自动标注

    • 尝试不同模型组合以获得最佳标注结果
    • 对自动标注结果进行人工校验

BooruDatasetTagManager通过其直观的界面和强大的功能,显著简化了AI训练数据集的管理和标注工作流程,是AI研究人员和内容创作者的高效工具。

登录后查看全文
热门项目推荐
相关项目推荐