VOICEVOX 项目中的颜色系统优化实践

2025-06-29 19:51:01作者：秋泉律Samson

背景与目标

VOICEVOX 是一款语音合成软件，近期开发团队针对其界面颜色系统进行了全面优化。本次优化的核心目标是实现视觉一致性、提升用户体验，并为未来的功能扩展奠定基础。优化工作主要集中在以下几个方面：

建立统一的颜色定义规范
改善视觉可读性和美观度
实现与VOICEVOX语音侧界面的风格统一
为多音轨编辑等未来功能预留扩展空间

技术实现方案

1. 颜色系统架构

团队采用了Material Design 3(M3)作为基础设计系统，同时针对VOICEVOX特有的音乐编辑功能进行了定制化扩展。系统架构包含三个层次：

基础色系：基于M3定义primary、surface、display等标准颜色角色
计算色系：通过算法动态生成色调、明度变化
专用色系：为钢琴卷帘等专业组件定义特殊颜色

2. 颜色空间选择

团队深入评估了多种颜色空间后，最终选择了OKLCH色彩模型，主要基于以下技术考量：

感知均匀性：相比sRGB，OKLCH在人类视觉感知上更接近线性
动态生成：便于程序化生成协调的颜色变体
现代支持：主流现代浏览器已原生支持

针对OKLCH在sRGB显示设备上的适配问题，团队实施了以下解决方案：

设置25%-100%的有效亮度范围，避免低亮度区细节丢失
彩度控制在0.1-0.12区间，确保在sRGB色域内
实现自动色域裁剪(Gamut Clamp)机制

3. 钢琴卷帘专用颜色

针对音乐编辑的核心组件，团队定义了专用颜色体系：

钢琴键盘：区分黑键/白键的底色和边框
网格线：按节拍、小节、吸附精度分级定义
音符元素：包括普通状态、选中状态、拖拽预览等
音高线：编辑线、预览线、修正线等

4. 动态主题系统

团队构建了灵活的JSON主题配置系统，支持：

基于角色(role)的颜色定义
源色自动衍生计算
亮/暗模式切换
未来可能的角色自定义

创新实践

1. 音轨差异化着色

探索性地实现了基于音轨/角色的差异化着色方案：

使用图像分析算法从角色立绘提取主色调
应用OKLCH模型保持视觉协调性
为多音轨编辑提供直观的视觉区分

2. 感知优化技术

针对人类视觉特性进行了多项优化：

明度非线性映射，增强低亮度区对比度
文本与背景的WCAG对比度保障
禁用状态的视觉降级处理

实施效果

经过优化后的界面展现出以下改进：

一致性提升：各组件颜色协调统一
可读性增强：关键操作元素更醒目
扩展性完善：支持未来功能如多音轨编辑
个性化潜力：为主题定制奠定基础

经验总结

本次VOICEVOX颜色系统优化的关键经验包括：

平衡设计规范与专业需求，M3基础+音乐编辑扩展
OKLCH模型在UI应用中的实践心得
动态颜色系统的架构设计思路
感知优化在专业软件中的实施方法

这些实践不仅提升了VOICEVOX的用户体验，也为类似多媒体创作工具的颜色系统设计提供了有价值的参考。

voicevox

無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのエディター

项目地址：https://gitcode.com/gh_mirrors/vo/voicevox

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。