首页
/ Common Voice项目新增Kidaw'ida语言本地化支持

Common Voice项目新增Kidaw'ida语言本地化支持

2025-06-24 11:53:16作者:尤辰城Agatha

Common Voice是一个致力于让语音技术对所有人开放的开源项目,通过构建一个包含全球各种语言、变体和口音的标记语音数据集来实现这一目标。近期,该项目新增了对Kidaw'ida语言的支持。

Kidaw'ida是一种使用拉丁字母书写的语言,全球约有30万活跃使用者。该语言的复数形式具有独特的表达方式,例如:

  • 0个石头:magho ndeghiko
  • 1个石头:igho jimweri
  • 2个石头:magho aw'i
  • 10个石头:magho ikumi
  • 100个石头:magho ighana

在句子收集方面,Kidaw'ida被归类为A级语言,这意味着它需要从750个句子开始构建语料库。这一分级标准考虑了语言的使用人口规模、资源评估和语言活力等因素。

项目团队已经完成了Pontoon本地化平台的设置工作,为Kidaw'ida语言创建了专门的翻译空间。Pontoon是Mozilla开发的开源本地化平台,支持协作翻译工作。社区成员可以通过该平台参与Common Voice界面的本地化工作。

对于希望参与Kidaw'ida语言支持的技术爱好者,建议首先熟悉该语言的基本语法和表达方式,特别是其独特的复数形式。然后可以通过Pontoon平台参与界面翻译工作,或者协助收集和验证符合CC0许可的句子语料。

这种语言支持工作对于保护语言多样性具有重要意义,特别是对于像Kidaw'ida这样使用人口相对较少的语言。通过将其纳入Common Voice项目,不仅有助于该语言的数字化保存,也为开发基于该语言的语音技术应用奠定了基础。

登录后查看全文
热门项目推荐