eSpeak NG 文本转语音引擎安装和配置指南

2026-02-06 04:36:10作者：戚魁泉Nursing

1. 项目基础介绍和主要编程语言

项目基础介绍

eSpeak NG 是一个紧凑的开源软件文本转语音合成器，支持 Linux、Windows、Android 和其他操作系统。它基于 Jonathan Duddington 创建的 eSpeak 引擎，采用"共振峰合成"方法，能够在较小的体积内提供清晰的语音输出。

该项目支持超过 100 种语言和口音，语音清晰，可在高速下使用，虽然不如基于人类语音录音的大型合成器那样自然流畅。它还支持 Klatt 共振峰合成，并能够使用 MBROLA 作为后端语音合成器。

主要编程语言

eSpeak NG 主要使用 C 语言编写，确保高性能和跨平台兼容性。

2. 项目使用的关键技术和框架

关键技术

共振峰合成：eSpeak NG 使用共振峰合成方法，这种方法允许在较小的体积内支持多种语言
MBROLA 支持：eSpeak NG 可以作为 MBROLA 的语音合成后端
SSML 支持：eSpeak NG 支持 Speech Synthesis Markup Language (SSML)，尽管功能还不完全
HTML 支持：能够处理 HTML 内容的语音合成

框架

Autotools：用于自动配置和构建项目的标准 GNU 构建系统
CMake：跨平台构建系统，支持多种编译环境

3. 项目安装和配置的准备工作和详细安装步骤

准备工作

在开始安装之前，请确保您的系统已经安装了以下工具和库：

基本依赖（Debian/Ubuntu系统）：

sudo apt-get install make autoconf automake libtool pkg-config
sudo apt-get install gcc g++

可选依赖：

sudo apt-get install libpcaudio-dev    # 音频输出支持
sudo apt-get install libsonic-dev      # 音频加速支持
sudo apt-get install ronn              # 手册页处理
sudo apt-get install kramdown          # 文档构建

详细安装步骤

步骤 1：获取项目源码

首先克隆 eSpeak NG 的代码仓库：

git clone https://gitcode.com/GitHub_Trending/es/espeak-ng.git
cd espeak-ng

步骤 2：生成构建配置文件

使用 autotools 生成构建文件：

./autogen.sh

步骤 3：配置项目

配置项目安装路径和选项：

./configure --prefix=/usr

您可以查看所有可用配置选项：

./configure --help

步骤 4：编译项目

编译 eSpeak NG 程序和语音数据：

make

注意：构建语音数据时不支持并行编译。如果需要并行编译，可以分步执行：

make -j8 src/espeak-ng src/speak-ng
make

步骤 5：安装项目

安装到系统目录：

sudo make LIBDIR=/usr/lib/x86_64-linux-gnu install

步骤 6：验证安装

安装完成后，验证 eSpeak NG 是否正常工作：

espeak-ng "Hello, World!"

如果听到语音输出，说明安装成功。

功能特性配置

eSpeak NG 支持多种功能配置选项：

# 启用 Klatt 共振峰合成
./configure --with-klatt=yes

# 启用 MBROLA 语音支持
./configure --with-mbrola=yes

# 使用 sonic 库支持更高语速
./configure --with-sonic=yes

# 启用异步命令
./configure --with-async=yes

扩展字典配置

支持多种语言的扩展字典：

# 俄语扩展字典
./configure --with-extdict-ru=yes

# 普通话中文扩展字典
./configure --with-extdict-cmn=yes

# 粤语扩展字典
./configure --with-extdict-yue=yes

测试安装

在安装前可以进行测试：

ESPEAK_DATA_PATH=`pwd` LD_LIBRARY_PATH=src:${LD_LIBRARY_PATH} src/espeak-ng "测试语音合成"

配置说明

eSpeak NG 的配置文件和数据文件通常安装在 /usr/share/espeak-ng-data 目录下。您可以根据需要修改语音参数、添加新语言或调整合成设置。

语音文件位于 phsource/ 目录，字典文件位于 dictsource/ 目录，您可以根据需要定制或添加新的语音和字典规则。

使用示例

基本使用

# 朗读文本
espeak-ng "这是中文测试"

# 朗读文件内容
espeak-ng -f filename.txt

# 指定语言
espeak-ng -v zh "中文语音合成"

# 输出到 WAV 文件
espeak-ng -w output.wav "保存为音频文件"

高级选项

# 调整语速（单词每分钟）
espeak-ng -s 150 "较快的语速"

# 调整音高（0-99）
espeak-ng -p 50 "中等音高"

# 调整音量（0-200）
espeak-ng -a 100 "标准音量"

# 选择特定语音
espeak-ng -v mb-en1 "使用MBROLA英语语音"

通过以上步骤，您已经成功安装并配置了 eSpeak NG 文本转语音引擎。现在您可以开始使用它来生成多种语言的语音输出，或集成到您的应用程序中。

espeak-ng

eSpeak NG is an open source speech synthesizer that supports more than hundred languages and accents.

项目地址：https://gitcode.com/GitHub_Trending/es/espeak-ng

登录后查看全文