TTS Server 文字转语音服务器安装与使用指南

2026-02-06 04:08:27作者：郦嵘贵Just

项目介绍

TTS Server 是一个基于 Rust 语言开发的文字转语音（Text-to-Speech, TTS）服务器应用。该项目集成了微软 Edge 浏览器的"大声朗读"API 和 Azure TTS 服务，提供高效的文本转语音功能。通过 WebSocket 保持连接，极大提升了请求并发性和响应速度，特别适合需要高性能 TTS 服务的场景。

环境准备

安装 Rust 编程环境

在开始之前，需要先安装 Rust 和 Cargo 工具链：

curl --proto '=https' --tlsv1.3 -sSf https://sh.rustup.rs | sh

安装完成后，验证安装是否成功：

rustc --version
cargo --version

项目获取与编译

克隆项目仓库

通过以下命令获取项目源码：

git clone https://gitcode.com/gh_mirrors/tt/tts-server.git
cd tts-server

编译项目

使用 Cargo 编译项目并生成优化版本：

cargo build --release

编译完成后，可执行文件将生成在 target/release/tts-server 目录下。

服务器配置与启动

基本启动

直接运行可执行文件，使用默认配置：

./target/release/tts-server

默认监听地址：0.0.0.0，默认端口：8080

自定义配置启动

可以指定监听地址和端口：

./target/release/tts-server --listen-address 192.168.1.100 --listen-port 9000

查看帮助信息

./target/release/tts-server --help

查看支持的音频格式

./target/release/tts-server --show-quality-list

查看支持的发音人列表

./target/release/tts-server --show-informant-list

API 接口说明

项目提供以下三个主要接口：

Edge 渠道接口: /api/tts-ms-edge
官网预览渠道接口: /api/tts-ms-official-preview
官方订阅 Key 渠道接口: /api/tts-ms-subscribe-api

请求参数

支持 GET 和 POST 请求方式：

text: 待转换文本内容（必填）
informant: 发音人（可选，默认：zh-CN-XiaoxiaoNeural）
style: 发音风格（可选，默认：general）
rate: 语速（可选，范围：0-3，默认：1）
pitch: 音调（可选，范围：0-2，默认：1）
quality: 音频格式（可选）

在阅读软件中的配置示例

以"阅读"App 为例，可以使用以下配置：

http://192.168.1.100:9000/api/tts-ms-edge,{
    "method": "POST",
    "body": {
        "informant": "zh-CN-XiaoxiaoNeural",
        "style": "general",
        "rate": {{ speakSpeed / 6.5 }},
        "quality": "audio-48khz-96kbitrate-mono-mp3",
        "text": "{{java.encodeURI(speakText).replace('+','%20')}}"
    }
}

支持的音频格式

项目支持多种音频格式，包括：

MP3 格式：audio-16khz-128kbitrate-mono-mp3、audio-24khz-96kbitrate-mono-mp3 等
Opus 格式：ogg-16khz-16bit-mono-opus、webm-24khz-16bit-mono-opus 等
PCM 原始格式：raw-16khz-16bit-mono-pcm、riff-24khz-16bit-mono-pcm 等

发音人选择

支持多种中文发音人，如：

晓晓 (zh-CN-XiaoxiaoNeural)
云扬 (zh-CN-YunyangNeural)
晓辰 (zh-CN-XiaochenNeural)
晓涵 (zh-CN-XiaohanNeural)

发音风格选项

支持丰富的发音风格，包括：

affectionate: 温暖亲切的语气
calm: 沉着冷静的态度
cheerful: 积极愉快的语气
fearful: 恐惧紧张的语气
gentle: 温和礼貌的语气
serious: 严肃命令的语气

后台运行（Linux）

在 Linux 系统中可以使用 screen 等工具让服务器在后台运行：

screen -S tts-server ./target/release/tts-server

注意事项

项目主要使用 Edge 浏览器和 Azure TTS 演示页面接口，稳定性无法保证
推荐使用官方订阅接口以获得更好的稳定性和服务品质
项目仅供学习交流使用，严禁用于商业用途
微软 Azure TTS 服务提供一定的免费额度，建议支持官方服务

通过以上步骤，您可以成功部署和使用 TTS Server 文字转语音服务，为您的应用提供高质量的语音合成功能。

tts-server

tts-server-api

项目地址：https://gitcode.com/gh_mirrors/tt/tts-server

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TTS Server 文字转语音服务器安装与使用指南

项目介绍

环境准备

安装 Rust 编程环境

项目获取与编译

克隆项目仓库

编译项目

服务器配置与启动

基本启动

自定义配置启动

查看帮助信息

查看支持的音频格式

查看支持的发音人列表

API 接口说明

请求参数

在阅读软件中的配置示例

支持的音频格式

发音人选择

发音风格选项

后台运行（Linux）

注意事项

热门内容推荐

最新内容推荐

项目优选

TTS Server 文字转语音服务器安装与使用指南

项目介绍

环境准备

安装 Rust 编程环境

项目获取与编译

克隆项目仓库

编译项目

服务器配置与启动

基本启动

自定义配置启动

查看帮助信息

查看支持的音频格式

查看支持的发音人列表

API 接口说明

请求参数

在阅读软件中的配置示例

支持的音频格式

发音人选择

发音风格选项

后台运行（Linux）

注意事项

相关内容推荐

热门内容推荐

最新内容推荐

项目优选