首页
/ TTS Server 文字转语音服务器安装与使用指南

TTS Server 文字转语音服务器安装与使用指南

2026-02-06 04:08:27作者:郦嵘贵Just

项目介绍

TTS Server 是一个基于 Rust 语言开发的文字转语音(Text-to-Speech, TTS)服务器应用。该项目集成了微软 Edge 浏览器的"大声朗读"API 和 Azure TTS 服务,提供高效的文本转语音功能。通过 WebSocket 保持连接,极大提升了请求并发性和响应速度,特别适合需要高性能 TTS 服务的场景。

环境准备

安装 Rust 编程环境

在开始之前,需要先安装 Rust 和 Cargo 工具链:

curl --proto '=https' --tlsv1.3 -sSf https://sh.rustup.rs | sh

安装完成后,验证安装是否成功:

rustc --version
cargo --version

项目获取与编译

克隆项目仓库

通过以下命令获取项目源码:

git clone https://gitcode.com/gh_mirrors/tt/tts-server.git
cd tts-server

编译项目

使用 Cargo 编译项目并生成优化版本:

cargo build --release

编译完成后,可执行文件将生成在 target/release/tts-server 目录下。

服务器配置与启动

基本启动

直接运行可执行文件,使用默认配置:

./target/release/tts-server

默认监听地址:0.0.0.0,默认端口:8080

自定义配置启动

可以指定监听地址和端口:

./target/release/tts-server --listen-address 192.168.1.100 --listen-port 9000

查看帮助信息

./target/release/tts-server --help

查看支持的音频格式

./target/release/tts-server --show-quality-list

查看支持的发音人列表

./target/release/tts-server --show-informant-list

API 接口说明

项目提供以下三个主要接口:

  1. Edge 渠道接口: /api/tts-ms-edge
  2. 官网预览渠道接口: /api/tts-ms-official-preview
  3. 官方订阅 Key 渠道接口: /api/tts-ms-subscribe-api

请求参数

支持 GET 和 POST 请求方式:

  • text: 待转换文本内容(必填)
  • informant: 发音人(可选,默认:zh-CN-XiaoxiaoNeural)
  • style: 发音风格(可选,默认:general)
  • rate: 语速(可选,范围:0-3,默认:1)
  • pitch: 音调(可选,范围:0-2,默认:1)
  • quality: 音频格式(可选)

在阅读软件中的配置示例

以"阅读"App 为例,可以使用以下配置:

http://192.168.1.100:9000/api/tts-ms-edge,{
    "method": "POST",
    "body": {
        "informant": "zh-CN-XiaoxiaoNeural",
        "style": "general",
        "rate": {{ speakSpeed / 6.5 }},
        "quality": "audio-48khz-96kbitrate-mono-mp3",
        "text": "{{java.encodeURI(speakText).replace('+','%20')}}"
    }
}

支持的音频格式

项目支持多种音频格式,包括:

  • MP3 格式:audio-16khz-128kbitrate-mono-mp3、audio-24khz-96kbitrate-mono-mp3 等
  • Opus 格式:ogg-16khz-16bit-mono-opus、webm-24khz-16bit-mono-opus 等
  • PCM 原始格式:raw-16khz-16bit-mono-pcm、riff-24khz-16bit-mono-pcm 等

发音人选择

支持多种中文发音人,如:

  • 晓晓 (zh-CN-XiaoxiaoNeural)
  • 云扬 (zh-CN-YunyangNeural)
  • 晓辰 (zh-CN-XiaochenNeural)
  • 晓涵 (zh-CN-XiaohanNeural)

发音风格选项

支持丰富的发音风格,包括:

  • affectionate: 温暖亲切的语气
  • calm: 沉着冷静的态度
  • cheerful: 积极愉快的语气
  • fearful: 恐惧紧张的语气
  • gentle: 温和礼貌的语气
  • serious: 严肃命令的语气

后台运行(Linux)

在 Linux 系统中可以使用 screen 等工具让服务器在后台运行:

screen -S tts-server ./target/release/tts-server

注意事项

  1. 项目主要使用 Edge 浏览器和 Azure TTS 演示页面接口,稳定性无法保证
  2. 推荐使用官方订阅接口以获得更好的稳定性和服务品质
  3. 项目仅供学习交流使用,严禁用于商业用途
  4. 微软 Azure TTS 服务提供一定的免费额度,建议支持官方服务

通过以上步骤,您可以成功部署和使用 TTS Server 文字转语音服务,为您的应用提供高质量的语音合成功能。

登录后查看全文
热门项目推荐
相关项目推荐