AllTalk TTS 在 macOS 上的纯 pip 安装方案优化

2025-07-09 14:05:13作者：廉彬冶Miranda

AllTalk is based on the Coqui TTS engine, similar to the Coqui_tts extension for Text generation webUI, however supports a variety of advanced features, such as a settings page, low VRAM support, DeepSpeed, narrator, model finetuning, custom models, wav file maintenance. It can also be used with 3rd Party software via JSON calls.

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

背景介绍

AllTalk TTS 是一个开源的文本转语音项目，目前在 macOS 平台上的安装指南推荐使用 conda 环境管理工具。然而，在实际安装过程中，conda 在 macOS 上存在兼容性问题，特别是在处理 faiss-cpu 等依赖包时容易失败。本文提出了一种完全基于 pip 的替代安装方案，不仅解决了兼容性问题，还能减少系统环境的复杂性。

系统准备

在开始安装前，需要确保系统已安装必要的底层依赖库：

brew install openssl xz zlib

这些库是 Python 编译和后续语音处理功能的基础依赖项，特别是 openssl 对于 Python 的安全通信功能至关重要。

Python 环境配置

推荐使用 Python 3.11.12 版本以获得最佳兼容性：

curl -O https://www.python.org/ftp/python/3.11.12/Python-3.11.12.tar.xz
tar -xf Python-3.11.12.tar.xz
cd Python-3.11.12
./configure --enable-optimizations --with-openssl=$(brew --prefix openssl)
make
make install

编译时加入 openssl 支持可以确保后续 pip 安装过程中的安全连接，而优化选项(--enable-optimizations)能提升 Python 运行时的性能。

虚拟环境创建

为避免与系统 Python 环境冲突，建议创建专用虚拟环境：

cd ..
/alltalk_environment/Python-3.11.12/bin/python3.11 -m venv venv
source venv/bin/activate

虚拟环境能隔离项目依赖，防止不同项目间的包版本冲突。

核心依赖安装

PyTorch 是 AllTalk TTS 的核心依赖，可以选择稳定版或最新开发版：

稳定版(推荐生产环境使用):

pip install pytorch==2.2.1 torchvision==0.17.1 torchaudio==2.2.1

开发版(包含最新特性但可能不稳定):

pip install --pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cpu

语音处理组件安装

语音处理需要以下关键组件:

pip install faiss-cpu ffmpeg ffmpeg-python

faiss-cpu 用于高效的相似性搜索，而 ffmpeg 则是音频处理的核心工具链。

项目依赖安装

项目的主要依赖可以通过以下命令安装：

pip install -r requirements.txt

需要注意的是，原 requirements.txt 中 onnxruntime 的版本限制可能导致安装失败，建议移除版本限制以自动获取最新兼容版本。

特殊组件处理

Piper TTS 组件在 macOS 上需要特别注意：

pip install piper-phonemize==1.1.0
pip install piper-tts==1.2.0

如果遇到版本冲突，可能需要先安装特定版本的 phonemize 再安装 piper-tts。

版本兼容性说明

不同功能模块对 transformers 库有不同要求：

XTTS 流式支持需要 transformers==4.42.4
Parler-TTS 需要 transformers==4.46.1

在实际使用中，需要根据主要使用功能选择合适的版本。

优势总结

纯 pip 安装方案相比 conda 方案具有以下优势：

依赖关系更简单直接，减少中间层带来的问题
安装过程更透明，易于调试
占用空间更小，环境更轻量
与 Python 原生工具链集成更好
社区支持更广泛，问题解决方案更多

注意事项

确保使用 Python 3.11.x 版本以获得最佳兼容性
虚拟环境激活后所有操作应在该环境下进行
如遇包冲突，可尝试先卸载冲突包再重新安装
不同语音模型可能有特定的依赖要求
开发版 PyTorch 可能包含未稳定的特性，生产环境慎用

通过这套优化后的安装流程，macOS 用户可以更顺利地搭建 AllTalk TTS 开发环境，避免了 conda 带来的兼容性问题，同时也为后续的维护和升级提供了更清晰的技术路径。

alltalk_tts

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

458

450

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

250

AllTalk TTS 在 macOS 上的纯 pip 安装方案优化

背景介绍

系统准备

Python 环境配置

虚拟环境创建

核心依赖安装

语音处理组件安装

项目依赖安装

特殊组件处理

版本兼容性说明

优势总结

注意事项

热门内容推荐

最新内容推荐

项目优选

AllTalk TTS 在 macOS 上的纯 pip 安装方案优化

背景介绍

系统准备

Python 环境配置

虚拟环境创建

核心依赖安装

语音处理组件安装

项目依赖安装

特殊组件处理

版本兼容性说明

优势总结

注意事项

相关内容推荐

热门内容推荐

最新内容推荐

项目优选