Simple-EHM 使用教程

2025-04-21 12:10:11作者：宣海椒Queenly

1. 项目介绍

Simple-EHM 是一个开源工具，旨在从预录制的演讲中自动去除填充音（如“ehm”）。该工具采用了人工智能技术，能够识别并消除这些不必要的噪音，使得演讲更加清晰和专业。

2. 项目快速启动

环境准备

确保您的系统中已经安装了以下依赖：

Python
FFmpeg
Docker (可选，用于容器化运行)

克隆项目

首先，从GitHub上克隆项目到本地：

git clone https://github.com/morrolinux/simple-ehm.git
cd simple-ehm

安装依赖

使用pip安装项目所需的Python库：

pip install -r requirements.txt

运行项目

运行以下命令来处理视频文件：

python simple_ehm-runnable.py /path/to/video/file

这将在原始视频文件相同的目录下生成一个字幕文件（.srt）和一个处理后的视频文件。

使用Docker运行

如果您选择使用Docker，首先构建镜像：

docker build -t simple .

然后，使用以下脚本代替直接运行Python脚本：

./convert.sh

注意：在使用 ./convert.sh 脚本之前，确保将视频文件移动到该脚本的同一目录下。

3. 应用案例和最佳实践

应用案例

减少视频演讲中的不必要的“ehm”声音，提高观看体验。
在播客编辑中自动移除填充音，使内容更加紧凑。

最佳实践

提供至少30个1秒长的WAV格式（pcm_s16le，单声道，16kHz采样率）的音频片段，用于训练数据集，以改善模型性能。
使用 --generate-training-data 参数生成训练数据，用于改进训练集。

4. 典型生态项目

Simple-EHM 可以与以下开源项目结合使用，以构建更加完善的工作流程：

FFmpeg：用于视频和音频处理。
TensorFlow：用于进一步训练和优化AI模型。
Jupyter Notebook：用于数据分析和模型开发。

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

ohos_react_native

React Native鸿蒙化仓库

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。