whisper-openvino 的安装和配置教程

2025-05-27 15:12:59作者：裴锟轩Denise

项目基础介绍

whisper-openvino 是一个开源项目，它基于 whisper ASR 模型，并使用 openvino 作为后端。该项目目前支持所有模型（除了大型模型）的转录功能。whisper 是一个强大的自动语音识别（ASR）模型，可以用于将音频文件转录为文本。

主要编程语言

该项目的开发主要使用 Python 和 Jupyter Notebook。

项目使用的关键技术和框架

Whisper ASR Models: Whisper 是一个由 OpenAI 开发的自动语音识别模型，能够处理多种语言的语音识别任务。
OpenVINO: OpenVINO 是一个由英特尔开发的工具套件，用于加速计算机视觉工作负载。在这个项目中，它被用来加速 whisper 模型的推理过程。

项目安装和配置的准备工作

在开始安装 whisper-openvino 之前，请确保您的系统中已安装以下软件：

Python（建议版本为 3.7 或更高） 2.pip（Python 包管理器）
Git（用于从 GitHub 克隆项目）

安装步骤

克隆项目仓库到本地环境：

git clone https://github.com/zhuzilin/whisper-openvino.git

进入项目目录：
```
cd whisper-openvino
```
安装项目所需的依赖项。首先，确保您已经安装了 pip。然后运行以下命令安装所需的 Python 包：
```
pip install -r requirements.txt
```

安装 whisper-openvino：

pip install git+https://github.com/zhuzilin/whisper-openvino.git

验证安装是否成功。您可以通过尝试转录一个音频文件来测试安装。例如，可以使用以下命令来转录一个名为 carmack.mp3 的音频文件：
```
whisper carmack.mp3 --model tiny.en --beam_size 3
```
如果一切正常，转录过程将开始，并生成一个文本文件，其中包含了转录的文本。

以上步骤即为 whisper-openvino 的安装和配置过程。如果您在安装过程中遇到任何问题，请检查项目文档或向项目维护者寻求帮助。

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

deepin linux kernel

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。