Whisper.cpp服务器请求参数配置指南

2025-05-03 14:40:21作者：袁立春Spencer

Whisper.cpp作为一款开源的语音识别工具，其内置的服务器功能为开发者提供了便捷的API接口。本文将详细介绍如何通过curl命令向Whisper.cpp服务器发送请求并配置各种参数。

核心请求参数

Whisper.cpp服务器支持多种参数配置，这些参数主要通过multipart/form-data格式的HTTP请求传递：

文件参数(file)：必须参数，指定要识别的音频文件路径
温度参数(temperature)：控制模型输出的随机性，默认值为0.0
温度增量(temperature_inc)：温度参数的增量值，默认0.2
响应格式(response_format)：指定返回结果的格式，支持json等格式
语言参数(language)：指定识别语言，如"fr"表示法语

正确请求示例

以下是向本地运行的Whisper.cpp服务器发送请求的标准格式：

curl 127.0.0.1:8080/inference \
    -H "Content-Type: multipart/form-data" \
    -F file="@audio.wav" \
    -F temperature="0.0" \
    -F temperature_inc="0.2" \
    -F response_format="json" \
    -F language="fr"

参数使用说明

温度参数：值越高结果越随机，适合创造性任务；值越低结果越确定，适合精确转录
语言参数：虽然Whisper支持自动检测语言，但明确指定语言参数可以提高识别准确率
文件格式：支持常见音频格式如WAV、MP3等，建议使用16kHz采样率的单声道音频以获得最佳效果

常见问题解决

如果遇到参数不生效的情况，请检查：

参数名称拼写是否正确（注意是language而非-l）
参数值是否在有效范围内
服务器是否已正确启动并监听指定端口

通过合理配置这些参数，开发者可以充分利用Whisper.cpp的强大语音识别能力，构建各种语音处理应用。

whisper.cpp

OpenAI 的 Whisper 模型在 C/C++ 中的移植版本。

项目地址：https://gitcode.com/GitHub_Trending/wh/whisper.cpp

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

186

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

759

Whisper.cpp服务器请求参数配置指南

核心请求参数

正确请求示例

参数使用说明

常见问题解决

热门内容推荐

最新内容推荐

项目优选

Whisper.cpp服务器请求参数配置指南

核心请求参数

正确请求示例

参数使用说明

常见问题解决

相关内容推荐

热门内容推荐

最新内容推荐

项目优选