在macOS项目中集成Sherpa-Onnx语音识别库的完整指南

2025-06-06 16:25:07作者：郜逊炳

Sherpa-Onnx是一个基于ONNX运行时的高性能语音识别库，支持多种平台包括macOS系统。本文将详细介绍如何在macOS应用项目中正确集成和使用Sherpa-Onnx的Swift API。

准备工作

首先需要获取Sherpa-Onnx的macOS版本框架文件。Sherpa-Onnx为macOS提供了专门的xcframework包，支持x86_64和arm64两种架构。这个框架包含了所有必要的静态库和头文件。

项目配置步骤

添加桥接头文件

在Xcode项目中添加SherpaOnnx-Bridging-Header.h文件，这个头文件是Swift与C++代码交互的关键桥梁。它包含了所有必要的C函数声明，使得Swift代码能够调用底层的Sherpa-Onnx功能。
集成Swift封装类

SherpaOnnx.swift文件提供了对底层C API的Swift友好封装。这个文件定义了各种配置结构体和Wrapper类，大大简化了在Swift中使用Sherpa-Onnx的复杂度。
添加Sherpa-Onnx框架

将下载的sherpa-onnx.xcframework添加到项目中。这个框架包含了编译好的静态库，支持macOS平台。在Xcode中，只需将框架拖入项目导航器的Frameworks文件夹即可。
集成ONNX运行时库

Sherpa-Onnx依赖于ONNX运行时库。需要下载libonnxruntime.a静态库文件并添加到项目中。这个库提供了ONNX模型运行的基础支持。
配置构建设置

在项目的构建设置中，需要添加ONNX运行时库的搜索路径，确保链接器能够找到所需的静态库文件。同时，还需要在"Other Linker Flags"中添加"-lc++"选项，以链接C++标准库。

使用示例

配置完成后，就可以在Swift代码中使用Sherpa-Onnx提供的各种功能了。例如，创建说话人分离配置非常简单：

var config = sherpaOnnxOfflineSpeakerDiarizationConfig(
    segmentation: sherpaOnnxOfflineSpeakerSegmentationModelConfig(
        pyannote: sherpaOnnxOfflineSpeakerSegmentationPyannoteModelConfig(model: segmentationModel)),
    embedding: sherpaOnnxSpeakerEmbeddingExtractorConfig(model: embeddingExtractorModel),
    clustering: sherpaOnnxFastClusteringConfig(numClusters: numSpeakers)
)

let sd = SherpaOnnxOfflineSpeakerDiarizationWrapper(config: &config)