SherpaOnnx iOS-SwiftUI 项目中的音频会话初始化问题解析

2025-06-06 12:58:46作者：郜逊炳

在开发基于 SherpaOnnx 的 iOS-SwiftUI 应用时，开发者可能会遇到一个常见的音频会话初始化问题。本文将深入分析该问题的成因、解决方案以及相关的技术背景。

问题现象

当开发者在 Xcode 中构建并运行 SherpaOnnx 的 iOS-SwiftUI 项目时，控制台会输出以下错误信息：

init recorder
AddInstanceForFactory: No factory registered for id <CFUUID 0x600000123456> xxxxxxx-xxxxx-xxxxx-xxxx-xxxxxxxx
AURemoteIO.cpp:1090 failed: -10851 (enable 1, outf< 2 ch, 0 Hz, Float32, deinterleaved> inf< 2 ch, 0 Hz, Float32, deinterleaved>)
AVAEInternal.h:71 required condition is false: [AVAEGraphNode.mm:832:CreateRecordingTap: (IsFormatSampleRateAndChannelCountValid(format))]

最终导致应用崩溃，抛出异常：

*** Terminating app due to uncaught exception 'com.apple.coreaudio.avfaudio', reason: 'required condition is false: IsFormatSampleRateAndChannelCountValid(format)'

问题根源分析

这个问题的根本原因是应用没有正确初始化音频会话(AVAudioSession)。在iOS系统中，音频会话管理着应用与系统音频交互的行为，包括：

音频输入输出路由
采样率和通道数配置
音频中断处理
音频类别设置(播放、录音或两者兼具)

当应用尝试使用音频功能(如录音)而没有正确配置音频会话时，系统无法确定如何处理音频数据流，导致上述错误。

解决方案

正确的做法是在初始化录音器之前先配置好音频会话。以下是修复代码示例：

private var audioSession: AVAudioSession!

func setupAudioSession() {
    audioSession = AVAudioSession.sharedInstance()
    do {
        // 设置音频会话类别为播放和录音
        try audioSession.setCategory(.playAndRecord, 
                                  mode: .default, 
                                  options: [.defaultToSpeaker])
        // 激活音频会话
        try audioSession.setActive(true)
    } catch {
        print("Failed to set up audio session: \(error)")
    }
}

init() {
    initRecognizer()
    setupAudioSession()  // 必须先初始化音频会话
    initRecorder()
}

技术细节解析

音频会话类别选择：.playAndRecord类别表示应用需要同时进行音频播放和录制，这是语音识别类应用的典型需求。
模式选择：.default模式适用于大多数场景，如果需要更精细的控制，可以考虑.voiceChat或.videoRecording等其他模式。
选项配置：.defaultToSpeaker选项确保音频默认从扬声器输出，而不是听筒，这在语音识别场景中能提供更好的用户体验。
错误处理：必须妥善处理setCategory和setActive可能抛出的异常，因为在实际部署中可能会遇到权限问题或其他配置冲突。