探索Subsonic:SwiftUI音频播放的轻量级解决方案

Subsonic是一个为SwiftUI设计的小巧而强大的音频处理库,它使得在各种场景下播放音频变得异常简单,无论是即时触发还是基于状态的播放。该库支持iOS 14+、macOS 11+、tvOS 14+以及watchOS 7+。
“Subsonic”这个名字源于音速之下,象征着这个库的存在几乎察觉不到,但它的功能强大到足以让你的音频体验提升一个档次。
安装
使用Swift Package Manager(SwiftPM)将Subsonic添加到你的项目中,只需在你的Package.swift文件的dependencies部分加入以下代码:
.package(url: "https://github.com/twostraws/Subsonic", from: "0.2.0"),
然后在需要的地方导入Subsonic即可开始使用。
播放音频
Subsonic提供了四种不同级别的控制方式来满足你的需求。
1. 简单播放音频
如果你只是想立即播放一个位于主bundle内的音频文件,可以这样操作:
Button("播放声音") {
play(sound: "example.mp3")
}
2. 带有控制权的播放
当你需要精细控制音频播放时,可以创建一个SubsonicPlayer对象的@StateObject属性:
struct ContentView: View {
@StateObject private var sound = SubsonicPlayer(sound: "example.mp3")
var body: some View {
VStack {
Button("开始") {
sound.play()
}
Button("停止") {
sound.stop()
}
Slider(value: $sound.volume)
}
}
}
这允许你在需要的时候启动或停止音频,调整音量和其他属性。
3. 绑定播放状态
若希望音频的播放与程序状态同步,可以使用sound()修饰符:
struct ContentView: View {
@State private var isPlaying = false
var body: some View {
Button {
isPlaying.toggle()
} label: {
Image(systemName: isPlaying ? "speaker.wave.3" : "speaker")
}
.sound("example.mp3", isPlaying: $isPlaying)
}
}
4. 自管理音频播放器
如果你想自行准备和播放音频,可以使用prepare(sound:):
Button("播放声音") {
let player = prepare(sound: "example.mp3")
// 配置后按需播放
}
请注意,你需要保存返回的player对象并自行控制播放。
停止音频
停止音频播放的方式取决于你是如何开始播放的:
- 使用
play(sound:)时,可调用stop(sound:)或stopAllManagedSounds()。 SubsonicPlayer实例可通过调用其stop()方法停止。- 对于
sound()修饰符,状态改变会自动停止播放。 - 如果使用
prepare(sound:),则自行负责播放和停止。
参数选项
play(sound:)和sound()修饰符接受一些额外参数:
bundle用于指定音频文件所在的捆绑包,默认是Bundle.main。volume设置相对音量,范围从0(静音)到1(最大),默认值为1。repeatCount控制重复次数,0为一次,1为两次,以此类推,.continuous表示无限循环。sound()修饰符还有一个playMode选项,它可以设置为.reset(从头开始播放) 或.continue(从暂停处继续)。
prepare(sound:)也允许指定自定义的bundle。
对于SubsonicPlayer,这些参数可以在初始化时设定,并且它们也可以动态调整。
项目特点
- 易用性:无论你是需要简单的播放还是复杂的控制,Subsonic都提供了直观的API。
- 灵活性:你可以以声明式或命令式的方式操作音频,适应不同的编程风格。
- 跨平台:Subsonic支持多个Apple平台,方便你在所有设备上构建一致的用户体验。
- 小巧而强大:Subsonic的体积小,但在音频处理上毫不妥协,确保了性能和稳定性。
关于作者
Subsonic由Paul Hudson创建,他的个人网站Hacking with Swift提供了丰富的Swift教程资源。
Subsonic遵循MIT许可证,详细条款请查看LICENSE文件。
现在就尝试Subsonic,为你的SwiftUI应用添加生动的音频元素吧!
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00