告别复杂配置:Python-for-Android实现音频录制与播放的极简方案
你还在为Python应用打包成Android APK时的音频功能头疼吗?当Kivy应用需要录制语音留言,或者游戏需要播放背景音效时,面对NDK编译、Java接口调用等复杂流程望而却步?本文将用80行代码+3个核心模块,带你实现从麦克风录音到扬声器播放的完整音频链路,无需深入Android原生开发。
读完本文你将获得:
- 3分钟搭建Python音频开发环境
- 50行代码实现录音+播放功能
- 解决常见音频卡顿/权限问题的实战经验
- 适配SDL2/SDL3的跨版本兼容方案
核心模块解析
Python-for-Android通过三层架构实现音频功能:底层Cython桥接Android NDK,中层Python API封装,上层应用调用。关键实现位于pythonforandroid/recipes/android/src/setup.py,其中定义了两个核心扩展模块:
Extension('android._android_sound',
['android/_android_sound.pyx', 'android/_android_sound_jni.c'],
libraries=['log'],
library_dirs=library_dirs,
extra_compile_args=['-include', 'stdlib.h'])
_android_sound模块通过JNI(Java Native Interface)调用Android AudioRecord和AudioTrack类,实现了音频流的底层处理。该模块会被编译为.so文件,打包进APK的lib目录。
环境准备与依赖配置
基础环境搭建
确保已安装Python-for-Android核心依赖:
pip install python-for-android
git clone https://gitcode.com/gh_mirrors/py/python-for-android
cd python-for-android
音频组件集成
在buildozer.spec或requirements.txt中添加必要的音频组件:
android
sdl2_mixer # 或sdl3_mixer(视bootstrap版本而定)
录音功能实现
权限配置
在APK打包前,需在AndroidManifest.xml中添加录音权限(通过buildozer.spec配置):
android.permissions = RECORD_AUDIO, WRITE_EXTERNAL_STORAGE
核心录音代码
from android import _android_sound
import time
import os
def record_audio(filename, duration=5):
"""录制指定时长的音频并保存为WAV文件"""
# 初始化录音器(44.1kHz采样率,单声道,16位深度)
recorder = _android_sound.AudioRecorder(44100, 1, 16)
recorder.start()
# 存储音频数据的缓冲区
audio_data = []
# 录制指定时长
start_time = time.time()
while time.time() - start_time < duration:
# 读取1024帧音频数据
buffer = recorder.read(1024)
audio_data.append(buffer)
recorder.stop()
# 合并缓冲区并保存为文件
with open(filename, 'wb') as f:
# WAV文件头(简化版)
f.write(b'RIFF$\x00\x00\x00WAVEfmt \x10\x00\x00\x00\x01\x00\x01\x00D\xac\x00\x00\x88X\x01\x00\x02\x00\x10\x00data\x00\x00\x00\x00')
f.write(b''.join(audio_data))
return filename
播放功能实现
SDL音频播放
对于基于SDL的应用(如Kivy),推荐使用SDL_mixer模块播放音频:
from android import mActivity
from jnius import autoclass
def play_audio(filename):
"""使用SDL_mixer播放音频文件"""
SDLActivity = autoclass('org.kivy.android.PythonSDLActivity')
mixer = autoclass('org.libsdl.app.SDLActivity').getMixer()
# 加载音频文件
sound = mixer.load(filename)
# 播放(-1表示循环播放,0表示播放一次)
sound.play(0)
# 等待播放完成
while sound.isPlaying():
time.sleep(0.1)
sound.unload()
原生Android播放
对于非SDL应用,可直接使用Android的MediaPlayer:
def play_audio_native(filename):
"""使用Android原生MediaPlayer播放音频"""
MediaPlayer = autoclass('android.media.MediaPlayer')
mp = MediaPlayer()
try:
mp.setDataSource(filename)
mp.prepare()
mp.start()
while mp.isPlaying():
time.sleep(0.1)
finally:
mp.release()
完整应用示例
以下是一个包含录音和播放功能的完整Kivy应用:
from kivy.app import App
from kivy.uix.boxlayout import BoxLayout
from kivy.uix.button import Button
from android import _android_sound
import time
import os
class AudioApp(App):
def build(self):
self.layout = BoxLayout(orientation='vertical')
self.record_btn = Button(text='开始录音', size_hint=(1, 0.5))
self.record_btn.bind(on_press=self.start_recording)
self.play_btn = Button(text='播放录音', size_hint=(1, 0.5))
self.play_btn.bind(on_press=self.play_recording)
self.layout.add_widget(self.record_btn)
self.layout.add_widget(self.play_btn)
self.audio_file = os.path.join(os.environ['EXTERNAL_STORAGE'], 'recording.wav')
return self.layout
def start_recording(self, instance):
self.record_btn.text = '录制中...'
self.record_audio(self.audio_file, duration=3)
self.record_btn.text = '开始录音'
def play_recording(self, instance):
if os.path.exists(self.audio_file):
self.play_audio(self.audio_file)
# 此处省略record_audio和play_audio方法(同前文)
if __name__ == '__main__':
AudioApp().run()
常见问题解决
音频卡顿问题
若出现播放卡顿,可尝试调整缓冲区大小:
# 在初始化AudioRecorder时设置更大的缓冲区
recorder = _android_sound.AudioRecorder(44100, 1, 16, buffer_size=8192)
权限动态申请
Android 6.0以上需要动态申请权限:
from android.permissions import request_permissions, Permission
request_permissions([Permission.RECORD_AUDIO, Permission.WRITE_EXTERNAL_STORAGE])
打包与测试
使用buildozer打包应用:
buildozer android debug deploy run
测试APK将自动安装到连接的Android设备,可通过logcat查看音频相关日志:
adb logcat | grep audio
总结与进阶
本文介绍的方案已覆盖80%的音频应用场景。如需更复杂的音频处理(如实时滤波、音频可视化),可扩展_android_sound模块,或集成pythonforandroid/recipes/aubio等专业音频分析库。
建议参考官方测试应用testapps/on_device_unit_tests/test_app/main.py中的音频测试用例,获取更多实战经验。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
FreeSql功能强大的对象关系映射(O/RM)组件,支持 .NET Core 2.1+、.NET Framework 4.0+、Xamarin 以及 AOT。C#00