告别复杂配置:Python-for-Android实现音频录制与播放的极简方案
你还在为Python应用打包成Android APK时的音频功能头疼吗?当Kivy应用需要录制语音留言,或者游戏需要播放背景音效时,面对NDK编译、Java接口调用等复杂流程望而却步?本文将用80行代码+3个核心模块,带你实现从麦克风录音到扬声器播放的完整音频链路,无需深入Android原生开发。
读完本文你将获得:
- 3分钟搭建Python音频开发环境
- 50行代码实现录音+播放功能
- 解决常见音频卡顿/权限问题的实战经验
- 适配SDL2/SDL3的跨版本兼容方案
核心模块解析
Python-for-Android通过三层架构实现音频功能:底层Cython桥接Android NDK,中层Python API封装,上层应用调用。关键实现位于pythonforandroid/recipes/android/src/setup.py,其中定义了两个核心扩展模块:
Extension('android._android_sound',
['android/_android_sound.pyx', 'android/_android_sound_jni.c'],
libraries=['log'],
library_dirs=library_dirs,
extra_compile_args=['-include', 'stdlib.h'])
_android_sound模块通过JNI(Java Native Interface)调用Android AudioRecord和AudioTrack类,实现了音频流的底层处理。该模块会被编译为.so文件,打包进APK的lib目录。
环境准备与依赖配置
基础环境搭建
确保已安装Python-for-Android核心依赖:
pip install python-for-android
git clone https://gitcode.com/gh_mirrors/py/python-for-android
cd python-for-android
音频组件集成
在buildozer.spec或requirements.txt中添加必要的音频组件:
android
sdl2_mixer # 或sdl3_mixer(视bootstrap版本而定)
录音功能实现
权限配置
在APK打包前,需在AndroidManifest.xml中添加录音权限(通过buildozer.spec配置):
android.permissions = RECORD_AUDIO, WRITE_EXTERNAL_STORAGE
核心录音代码
from android import _android_sound
import time
import os
def record_audio(filename, duration=5):
"""录制指定时长的音频并保存为WAV文件"""
# 初始化录音器(44.1kHz采样率,单声道,16位深度)
recorder = _android_sound.AudioRecorder(44100, 1, 16)
recorder.start()
# 存储音频数据的缓冲区
audio_data = []
# 录制指定时长
start_time = time.time()
while time.time() - start_time < duration:
# 读取1024帧音频数据
buffer = recorder.read(1024)
audio_data.append(buffer)
recorder.stop()
# 合并缓冲区并保存为文件
with open(filename, 'wb') as f:
# WAV文件头(简化版)
f.write(b'RIFF$\x00\x00\x00WAVEfmt \x10\x00\x00\x00\x01\x00\x01\x00D\xac\x00\x00\x88X\x01\x00\x02\x00\x10\x00data\x00\x00\x00\x00')
f.write(b''.join(audio_data))
return filename
播放功能实现
SDL音频播放
对于基于SDL的应用(如Kivy),推荐使用SDL_mixer模块播放音频:
from android import mActivity
from jnius import autoclass
def play_audio(filename):
"""使用SDL_mixer播放音频文件"""
SDLActivity = autoclass('org.kivy.android.PythonSDLActivity')
mixer = autoclass('org.libsdl.app.SDLActivity').getMixer()
# 加载音频文件
sound = mixer.load(filename)
# 播放(-1表示循环播放,0表示播放一次)
sound.play(0)
# 等待播放完成
while sound.isPlaying():
time.sleep(0.1)
sound.unload()
原生Android播放
对于非SDL应用,可直接使用Android的MediaPlayer:
def play_audio_native(filename):
"""使用Android原生MediaPlayer播放音频"""
MediaPlayer = autoclass('android.media.MediaPlayer')
mp = MediaPlayer()
try:
mp.setDataSource(filename)
mp.prepare()
mp.start()
while mp.isPlaying():
time.sleep(0.1)
finally:
mp.release()
完整应用示例
以下是一个包含录音和播放功能的完整Kivy应用:
from kivy.app import App
from kivy.uix.boxlayout import BoxLayout
from kivy.uix.button import Button
from android import _android_sound
import time
import os
class AudioApp(App):
def build(self):
self.layout = BoxLayout(orientation='vertical')
self.record_btn = Button(text='开始录音', size_hint=(1, 0.5))
self.record_btn.bind(on_press=self.start_recording)
self.play_btn = Button(text='播放录音', size_hint=(1, 0.5))
self.play_btn.bind(on_press=self.play_recording)
self.layout.add_widget(self.record_btn)
self.layout.add_widget(self.play_btn)
self.audio_file = os.path.join(os.environ['EXTERNAL_STORAGE'], 'recording.wav')
return self.layout
def start_recording(self, instance):
self.record_btn.text = '录制中...'
self.record_audio(self.audio_file, duration=3)
self.record_btn.text = '开始录音'
def play_recording(self, instance):
if os.path.exists(self.audio_file):
self.play_audio(self.audio_file)
# 此处省略record_audio和play_audio方法(同前文)
if __name__ == '__main__':
AudioApp().run()
常见问题解决
音频卡顿问题
若出现播放卡顿,可尝试调整缓冲区大小:
# 在初始化AudioRecorder时设置更大的缓冲区
recorder = _android_sound.AudioRecorder(44100, 1, 16, buffer_size=8192)
权限动态申请
Android 6.0以上需要动态申请权限:
from android.permissions import request_permissions, Permission
request_permissions([Permission.RECORD_AUDIO, Permission.WRITE_EXTERNAL_STORAGE])
打包与测试
使用buildozer打包应用:
buildozer android debug deploy run
测试APK将自动安装到连接的Android设备,可通过logcat查看音频相关日志:
adb logcat | grep audio
总结与进阶
本文介绍的方案已覆盖80%的音频应用场景。如需更复杂的音频处理(如实时滤波、音频可视化),可扩展_android_sound模块,或集成pythonforandroid/recipes/aubio等专业音频分析库。
建议参考官方测试应用testapps/on_device_unit_tests/test_app/main.py中的音频测试用例,获取更多实战经验。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin08
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00