[具身智能-631]：获取音频输入的代码示例

张

张建站

2026/5/10 17:39:38

10分钟阅读

树莓派 4B/5、RK3568/RK3588 音频输入代码示例统一用Python pyaudio wave适配USB 麦克风、I2S 麦克风、板载音频输入一套代码通用。一、先装依赖bash运行sudo apt update sudo apt install portaudio19-dev python3-pip pip3 install pyaudio wave二、通用音频录制代码录音保存为 wavpython运行import pyaudio import wave # 配置参数 FORMAT pyaudio.paInt16 # 16位采样 CHANNELS 1 # 单声道语音够用 RATE 16000 # 语音标准16k采样率 CHUNK 1024 # 每次读取帧数 RECORD_SECONDS 5 # 录音时长 WAVE_OUTPUT_FILENAME audio_in.wav # 初始化 p pyaudio.PyAudio() # 打开音频流 stream p.open( formatFORMAT, channelsCHANNELS, rateRATE, inputTrue, frames_per_bufferCHUNK ) print(开始录音...) frames [] # 循环读取音频输入 for _ in range(0, int(RATE / CHUNK * RECORD_SECONDS)): data stream.read(CHUNK) frames.append(data) print(录音结束) # 关闭流 stream.stop_stream() stream.close() p.terminate() # 保存为wav文件 wf wave.open(WAVE_OUTPUT_FILENAME, wb) wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b.join(frames)) wf.close()三、实时读取音频流不存文件直接拿数据流适合做语音识别、降噪、AI 实时推理python运行import pyaudio import numpy as np FORMAT pyaudio.paInt16 CHANNELS 1 RATE 16000 CHUNK 512 p pyaudio.PyAudio() stream p.open( formatFORMAT, channelsCHANNELS, rateRATE, inputTrue, frames_per_bufferCHUNK ) print(实时获取音频输入按CtrlC退出) try: while True: # 读取原始字节 data stream.read(CHUNK) # 转成numpy数组方便算法处理 audio_np np.frombuffer(data, dtypenp.int16) # 这里可以做音量检测、VAD静音检测、送入AI模型 print(当前音频音量均值, np.abs(audio_np).mean()) except KeyboardInterrupt: print(停止采集) finally: stream.stop_stream() stream.close() p.terminate()四、选择指定麦克风设备多麦共存时用1. 先查看所有音频设备python运行import pyaudio p pyaudio.PyAudio() for i in range(p.get_device_count()): print(i, p.get_device_info_by_index(i)[name])2. 指定设备编号录制在stream.open加input_device_index设备号python运行stream p.open( formatFORMAT, channelsCHANNELS, rateRATE, inputTrue, input_device_index2, # 改成你查到的麦克风编号 frames_per_bufferCHUNK )五、平台适配说明树莓派 4B/5USB 麦、USB 声卡、I2S ReSpeaker 阵列都能用采样率固定16000适配语音识别最佳RK3568/RK3588板载模拟麦、I2S、PDM 阵列全部兼容自带 NPU可把读到的音频流直接送入本地语音模型六、常见问题报错找不到设备apt install alsa-utils执行arecord -l看麦克风是否被系统识别杂音大降低增益、改用 I2S/PDM 数字麦不用模拟麦采样率报错强制用 16000 或 8000 标准语音采样率

Simscape建模避坑指南：搞懂‘贯穿变量’和‘跨变量’，别让能量流算错了

Simscape建模避坑指南：搞懂‘贯穿变量’和‘跨变量’，别让能量流算错了第一次在Simscape中搭建液压执行器模型时，我盯着屏幕上那个反向运动的机械臂发呆了整整十分钟。明明按照物理直觉连接了所有模块，为什么仿真结果会和现实世界…...

2026/5/10 17:38:44 阅读更多 →

WindowResizer完整指南：如何强制调整任意Windows窗口大小

WindowResizer完整指南：如何强制调整任意Windows窗口大小【免费下载链接】WindowResizer 一个可以强制调整应用程序窗口大小的工具项目地址: https://gitcode.com/gh_mirrors/wi/WindowResizer 还在为那些无法调整大小的Windows窗口而烦恼吗？老…...

2026/5/10 17:37:51 阅读更多 →

终极指南：3分钟快速解锁QQ音乐加密文件，实现音频格式自由转换

终极指南：3分钟快速解锁QQ音乐加密文件，实现音频格式自由转换【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 你是否曾经遇到过这样的困扰&#xff…...

2026/5/10 17:34:17 阅读更多 →

【阳师范学院主办，多高校承协办 | IET出版，往届连续4届EI稳定检索，平均刊后2个月EI检索，EI检索稳定 | 择优至EI期刊】第五届电力工程与电气技术学术会议（ICPEET 2026）

ICPEET 2026 已申请IET (CA) EAI (JA) 出版会议论文（CA）： 会议已申请IET Conference Proceedings (ISSN: 2732-4494) 出版，收录于IET数字图书馆，并提交EI Compendex、Scopus、IEEE Xplore等数据库进行检索。期刊论文…...

2026/5/10 0:00:32 阅读更多 →