当前位置: 开发笔记 > 编程语言 > 正文

python怎么播放本地录音_python实现播放音频和录音功能示例代码

作者：浪漫的白狼族 | 来源：互联网 | 2023-09-23 16:48

音频预处理这一讲主要介绍些音频基本处理方式，为接下来的语音识别打基础。三种播放音频的方式使用python播放音频有以下几种方式：os.system()o

音频预处理

这一讲主要介绍些音频基本处理方式&＃xff0c;为接下来的语音识别打基础。

三种播放音频的方式

使用 python 播放音频有以下几种方式&＃xff1a;

os.system()

os.system(file) 调用系统应用来打开文件&＃xff0c;file 可为图片或者音频文件。

缺点&＃xff1a;要打开具体的应用&＃xff0c;不能在后台播放音频。

pyaudio

安装&＃xff1a;pip install pyaudio

官方提供了播放音频与录音的 api &＃xff0c;使用十分方便&＃xff0c;只要把Filename更改为你的音频文件的文字&＃xff0c;就可以播放音频了。

"""PyAudio Example: Play a WAVE file."""

import pyaudio

import wave

CHUNK &＃61; 1024

FILENAME &＃61; &＃39;你的音频文件&＃39;

def play(filename &＃61; FILENAME):

wf &＃61; wave.open(filename, &＃39;rb&＃39;)

p &＃61; pyaudio.PyAudio()

stream &＃61; p.open(format&＃61;p.get_format_from_width(wf.getsampwidth()),

channels&＃61;wf.getnchannels(),

rate&＃61;wf.getframerate(),

output&＃61;True)

data &＃61; wf.readframes(CHUNK)

while data !&＃61; b&＃39;&＃39;:

stream.write(data)

data &＃61; wf.readframes(CHUNK)

stream.stop_stream()

stream.close()

p.terminate()

jupyter notebook

在 jupyer notebook 中播放音频可以使用以下函数&＃xff1a;

import IPython.display as ipd

ipd.Audio(文件名)

几种读取音频的方式

python 有很多读取音频文件的方法&＃xff0c;内置的库 wave &＃xff0c;科学计算库 scipy, 和方便易用的语音处理库 librosa。

下面将介绍分别使用这几种库读取音频文件&＃xff1a;

安装&＃xff1a;

wave 是内置库直接导入即可。

scipy: pip install scipy

librosa: pip install librosa

使用&＃xff1a;

wave.open:

参数 path 为文件名&＃xff0c;mode 为打开方式

以&＃39;rb&＃39;方式打开文件返回一个 Wave_read 对象&＃xff0c;而以&＃39;wb&＃39;方式打开文件返回一个 Wave_write 对象。

scipy.io.wavfile:

参数 path 为文件名

返回 rate : 采样率(每秒采样点的个数)&＃xff0c;data : 音频数据

librosa.load:

参数 path 为文件名

返回 y 为音频数据&＃xff0c;sr 为采样率

# read wav file from path

from scipy.io import wavfile

import librosa

import pyaudio

# wave

file &＃61; wave.open(path,&＃39;rb&＃39;)

# wavfile

rate, data &＃61; wavfile.read(path)

# librosa

y, sr &＃61; librosa.load(path)

下面演示一个使用 wavfile 读取音频文件并且画出波形的例子&＃xff1a;

首先要计算音频到底持续了多长时间&＃xff0c;wave 的 shape 就是总的采样点个数&＃xff0c;除以采样频率可以得到持续的总时间(秒)&＃xff0c;乘1000得到总持续时间(毫秒)。接着通过 np.linsapce 产生时间的序列&＃xff0c;最后使用 matplotlib 画出图像。

from scipy.io import wavfile

import matplotlib.pyplot as plt

import numpy as np

%matplotlib inline

# 一秒采样数

sr, wave &＃61; wavfile.read(&＃39;D://QQPCMgr/Desktop/python3/skip.wav&＃39;)

sample_number &＃61; wave.shape[0]

total_time &＃61; int(sample_number / sr * 1000)

time_series &＃61; np.linspace(0,total_time,sample_number)

fig, ax &＃61; plt.subplots(1, 1)

ax.plot(time_series, wave)

ax.set_title(&＃39;Time*Amplitude&＃39;)

ax.set_xlabel(&＃39;Time/ms&＃39;)

ax.set_ylabel(&＃39;Amplitude/dB&＃39;)

最后再借用 pyaudio 的 api 我们可以实现连续录音功能&＃xff1a;

python 实现录音功能

其中&＃xff0c;函数 multi_record每结束一次录音会询问 “是否进行下一次录音&＃xff1f;”&＃xff0c;按回车就可以进行下一次录音了。

import wave

import pyaudio

import matplotlib.pyplot as plt

import time

CHUNK &＃61; 1024

FORMAT &＃61; pyaudio.paInt16

CHANNELS &＃61; 2

RATE &＃61; 44100

RECORD_SECONDS &＃61; 5

def record(filename&＃61;&＃39;output.wav&＃39;):

"""官方录音教程

"""

p &＃61; pyaudio.PyAudio()

stream &＃61; p.open(format&＃61;FORMAT,

channels&＃61;CHANNELS,

rate&＃61;RATE,

input&＃61;True,

frames_per_buffer&＃61;CHUNK)

print("* recording")

frames &＃61; []

for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):

data &＃61; stream.read(CHUNK)

frames.append(data)

print("* done recording")

stream.stop_stream()

stream.close()

p.terminate()

wf &＃61; wave.open(filename, &＃39;wb&＃39;)

wf.setnchannels(CHANNELS)

wf.setsampwidth(p.get_sample_size(FORMAT))

wf.setframerate(RATE)

wf.writeframes(b&＃39;&＃39;.join(frames))

wf.close()

def multi_record(num&＃61;3):

"""implement 多次录音"""

for i in range(1,num&＃43;1):

print(&＃39;第{}次录音准备&＃39;.format(i))

filename &＃61; &＃39;record_{}.wav&＃39;.format(i)

record(filename)

time.sleep(second)

_ &＃61; input(&＃39;进行下一次录音&＃xff1f;&＃39;)

def main():

multi_record()

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

main()

总结

以上就是这篇文章的全部内容了&＃xff0c;希望本文的内容对大家的学习或者工作具有一定的参考学习价值&＃xff0c;如果有疑问大家可以留言交流&＃xff0c;谢谢大家对脚本之家的支持。

推荐阅读

format
基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本

文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]

蜡笔小新 2023-12-12 13:27:42
format
Python实现变声器功能(萝莉音御姐音)的方法及步骤

本文介绍了使用Python实现变声器功能(萝莉音御姐音)的方法及步骤。首先登录百度AL开发平台，选择语音合成，创建应用并填写应用信息，获取Appid、API Key和Secret Key。然后安装pythonsdk，可以通过pip install baidu-aip或python setup.py install进行安装。最后，书写代码实现变声器功能，使用AipSpeech库进行语音合成，可以设置音量等参数。 ... [详细]

蜡笔小新 2023-12-14 16:21:36
blob
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
main
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
get
树莓派语音控制的配置方法和步骤

本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助，文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行，然后使用Eoman的控制方法，即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]

蜡笔小新 2023-12-12 03:02:49
get
Spark实现高斯朴素贝叶斯模型的低配版

本文介绍了使用Spark实现低配版高斯朴素贝叶斯模型的原因和原理。随着数据量的增大，单机上运行高斯朴素贝叶斯模型会变得很慢，因此考虑使用Spark来加速运行。然而，Spark的MLlib并没有实现高斯朴素贝叶斯模型，因此需要自己动手实现。文章还介绍了朴素贝叶斯的原理和公式，并对具有多个特征和类别的模型进行了讨论。最后，作者总结了实现低配版高斯朴素贝叶斯模型的步骤。 ... [详细]

蜡笔小新 2023-12-10 21:42:37
tree
开源Keras Faster RCNN模型介绍及代码结构解析

本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构，包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]

蜡笔小新 2023-12-10 17:44:07
filter
Python使用Pillow包生成验证码图片的方法

本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号，并添加干扰象素，生成一幅验证码图片。需要配置好Python环境，并安装Pillow库。代码实现包括导入Pillow包和随机模块，定义随机生成字母、数字和字体颜色的函数。 ... [详细]

蜡笔小新 2023-12-10 16:51:25
process
scrapy存入excel时，excel文件被反复擦除重写。文件大小始终不超过100k，请问这种情况改如何解决

怀疑是每次都在新建文件，具体代码如下 ... [详细]

蜡笔小新 2023-12-13 17:53:49
process
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
filter
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
get
网络请求模块选择——axios框架的基本使用和封装

本文介绍了选择网络请求模块axios的原因，以及axios框架的基本使用和封装方法。包括发送并发请求的演示，全局配置的设置，创建axios实例的方法，拦截器的使用，以及如何封装和请求响应劫持等内容。 ... [详细]

蜡笔小新 2023-12-12 10:16:43
yaml
EzPP 0.2发布，新增YAML布局渲染功能

EzPP发布了0.2.1版本，新增了YAML布局渲染功能，可以将YAML文件渲染为图片，并且可以复用YAML作为模版，通过传递不同参数生成不同的图片。这个功能可以用于绘制Logo、封面或其他图片，让用户不需要安装或卸载Photoshop。文章还提供了一个入门例子，介绍了使用ezpp的基本渲染方法，以及如何使用canvas、text类元素、自定义字体等。 ... [详细]

蜡笔小新 2023-12-11 12:39:10
fetch
Python操作MySQL（pymysql模块）详解及示例代码

本文介绍了使用Python操作MySQL数据库的方法，详细讲解了pymysql模块的安装和连接MySQL数据库的步骤，并提供了示例代码。内容涵盖了创建表、插入数据、查询数据等操作，帮助读者快速掌握Python操作MySQL的技巧。 ... [详细]

蜡笔小新 2023-12-10 17:50:06
fetch
Gitlab接入公司内部单点登录的安装和配置教程

本文介绍了如何将公司内部的Gitlab系统接入单点登录服务，并提供了安装和配置的详细教程。通过使用oauth2协议，将原有的各子系统的独立登录统一迁移至单点登录。文章包括Gitlab的安装环境、版本号、编辑配置文件的步骤，并解决了在迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2023-12-10 14:38:53

浪漫的白狼族

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章