当前位置:首页 > 文章列表 > 文章 > python教程 > PyAudio实时音频控制:无限播放与停止技巧

PyAudio实时音频控制:无限播放与停止技巧

2025-08-27 20:30:58 0浏览 收藏

**实时音频控制:PyAudio无限时长播放与停止方法** 想实现按下按钮播放声音,松开按钮停止播放的实时音频控制吗?本文将深入探讨如何利用PyAudio库实现这一功能,打破传统预设音频时长的限制。通过修改原始代码的循环结构和音频流控制方式,我们实现了对声音播放的精确控制,避免了音频只能播放很短时间的难题。文章提供详细的代码示例,展示了如何移除时长限制、使用外部循环监听MIDI输入以及实时控制音频流的启动与停止。同时,还分享了MIDI消息处理、性能优化以及音频流控制等关键注意事项,助您轻松掌握无限时长音频播放与停止的技巧,灵活应用于各种音频应用场景。

实时音频控制:基于PyAudio的无限时长声音播放与停止

本文介绍如何使用PyAudio库实现按下按钮开始播放声音,松开按钮停止声音的实时音频控制。通过修改原始代码中的循环结构和停止音频流的方式,实现对声音播放的精确控制,避免了预先定义音频时长的限制,并提供了代码示例和注意事项,帮助开发者更好地理解和应用该技术。

实现无限时长声音播放与停止

原始代码中存在一个关键问题:音频流的播放被限制在一个内部的while循环中,并且循环只执行一次。这导致声音只能播放很短的时间。要实现按下按钮开始播放声音,松开按钮停止声音的效果,需要对代码结构进行调整。

核心思路:

  1. 移除时长限制: 不再预先定义音频的时长,而是持续生成音频数据并播放,直到接收到停止信号。
  2. 外部循环控制: 使用外部循环来监听MIDI输入,根据按键状态控制音频流的启动和停止。
  3. 实时音频流控制: 在接收到停止信号时,立即停止音频流。

修改后的代码:

import time
from rtmidi.midiutil import open_midiinput
import numpy as np
import pyaudio

p = pyaudio.PyAudio()
# play = True  # Removed this line

volume = 0.5  # range [0.0, 1.0]
fs = 44100  # sampling rate, Hz, must be integer
# duration = 5.0  # in seconds, may be float # Removed duration
fA = 440.0  # sine frequency, Hz, may be float
fB = 493.88
fC = 523.25
fD = 587.33

frekvence = 440

frekvence_seznam = {
    (144, 32): fA,
    (144, 33): fB,
    (144, 34): fC,
    (144, 35): fD,
}

port = 0

midiin, port_name = open_midiinput(port)

stream = None  # Initialize stream outside the loop

try:
    while True:
        msg = midiin.get_message()

        if msg:
            message = msg
            klic = message[0]
            lepsi_klic = tuple(klic[:2])
            print(message[0])

            if lepsi_klic in frekvence_seznam:
                print("je to tam")
                frekvence = frekvence_seznam[lepsi_klic]

                period = 2 * np.pi
                # Removed duration from np.arange
                x = period * np.arange(fs * 0.1) * frekvence / fs # Use a small chunk size

                sinus = np.sin(x)
                square = np.sign(sinus)
                triangle = 2/np.pi * np.arcsin(np.sin(x))
                saw = abs((x % period) - 1)
                curvy_triangle = (abs((x % period) - 1)) ** 2

                samples = (triangle).astype(np.float32)

                # for paFloat32 sample values must be in range [-1.0, 1.0]
                if stream is None or not stream.is_active(): # Check if stream is active
                    stream = p.open(format=pyaudio.paFloat32,
                                    channels=1,
                                    rate=fs,
                                    output=True)

                vysledek = volume * samples

                # spusteni zvuku
                stream.write(vysledek) #Removed while Loop and just write one chunk

            elif lepsi_klic == (128, 32) or lepsi_klic == (128, 33) or lepsi_klic == (128, 34) or lepsi_klic == (128, 35): # Key released
                print("Key Released")
                if stream is not None and stream.is_active():
                    stream.stop_stream()

            elif lepsi_klic == (144, 81):
                break # Exit the main loop
finally:
    if stream is not None and stream.is_active():
        stream.stop_stream()
    if stream is not None:
        stream.close()
    p.terminate()
    print("Program terminated.")

代码解释:

  1. 移除duration: 不再预先定义音频时长。
  2. 移除内部while循环: 去掉了while play == True循环,直接在if语句块中写入音频数据。
  3. 使用小chunk size: 使用小的chunk size,例如fs * 0.1,使得音频可以更快的响应按键释放。
  4. 按键释放检测: 增加了对按键释放事件的检测(例如,MIDI消息(128, 32)),当检测到按键释放时,停止音频流。
  5. 流的初始化和判断: 在循环外部初始化 stream = None,并在每次播放前检查 stream 是否已经创建和激活,避免重复创建。
  6. 异常处理: 使用try...finally块确保程序退出时能够正确关闭音频流和PyAudio实例。

注意事项:

  • MIDI消息: MIDI消息的具体数值取决于MIDI键盘的设置。请根据实际情况调整代码中的MIDI消息值。
  • 性能优化: 持续生成和播放音频数据可能会消耗一定的CPU资源。如果需要处理复杂的音频效果,可以考虑使用更高效的音频处理库,例如librosa或sounddevice。
  • 音频流控制: 确保在程序退出前正确关闭音频流,释放资源。
  • chunk size: 调整np.arange(fs * 0.1)中的0.1可以调整每次写入音频流的数据量,影响响应速度和CPU占用。

总结:

通过修改原始代码的循环结构和音频流控制方式,可以实现按下按钮开始播放声音,松开按钮停止声音的实时音频控制。这种方法避免了预先定义音频时长的限制,提供了更大的灵活性。在实际应用中,可以根据需要调整代码,实现更复杂的音频效果。

以上就是《PyAudio实时音频控制:无限播放与停止技巧》的详细内容,更多关于的资料请关注golang学习网公众号!

HTML模板标签使用详解HTML模板标签使用详解
上一篇
HTML模板标签使用详解
多边形内提取NDVI方法:Python教程详解
下一篇
多边形内提取NDVI方法:Python教程详解
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    381次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    377次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    369次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    381次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    398次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码