当前位置：首页 > 文章列表 > 文章 > python教程 > PyAudio实时音频控制：无限播放与停止技巧

PyAudio实时音频控制：无限播放与停止技巧

2025-08-27 20:30:58 0浏览收藏

**实时音频控制：PyAudio无限时长播放与停止方法** 想实现按下按钮播放声音，松开按钮停止播放的实时音频控制吗？本文将深入探讨如何利用PyAudio库实现这一功能，打破传统预设音频时长的限制。通过修改原始代码的循环结构和音频流控制方式，我们实现了对声音播放的精确控制，避免了音频只能播放很短时间的难题。文章提供详细的代码示例，展示了如何移除时长限制、使用外部循环监听MIDI输入以及实时控制音频流的启动与停止。同时，还分享了MIDI消息处理、性能优化以及音频流控制等关键注意事项，助您轻松掌握无限时长音频播放与停止的技巧，灵活应用于各种音频应用场景。

实时音频控制：基于PyAudio的无限时长声音播放与停止

本文介绍如何使用PyAudio库实现按下按钮开始播放声音，松开按钮停止声音的实时音频控制。通过修改原始代码中的循环结构和停止音频流的方式，实现对声音播放的精确控制，避免了预先定义音频时长的限制，并提供了代码示例和注意事项，帮助开发者更好地理解和应用该技术。

实现无限时长声音播放与停止

原始代码中存在一个关键问题：音频流的播放被限制在一个内部的while循环中，并且循环只执行一次。这导致声音只能播放很短的时间。要实现按下按钮开始播放声音，松开按钮停止声音的效果，需要对代码结构进行调整。

核心思路：

移除时长限制： 不再预先定义音频的时长，而是持续生成音频数据并播放，直到接收到停止信号。
外部循环控制： 使用外部循环来监听MIDI输入，根据按键状态控制音频流的启动和停止。
实时音频流控制： 在接收到停止信号时，立即停止音频流。

修改后的代码：

import time
from rtmidi.midiutil import open_midiinput
import numpy as np
import pyaudio

p = pyaudio.PyAudio()
# play = True  # Removed this line

volume = 0.5  # range [0.0, 1.0]
fs = 44100  # sampling rate, Hz, must be integer
# duration = 5.0  # in seconds, may be float # Removed duration
fA = 440.0  # sine frequency, Hz, may be float
fB = 493.88
fC = 523.25
fD = 587.33

frekvence = 440

frekvence_seznam = {
    (144, 32): fA,
    (144, 33): fB,
    (144, 34): fC,
    (144, 35): fD,
}

port = 0

midiin, port_name = open_midiinput(port)

stream = None  # Initialize stream outside the loop

try:
    while True:
        msg = midiin.get_message()

        if msg:
            message = msg
            klic = message[0]
            lepsi_klic = tuple(klic[:2])
            print(message[0])

            if lepsi_klic in frekvence_seznam:
                print("je to tam")
                frekvence = frekvence_seznam[lepsi_klic]

                period = 2 * np.pi
                # Removed duration from np.arange
                x = period * np.arange(fs * 0.1) * frekvence / fs # Use a small chunk size

                sinus = np.sin(x)
                square = np.sign(sinus)
                triangle = 2/np.pi * np.arcsin(np.sin(x))
                saw = abs((x % period) - 1)
                curvy_triangle = (abs((x % period) - 1)) ** 2

                samples = (triangle).astype(np.float32)

                # for paFloat32 sample values must be in range [-1.0, 1.0]
                if stream is None or not stream.is_active(): # Check if stream is active
                    stream = p.open(format=pyaudio.paFloat32,
                                    channels=1,
                                    rate=fs,
                                    output=True)

                vysledek = volume * samples

                # spusteni zvuku
                stream.write(vysledek) #Removed while Loop and just write one chunk

            elif lepsi_klic == (128, 32) or lepsi_klic == (128, 33) or lepsi_klic == (128, 34) or lepsi_klic == (128, 35): # Key released
                print("Key Released")
                if stream is not None and stream.is_active():
                    stream.stop_stream()

            elif lepsi_klic == (144, 81):
                break # Exit the main loop
finally:
    if stream is not None and stream.is_active():
        stream.stop_stream()
    if stream is not None:
        stream.close()
    p.terminate()
    print("Program terminated.")

代码解释：

移除duration： 不再预先定义音频时长。
移除内部while循环： 去掉了while play == True循环，直接在if语句块中写入音频数据。
使用小chunk size: 使用小的chunk size，例如fs * 0.1，使得音频可以更快的响应按键释放。
按键释放检测： 增加了对按键释放事件的检测（例如，MIDI消息(128, 32)），当检测到按键释放时，停止音频流。
流的初始化和判断： 在循环外部初始化 stream = None，并在每次播放前检查 stream 是否已经创建和激活，避免重复创建。
异常处理： 使用try...finally块确保程序退出时能够正确关闭音频流和PyAudio实例。

注意事项：

MIDI消息： MIDI消息的具体数值取决于MIDI键盘的设置。请根据实际情况调整代码中的MIDI消息值。
性能优化： 持续生成和播放音频数据可能会消耗一定的CPU资源。如果需要处理复杂的音频效果，可以考虑使用更高效的音频处理库，例如librosa或sounddevice。
音频流控制： 确保在程序退出前正确关闭音频流，释放资源。
chunk size: 调整np.arange(fs * 0.1)中的0.1可以调整每次写入音频流的数据量，影响响应速度和CPU占用。

总结：

通过修改原始代码的循环结构和音频流控制方式，可以实现按下按钮开始播放声音，松开按钮停止声音的实时音频控制。这种方法避免了预先定义音频时长的限制，提供了更大的灵活性。在实际应用中，可以根据需要调整代码，实现更复杂的音频效果。

以上就是《PyAudio实时音频控制：无限播放与停止技巧》的详细内容，更多关于的资料请关注golang学习网公众号！