去混响技术总结
时间:2022-05-23
来源:原创 人气:1893
混响(reverberation)是相对关闭空间如房间中,爆发的一种典范声学现象。声波在房间中流传时,遇到墙面、地面、天花板或其他物体外貌时,会被阻碍并反射回来,反射声波在流传历程中再次遇到障碍物时,会形成二次反射,如此重复。在流传以及反射的历程中,声波不绝被壁面吸收会慢慢衰减。声波在各个偏向来回反射,而又逐渐衰减的现象称为混响。
关于房间中的人来说,从声源处直接抵达人耳的声波叫直达声,而经过壁面一次或多次反射到人耳的声波,听起来像是直达声的延续,叫做混响声。
下面两段音轨,左边的是在消声室中录制的直达声信号,没有混响;右边模拟房间情况处理后获得的有混响的信号;混响声听起来像是无混响声的延续和拖尾。

混响时间是怀抱房间内混响水平的基本指标之一�;煜焓奔溆美疵枋龇考淠谏羲ゼ蹩炻乃�。它的界说为:声源停止后声音在房间内较初始声压级衰减60dB所经过的时间,一般用T60体现。盘算混响时间有一个有名的公式,叫“塞宾公式”,界说如下:
其中,V为房间体积,S为房间的外貌积,

为平均吸声系数。一般的,房间越大,室内越空旷,混响时间会越长。因此,像银行营业大厅、金库,这种空间较大、壁面平滑的空间里,混响时间明显较长。
混响的作用:
合适的混响时间,关于房间的听音效果有重要的作用,能使人声听起来饱满立体,有空间感�;煜焓奔涮�,声音听起来会干涩、空旷、不饱满。过长的混响时间会使人感应声音污浊不清。一般房间的混响时间在1s以内较为合适。
关于音频监控来说,房间混响往往是清晰拾音的一个重要挑战。当人距离拾音设备较远时,直达声和混响声的比值较小,纵然声音较大,在一般的混响情况中,仍然较难听清楚。实际的音频监控场合中,如银行营业大厅、中型集会室等,往往未做声学处理,混响时间较长,要在这样的场合里,远场清晰的拾取声音,仍然保存比较大的困难。
混响除影响拾音的音质外,也明显的影响自动语音识别(ASR)的识别率。如上面的语谱图所示,没有混响的语音,其声纹清晰可辨,而有混响的语音,声纹模糊不清。因此,如何消除录音中的混响,也是提高语音识别率需要解决的问题。
去混响技术
混响影响拾音音质和语音识别率,因此需要从拾音信号中去除混响声,这种技术就是去混响技术。一般去混响主要有三种技术:第一种要领,麦克风拾取的信号可以看作声源信号与房间攻击响应的卷积生成的信号,通过这种数学模型来消除混响,在预计房间声学模型参数之后,形成对原始信号的预计。第二种要领,通过将混响视为一种噪声,通过适用于混响的降噪历程来抑制混响,事实上,一般的语音降噪算法都具有一定的去混响效果;第三种要领,接纳深度学习的要领去混响,经过神经网络后,获得频域的滤波系数�;煜煨藕啪瞬ê�,输出去混响信号。这样的网络经过大宗数据训练后,用于去混响处理,就能获得较清晰的信号。
上图为混响爆发与去混响的历程模型,
为语音信号,经过房间响应
卷积后,形成混响信号,加上引入的房间噪声或其他噪声
,形成麦克风处拾取的信号
。信号经过滤波器
后,获得去混响的信号
。‘理想情况下,
和
关系如下:
多通道去混响技术,接纳麦克风阵列(多个麦克风),可以较为准确的预测房间的冲激响应

,从而预计逆滤波器

,经逆滤波后形成去混响的信号;
下图左边为去混响前的信号,右图为去混响后的信号
引用:
《声学基础》,杜功焕等,南京大学出书社
https://en.wikipedia.org/wiki/Reverberation