Page 199 - 安防19年1月刊

P. 199

信号的放大比例是比较高的，比如，能将驻极体输出的声”。因为拾音器接受位置距离声源较远，混响声的高
1mV 信号放大到 1V，这样音频信号在传输过程中就能强度对直达声有显著的影响，会使人感到声音“混浊”
获得比较高的信噪比。不清，使语言清晰度降低，甚至根本听不清。
背景噪声问题
单麦克风采集到的声音会受到各种各样的干扰，麦克风阵列技术
最主要是背景噪声和房间混响等的影响，目前多聚焦于麦克风阵列技术原理
前者。因此，拾音器为了去除或者抑制背景噪声，除了前麦克风的功能是接受声波、输出音频信号，进而可
置放大电路，还需要内置语音增强（噪声抑制）算法。将音频信号保存下来并进行处理，如实现降噪和信号
在安防语音识别、说话人识别等智能语音处理中，识别增强等。但是只有一个麦克风时，它可以实现的功能很少，
精度会受到噪声的较大影响，因此在进行识别之前，也并且效果不太好。麦克风阵列的原理从天线阵列中来，

需要将带噪语音通过语音增强算法等进行预处理。上世纪 90 年代开始，人们逐渐将阵列信号处理技术应
语音增强的目标是提高受损语音的质量和可懂度，用到语音信号处理中，对麦克风阵列的研究纷纷涌起。
与具体应用相关。当需要长时间监听大噪声环境中的因为语音信号具有随机、宽带和非平稳特性，不能用窄
语音时，例如机场、火车站内，人们希望改善语音质量带阵列处理算法简单推广得到，需要重新设计或针对
以减轻听觉上的疲劳。当背景噪声强度不是很大时，人实际声学环境进行调整。
们希望提高语音的可懂度。实际上，大多数基于单麦克
风的语音增强算法只是改善了语音的质量，在减少背景
噪声的同时，也引入了语音的失真，进而损伤了语音的
可懂度。因此，语音增强的主要挑战就在于设计一个高
效的算法，在不明显引入信号失真的前提下，对其中的
噪声进行有效抑制。
远距离拾音问题
日常生活中使用的麦克风多为近场，声源与麦克风 ▲图1 麦克风阵列技术原理图
的距离非常近，这样保证了声音采集的信噪比。而安防
麦克风阵列是以特定方式排列，从而能够准确获取
拾音器的摆放位置与声源距离一般较远，这就带来了
声场空间信息的一组麦克风。语音信号从声源位置发出，
近讲麦克风不会遇到的问题。离声源距离增加一倍，
麦克风将接收到语音信号离散成数字信号。为了对这些
接受处的声级减少 6dB，例如，正常人讲话在 1m 处的
数字信号进行处理，在每个麦克风的后面都带有一个滤
声级约为 64dB，在 2m 处的声级将衰减为 58dB，在 5m
波器。信号经过滤波器处理后会实现定位、降噪、消除
处的声级只有 50dB。在很多安防应用场景中，目标声源
回声等功能，滤波器的系数根据实际需求进行优化设计。
在拾音器安放位置处产生的声级仅比背景噪声级高几
麦克风阵列涉及的算法主要包括声源定位、波束形
分贝，甚至出现背景噪声比目标声音大的情况。
成、去混响和后处理增强等。其中麦克风波束形成是用来
除了噪声问题，混响是远距离拾音遇到的另一个
增强来自某一方向的信号，而抑制来自其他方向的语音或
突出问题。在房间中，拾音器接受到的声音除了声源的
噪声信号的空间滤波器。按照拓扑结构的不同，麦克风阵
直达声之外，还有经过墙壁、天花板、地面等多重反射
列可以分为均匀线性阵列、非均匀线性阵列、非线性阵列、
后的声音，听起来好像是直达声的延续，称之为“混响

2019第四届深圳国际无人机展览会（2019.6.20-22 深圳会展中心） www.china-drone.com.cn 163

భခ࠯ඌ JOEE ྒ௹၂

194 195 196 197 198 199 200 201 202 203 204