Page 71 - 安防19年10月刊_正刊_150dpi
P. 71
除环境干扰噪声(车辆引擎声、刹车声、电动车 声音不同于视频图像信息,它是动态的且无
鸣笛声、建筑噪声等),精准锁定目标噪声源位 形的,但是它跟视频图像的采集是类似方式,只
置,准确定位到违章鸣笛车辆,并将声音可视化, 不过视频以帧为单位,而声音是连续的。计算机
为后台智能管理系统提供直观准确的车辆鸣笛 视觉有典型的ImageNet数据集,声纹数据集现在
执法证据。 还比较少,主要是由像微纳感知这样的企业自主
从成本角度来看,随着安防整体解决方案日 建设子集数据集,相信未来随着业内机器听觉技
趋成熟,现在前端设备的成本已经下降了很多。 术应用的爆发,产业将会逐渐成熟。
微纳感知也在不断尝试,在保障产品和系统性能 而公安声纹库现阶段也在逐步建设,还是会
的基础之上,实现TCO(拥有成本)的最优化,即便 像视频监控人脸库建设一样分期进行,比如一期
是新建部署,也能让用户承受得起而不会成为负 主要采集特殊人群的声纹信息,二期才会建大量
担。 的常规声纹信息库,未来公民身份信息将会包含
作为一家提供智能语音解决方案的企业,经 人像、指纹以及声纹等。
过六年左右的核心技术探索和积累,2018年微纳 声学技术在智慧城市领域的应用中,政府部
感知正式进军安防市场,目前已经和部分安防厂 门的需求引导和产业推动意义很大。目前相关落
家达成了合作,推出了包括公安监所、交通管控、 地应用仍然依赖着产品技术和应用企业的推进,
远程教育、会议系统等细分领域的音视频联动产 作为声学技术方案提供商,微纳感知已经完成了
品和方案。 技术研究的基础工作,进入到应用阶段。人工智
复杂场景下的声音处理之所以此前一直没 能和感知计算是我们国家的未来战略产业,声学
有大规模应用主要是因为技术实现上存在很大 技术在智慧城市、安防、教育、金融等领域将可
困难,首先要将声音从复杂环境中清晰的采集下 能获得大面积应用,并以应用促进产业和技术的
来,其次要分析声音包含的信息,这些其实都非 更为良性的发展。
常困难。不过微纳感知从2013年便一直专注于机 视频能够完成城市监控、特征识别、视觉获
器听觉技术的研究,这其中的技术核心就包括麦 取等方方面面的信息,而在眼睛看不到的地方,
克风阵列信号处理和基于AI技术的声音内容识 “听觉”系统的补充将进一步丰富和完善城市感
别分析。 知系统的维度。从视听交互、声纹识别、听觉判
麦克风阵列信号处理技术主要包括回声消 断到语言学习,通过音视频联动,可以构建起城
除、噪声&混响抑制等,将声音清晰采集下来后 市实时感知的“眼睛”“耳朵”,由此来进一步提
传送到后端人工智能引擎,然后基于AI技术展开 升城市精细化管理水平。
声音类型识别分析的应用,比如识别枪声、鸣笛
声、建筑工地施工噪音以及人声声纹检测、连续
语音识别等等。
现阶段微纳感知积累的技术已经能够实现
商用化,并在一些行业领域正在展开相关应用。
第五届深圳国际无人机展览会(2020年8月深圳会展中心) www.china-drone.com.cn 51
ᇆ߰Ӭ൧ JOEE ྒ௹၂