icon-auth-user dollor setting alipay success appmanage user order logout workorder cart mail

 

新品介绍——环形五麦克风阵列

发布时间:2016-04-19

    语音技术作为智能硬件的重要入口,可让人机的交互内容更丰富,体验更自然简洁。2015年3月,讯飞开放平台(www.xfyun.cn)正式对外发布全球首个智能硬件远场识别解决方案,这套包含双/四麦克风阵列、语音唤醒以及语音云服务的解决方案,一经问世便迅速成为行业关注的焦点。

   麦克风阵列(Microphone Array),由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

  近日,科大讯飞再次在其人工智能技术开放平台——讯飞开放平台上发布行业内首个实用级别的环形五麦克风环形阵列,为远场语音识别技术带来技术革新。基于5(4+1)麦克风阵列的语音前端解决方案,利用麦克风阵列的空域滤波特性,通过对唤醒人的角度定位,形成定向拾音波束,并对波束以外的噪声进行抑制,可以解决远场识别中遇到的背景噪声、其他人声干扰、回声、混响等核心问题,提供优质音频。用户可以通过语音轻松操控智能硬件设备。相比较之前推出的二麦、四麦,新产品的优势十分明显:拾音距离达到5米,动态噪声抑制显著增强,平面声源定位拓展到360°,水平定位精度达到±10度。


 


新品功能及特性

1、远场拾音距离达5米
利用远场识别和降噪技术,使拾音距离达到5米。5米范围内识别率和近讲效果相当,5米距离语音识别率超过90%

2、4+1环形五麦克风方案,360°语音信号采集,高精准声源定位



 
环形麦克风阵列架构示意图

五麦环形阵列呈原型布局,其中四个麦克风均匀分布在圆周,一个麦克风在圆心,圆直径为54mm,这种组合能够较好的适应远场拾音的特性需求,从而达到360°语音信号采集,并能通过声源精确定位来确定目标说话人的方向的效果。

3、支持语音唤醒、连续唤醒,成功率超过90%
支持语音唤醒的功能,用户通过说出关键词,可以改变交互状态,例如从睡眠至等待,从交互到等待。同时也支持连续唤醒,可随时在任意角度进行多次唤醒,输出环形波束的识别音频,唤醒的成功率超过90%。

4、回声消除
当播放和录音同时进行时,扬声器的声音会被麦克风拾取,就会形成回声,影响录音质
量。通过接入参考信号,并对录音信号进行滤波计算,这种回声消除的技术,可以将扬声器的声音屏蔽,播放和录音同时进行也不必担忧识别准确度。

5、支持语音打断
 在设备播音时,仍然可以唤醒,实现打断效果。

6、稳态、动态噪声的高效抑制,嘈杂的环境也能轻松应对
 在语音通讯环境中,由于受到环境噪声,混响,以及其它声源干扰等因素的影响,这将直接影响到语音信号的拾音、编码和识别等的性能,严重时会导致整个语音系统无法正常工作,麦克风阵列不仅可以提供时/频域信息,而且能够集成空间域的语音信息,具有超强的降噪性能,信噪比10dB、干扰60度条件下,识别率超过98%,可以很好的解决远距离拾音。

典型应用场景
对远场距离较远要求拾音效果较好的场景,或者是需要360°声源定位的智能硬件,环形五麦克风阵列都是很好的解决方案。
例如:
1.智能机器人


 


2.智能家居

 


3.智能硬件

 



在万物互联的今天,麦克风阵列技术已经深刻的走进了我们的日常生活。在智能车载、智能家居、机器人、可穿戴设备等应用热潮正兴起的时代,语音交互由于其便捷性,成了人机交互入口的第一选择,麦克风阵列自然也成为其中非常重要的前端技术。