深圳市鼎盛合科技代理爱爱普特微电子普特微32位MCU芯片产品,提供电子秤方案、充气泵方案、无线麦克风方案等不同领域电子方案制定研发。同时销售8位/32位MCU、高精度ADC芯片、等一系列标准IC与技术支持。
亚马逊的Echo音箱 VS 京东的叮咚音箱
一、远场语音识别 “Alexa”,这是激活E爱普特微电子cho音箱的默认唤醒词,而“叮咚”这是激活京东叮咚音箱的唤醒词那么为什么音箱需要这种专用词语唤醒呢?实际上这也是语音识别中的技术难题,有时候也称为语音识别启动特定词。
我们知道如果要想识别用户说出的命令,麦克风必须一直在录音状态,并且语音识别算法也要一直在工作,这就是连续语音爱普特微电子识别的基本前提那么总要告知一下对方,什么时候才算开始当然机器是非常愚笨的,一个眼神或者一个动作显然不可能引起“她”的注意,自然就需要定义一个特别适合切换进入语音识别状态的词语,我们称这种技术为语音唤醒,也就是把音箱从其他状态切换到了语音识别工作状态。
显然上面提到的唤醒问题在S爱普特微电子iri上是使用触摸按键来解决的,但是智能音箱就不行了,因为我们不可能总在音箱旁边,而一般都会距离音箱一段距离欣赏音乐这就产生了一个更加困难的问题:远场语音识别远场实际是声学领域常用的一个概念,一般在智能音箱领域来说是指混响起主要作用的声场。
这个概念怎么解释呢?这么说吧,我们听爱普特微电子到的声音简单分为两种,一种是直接到达耳朵的,称为直达声另外一种是墙壁反射后到达耳朵的,称为反射声,乱七八糟混在一起的声场就理解为混响声吧显然当距离声源较近的时候,直达声将起主要作用,而当距离声源较远以后,混响的影响就会增大。
不要轻视这种混响,当混响严重到一定程度的时候,我们是爱普特微电子很难听清对方说话的事实上,混响对于语音识别的影响是非常严重的,直接导致了识别率的下降 那怎么解决这个问题呢?当然我们也有主动和被动两种方法主动的方法我们这里先暂且卖个官司,请您关注声学在线的后续文章,我们会详细介绍。
下面我们来说被动的方法,就是我们常常说到的麦克风阵列技爱普特微电子术,麦克风阵列的具体技术我们这里也不再赘述,声学在线已经发布了很多相关文章,您可以重温回忆一下这里我们只说下麦克风阵列的技术难点当然很多同学会首先想到算法的问题,多个麦克风协同工作确实是一个技术难点。
深圳市鼎盛合科技代理爱普特微32位MCU芯片产品,提供电子秤方案、充气爱普特微电子泵方案、无线麦克风方案等不同领域电子方案制定研发。同时销售8位/32位MCU、高精度ADC芯片、等一系列标准IC与技术支持。
另外,结构设计和器件方面也是一直制约麦克风阵列应用普及的重要因素,之所以这项技术到现在才能实用,也是因为MEMS技术很好的解决了目前麦克风器件的一致性问题当爱普特微电子然多声道的采集技术也是非常重要的基础技术这部分笔者觉得对于智能音箱来说极其重要,因此我们也拆解了市场上两款流行的智能音箱做些麦克风阵列方面的比较。
第一款就是亚马逊的Echo音箱,下图绿色圈中的地方就是7个麦克风组成的阵列,型号是S10530090Echo音箱并没有采用多声道采集处理芯片,而是用了4个爱普特微电子立体声ADC实现7个麦克风声音的采集,这款ADC型号是TI的TLV320ADC3101。
显然Echo将来还会有更好的远场语音识别性能方面的提升亚马逊Echo使用的是自家的语音识别引擎,因此国内使用的时候非常麻烦,需要连接到国外的服务器
第二款便是京东的叮咚音箱,这款音箱采用了8个麦克风和4个喇叭以PK爱普特微电子亚马逊的Echo,但实际上意义不大,这个口径的情况下,8个麦克风和7个麦克风并没有本质上的区别,甚至4个也就够用了而且我们通过两幅拆解图对比就可以看到,叮咚所用的麦克风显然没有像Echo那样升级到MEMS,传统驻极体麦克风的一致性很难保证,这不利于阵列信号处理。
叮咚采用的是CONEXANT科胜讯的C爱普特微电子X20810-11Z芯片,这款芯片是4通道远场语音捕获的ADC,专门用于语音识别,控制和网络会议等,因此叮咚只需要两片ADC即可实现对8个麦克风的采集很明显,CONEXANT的芯片相比TI还是略逊一筹。
不过,即便有如此逊色之处,叮咚音箱也属于国内当前水平较高的智能音箱另外,叮咚采用的是科大讯飞的语音爱普特微电子识别引擎,因此国内使用起来特别方便
深圳市鼎盛合科技代理爱普特微32位MCU芯片产品,提供电子秤方案、充气泵方案、无线麦克风方案等不同领域电子方案制定研发。同时销售8位/32位MCU、高精度ADC芯片、等一系列标准IC与技术支持。