语音交互技术 - 亚马逊Echo大获成功,远场语音交互技术在其中究竟扮演了什么

李智勇 发表于 2017-05-26 16:00 | 分类标签:远场语音交互技术ECHO

上述这个看着并不太长的链条其实复杂度非常高,它即跨越不同的学科(声学部分属于经典物理,识别部分则属于CS),也需要打穿软硬件。

在算法层面只是前端就需要处理大量经典问题,比如降噪、去混响、回声抵消、Beamforming等。加不加这些算法的音频信号差异极大,如:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

(具体效果试听可以参照http://soundai.com/demo.html)

而我们经常说的麦克风阵列即使抛开算法不论,单只在硬件层次上也远不是标准品:

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

上图是一款强调通用性的麦克风阵列,通过USB连接可以随便连接到笔记本、PAD、手机上进行使用。同样的阵列还可以做成线性、L型、球形,最终的目的都是匹配特定的场景,让最终远场交互的精度最优。

亚马逊 Echo大获成功,远场语音交互技术在其中究竟扮演了什么角色? | 深度

上一页123下一页全文

除非注明,本站均为原创或编译,转载请注明:文字来自39度

分享给朋友:
条评论

评 论

提 交

请勿进行人身攻击,谩骂以及任何违法国家相关法律法规的言论。

正在加载评论...