语音交互技术 - 亚马逊Echo大获成功，远场语音交互技术在其中究竟扮演了什么

李智勇发表于 2017-05-26 16:00 | 分类标签：远场语音交互技术 ECHO

上述这个看着并不太长的链条其实复杂度非常高，它即跨越不同的学科（声学部分属于经典物理，识别部分则属于CS），也需要打穿软硬件。

在算法层面只是前端就需要处理大量经典问题，比如降噪、去混响、回声抵消、Beamforming等。加不加这些算法的音频信号差异极大，如：

亚马逊 Echo大获成功，远场语音交互技术在其中究竟扮演了什么角色？ | 深度

（具体效果试听可以参照http://soundai.com/demo.html）

而我们经常说的麦克风阵列即使抛开算法不论，单只在硬件层次上也远不是标准品：

亚马逊 Echo大获成功，远场语音交互技术在其中究竟扮演了什么角色？ | 深度

上图是一款强调通用性的麦克风阵列，通过USB连接可以随便连接到笔记本、PAD、手机上进行使用。同样的阵列还可以做成线性、L型、球形，最终的目的都是匹配特定的场景，让最终远场交互的精度最优。

亚马逊 Echo大获成功，远场语音交互技术在其中究竟扮演了什么角色？ | 深度

除非注明，本站均为原创或编译，转载请注明：文字来自39度

分享给朋友:

提交

请勿进行人身攻击，谩骂以及任何违法国家相关法律法规的言论。

正在加载评论...

评 论