语音交互会成为未来的主交流方式吗?
  • 2021-06-15 17:28

语音交互被认为是下一代用户界面,而我的观点是:语音交互必不可少,多模态交互才是主流趋势,简单分析如下:


随着人工智能的发展,多模态交互是更接近与人和人之间交互的一种方式,人车交互变得更加的自然和轻松。多模态交互需要把语音、触觉、触控、嗅觉、视觉、手势、体感等多种交互方式,结合汽车出行场景,建立合理有效的多模交互配合满足用户未来出行的体验需求。


而语音交互为汽车的使用场景提供了切实可行的解决方案,在驾驶过程中对某些功能进行控制,使用户的双手不离开方向盘的同时,为更多的娱乐互联信息提供了更多的可能。



语音交互的发展进程


语音交互VUI全称叫Voice User Interface


语音交互第一时期:20世纪90年代,诞生了第一个可行的、非特定的(每个人都可以对他说话)的语音识别系统,交互式语音应答(Interactive Voice Response,IVR),此时通过电话拨号的方式开始语音的问答还存在很多的缺点。


语音交互第二时期:我们现在所处第二时期,目前移动端像siri、Google这类集成了视觉和语音信息的APP,以及Amazon Echo这类纯语音的设计产品,逐步发展并成为主流,而车机端也有了以各大主机厂自身定制化的语音产品。随着语音识别技术、AI技术、互联网技术的发展,我们已经可以在驾驶场景和非驾驶场景用语音处理很多事情,让用户在使用汽车的过程中更加的快捷和高效去处理一些任务,有利于驾驶安全以及提供更好的用户体验。此时的语音交互可以同时使用语音和屏幕交互,是一种多模态的交互设计。发展到这个阶段就有了多轮对话的可能性,但是如何对用户的语音进行理解就成为了语音交互的技术瓶颈了。


人工智能-语音交互第三时期


随着人工智能的发展,语音识别和语义理解是人工智能领域相对成熟的技术,语音交互在人工智能时代已经有了先发优势,正在被逐渐落地并且有望大规模应用。目前,语音交互已经加速在智能家居、手机、 车载、智能穿戴、机器人等行业渗透和落地。


区别于以往的交互方式,语音交互在输入和输出方式上发生了质的变化,“听”和“说”成为人们与产品之间信息交互的主要方式,人机交互方式从“Finger-first”转变成4<Voice- first”o语音可以解放人们的双手和双眼,降低产品的使用门槛。但目前语音交互仍不够自然,会受诸多条件限制,例如需要在安静环境下、先唤醒然后发出指令、使用普通话交流等, 这些并不符合人们日常对话的习惯。