最自然的互动是最好的互动 蘑菇车联打造全场景语音交互车载OS

摘要 “最自然的交互才是最好的交互,汽车场景下的语音交互才是最自然的交互。蘑菇OS从设计的第一天起就致力于打造全场景语音交互的车载OS。”20

“最自然的交互才是最好的交互,汽车场景下的语音交互才是最自然的交互。蘑菇OS从设计的第一天起就致力于打造全场景语音交互的车载OS。”2019年10月18日,蘑菇车联副会长、蘑菇OS部总经理邓智伟在第二届人机交互与智能驾驶舱国际峰会上表示。

车联副总裁、蘑菇OS部总经理邓智伟

从工业革命到信息革命,随着机器智能的飞速发展,人与机器的交互经历了数次进化。从最早的机械操作到物理按键,再到触摸屏,手机的出现进一步推动了最近20年来最大的人机交互变革。所见即所得触摸交互大大提高了人与机器的沟通效率,为终端场景下的人机交互提供了最佳的用户体验。

随着车联网和物联网的蓬勃发展,人机交互面临着新的挑战。在传统的手机触屏操作时代,由于人的视觉、听觉、触觉得到了完全的释放,90%的触屏交互配合10%的语音交互,带来了移动终端时代的完美体验。在车联网、物联网时代,由于操作环境和机器的复杂性,人体的自然感官处于受限状态。尤其是车联网领域,在驾驶舱环境下,视觉和触觉受到高度制约。在如此复杂的受限环境下,语音交互成为了车载场景下最好的交互方式。

在过去的几十年里,车企一直致力于为用户提供更好的交互体验,比如奔驰率先提出的方向盘按键和鼠标触控面板,奥迪的MMI,宝马的idriver智能驾驶控制系统,这些都极大地推动了人车交互的变革。信息时代和人工智能时代的技术突破给了行业更多的机会。

“在这个时代,蘑菇OS的交互设计理念就是为用户提供最好的交互体验。”邓智伟表示,“蘑菇OS打造的全场景VUI(语音用户界面),将从现在的90%语音加10%触摸交互,进化到最终实现100%全语音交互。”

“语音交互最大的难点在于语音识别和语义理解。泛场景的语义理解一直是业界最大的难题。即使是机器学习的出现,也无法解决泛场景的持续交互问题。这也是为什么在包括手机、音箱等语音交互在内的终端场景中,人们总觉得语音交互体验不好,人工智能‘笨’的原因。”邓智伟在现场坦言,泛场景语音交互场景仍然面临着严峻的理论问题和体验缺陷。“但在车载领域,我们迎来了一个全新的机遇。由于车载场景的封闭性、场景化、常态化的特点,使得我们在车载领域实现全场景语音交互的高品质体验成为可能。”

“目前,蘑菇OS的用户月语音交互次数已经超过3亿次,我们发现80%的语音交互内容具有惊人的场景相似度,这给蘑菇OS的全场景语音交互带来了巨大的启发。”

OS的VUI定义了两类语音分组场景:通用语音分组服务和个性化语音分组服务。

通用语音包服务通过对用户相似场景的集中抽象,以及渐进理解、意图跟踪、智能纠错等技术的应用,对用户意图进行场景化分析。目前已支持涵盖车控、娱乐、安全、生活服务、资讯等五类需求的81个细分场景。通过大量的模型训练和机器学习,再加上底层的语音引擎技术,可以快速理解用户的意图,提供精准的反馈;通过场景引擎的定义,支持上下文多轮对话,可以实现边听边思考,grea

同时,OS的VUI推出个性化语音包服务,通过声纹识别、声源识别、语言语调识别,满足个性化服务需求。通过声纹识别提供定制服务,包括空调温度、座椅角度、音乐偏好等。通过声源识别用户位置,当识别到“降低温度”命令时,可以调节声源温度;此外,个性化语言包系统可以通过语言、语调识别用户的情绪,实现差异化的内容回复。

在汽车发展的百年历程中,汽车行业的先行者们也在不断探索人与车的交互方式,努力打造最佳的人车交互体验。邓智伟表示,“人工智能时代的到来给行业带来了新的机遇。蘑菇OS期待与车企合作伙伴一起,沿着汽车行业开拓探索的步伐,打造信息时代全新的人车交互体验!”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。