蘑菇OS推出全场景VUI,打造车联网时代最自然的人机交互

企业 盖世汽车 1048次浏览 已收录 0个评论 扫描二维码

“最自然的交互才是最好的交互,车内场景下语音交互才是最自然的交互,蘑菇OS从设计的第一天开始就致力于打造全场景语音交互的车载OS。”2019年10月18日,蘑菇车联副总裁、蘑菇OS部总经理邓志伟在第二届汽车人机交互与智能座舱国际峰会上表示。

蘑菇OS推出全场景VUI,打造车联网时代最自然的人机交互

蘑菇车联副总裁、蘑菇OS部总经理邓志伟

从工业革命到信息革命,伴随着机器智能化的高速发展,人类与机器的交互方式经历了若干个时代的演进,从最早的机械式操作到实体按键,再到触摸屏,手机的出现进一步推动了近20年来最大的一次人机交互变革。所见即所得的触摸式交互极大的提升了人与机器的交流效率,为终端场景下的人机交互方式提供了最佳的用户体验。

随着车联网、物联网的蓬勃发展,人机交互方式面临了全新的挑战。在传统的手机触屏操作时代,由于人的视觉、听觉、触觉是完整释放状态,因此90%的触屏交互辅以10%的语音交互带来了移动终端时代的完美体验。而在车联网、物联网时代,因为操作环境与机器的复杂化,人体自然感官处于受限的状态。特别是车联网领域,在驾驶舱的环境中视觉与触觉都受到高度约束。如此复杂的约束环境中,语音交互成为了车载场景下最佳的交互方式。

过去几十年里,车企一直致力于为用户提供更好交互体验,例如奔驰首先提出的方向盘按键及鼠标式触摸板、奥迪的MMI、以及宝马的idriver智能驾驶控制系统等,都极大地推动了人车交互的变革。信息时代与人工智能时代的技术突破,赋予了行业更多的机会。

“在这样的时代背景下,蘑菇OS的交互设计理念就是为用户提供最好的交互体验。”邓志伟表示,“蘑菇OS打造的全场景VUI(Voice User Interface),将从目前90%的语音辅以10%的触摸交互,演进到最终实现100%的全语音交互。”

“语音交互最大的难点在于语音识别与语义理解,泛场景化的语义理解一直是业界最大的难题,即使机器学习的出现也不能解决泛场景化的连续交互问题。这也是为什么大家在使用手机、音箱等包含语音交互的终端场景里面始终感觉语音交互体验不好,人工智能比较‘傻’的原因。”邓志伟现场坦言,泛场景化语音交互场景依然面临严峻的理论难题与体验缺陷,“但是在车载领域,我们迎来了全新的机会,由于车载场景封闭化、场景化、归一化的特点,使我们在车载领域实现全场景语音交互的优质体验成为了可能。”

“目前蘑菇OS的用户月语音交互次数已经突破了三亿次,我们发现80%的语音交互内容出现了惊人的场景相似性,这为蘑菇OS的全场景语音交互带来了巨大的启发。”

蘑菇OS的VUI,定义了两大类语音包场景:通用语音包服务与个性化语音包服务。

通用语音包服务通过用户相似性场景的集中抽象,通过渐进理解、意图跟踪、智能纠错等技术的运用,对用户的意图进行场景化分析,目前已支持涵盖车辆控制、娱乐、安全、生活服务、信息等5类需求81个细分场景;通过大量模型训练与机器学习,配以底层语音引擎技术,能够迅速理解用户意图并提供精准反馈;通过场景引擎的定义,支持上下文多轮对话,能够实现边听边说边想,大幅缩短响应时间,用户可随意插话,更贴近人们日常交流习惯。蘑菇通用语音包服务的理解准确率超过97%。

蘑菇OS的VUI同时推出了个性化语音包服务,可以通过声纹识别、声源识别、语言及语调识别,满足个性化服务需求。通过声纹识别提供定制服务,包括空调温度、座椅角度、音乐喜好等;通过声源识别用户位置,当识别到“调低温度”指令时,即可调节声源位置的温度;此外,个性化语言包系统还可通过语言及语调识别用户情绪,实现差异化内容回复。

在百年的汽车发展历程中,汽车产业的先驱们在不断的探索人与车的交互方式,力争打造最优质的人车交互体验。邓志伟表示,“人工智能时代的到来,给产业带来了新的机遇,蘑菇OS期待沿着汽车产业先驱探索的步伐,与车企的伙伴们一起打造信息时代全新的人车交互体验!”


喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址