新闻中心

语音交互在汽车HMI人机界面领域的应用

作者:华一汽车科技    来源:www.itas-hk.com    发布时间:2018-05-15 11:29    阅读:

语音交互的特点

 
语音交互是通过语音与机器完成一系列输入和输出,进行信息交换,最终达成用户目标的人机交互方式。下面简要分析一下语音交互的优、劣势以及与GUI 界面交互相比的一些特点。
 
1、优势:
1)解放双手:与目前主流的GUI界面交互方式相比,不需要借助鼠标、键盘或者手指触控进行信息输入。
2)易学习性:声音是人与人之间基本的交流方式,不同年龄段、不同能力技术水平,应用我们的直觉,就可以掌握。
3)便捷性:当执行的任务比较简单时,如:导航去某地,语音输入比打字输入更快速、简单,在语音识别准确率高的情况下,用户可以完全相信语音,无需再用视觉方式来给用户安全感。
4)低复杂度:语音交互可以直接解决用户的最终目标,而不像GUI 界面有不同的层级关系,用户达成目标时需要一系列操作并且经历很多页面之间的切换。
 
2、劣势:
1)需要输出大量信息时,效率低:信息必须一句一句输出,人与系统交互时通常调动短时记忆,能记住的信息就 15 s左右。可能会发生这样的情况:在进行多步骤、多选项任务时,系统还没有说完选项,用户已忘记前面内容。
2)场景有限:不适合在嘈杂环境中进行,对隐私要求比较高的任务不适合使用语音交互。
3. 与GUI界面主要差别是什么?
 
笔者认为GUI 本身是为大家提供选择,并不精准确定用户要什么(所以才会有直接搜索的出现),设计师们通过用户研究、需求、场景分析等将界面以更为合理的方式呈现,希望用户可以更快速的找到自己所需。
VUI 是一般处于沉默状态,只在精准知道用户目标时,为用户服务,简单、快速,没有那么多中间步骤,是另外一种形式的直接搜索。
GUI 界面依托屏幕为载体,可以呈现更丰富的信息,而且人眼倾向于过滤无关信息,寻找重点。网上购物、多步骤、多任务场景中,依托场景以及用户需求进行优质信息设计的GUI 会提供更好的体验。
VUI对私密性、密闭性的要求更高,比如:虽然笔者更愿意使用siri进行内容的直接查找,但通常不会在公共场合使用,会觉得尴尬。
语音交互在国内汽车设计中的应用情况
 
为保证安全,驾驶过程中视线最好不要离开前方道路。这种视觉通道被占用的情况下,可以利用听觉通道接收信息,所以语音交互为安全驾驶提供了一种交互方向。随着语音识别、声纹识别、人工智能、机器学习等软硬件领域不同技术的发展,也使得这种方式能够落地,并被逐步优化与完善。
 
根据语音系统在国内汽车中所依托的硬件设备来看,主要有以下应用:
1)前装应用—汽车厂商提供的支持语音交互的车机系统;
2)App in the car—互联网制造商提供的运行在车机系统上的应用程序;
3)后装应用—车载智能硬件;
 
1、前装应用—汽车厂商提供的支持语音交互的车机系统
车场开发的车机系统中,通过语音除了可以进行:音乐播放,天气查询,开启导航等娱乐与信息层面的操作;还可以调节车内环境:如空调开启/关闭,风速调整等,甚至涉及到部分机械功能:如打开/关闭天窗,打开/关闭车窗等。
 
A、斑马系统
由上汽和阿里合作推出的斑马系统是基于Alios(Yun OS) 开发的智能互联开放平台,已更新至2.0版本,应用在荣威RX5车型中。
斑马2.0 语音交互的一些特点:
1)回应更快速:唤醒和指令可以一句话输出,不需要在“你好斑马”之后等待机器反应;
2)支持对话模式:支持多轮对话;
3)人声干扰消除,识别不用用户需求:主副驾驶两个位置的用户,谁唤醒谁来使用语音控制功能,不会受到别人影响(但后排乘客还不能使用语音进行操作);
4)自然语言交互与智能学习:若用户多次跟同一台车的斑马系统交流后,机器的识别和反应速度会逐步提升,甚至开始能够听懂个别带方言的句子。
 
斑马系统
B、吉利的GKUI
GKUI是一套基于安卓系统深度定制的车机交互系统,Geek User Interaction是以吉利大数据为基础研发,联合多家不同领域的互联网公司,打造的一种全新的智能出行车机系统。目前这套系统应用在「2018款吉利博越」车型中,语音交互式是整个车机交互系统的核心之一。
GKUI的一些特点:
1)唤醒更灵活:原来在每条语音指令之前都得说「你好博越」,但是现在如果要和车机连续对话,只说一次「你好博越」就可以;也可以自定义唤醒词,车主可以为博越取个喜欢的昵称。
2)支持对话模式:对话过程中,可以打断车机的语音,系统响应速度也很快,识别响应时间达到了500毫秒级别。
3)识别用户精准需求:所有乘客都可以通过语音进行操作,并且可以指定语音系统帮助开启/关闭任意一个车窗,或者全部开启/关闭(比如,开启左后方车窗,语音系统可以很快识别并执行)
4)自然语言对话:这套系统支持6种方言(湖南话、四川话、广东话、河南话、台湾话、东北话)16 种发音的选择。系统也能以相应的方言来跟你互动,但用普通话输入系统依然能够识别,并不会因为选了方言,就只能用相应方言来沟通。
 
吉利GKUI
 
C、蔚来的NOMI人工智能系统
基于强大的车载计算能力和云计算平台的车载人工智能系统“NOMI”,集成了语音交互系统和智能情感引擎,创造出了一种全新的人车交互方式。除安全以及驾驶之外的功能,很多都可以通过NOMI 来实现。
 
NOMI人工智能系统
 
本次2018北京车展中,笔者去体验了蔚来汽车的 NOMI系统,印象比较深刻的是:
1)NOMI 多维响应方式:在通过" HI、NOMI”唤醒后
语音响应:回复的语句丰富、自然,音调有高低,没有很强的机械感。
表情响应:NOMI 有表情系统,模拟人的倾听状态,眼睛会放大,认真的看着你。
动作响应:NOMI 模拟人听到声音时头部转向声音来源的动作。
表情以及动作响应是nomi 独有的一套系统,「听取任务中」、「听取任务后查找状态」、或者「提供结果状态」都有不同的表情以及动作呈现,所有这些拟人化的响应设计,都让用户感觉NOMI 是一个有生命、 有情感、愿意倾听与陪伴的朋友。
2)声音定位,提供精准服务:根据乘客的声音的位置,提供精确的服务,比如:后排左侧用户,只是说想开一下窗,NOMI 就可以判定你的位置直接为你打开窗户,并通过语音告诉你。
 
2、App in the car—互联网制造商提供的运行在车机系统上的应用程序
苹果公司推出的CarPlay以及google 推出的Android auto 并没有直接安装在车载系统上,而是在移动设备上运行并投影至车载屏幕上,界面以及交互根据驾驶环境以及驾驶员状态进行了优化设计。
1)Android Auto
Android Auto除了可投屏到车载屏幕上,也推出了手机版, 可直接通过手机app使用。
它可以同步手机中的日程信息,进行导航、接收短信、音乐播放。
Android Auto 会获得用户的一些个人权限,这样用户就可以询问更个人化的问题或者给出指令,比如“下一个会议是几点”、“带我回家”。Android Auto 还会根据用户的日历安排主动提示用户是否需要前往某个地方。
 
语音交互
 
2)CarPlay
CarPlay必须需要车厂或后装车载多媒体主机厂支持才能使用。
CarPlay可以访问iPhone的电话、短信、导航、音乐、播客等功能,大部分功能都可以通过Siri 来控制。
笔者在自己周围做了小范围的调研,使用car play 的朋友并不多,siri本身对于中文的识别度表现并不特别理想是一个原因,短信里放满的是各种应用的广告信息或者验证码提醒,所以语音收发短信功能也基本用不上。导航、音乐可以直接通过手机或者自身的车机系统系统实现。
 
CarPlay
 
3、后装-车载智能硬件
比如汽车智能后视镜-CoDriver。
CoDriver 这个方案的核心是「语音交互」,在此基础上,它整合了百度地图导航、智能管车、远程监控、辅助驾驶等功能。
1)命令唤醒方式:唤醒词:「你好,善领」,唤醒后可以进行导航、音乐、电话等功能的语音操作。
2)自然语音交互: 基本实现自然语音交互,不需要完全按照规定的指令操作。
 
总结
语音只是一种工具,对于正在驾驶汽车的驾驶员来说,不占用视觉通道来获取信息、布置任务是一种恰当的方式,但驾驶员并不是汽车中唯一的用户,副驾驶、后排座位的乘客、甚至是其他车辆、路上行人也是驾驶生态中的重要角色,他们的需求是什么,通过什么样的交互方式满足每个人的需求是我们之后要一直关注与持续探讨的。所以笔者认为未来可能没有唯一的交互方式,更可能是如下情况:
1)场景化思考进行交互方式选择。比如在开车、医生手术室等双手被占用的场景下,VUI 的方式更便捷;
2)多通道设计:通过利用不同通道的结合,让用户更准确、快速或者有趣的达成目标。比如:声音与触感操作结合,声音与GUI 结合实现各自优势,弥补缺点,GUI与触感操作结合模拟真实的物理感受等。

 

文章转载请保留原文网址:http://www.itas-hk.com/news/yjyb/393.html


上一篇:除了大,汽车中控屏竟然还能这么玩!

下一篇:关于车载系统交互设计的三秒原则


液晶仪表 返回列表