注:本文摘自百度人工智能交互设计院《李璇:AI时代的人因工程》,如有侵权,联系删除。
引言
早在工业时代,人们使用机器来提高生产效率,人机互动是纯物理的机械互动,所以人们研究的是人的生理方面的阈限,然后基于这些阈限做出人可以承受范围内效率最大化的设计。而这种基于人体特征的研究应用到设计当中的思路也被沿用至今。到了信息时时代,让人使用机器替代一部分的认知劳动,人机互动是虚拟的认知交流,所以人因工程研究人的感知规律,来优化信息传递。比如根据人类可以明显区分的最小音量差,5分贝,来设计手机音量键每次调整音量大小。在过去,人因工程奠定了将人的特征以及规律进行研究,然后应用到设计的基础。那么到了AI时代人因工程又有了哪些新的延伸呢? 首先,AI时代的人因工程让机器越来越像人,它开始可以通过人类的语言、表情等方式进行交流,甚至被赋予人的外形。人类不再需要适应机器,而是让机器适应人。其次机器越来越懂人,不仅懂我们的语言,更懂我们的文化、动机等等。所以在这样的情况下,AI时代的人因工程不仅关乎人的能力、行为、限制和特点,也关乎人的文化和心理,是真正以人类为中心的系统工程。
对于人来说,语音对话是最自然、也是最高效的交流方式,因此,语音交互是AI时代新型交互的一个开端。语音交互有五个节点:唤醒、响应、输入、理解和反馈。为了打造更好的体验,每个环节下面其实都有非常多的问题需要被研究和定义。比如好的唤醒词是什么样的,比如用户发出指令之后多久响应是好的,比如怎么引导客户比较自然的进行输入等等。
AI 2.0
在完成了大部分语音交互节点之后,如何在这个基础上让人机交互更加类人,更加让人感觉到它是一个智能体而不仅仅是机器。心理学有一个经典研究结论:人和人的第一印象中大概55%的信息来自外观。这是一个惊人的数字,也给我们很大的启示:外观很重要!目光所及的那一刻,印象就形成了。所以首先我们研究作为一个智能体,它的外观应该怎么样?
首先,将拟人度按面部拟人和身体拟人进行拆解。根据不同的拟人度分析得到不同结果,比如脸部造型中两个眼睛是关键部位,对于是否增加嘴巴要谨慎;全身拟人方面手是关键部位等等。
在探讨了外观之后,让交流更加立体是下一个主题。在当下语音交互体验持续优化的基础上,我们认为让人和机器的交流更加自然是人机交互发展的下一个趋势,这也就是我们提到的自然交互。所谓自然交互,其实就是参照人的信息输入、输出通道来进行交互的一种方式。人类的信息输入包括视听触味嗅,而输出则通过语音、肢体、文字等等。在信息接受方面,视觉和听觉基本上能够满足90%以上的信息需求,所以机器在自然交互的信息输出方面,最主要的其实是处理视觉和听觉信息的配合关系,而在这个问题上,车载环境是一个非常典型的场景。
在车载环境下,智能车机的使用,能进一步解放双手和双眼,更好的保证安全驾驶。但是实际上,语音并不能满足所有的信息传递,比如当我们想要了解路况信息的时候,看一眼界面远远比听播报更有效,所以完全不看界面是不可能的,我们希望的是通过声音和屏幕的配合,尽量少的分散用户的资源。

所谓的情感交互,其实就是让机器拥有能够具有类似人一样去感知观察、理解和表达情绪的能力。所以,当机器进化到情感交互这一步的时候,它将不仅能够听话,还能懂事,这是人机关系的进一步深入。机器要完成情感交互,需要对人的情绪进行准确的识别和应对,这是两个非常重要的环节。
无论是自然交互还是情感交互,这些都是很前瞻的研究领域,在此也分享一下在研究方法上的一些心得。第一,由于研究领域越来越前沿,需要在研究中不断创造交互体验和场景,比如通过AR、VR技术构建场景。第二,由于体验更加多元及立体,因此需要越来越多引入生理测量系统,脑电、机电、心电都是比较成熟的体系。