AI时代的人因工程

DAE专栏 / 04-21

注：本文摘自百度人工智能交互设计院《李璇：AI时代的人因工程》，如有侵权，联系删除。

引言

早在工业时代，人们使用机器来提高生产效率，人机互动是纯物理的机械互动，所以人们研究的是人的生理方面的阈限，然后基于这些阈限做出人可以承受范围内效率最大化的设计。而这种基于人体特征的研究应用到设计当中的思路也被沿用至今。

到了信息时时代，让人使用机器替代一部分的认知劳动，人机互动是虚拟的认知交流，所以人因工程研究人的感知规律，来优化信息传递。比如根据人类可以明显区分的最小音量差，5分贝，来设计手机音量键每次调整音量大小。

在过去，人因工程奠定了将人的特征以及规律进行研究，然后应用到设计的基础。那么到了AI时代人因工程又有了哪些新的延伸呢？

首先，AI时代的人因工程让机器越来越像人，它开始可以通过人类的语言、表情等方式进行交流，甚至被赋予人的外形。人类不再需要适应机器，而是让机器适应人。其次机器越来越懂人，不仅懂我们的语言，更懂我们的文化、动机等等。所以在这样的情况下，AI时代的人因工程不仅关乎人的能力、行为、限制和特点，也关乎人的文化和心理，是真正以人类为中心的系统工程。

AI 1.0

语音交互有五个节点：唤醒、响应、输入、理解和反馈。为了打造更好的体验，每个环节下面其实都有非常多的问题需要被研究和定义。比如好的唤醒词是什么样的，比如用户发出指令之后多久响应是好的，比如怎么引导客户比较自然的进行输入等等。

AI 2.0

在完成了大部分语音交互节点之后，如何在这个基础上让人机交互更加类人，更加让人感觉到它是一个智能体而不仅仅是机器。心理学有一个经典研究结论：人和人的第一印象中大概55%的信息来自外观。这是一个惊人的数字，也给我们很大的启示：外观很重要！目光所及的那一刻，印象就形成了。所以首先我们研究作为一个智能体，它的外观应该怎么样？

首先，将拟人度按面部拟人和身体拟人进行拆解。根据不同的拟人度分析得到不同结果，比如脸部造型中两个眼睛是关键部位，对于是否增加嘴巴要谨慎；全身拟人方面手是关键部位等等。

在探讨了外观之后，让交流更加立体是下一个主题。在当下语音交互体验持续优化的基础上，我们认为让人和机器的交流更加自然是人机交互发展的下一个趋势，这也就是我们提到的自然交互。

所谓自然交互，其实就是参照人的信息输入、输出通道来进行交互的一种方式。人类的信息输入包括视听触味嗅，而输出则通过语音、肢体、文字等等。在信息接受方面，视觉和听觉基本上能够满足90%以上的信息需求，所以机器在自然交互的信息输出方面，最主要的其实是处理视觉和听觉信息的配合关系，而在这个问题上，车载环境是一个非常典型的场景。

在车载环境下，智能车机的使用，能进一步解放双手和双眼，更好的保证安全驾驶。但是实际上，语音并不能满足所有的信息传递，比如当我们想要了解路况信息的时候，看一眼界面远远比听播报更有效，所以完全不看界面是不可能的，我们希望的是通过声音和屏幕的配合，尽量少的分散用户的资源。