人工智能三部曲（全三册）(（美）理查德·扬克，（美）拜伦·瑞希，（印）卡尔提克·霍桑纳)_情绪推动第一次技术革命（1 / 1）_人工智能三部曲（全三册）最新章节免费阅读无弹窗

埃塞俄比亚阿法尔三角区戈纳，339万年前

青翠苍郁的山谷中，一个浑身毛茸茸的矮小身影，蹲在一小堆石块前。她一手屈掌捧着一块中等大小的燧石，一手不停地用第二个石块——一块没了棱角的花岗岩，反复击打燧石的表面。每击打几下，燧石就会迸落一小片，留下一个浅凹。随着这位年轻女性反复击打，原本没有什么形状的燧石慢慢有了形状。在女子辛苦的劳作中，这块燧石渐生出锋利的刃面。

这项工作带有仪式的神圣，同时也是传承沿袭——是祖祖辈辈传下来的技艺，不知已经传了多少代。最终的成品，是一件很小的切割工具，人们可以牢牢握住，然后把肉从骨头上剔下来，确保维系生命的那点食物连碎渣都不会浪费。

这里是东非大裂谷，旧石器时代的人类先祖，正在运用一项人类最早的技术。我们现在还无法确定她所属的具体人种，但可以肯定她是双足行走的原始人，而且早于能人，也就是在教科书里一直被描述为“能人，工具制造者”的物种。她也许是肯尼亚平脸人，也可能是体形稍大的阿法古猿。按我们现在的标准，她体形娇小：大约三英尺[4]半(约1.06米)，相对偏瘦。脑容量也比我们小很多，大约400立方厘米，比起我们的1350立方厘米，还不到三分之一。但这种比较实在有失公允。与人类进化树状分布图上的其他分支比，这个原始人，这个早期人类，已经是脑力上的巨人。她把这种能力充分运用了起来，制造出工具，从此将她属于的这一物种与之前的所有物种区别开来。

以今天的眼光来看，这些石器可能显得简陋。但在当时，这算是一个巨大的飞跃，大大提高了人类先祖获取营养、击败竞争对手和抵御猛兽的能力。借助这些工具，他们可以捕杀比自身强大得多的动物，把肉从骨头上剔下来。这又进而改变了他们的饮食结构，让他们能更稳定地获得蛋白质和脂肪，为大脑的进一步发展提供条件。

制造这些工具，需要知识与技能将人类先祖剧增的脑力与拇指屈伸使手部更灵活的特点两相结合。而最为重要的是，这从中发展出了交流石器制作，即石器打制技术的能力，从而使这一技术得以代代相传。这一点太神奇了，因为这些古猿更多地依靠情绪、面部表情和其他非言语交流手段。

要使这种知识的传递成为可能，需要多种认知和进化因素共同协调作用。打制技术并不简单，也不容易学，但对个体的生存，乃至整个物种的最终发展至关重要。因此，不管是通过基因传递，还是行为承袭，有利于这种知识延续和发展的人类特质会在自然选择中存留下来。

这是人类历史上非常不可思议的一件事，因为我们从此就成了实实在在的技术物种，人类与技术也自此开启齐肩并进的漫长旅程。我们会发现，情绪从一开始就参与其中，并让这一切成为可能。人类和技术此后的依存发展，给双方各自带来的机会和空间，若非彼此互为助力是根本做不到的。

人们往往会觉得工具和机器都是“蠢”物件，对其不以为然，但这显然是以人的智能水平作为衡量标准的。我们和机器比，毕竟是占了十亿年的先机，从单细胞生命出现我们就起步了。但随着时间推移，技术的智能水平已经越来越高，在不少新生领域已有赶超之势。再加上技术达到这一步几乎只在转瞬之间。原因我们后面会谈到，那就是技术的发展速度是以指数形式增长，相比之下人类的进化却是线性的。

于是我们又绕回到那个重要问题：石器打制是技术吗？答案是“绝对是”。石质工具的制作技术，在当时属于先锋前沿技术(拿“先锋”这个词做双关不太完美，但肯定贴切)，这一点应该是确定无疑的。石器打制技术非常有用，乃至人类将这项技术整整沿用了三百余万年。毕竟，不夸张地讲，这些原始人的生死都仰仗着它。在这段时期，制作工艺的变化和发展异常缓慢，其中至少有部分原因是因为，新的尝试即便不被视为彻头彻尾的浪费，至少代价也太过昂贵。燧石是一种细粒的沉积岩，在当地的储量有限。从古人类遗址和当地的化石记录来看，燧石在非洲几个不同区域都曾数度消耗殆尽。而且据推测，有数次只能转而从产出更为丰富的地区搬运。

从化石记录来看，石器从简单的单边直刃，发展到多达上百个切面的精美切片石器，用了一百多万年的时间，差不多经历了七万代人的传承。虽然这项技术本身的改进速度拖沓缓慢，但有一点至关重要，那就是分享和传递这一技艺的能力。石器打制技术并没有随着某个才华出众的个体，或者旧石器时代的某位天才之死而消亡。因为这项技术太有用了，它让使用者具有更强的竞争力，所以世代交替间，这门技艺和知识被一丝不苟地传递下去，并得以慢慢演化出更复杂的技术形式和更多样的实际用途。

人类的原始人先祖会打制石器，这个我们几十年前就已经知道了。自20世纪30年代始，英国考古学家路易斯·利基及夫人玛丽·利基，从坦桑尼亚的奥杜瓦伊[5]峡谷挖掘出土了上千件石器工具和切片石器，这些石器也因此得名奥杜韦[6]石器。现在奥杜韦石器多用于指最早的切片石器类型[7]。后期对这些石器的年代分析表明，这些石器大约有170万年的历史，其制造者应该是鲍氏傍人，或者能人。

但是，更为近期的发现大大提早了人类使用工具的时间。20世纪90年代早期，沿着东非大裂谷，在位于奥德瓦伊北部的另一处旧石器时代古人类遗址，出土了年代更早的石器工具及碎片。1992年到1993年，美国新泽西州罗格斯大学的古人类学专家在埃塞俄比亚的阿法尔地区出土了2600件刃面锋利的切片石器及石锋碎片。经过放射性年代测定法和磁性地层学检测，研究人员认定这些碎片应完成于260多万年前，从而使这些石器成为已知最古老的人类工具遗存。

当然了，毕竟是数百万年前的东西，并不是总能找到直接证据。2010年的一个发现就属于这种情况。2010年，古人类学家在上述同一地区发现了一些兽骨，上面的痕迹与石器的刮切痕迹相符。其中有两块骨化石，一块是股骨，另一块是肋骨，出自两种不同的有蹄类动物。两块化石上的痕迹，显然是为了剔净上面的肉而精心运用多种工具留下的。扫描结果显示，这两块骨头约有339万年的历史，从而将工具最初的使用又上溯了80万年。如果这个判断准确，根据其所在位置及年代可以推断阿法古猿，也可能是面部平坦的肯尼亚平脸人，就已经在使用，当然也已经在制作工具了。可惜，因为这一证据属于非直接证据，其有效性受到了很多专家的质疑。而由其得出的结论，即精细复杂工具的制作年代比以前认为的要早得多的论断，也因此颇有争议。

到了2015年，研究人员在肯尼亚境内距离奥杜瓦伊1000公里左右的地方，出土了石片、石核及石砧等石器，其制作年代全部在公元前330万年。今后可能还会有新的发现，将人类使用工具的历史上溯到更早的年代。目前为止，我们至少可以确定，石器打制是应用历史最悠久的技术之一。

至此，我们有了证据，证明我们最早开始应用的这项技术，正确无误地一代代传承，历经300多万年。单这一事实，本身就已经足够了不起了。不过还有一点值得思考，那就是在语言还不存在的时候，我们的先祖是如何维持这种连贯性的？

没有人知道语言确切的出现时间，就连人类何时开始使用真正有句法的语言的时间都难以确定。这在一定程度上是因为口头语言与化石和石器相比，不会留下有形的痕迹。从达尔文认为语言使用能力得以进化的观点，到乔姆斯基[8]反进化的强式最简命题，再到平克的新达尔文主义[9]论调，对语言的起源可谓众说纷纭。在本书中，我们姑且做几个假设，判定我们的语言能力至少部分是受自然选择推动，又由自然选择塑造形成的。

尽管我们很想将这个世界的一切都拟人化，但其他灵长类，以及其他动物并没有真正的组合性语言。固然很多动物都会嘶吼、啸鸣或是啼唤，但这些在本质上只是宣示或者情绪流露，最多只能表达当前的状态或处境。这些声音，绝大多数无法通过组合或者重组产生不同的意义。就算像有些鸣禽和鲸类动物能做到声音组合与重组，却不能细分保留其中各组合单元的意义。此外，动物的鸣叫无以表达否定传达讥讽意味，也不存在过去和未来的时态区分。简而言之，动物的语言与人类的语言的确没有可比性。

人们普遍认为，黑猩猩和倭黑猩猩在基因上，是与人类关系最近的表亲。很长时间以来，进化生物学家都表示，我们最晚近的共同祖先人与黑猩猩最晚近的同一个先祖生活在600万年前。这个时间是根据DNA特定片段的突变率推算的。以人类而言，我们的整体突变率据估测在每个后代产生30个变异基因左右。然而，近期研究人员对黑猩猩的分子钟进行了重新测定，发现速度比原来想的要快。如果这一信息准确，那么人与黑猩猩最晚近共同祖先的生活时期就应该前推至1300万年前，而这个共同祖先应该是已经灭绝了的人科人亚科中的乍得人猿。

当然，单个基因的不同，并不会造就新物种。突变需要积累到一定数量，才能产生一个完全不同的灵长类物种，比如远古地猿。而这个突变量，据估计直到1000万至7000万年前才终于积累完成。这是一段相当漫长的时间。

在如此大幅的时间跨度中，我们能明确指出人类语言出现的时间点吗？人们普遍认为，南方古猿通过发声来交流的能力，与黑猩猩及其他灵长类动物没有什么不同。事实上，进化生物学家认为，在舌骨演化出特定形状，并移动到特定部位之前，我们的声带结构根本达不到现代语言的发声要求。舌骨的演化，加上咽喉的精准构造，才让我们在20万到25万年前，开始以音素[10]为单位，发出复杂的声音。近年来，有研究指出，尼安德特人可能同样具有语言能力。不管怎么说，这都是阿法古猿、鲍士傍人以及能人从地球上消失很久以后的事了。

遗传学则从另一角度对这一问题展开了研究。很多遗传学家认为，叉头框蛋白P2(FOXP2)基因的变异，可能与人的言语形成及运用有密切关系。叉头框蛋白P2基因，控制着转录因子叉头框蛋白P2的合成。这种基因在现代人身上发生了变异，而在其他哺乳动物身上则高度保留。转录因子是符合DNA特定序列的多种蛋白质，负责调控DNA模板转录成信使RNA的速度，核糖体随后通过信使RNA来合成氨基酸。

氨基酸合成上的差异对生物的发展会产生重要影响。FOXP2基因在除人类之外的灵长类动物身上同样存在，但人的这一基因中氨基酸序列发生了两处变化，正是这两处变化对人类的语言发展起到了关键作用。当然人的语言发展仅凭FOXP2一个基因是远远不够的，但这是我们首个发现的与语言表达相关的基因。另外，FOXP2的这种变异，直到距今约20万年前才发生。综合所有证据，就算是原始母语，即现代语言的初期形式，其发展历史相对而言也非常之短。

如果真是这样，那么在语言产生之前，我们旧石器时代的先祖是怎样分享并将石器打制的知识准确地传递了上百万年呢？机械的模仿和练习是肯定有的，但是仅靠模仿，能做的有限。我们早就知道，技艺不精的一个问题，就是你不知道自己不知道什么[11]。

一般来说，要把细致繁复的知识，从技艺精湛的老师传授给一无所知的学生，最好是能在教学过程中有一定的及时反馈。因此，我们可以假定，在口头语言还未出现时，他们只能依靠表情和其他非言语交流手段。手势可以传递与技艺相关的一些信息，也可以用于表示不满意或是可接受。面部表情同样可以提供反馈，达到某些发声表达的效果。

教者与学者之间，应该有交流愉悦、愤怒和挫败情绪的能力。鉴于他们的嗅觉应该远比我们敏锐，就连气味和信息素，都可能成为反馈的形式。此外，也许还有很多我们现在认为是不够社会化的手段。比如，黑猩猩投掷粪便的做法，在很多灵长类动物学家看来，是宣示对方要听从自己的手段。对黑猩猩的近期研究表明，这一投掷行为与黑猩猩大脑中相当于人脑布洛卡区的脑区联系增多有关。人脑的布洛卡区，是额下回的一个非连续区域，是重要的语言中心。研究结果显示，投掷越频繁越精准的黑猩猩，智能也更高。虽然这种行为很不能为人类社会所接受，但却可能属于早期人类的一项交流本事。看，扔屎有理!

那么，人类情绪交流的基础从何而来呢？首先，最基本的情绪极可能源自我们的生理反应。与这个星球上其他所有生命形式一样，现代智人是几十亿年演化的结果。在此过程中，早期的脊椎动物逐渐进化出复杂的内分泌系统。这套由化学信号构成的网络，帮助身体在危险袭临、捕获食物或**时机等特定情景下做出最佳反应[12]。当愤怒、恐惧、吃惊、厌恶、快乐和悲伤等基本情绪出现，多种激素的水平会随着情绪的兴奋度升高而升高。肾上腺素、皮质醇，还有其他多种化学物质，让身体做好要么打要么逃的准备。内啡肽控制痛感，多巴胺带来快感，褪黑素调节睡眠周期，催产素让人产生信任感和吸引力，如此等等。

但这只是情绪的生理构成。早在古希腊时期，人们就已在试图将情绪描述为驱动我们按某种方式行动的体验过程。我们可能会说，我们出拳是因为愤怒，跑开是因为恐惧。但在1884年，美国哲学家威廉·詹姆斯(William James)却提出，我们完全把事情弄反了。詹姆斯指出，人在受到某个事件的影响，也就是受到刺激时，身体会发生变化。这种反应几乎是瞬间发生的。在那篇名作《什么是情绪？》中，詹姆斯这样解释：

对刺激因素的感知，会直接带来身体的变化，而这些身体变化发生时给我们带来的感受，就是情绪。按照常识，没有了财产，我们会难过，开始哭泣；遇到了熊，我们会恐惧，然后逃跑；受到了对手的侮辱，我们会愤怒，大打出手。而本文要在这里提出的假说是，这种排序是不正确的。心理状态不是由刺激因素直接引发的，我们必须把身体变化置于两者之间。更合理的说法是，难过是因为我哭了，愤怒是因为我出手了，恐惧是因为我颤抖了，而不是我哭、我出手、我发抖，是因为我难过了、愤怒了或者恐惧了，等等。没有了随感知而得的身体状态，感知就成为纯认知层面的空壳，苍白无趣，缺乏情绪应有的温度。结果就成了我们看到熊，觉得最好开跑吧，受到侮辱，判断该出手了，但却无法真正感觉到恐惧或者愤怒。

因此，按照詹姆斯的理论，只有先出现身体反应，我们才能从认知角度加以理解，然后诉诸某种情绪表现。由此得出，对具体情绪在认知上的识别和归类，是在内分泌推动的生理反应之后发生的[13]。尽管詹姆斯-朗格理论在过去125年间不断受到批评和修正，但今天的很多情感影响神经学家至少会对这一理论的核心表示部分赞同。

虽然詹姆斯、朗格和塞吉都对情绪的理解进行了新的阐述，但他们的观点远未就此理论形成定论。在过去100年中，又涌现出很多新理论，对詹姆斯-朗格理论(James-Lange theory)或赞同或反对。关于这个话题，时至今日仍存在大量争论。就连是身体的体感先产生，还是我们称之为情绪的认知状态先产生，都无法完全达成共识。正如不少专家指出的那样，这两者几乎是同时产生的。在不假思索就对刺激做出反应时，可能是出于认知，甚至是本能主导，而反过来看也同样可能成立。我们经常会记起一些让我们或愤怒、或欢悦、或悲伤的回忆，而此时身体的生理反应是在之后才出现的。

众多持驳斥态度的理论之间，甚至连情绪到底有多少种都莫衷一是。例如，美国东北大学知名心理学教授丽莎·费尔德曼·巴雷特(Lisa Feldman Barrett)，于2000年左右提出了“情绪的概念化作用模型”(conceptual act model)，以期对所谓“情绪悖论”(emotion paradox)进行解释。这个悖论指出，虽然我们宣称自己有分类情绪的经验，比如愤怒、高兴、伤心等，还宣称自己能识别他人的情绪，但事实上却找不到什么神经科学的证据，来证明情绪体验存在这些分立的类别。

巴雷特的概念化作用模型认为，情绪不是脑回路产生的，而是出现在当时当刻的意识之中。巴雷特不同意分立情绪的观点，她认为这些情绪都是她称之为“核心情绪”的神经生理状态，而核心情绪的特征仅通过两个维度体现，一个维度是愉悦到不愉悦的程度高低，另一个维度则是从兴奋到平静的兴奋度变化。我们体验到的情绪，就落在由这两个轴构成的坐标系中，被人们按照在各自文化中对情绪的理解，根据具体情境加以归类。如果这种关于人类情绪的模型正确，那么这对我们如何将情绪性理解引入技术，会产生重大影响。

由于情绪的这些复杂性，关于情绪起源、作用及测量方法，争议还将持续下去。比如，巴雷特认为，两个维度足以定义情绪体验，但也有人提出，想恰当地定义情绪，需要四个、五个甚至六个维度才行。另外，同一事件可以让我们同时体验到积极和消极情绪，这一事实使问题变得更为复杂。正如德国心理学教授阿维尔·卡帕斯(Avril Kappas)在欧洲网络情感联会(Europe's Cyber Emotions consortium)的报告中所讲：“积极情绪和消极情绪并非水火不容，它们可能同时发生，从这个角度观察二者如何相互作用，会对我们有所裨益。”他还以父母在孩子第一次离家上大学时的心情为例，做了进一步解释。那种心情就是积极情绪和消极情绪的叠加。英语中甚至还专门有词来描述这种杂糅的状态，比如“bittersweet(苦乐参半)”。

显而易见，这些驱动我们的化学物质在我们身上存在已久。后来，随着我们大脑的进化，引发身体反应的激素刺激通过边缘系统与认知功能的整合程度越来越高，联系越来越紧密。边缘系统是大脑中包括杏核体、丘脑、下丘脑、海马体及其他一些脑结构在内的脑区，负责处理情绪、动机和长期记忆，进而影响这些方面的表现。此外，边缘系统的各组成部分之间还通过极为复杂的交互联通，作用于新皮层并为新皮层提供信息输入，而新皮层正是我们语言、感知和抽象思维的中心。

内分泌系统本质上是一套化学网络和信息体系，而边缘系统是其主控系统。如此，也就解释了内分泌系统的进化先于新皮层，且不受新皮层影响的原因。在新皮层区域，人们一般将种种化学变化归类为不同情绪。在两个各自进化的系统之间，必然产生了某种联系，使双向联通成为可能。

而前扣带皮层(anterior cingluate cortex, ACC)看来既是认知信息处理中心，又是情感信息处理中心。它同时负责处理下行和上行的双向刺激，因此很可能是受内分泌驱动的生理体验与认知功能的交会之所。

纺锤体神经元，又称Von Economo神经元(VENs)[14]，是前扣带皮层与另外两个皮层(前岛叶皮层和背外侧前额叶皮层)特有的脑皮层细胞。这种很长的特异性神经元将大脑相对距离较远的不同部分连接了起来，很可能起到了加快信息处理、强化不同脑区与功能间相互联系的作用。纺锤体神经元的进化大约发生在1500万至2000万年前，是新皮层进化相对较晚的部分。研究人员起初认为，只有人类和部分高等灵长类动物才有这种神经元，后来在其他某些亲缘关系很远的物种具体如鲸类和大象身上也发现了纺锤体神经元，从而表明纺锤体神经元的出现可能是趋同进化的结果。换言之，这些神经元是在完全不同的物种中各自独立进化的。促成这种趋同进化的原因也许是脑容量加大后，这种神经元的存在能为多物种带来普遍的利益。无独有偶，这些物种恰恰就是那些已证明能通过某些自我识别测试(镜子测试)的物种，这也说明纺锤体神经元提供的神经连接，很可能对自我意识和心智构成至关重要[15]。

有趣的是，人类婴儿的纺锤体神经元要到4至8个月大时才会出现。神经元的相互连接，要到1岁半左右才能达到一定数量，一般要到三四岁才能全部连接完成。这些时间点，与人类认知能力发展的一些重要节点基本吻合，显示纺锤体神经元对人类的自我意识发展有支持作用。

由此可见，我们的情绪和更高级的执行功能这两个系统，应该是经过了很漫长的进化，才开始慢慢相互融合。大脑的执行功能之所以能覆盖和调节我们的部分生理和情绪反应，可能与纺锤体神经元的连接作用有关。无论其神经机制如何，只有发生这种融合，通过融合生成的反馈环，意识、自我意识和内省才能唤起一系列所谓人类独有的高等情绪，如负罪感、骄傲、尴尬，还有羞愧等[16]。同理，如果不是有这种融合的作用，由内部生成的情绪，比如我们回忆过去时产生的情绪将无从生发。

最后，我们甚至发展出控制自己情绪的能力，至少是一定程度上的控制能力，这也和社会化进程不无关系。我们还学会了反省自己的情绪，在某些场合甚至可以随心调整。也许有人奇怪，究竟为什么我们的认知需要具备这些能力？这很可能是因为在做决定的过程中，这些能力通过判别过去记忆的不同价值让我们在进化上受益颇丰。毕竟，如果河里满是鳄鱼，你在决定过不过河时，恐惧是重要的参考和激发因素。

情绪还对形成和巩固记忆有重要帮助。这一功能进化可能是因为记住情绪反应更强烈的事件，比如能带来恐惧或愉悦的事往往比记住情绪反应一般的事件更有价值。记忆是文化和技术的重要推动力。因此任何提高记忆力的事物，实际也推动了我们作为技术物种的前进步伐，这一点也就不言而喻了。

情绪最有趣的一面，应该是情绪本质上的社会性。快乐的时候，我们展露笑颜；难过的时候，我们泣不成声；生气的时候，我们面红耳赤；恐惧的时候，我们苍白无力。从进化来看，这很奇怪，因为在他人不在场的情况下将个人感受表露在外，这本身并没有什么价值可言。要是纯粹从生物学上的经济观念出发，人类应该进化出只对所处情境做出反应的能力，然后安之若素。可是我们人类却始终要将情绪表达出来，而且不分种族、文化，基本都是如此。因此，也许在进化过程中，不只是那些更善于表达情绪的个体存活了下来，还有那些能马上理解这种情绪并相应做出反应的同伴也存活了下来。表情有部分组成原本属于生理过程的附随表现，比如面色涨红和苍白是血流变化所致。很可能那些对表情敏感的个体，就是先注意到这些基本信号并加以利用的。当然，这也可能是自然选择的结果。如果真是如此，那么辨识面部表情带来的种种益处，可能也是我们最终脱去面部毛发的诱因之一，要知道，我们的灵长类先祖面部可是毛发浓厚。

举例来说，比如我看见你逃跑了，甚至只凭你脸上的恐惧就马上做出反应，那我生存下去的概率就会大大提高。如果我能马上模仿你的行为，而不是先停下来想想，甚至还要去花时间自己慢慢识别、理解当时的情境，那我被吃掉或者被杀掉的可能性就会大大降低。要是我也能通过自己表达反应的面部表情，将这条救命信息传递给我的族人，提高他们的生存机会那就更好了，这对我也有利。简而言之，反应若能瞬时分享，对整个族群或部族都有利。我们现在言辞上总是对从众行为多加非难，但从历史上看，从众者往往可能活得更长久，从而将自己的基因传递下去。

20世纪90年代初期，研究人员首次找到证据，证明了执行这种镜像功能的特殊神经元的存在。在研究恒河猴的前运动皮质时，研究人员发现猴子在做出某一动作时会兴奋的神经元，在它观察到别的猴子做出同一动作时也会兴奋。换言之，行动和观察触发的是同一组神经元。[17]这一发现意义重大，因为它有可能解释人类心理学中很多未获解答的疑问。进一步的研究表明，这种镜像神经元存在于包括人在内的多种灵长类动物脑中。不过，也有些其他研究表示不赞同这种结论。虽然镜像神经元这一观点很流行，但对于是否确有专门的镜像神经元存在，乃至其在自闭症、自我意识、打哈欠等行为中的作用仍存在诸多争议。争议的范围还涵盖了镜像反应到底是不是特定神经元作用的结果，这是整个神经网络的整体反应，还是视觉和运动指令之间一连串习得的联系。如果这种作用机制——或者不管哪种作用机制的正确性最终得以证明，都会大大加深我们对人类进化的理解。除了能让个体活下来，镜像和模仿还可能促进学习、语言发展和同理心的产生，从而进一步强化家庭成员和部族成员之间的情感纽带[18]。反过来，这种行为又会进一步加大个体及其部族的存活机会，进而在自然选择中胜出。

再到后来，这种镜像行为可能还起到了另外一个作用，即传递文化和技术[19]，包括从第一项真正意义上的技术，一直到后来其他技术的传递和延续。在这些技术中，最引人注目的就是石器打制技术，显然它成功地传递了很久。然后，隔了几千代，甚至可能是上万代以后，又出现了其他技术，比如用火和最初的原始语言。

近期，美国埃默里大学人类学教授迪特里希·斯托特(Dietrich Stout)与神经学家一道，就数百小时石器打制活动对神经连接的影响进行了研究。石器打制对力量的稳定和着力的精准要求很高，因为要用石锤反复击打燧石核，不偏不倚。研究人员利用现代的正电子发射断层扫描(PET)和功能性核磁共振技术，发现只要击打的时间够长，这一石器技术的确能改变脑的连接，使众多神经结构间的连接加强，尤其是在控制精细运动的脑额下回[20]。有趣的是，那些精于粪便投掷的黑猩猩，同样也是这个区域的神经连接更多!在人类身上，左脑额下叶的一部分就成了后来我们所说的布洛卡区——言语生成的重要活动控制中心。部分学者认为，这一区域就是曾被大脑用来控制包括发声和手势等初等交流的区域。

因为有能力制造石器的原始人类存活的机会更大，斯托特以此为基础做了一个合理推断，认为“自然选择会偏向所有能让(石器打制)新手艺学起来更容易、更高效或者更可靠的变异”，包括交流方式上的进步。类似推断应该也适用于能改进镜像行为，以及其他通过手势和表情传递信息的手段。尽管现在这么说还有些牵强，但语言的逐步发展很可能也属于那些手段之一。

根据最近提出的镜像系统假说(Mirror System Hypothesis, MSH)，支撑人类语言的神经区域和功能，是以大量原本与沟通无关的基本结构为基础进化而来的。镜像系统假说认为，原用于抓取和操纵的镜像系统及通过复杂模仿产生行动的能力出现在先，并为组合和组织语言单位所需的语言运动中枢及认知能力提供了演化基础。起初是手势化语言，然后是口头语言。由此，将复杂行为分解为熟悉的单元，然后加以重复的能力，就成为人类语言发展的基础。

现在我们再来谈谈人科[21]，这个发明了人类第一批技术石器打制，并把这项技术延续了几百万年的物种。他们还没有说话的能力，知识的传递靠的是面部表情、发声、手势和镜像。数百个小时的敲打，实实在在地改变了它们的大脑，在相关神经区域建立起了更多的连接。于是打制的石器更好了，获得的营养更好了，大脑发育也更好了。

在历经数万代的自然选择中，有利于模仿和学习工具制造技术的基因变化被选择保留，因为它们提高了生存机会。最终，在学习和模仿过程中用到的部分认知机制被大脑调动起来，发展出越来越复杂的手势语言和口头语言。这大大强化了我们分享和改进知识与技术的能力，促成了人类与技术的共生演化。事实上，如果没有这样的发展，更确切地说，没有这些发展带来的技术传递，人类作为一个物种是否能生存下来都非常值得考量。

当然了，语言、工具和文化全都得到了发展，否则这本书不会存在，你也不会有读它的机会。但是正如有了新技术，并不等于老技术势必无以为继，文化有了新层面，旧层面也不一定会无影无踪一样，虽然优美复杂、句法精良的语言出现了，但非语言交流并没有消失。那些在语言出现前就有的交流方式，几乎全都保留了下来(也许有人有不同意见)，发挥着提供语境、补充信息，以及为略显平直的陈述抹上否定和讽刺色调的作用。我们的情绪表达——人类的第一界面(interface)——在很大程度上仍然是人类其他沟通方式的基础平台。

提起沟通，人们往往只会想到正式的语言。毕竟大多数人几乎每天都在说话和书写。但是，尽管口头语言和书面文字非常重要，我们沟通中的相当部分却是非语言的：充满同情的目光、怒气冲冲或失意徘徊的表情、因为沮丧耷拉着的肩膀、把整句话意思都反转过来的嘲讽语调。

加州大学心理学教授艾伯特·梅拉比安(Albert Mehrabian)在《沉默的讯息》(Silent Messages)一书中写道，他的研究结果显示，信息交流中词句占7%，语调占38%，而55%是非言语行为，比如面部表情。乍一看，梅拉比安似乎是在说，非言语交流比我们实际说的词句重要12倍!但这是对这项研究普遍存在的一种误解。梅拉比安反复说明，他的这一结果是在严格控制的特定条件下得出的，并不反映日常交流的真实情况。不管怎么说，我们都能发现此处的重要信息。倒不是说交流过程中到底是93%，或者80%，甚至60%是非语言的，而是非语言表达占有相当大的份额，乃至我们无法忽视它在我们日常交流中扮演的重要角色，以及进而在我们智能上占据的重要位置。

从多重意义上讲，很难想象世界上情绪的沟通不存在。去掉非语言部分的沟通会变成什么样？也许短信技术能给我们提供一些线索。说实话，谁没有在跟别人短信沟通时出现过误解？当然引发误解的原因有多种，但很多误解的产生，实际上都是因为在沟通时缺乏非语言线索和语调的缘故。这一点在很多针对手机短信和电子邮件的研究中得到证明。2005年的一篇文章《电子邮件中的自我中心主义——我们真如自己所想的那么善于沟通吗？》援引了相关研究成果，称参与者对邮件基调是否为嘲讽做出辨识，其正确率是50%。如果我们正确推导此类信息与随机概率相当，也就不奇怪为什么手机短信可能经常导致误解了。

这无疑是表情符号得以大行其道的主要原因之一。可能有些人觉得表情符号很傻，年龄因素大概算是有此偏见的主要原因，但表情符号在传递发送者的语调和意图上确实发挥了很多作用。

在解决沟通中缺乏情绪传递这个问题上，表情符号是绝佳的自发解决方案实例。使用者仅仅通过几个字符，就能至少将自己发送信息时的感受示意出来。一个笑脸“:-)”，一个皱眉“:-(”，在多种层面上都实现了成功的有效沟通[22]。后来，好像这样用都嫌费事了，很多使用者干脆将“-”(鼻子)也去掉了，只用两个字符就代表了脸“:)”或者“:(”。自这些符号开始应用，这一创意被推至极致，创造的字符和图像表情符号已有上千种，不过人们日常使用的也就是十几种最基本的而已。

不过，表情符号多么有效并不是我们要谈的重点，我们的重点是使用者有这种要开发出表情符号的基本需求。似乎无论我们如何交流、和谁交流、交流什么，反正不将情绪包含在内是做不到的。而这一点，似乎也越来越适用于我们的技术。

机器——首先也是最基本的一点——是我们的工具。我们发明、制造和改进机器的目的，是为了让自己生活得更好更便利。从来没有谁会专门发明一种机器，好让自己活得不容易，或让自己增加负担。不管是为了征服、协作还是便利，建造它的目的都是服务生命的延续，并最终改善我们的生活，至少是怀抱这样的希望。在此过程中，我们为使用者创造了竞争优势，加速了自然的演化进程，又将这些演化转移到文化的竞技场。我们以此谋求自己的竞争优势——不论发生在什么领域，不论是在职业上，还是个人生活中。在与另一家企业、另一个国家，抑或一个情敌的较量中占据上风，不仅会给我们带来优势，还会触发很多自远古以来就有的激素刺激反应，这些化学物质曾帮助我们一代代将遗传物质传递下来。不同只在于，技术作为我们无法回避进化过程的直接产物，正伴我们共同发展进化。

在向往美好生活而研发技术的过程中，人们始终不忘改善界面，那是我们与设备互动，并对设备进行控制的方式。从最初的操纵杆，到机动车的仪表盘，再到原子力显微镜，这些界面让我们在控制世界的方式和规模上达到了难以企及的高度。正如虚拟现实领域先驱布兰达·劳雷尔(Brenda Laurel)所说的：“我们很自然地将两个主体的接触点视为界面。两个主体间的差异越大，就越需要一个设计精良的界面。”

过去的十几年里，我们见证了计算机界面设计上的海量变化。当前计算机处理能力和记忆空间的不断增加是其中的一个重要因素。这是一种持续不断的进步。二十世纪八九十年代，GUI，也就是图形用户界面取代了打孔卡和命令行。如今，图形用户界面又正逐渐被自然用户界面取代。所谓自然用户界面，就是通过触摸、手势、语音识别及其他多种方式运行的界面。

这种发展背后的驱动力，是让使用更方便。但请注意，随着这种发展，我们在界面设计上正越来越趋向于自然使用，交流方式也越来越和人类接近。换言之，使用最方便的界面，是适应我们的方式习惯，而不是让我们去迁就它的界面。在执行任务时，我们更喜欢采取对我们来说自然的方式，而不是被迫去学习晦涩的指令，或者苦哈哈地像机器一样重复同样的步骤——如果有选择的话。斯坦福大学的两位交流学教授克利福德·纳斯(Clifford Nass)和拜伦·里弗斯(Byron Reeves)在共同撰写的《媒体等同》一书中，对这种关系进行了简要总结：“个人与媒体的互动，包括计算机、电视和其他媒体等，在本质上是社会性的，本质上是自然的。”他们认为，我们对待这些技术的态度，和对待其他社会关系的态度是一样的，进化使然。如果有这样的技术存在，而且还能和我们互动，那把它当活物对待就顺理成章。

因为想用更自然的方式控制机器、进行人机互动，想要机器和我们的距离感觉更接近，这样一来，想让它们理解我们的感情也就说得通了。会“本能”地根据我们的感受而改变行为的设备，有望给我们带来巨大潜在利益和作用。比如能注意到司机的警觉程度已低于既定阈值的汽车，能识别学生的挫败感高低，并据此实时调整课程进度的教育软件，能测定那些可能诱发个体愤怒情绪或自毁行为事件的咨询程序。

情绪计算的潜在优势正在于此。正如数字革命几乎改变了世界的每一个角落一样，未来情绪计算同样会让我们生活的方方面面发生改变。读完这本书，你会发现几乎没有什么领域是这个新技术不涉及的；执法机关和国家安全部门需要了解嫌犯和罪犯内心的想法和动机；通过早教及类似途径帮助婴幼儿大脑发育；自闭症程度检测及潜在疗法，建立更好的交流渠道；能改善购物体验的个性化市场营销；能成为我们的朋友、伙伴，甚至爱人的机器人。

对这种种可能，很多人会对其中一些抱有相当的怀疑、不确定，甚至会产生焦虑。每一种可能性自身都会面对独特的挑战、意料之外的后果和种种不尽如人意的评价。简而言之，阴暗面。几乎任何技术都兼具利弊之可能，既可用于行善，也能用于不义，这大概无法避免。

最终，社会会找到应对挑战、解决问题的办法。如果同时还不会变得对技术过于剑拔弩张，那就最好了。以可能有负面影响为由便对技术严令禁止(就算能做得到)，实与技术恐惧无异。想知道这种恐惧可回溯到多么久远以前，看看历史就知道，以希腊哲学家苏格拉底为例。他就对当时的一项新技术——书写和文字普及——持坚决反对的态度：

如果人学会了这个，就等于在灵魂中种下遗忘；他们不再去努力记忆，因为可以依赖写下来的东西；不再从自己的脑海回想，而是去借助外在符号。你发明的这贴药不会增强记忆，只是起提醒作用罢了，而且你传递给学生的也不是真正的智慧，而是智慧的仿品。因为借助文字，你只是告诉了他们很多东西，却没有真正地教授，你会让他们觉得自己知道很多，但其实基本上什么都不知道。人，如果不是充满了智慧，而是自以为有智慧，会成为其同胞的负担。

苏格拉底谈到的书写对前书写社会及口头记忆的影响，可能有些合理成分存在，但今天相信没有几个人会真心认为，这个世界没有书写会更好。与其他所有技术一样，书写技术的使用也存在利弊。但就具体情况而言，显然利大于弊。可能会有人说，在漫长的发展过程中有相当数量的书面作品对人类造成了一定损害，但这远不足以成为将书写彻底抛弃的理由。

统观历史，对新技术抱有类似恐惧态度的情况比比皆是。印刷机、电、汽车、电脑，还有智能手机只是其中几个例子而已。几乎找不出一项通用技术，其用途没有覆盖伦理道德要求的整个范围。这样想，也就没有理由期望情感计算成为特例。

情感计算的多种可能用途会让大多数人担心，感觉会受到冒犯。因为和我们的思想一样，我们的个人感受是最隐蔽的避难所，永远不该冒犯其私密性。对这一领地的入侵，预示着思想被浏览的日子即将到来。接下来我们会看到，也许这么说并非完全脱离实际。

还有一个担忧就是麦迪逊大道式的心理操纵——在第十章中我们会谈到，有这种可能性。广告和市场营销历来就是以诱发受众的行为改变为要旨。有了对消费者情绪反应的不间断实时反馈，可能会彻底改变这些领域的局面。

当然，还有那个老问题也需要再度审视，就是认为这种新兴技术会弱化人性，或者说造成人类的异化。担心的理由通常都是说新设备，或者新系统导致人们彼此隔绝，或者一定程度上让人们越来越像机器了。如果我们的目标是让机器更像我们又会怎样呢？

我们正进入一个陌生的新时代。在这个时代，人与技术之间的界限会日渐模糊，世界将看到那些见所未见的奇迹成为现实。我们会遇到前所未有的机遇和挑战。有趣之处在于，这个勇敢的新时代，虽然难以回避属于这个时代的恐惧与焦虑，但同时也让我们整体上更快乐，更欢悦，甚至可能更有爱。

在这些颠覆性变革发生的同时，我们一定会一遍一遍地问自己，做人到底意味着什么？是什么塑造了我们？是什么让我们与周围的自然世界、技术世界有那么大区别？最终我们也许会发现，原来其中的区别并没有原先想的那么重要。也许随着我们进入情感交互智能机器时代，我们甚至会发现，自己正与一种新的意识形式共享未来，而这种意识恰是对我们自身的回顾与反映。