安尼顿,美国,1987年
艾略特曾拥有大多数人只能做梦想想的生活。当时他才三十几岁,是一名公司律师,智力超常,身体健壮,有妻有子,有房有钱,社会地位不容小觑。突然之间,艾略特的生活开始分崩离析。他开始出现剧烈头痛,注意力越来越难以集中。根据这些症状再加上他一系列行为上的改变,医生怀疑他可能得了脑瘤。这个怀疑很快得到了证实。
他得的是脑膜瘤。这种肿瘤发生在脑膜组织,通常是良性的,但艾略特的肿瘤却生长迅速。到确诊时,肿瘤已经有小橘子大小。因为位置就在他的眼后、鼻腔上方,因此对艾略特大脑额叶的压迫越来越厉害。虽然肿瘤本身不是恶性的,但这样下去,不可避免地会对他的大脑造成灾难性破坏,并最终导致其死亡。医生最后诊断出手术是唯一的办法。经过一台漫长的手术,艾略特的肿瘤以及部分受损组织被成功摘除。在这类手术中这属于常规做法。
从身体上讲,艾略特彻底康复了。他超乎常人的智力丝毫没有受损,语言运用一切如常。在认知上,术前能做的事,术后很多他仍有能力完成。然而,周围的人很快就发现,艾略特和从前完全不一样了。他整体的推理能力看似正常,但却无法进行个人决策,也无法通过恰当的行动执行个人决策。似乎在艾略特的眼中,所有事情的重要性和优先级都雷同,结果导致他无法做出决定。在任何给定时间,他都决定不了哪些事要做,或者不需要做。所有事,对于他都是等值的。结果没有一件事为他带来一丁点儿价值。
比如说,让他给文档归类,艾略特可以非常娴熟地完成。不过,这也未免过于娴熟了。因为他可能要花一整天时间来决定分类是应该按时间还是文件大小,或者编号,或者相关性,或者别的什么标准。从智力上讲,他能列出每一种分类方法的利弊,但就是决定不了哪种方法最好。然后,分类正做到一半,他说不定又转去读他正归档的什么报告,之后就把剩下的时间都集中到那个上面去了。说白了,就是他彻底失去了按事情轻重缓急恰当安排各项工作的能力。这么说听起来好像很复杂,其实这个过程我们每天都会完成几百次,也许上千次。
在接下来的几个月、几年间,艾略特陆续失去了工作、妻子和房子。他卷入一系列疑点多多、代价高昂的事务,并因此很快破产。他的生活变成理不清的一团糟。
可是,如果你和他谈起他的损失,你会发现他显然对此没什么感想。他既不难过,也不愤怒,更不怨恨,反正就是没反应。尽管他拥有的知识和智力与从前完全一样,但肿瘤造成的损害却夺走了他一样非常重要的东西,就是他与自身情感的联系。再进一步说,就是他对自己的世界中哪些东西重要、哪些不重要的识别能力。在他的生命中,事无巨细,样样事情都同等重要,结果他每样都没能留住。
美国著名神经科学家兼作家安东尼奥·达马西奥对艾略特进行了细致研究,将他的不幸遭遇写成了文字,并对这种失联状态进行了解释。艾略特脑部这一区域的损伤,实质上切断了大脑负责处理感受和动机的不同部分间的联系。达马西奥的体细胞标记假说提出,腹内侧前额叶皮层在感受和动机的处理上起着主要作用。这一皮层通过庞大的连接网络,与包括额下叶和杏核体在内的大脑其他部分相连。针对艾略特及大脑同一区域受到类似损害的其他病例,多种测试结果一致表明,所有这些病患都长期存在无法产生身体反应,或意识不到身体反应的问题。也就是说,身体发出的信息,比如心跳加快、出汗、心里忐忑不安、头发竖起来等,没有被传达到脑中对这些信息进行归类的部位。因为这些部位还同时负责将生理—心理的这种自我认识与其他认知功能相联系,结果导致这个联系也无法实现。达马西奥认为,所有这些刺激因素合在一起,形成了一种最终体细胞状态,这会使更高层的认知过程发生偏移,最终影响决策过程。
艾略特的这种状况,心理学上称为述情障碍,即识别和描述自我情绪的能力不足[23]。造成述情障碍的原因似乎有多种,其特征是情绪意识及人际关系处理能力不强,没有同理心,且无法辨识他人的情绪状态[24]。此外,正如艾略特所遭遇的那样,述情障碍还会造成在对事物进行优先排序并决定注意力投注方向时发生推理上的偏差。
这个问题并不仅限于人类。人工智能的很多缺陷都缘于不知道应该将关注点集中在哪里。正如本章将进一步探讨的那样,类情绪功能没有正常发挥,也许就是这背后的关键原因。
自计算机时代开始之初,科学家和研究人员就一直在努力寻求创造人工智能,也就是能让计算机借以执行人类全部或部分认知功能的程序。起初,人们以为这个宏伟目标很快就会实现。毕竟,机器已经证明了自己鼓捣海量数字计算的能力比任何个人都快得多。人们以为,“教”它们去做我们日常生活里更简单的事,应该容易得和玩儿似的。那时还是20世纪50年代,很多支持者都坚信,能与人相媲美的人工智能,一代人的时间里就能实现。
现在回头去看,无法想象人们对问题的复杂程度怎么会轻视得如此离谱。以今天的眼光看,想用25年就实现这个目标,显然是过于乐观,而且提前乐观了好多代。一年年过去,各种困难层出不穷。要造出有思考能力的机器,这过程期间的每个细微胜利,都需要经历那伴随着的上千次失败。随着时间推移,人类及动物智能的真正深度及复杂程度日渐明显。就连最简单的任务,比如定位杯子并把杯子拿起来,对机器都是巨大的挑战。从很多层面上讲,似乎正是这些我们时常熟视无睹的智能层面,才是机器最难以复制的。
那么为什么那么多绝顶聪明的人,会对这一挑战的本质产生如此彻底的误解?很大程度上,这要归结于认识论上的一条重要理论,那就是我们不知道自己不知道什么。认识论,是哲学的一个分支,探讨的是知识的本质和范围。它研究的是我们知道什么、怎么知道的、为什么知道、我们所知的是否是真实的,最后,知识的极限在哪里。就人工智能而言,对自然智能和心智,还有太多的东西我们当时尚未发现。只有在我们通过越来越精密的计算手段和越来越精细的扫描技术,对大脑的认识远远超出当年以后,我们才终于能让高等机器智能领域尽可能前进到看起来大有可能的地步。
人工智能的基础,回溯起来要比很多人所想的久远得多。在17、18世纪的启蒙运动中,包括笛卡尔、霍布斯和莱布尼兹在内的很多哲学家,就在探索理性思想的本质,希望将他们对理性的理解实体化。他们将理性视为一种系统化程式,就像数学上的公式一样。莱布尼兹甚至还探讨了推理中“通用语言”存在的可能性,期冀让它像几何定理一样严谨而纯粹。这些观点,对新生的人工智能的确起到了激励和指引作用。
到了19、20世纪,数理逻辑取得了长足发展,电子学也初显雏形,两者的结合促成了机器逻辑的发展,计算机语言随之诞生。而且,20世纪的神经学研究当时刚刚证明,大脑本身就是相互交换电子信号的细胞构成的网络。对很多人来说,很难不把大脑与当时的电网以及交通网络对等起来。
第二次世界大战给计算科学提供了一个迅猛发展的机会,让我们最终对人工智能的实现重拾信心。战争的迫切需要,再加上德、日加密信息看似无法破译的挑战,促成了计算科学的巨大进步。计算机科学就是在这种基础上建立起来的[25]。英国“二战”期间的密码破译活动中心——布莱克利公园的密码破译团队花了数年时间破译密码[26]。计算机科学之父阿兰·图灵就曾是团队的一员。没有他们取得的成就,“二战”很可能还会再打很久,甚至说不定盟军会战败。正如我们所见,“二战”结束没多久,计算机科学及理论就已经发展到相当高度,这让很多研究者和科学家都相信,用不了很久就能造出真正有智能的机器了。
了解了这些之后,就很容易理解为什么人们会对新生的计算机科学产生如此大错特错的理解了。这场世界大战,是机器“智能”赢的,起初差点帮德国赢了,不过到最后是帮盟军赢了。没有技术,德国的英格玛密码机(Enigma)也不可能给上千条信息加密解密,让这些文件看起来无可破译。如果不是靠更精密复杂的技术(人类智能参与的杰作),盟军也不可能破译当时最先进的密码机生成的、几乎不能破解的密码。
按照英国《公务保密法》仍须保持沉默的图灵,战后于1950年发表了那篇著名的论文《计算机器与智能》,开篇一句就是:“我建议大家考虑这个问题,机器会思考吗?[27]”说过了图灵,再来看看其他人,比如19世纪中期的数学家、逻辑学家乔治·布尔——《思维规律的研究》一书的作者。从他对逻辑的数学分析,可以更明显地看出,当时的计算机科学家根本没有意识到面临的困难有多大。一些史无前例的复杂难题挡在路上,看起来,它们在等待人类的仆从机器来解答,而非人类天赋的智能本身。
“二战”结束后的若干年间,对机器智能领域的投入达到了数百上千万美元。1956年,在达特茅斯的一场研讨会上,“人工智能”的说法被正式提出,标志着人工智能学科正式诞生。20世纪50年代后期,人们首次通过编写人工智能程序,开始了应用性尝试。如1956年的程序“逻辑理论家”(Logic Theorist)、1957年的程序“通用解题器”(General Problem Solver),还有1958年开发的人工智能编程语言LISP。虽然人工智能在这段繁荣期有所进展,但同时也存在着大量的失败案例。终于,到了20世纪70年代早期,由于计算机发展进退维谷,外加政治上的压力,政府大幅缩减了对人工智能研究的资助,英、美两国政府都是如此。这段时期,后来被称为第一次“AI之冬”。人们用这个非正式的口语化词汇,来指代那段因为政府机构和企业逐渐冷静,决定大幅削减人工智能项目资金的时期。
之后的相当长一段时期,经济时好时坏,对人工智能研究自然是冲击不断,不过这样的冲击在很大程度上也有其作用。就像环境条件的变化会形成压力推动物竞天择一样,经济和社会状况的改变也会促进技术的进化。在新想法产生的过程中,不够好的点子会被舍弃或搁置,人们会转而探索更新出炉的想法。如果不停止资助那些走入死胡同的想法,资源和人力还会继续迷失方向。这样阶段性的冷缩起到一个非常重要的作用,那就是去芜存菁。
不管怎么说,尽管人工智能遭遇了种种挑战,但它手里的确有张王牌——一张起初人们并没有留意到的王牌,那就是摩尔定律。
推动计算机技术不断发展的因素有很多,但其中作用最大的,无疑要数我们称之为摩尔定律的一个发展趋势。1965年,时任仙童半导体公司(Fairchild Semiconductor)研发部主任的戈登·摩尔(Gordon Moore)发表了一篇文章。大约五年后,在这篇文章的基础上,摩尔定律的说法诞生了。以摩尔名字命名的这条同名定律,对技术最重要的发展趋势之一进行了描述。在摩尔的那篇文章中,他给出了四组数据点,找出了集成电路板上电子元件数量翻倍的规律。从1962年到1965年,一直是同样的模式在重复。摩尔提出,这种发展趋势还会持续一段时间,而且做出大胆断言,称10年之内集成电路板上的元件数量将从64个,增至65000多个。这种增长,前后1000多倍的增长,是由每年翻倍而来[28]。后来,摩尔又于1975年将这一预测修正为大约每两年翻倍一次[29]。
摩尔定律不像物理定律或者自然法则那样恒定不变,因为它只是科技发展进程的一个观察结果。但即便如此,它在半导体行业半个多世纪的发展中,仍然是企业经济决策之机一个重要的推动因素。这一趋势及其他推动电子行业发展的因素一起,使计算机的速度越来越快、功能越来越强,最终带来了数字革命。而如今数字革命已经改变了我们的世界和我们的社会。按照摩尔定律的推论,我们会顺着这种发展趋势,将越来越强大的运算能力,纳入越来越小的空间,降低电耗和热损耗,最重要的是降低每一个处理运行周期的成本。
以某些标准来看,这种速度在近年来已经有所放缓。于是几乎年年都有很多人预测,认为摩尔定律要走到头了。但这种预测的假定前提,是半导体行业的生产方式和技术水平始终保持不变。正如发明家、未来学家及作家雷·库兹维尔指出的,摩尔定律所观察的集成电路,只是一个大发展趋势中的第五个范式[30]。这一大趋势可以追溯至20世纪初,它的延续时间比摩尔定律长得多,规模也要大得多。打孔式机电结构、继电器、真空管,还有晶体管,全都显现出与摩尔定律相似的规律,就是运算能力相对于成本会在一定时间内翻倍。那么会不会有第六范式来替代半导体呢?许多公司都把筹码押在会上,更是展开研发工作,希望能在未来的电脑技术上领先一步。
那么在现实生活中这意味着什么呢?有人指出,我们这么多人每天都在用的智能手机,其运算能力和储存空间已经超过了40多年前阿波罗登月计划所有的运算量和储存空间。2012年,当时任职于谷歌的世界算法大师乌迪·曼伯尔(Udi Manber)和人工智能专家彼得·诺维格(Peter Norvig)提交了一份统计报告,其中的数据更加让人震撼:
只在谷歌搜索栏输入一项简单查找任务,或者对着手机语音搜索一下,你所启动的运算量,与当年把阿姆斯特朗以及其他11位宇航员送上月球所做的总运算量不相上下。这里不单单是指实际飞行的那部分运算,而是包括后11年、所有17次阿波罗计划从筹划到执行所完成的全部运算。
我们往往意识不到自己在日常生活中动用了多少运算能力,而要全面把握短短数年间有多少事物因之发生变化就更不容易。
摩尔定律,以及克莱德定律(Kryder's law)和梅特卡夫定律(Metcalfe's law)等同类技术定律所描述的,都是几何级增长。克莱德定律指出,硬盘的存储密度每13个月翻一倍;而梅特卡夫定律指出,一个网络的价值与其用户数的平方成正比[31]。当某一个东西定期翻倍增长,不论这翻倍是每天发生一次,还是一年一次,还是一个世纪一次,我们都可说它是呈几何级增长。任何事物都可能呈几何级增长,从诸如细胞生长的生物系统,到动物种群数量,到投资的复利计算都有可能。
因为我们对世界的体验一般都是线性的,所以几何级增长的说法的确让人耳目一新。分分、日日、年年次第流逝,渐次累积。我们做的大多数事情也是这样一步一台阶。从多个方面看,几何级数变化对我们来说相对陌生。
假设有个小湖,湖上有一片莲叶,这片莲叶每天生出新枝。那么到了第二天,湖上就有了两片莲叶,第三天四片,第四天八片,以此类推。到了第十天,就已经是1024片莲叶了。可即便这样,也不足以遮住湖面一隅。假设这个湖的表面积为一百万平方英尺,每片莲叶的表面积为一平方英尺,即使到了第十五天,也只盖住了湖面的3%。可是仅仅四天之后,湖面就有一半被盖满了。到了第二十天结束的时候,整个湖面全被盖住了。还不只如此,假设不存在任何限制因素,再过十天,一千个这样的湖都能盖住了。一切都只是从一片莲叶开始的。
这就是为什么几何级数的发展速度经常让我们大跌眼镜。不论我们讨论的是荷叶、流行病,还是技术发展。我们没有进化出那个能力,无法凭直觉做出正确预期。这并不是说预期和预测不可能,只是说它也许不符合我们的直观判断。
几何级数的发展并不仅限于集成电路和摩尔定律,技术世界很大部分都是如此。几何级数发展是技术进步的一个基本特质已成为越来越多技术专家和科学家的共识。有了正反馈和技术本身带来的强化效果,几何级数的发展让我们越来越有能力加速改变世界,反过来世界变化的速度也越来越快。由此共生关系也必然得到加强,就是我们需要技术,而技术也需要我们(至少现在如此)。缘于这种共生关系,我们和技术二者同时在一个连续的抛物线上前进,一种自我持续的共同进化关系就此诞生。多种意义上讲,我们已经不仅是单纯的人类本身,也是包容自己创造物的总和。
这种加速发展一直都伴随我们身边,之所以最近这几十年中凸显了起来,是因为它终于发展到一些变化可以用人类习惯的时间标准来衡量的程度了。当初类人猿开始制造工具之时,这种发展变化的速度慢得多少代人也看不到一点蛛丝马迹。而今天,各种新技术推动社会进步成为司空见惯的事。库兹维尔将此称为“加速循环规则”[32],因为技术本质上是处于一个正反馈环中,因而使得可见的变化发现速度随时间越来越快。这种强化作用一方面又带来继发性的几何级数增长。库兹维尔认为,几何级增长本身也呈几何级增长。
正是这种几何级数式的改进和进展,会让人工智能在未来几十年内,有望取得巨大飞跃。这种飞跃意义极为重大,因为我们也许很快就会发现,人类智能至高无上的地位有了挑战者。简单地说,也许站在智能之巅的将不再是我们。
最近几十年中,为发展人工智能人们试用了很多方法,比如感知器、简单神经网络(simple neural network)、决策树专家系统(decision tree based expert systems)、反向传播算法(backpropagation)、模拟退火算法(simulated annealing),还有贝叶斯网络(Bayesian networks)等。每一种方法都有可取可用之处,但随着时间推移,可以越来越明显地看到,这些方法一个个都未必能发展出接近人脑水平的人工智能。
当年摆在罗萨琳德·皮卡德面前的,就是这种状况。1987年,这位年轻的电脑工程师进入麻省理工学院媒体实验室,成了一名教学及研究助理。1991年她正式入教职,加入了实验室的视觉及建模团队(Vision and Modeling group)。皮卡德的教学研究工作主要是围绕一些新技术和工程难题攻关,包括为模式识别、数学建模、计算机视觉、认知科学和信号处理等设计新的体系结构。皮卡德拥有电气工程学位,后来又获得了计算机科学学位,在进入媒体实验室之前,她在这两个领域就已取得一些重要成就。
可就在开发基于图像的建模系统和基于内容的检索系统的过程中,皮卡德走上了一个谁也不会想到的研究方向,就连她自己也未曾料及。这两个系统通过数学建模模仿生物视觉系统,模拟我们从任一场景,不论是图片、电影,还是真实生活中抽取物体、内容和意义的方式。她和她的团队最终开发出来的,就是世界上最早的三个图像检索系统之一,也是现在像谷歌图像识别这类现代系统的前身。
为了更好地了解大脑处理图像的机制,皮卡德与人类视觉科学家合作,对视觉皮层展开细致的研究。但是在他们已经完成对人类视觉活动的部分模拟后,主要难点还是没有解决。而指望系统运作稳定可靠,必须解决这些难题。他们发现,单纯靠添加过滤器来进行场景描述,或者编写硬性规则来规定老虎,或者椅子、汽车长什么样是不够的:线条会模糊,颜色和质地难以绝对区分,影子产生遮挡效果。这就是为什么只靠硬性规则支撑运作的系统不可能健康发展的原因。谈到这样的软件系统,人们会用“太脆”来形容,意思就是过于僵硬,无法在现实世界中应用自如。用“脆”来形容确实是再恰当不过了。这样的系统,一旦遇到新情况,或者输入它不理解的内容,它就会直接崩溃了。
就是在这一研究过程中,皮卡德意识到,自己的这些系统,如果能在某种程度上知道该把注意力放在哪里,其中很多系统的效率都能大幅提高。毕竟我们在看图像的时候,并不是将注意力平均分配到场景中每一件东西上的:我们每次只集中看一个目标,然后再转移到下一个。我们的眼睛、焦点和注意力掠过对象,找寻最感兴趣的点落脚,也许是颜色、对比度或者图形。皮卡德推测,如果她的软件具有类似注意力的功能,说不定就能解决她和团队正面临的一些难题。但是,要做到这一点就需要有更接近地模仿生物视觉系统主动识别物体的能力,它甚至能替我们发现重要的方面信息。皮卡德是这样解释的:
感受其实对认知有很大影响。它追随我们视线所及,影响我们的行事,左右我们的选择,决定我们要关注什么。而我发现,这正是计算机所缺乏的。计算机对每个入射光子都一视同仁。对所有比特数据都平等对待。它们感觉不到有些东西要比另一些重要。事实上,它们对多么重要的东西都没有一丁点感觉。于是我想,“如果这些计算机真要提供帮助,我们又觉得有些比特数据更为重要,那么它们(计算机)就需要有这个重要功能,能判断出有些东西比别的东西重要”。
皮卡德举了一个例子来说明感受是如何影响我们的视觉注意的。她讲了她早年在贝尔实验室[33]认识的一个朋友的事。那位朋友当时正读博,要开发一套视频压缩系统。他预先打听到评审他这套新系统的委员会成员是三名男性。于是他在视频中放了一个体态非常丰满的啦啦队队长,心里清楚评审委员的目光会聚焦在那儿。他始终保持着这一区域的高清晰度,而对评审委员们略过的其他区域使劲压缩,弄得那些区域满是毛病,相当粗糙。然而,尽管图像上缺陷不少,却没有一个人注意到。最后评审委员会还把他的这套压缩方法评了优。皮卡德最后大笔一挥总结道:“这就叫情商!”
但是,要将这种情商转移到机器上仍然是巨大的挑战。在图片中找出线条和边,当时对计算机来说已经相对比较容易了,但是要在图景中识别物体,并按照重要程度进行分类完全是另一回事。还是那个问题:“对于在任意场景中所见的景象,我们是如何决定何者更为重要的?”
1991年,皮卡德当时担任麻省理工媒体技术助理教授还不满一年。她在《华尔街日报》的头版读到了一篇有关科学家兼音乐家曼菲德·克莱恩斯(Manfred Clynes)的报道。克莱恩斯极具才华,拥有多项成功发明。他的研究工作以对音乐的神经科学研究为主,不过,吸引皮卡德注意的是他那个据说能测量情绪的机器“情绪记录器”[34]。克莱恩斯的机器所测量的是按压固定按钮时手指压力随时间发生的细微变化,并将其绘制成曲线图。克莱恩斯认为,这些变化遵循着一些特定模式,能反映被试者的不同情绪。看到有人居然想对情绪进行测量,皮卡德觉得很有趣,于是便将这篇文章收藏了起来。
随着研究的不断深入,皮卡德不断地遇到问题,这些问题一遍遍提醒她,她用的方法存在局限。于是她同视觉科学家建立了合作,努力了解视觉皮层的机制并进行模拟。视觉皮层,是我们在看到某一图像或场景时,大脑中主要负责对这些信息进行处理的地方。皮卡德的尝试在某些方面确实有用,但是她的系统用起来还是算不上得心应手。而且,在尝试的过程中,还产生了很多新问题。比如,我们怎么才能确定该把注意力放在哪里?为什么某一个物体或形状,在某一给定时刻会吸引我们注意,但换一个时间,看起来就寡淡无趣了呢?或者,正如艾略特术后境遇提示我们思考,我们的头脑是如何分配价值的?
在处理数字信号的过程中,皮卡德也遇到了类似的问题,只是它们是有关动机和优先性的。我们可以把系统建成按照一系列极为明确的步骤,对不同事件进行过滤,并按照优先性排序的模式。但是这种方法一旦遇到不常见的状况,或者不熟悉的输入,就很容易出错。这样的软件还是太脆弱了。皮卡德觉得,想要提高这些系统的稳定性和适应性,让系统能良好发展,必须寻找一种新方法。
此后有一年的圣诞,皮卡德读到了一本书叫《尝出形状味道的人》(The Man Who Tasted Shapes),作者是神经学家理查德·西多维克(Richard Cytowick)。这本书主要探讨的是联觉。所谓联觉,是指对一种感官输入的体验,完全像是另一种不同感官输入的现象。比如,有些联觉是将声音体验成了颜色。又比如在词汇味觉联觉中,一个词可以“尝”起来像某种食物或者物质。西多维克讲了很多,其中提到了一点,就是我们的各种感知不仅与其各自的主管皮层有关,而且还与边缘系统有关。皮卡德对这一点尤感兴趣,因为大脑中的边缘系统在人的记忆、注意和情绪产生上扮演着重要角色。
记忆和注意一直是这位年轻教授的关注点,现在她开始广泛阅读神经科学方面的书籍,结果发现各种书中不断提及情绪,不同的研究都支持同一个观点,那就是情绪在一定程度上与记忆、注意、感知和决策有着无法割断的联系。皮卡德开始觉得,她似乎找到了解开谜局的钥匙。
可惜,这和她心里所期望的可谓差之千里。此时的她主攻科学和工程两个领域小有成就,而这两个领域历来对情绪这类不理智的东西统统视而不见。在乔治亚理工学院上学的时候,教室里上百个男生,却常常只有她一个女生。她能以最优成绩获得电气工程学位,可不是因为她喜欢和人的感受这种不客观、不科学的东西搅和在一起。
不只如此,皮卡德知道再过一年,她就能申请麻省理工的终身教授了。她一直兢兢业业于图像模式建模领域的前沿研究,还开发了世界上第一个基于内容的检索系统。正如她在电气电子工程学会(IEEE)发表的一篇文章中写道:
这么久以来,我一周六天日夜无休地忙着开发世界上第一套基于内容的检索系统,忙着创建组合用于图像压缩、计算机视觉、结构模型、统计物理、机器学习等的数学模型,还要加进一些电影制片的想法。而其他所有时间,我还要指导学生、开新课、讲新课、发论文、阅读、审稿,还要参加永远在进行中的研讨会和实验室委员会议。我这么努力地工作,就是为了让别人看到我是一个脚踏实地的科研人员,而且我也已经给我的小组筹到了一百多万美元的研究资金。我最不希望发生的,就是颠覆所有这一切,去和情绪联系在一起。真是的,我是学工程出身的女性,从来不想被别人说成“情绪化”。当年的我觉得“情绪化”就等于不够理性。
显然,她非常担心这一决定会影响自己的事业发展。任由自己沿这个新方向走下去,也许如切线之于圆,越来越偏离她起初设定的方向。她担心这会严重威胁甚至抹杀她之前的所有辛苦付出。
皮卡德还是很确定,这中间的联系值得探讨。她也明白,一名真正训练有素的科学家应当接受研究证据的指引,哪怕它与个人或者整个科学界常规的预想并不一致。于是她开始在身边寻找能将这项研究双手托付的人,最好是某位学术地位已受肯定的男性同事——这里面肯定大有文章,值得有人去研究,即使不是她本人。
皮卡德继续着原有的课题研究却意外收到了很多人给予的热心建议。在与导师和同事的交谈中,总会有人提到她应该冒一下险,要允许自己成为别人眼中的另类,要跳出固有的思维模式。一次次的建议显然有了效果。皮卡德自认自己在麻省理工世界闻名的媒体实验室中循规蹈矩,只是一个设计了基于内容的检索系统的电气工程师而已。那些工作自然重要,但有风险吗?好像还好。要说有什么,那毕竟是大家觉得她该去做的事。
最终皮卡德认定,应该以全新的方式对情绪展开研究,发现它还有哪些作用不为人所知。于是她利用圣诞假期和随后的一个自由活动期,花了几周时间,写了一篇自己觉得还很不成熟的文章。除了要在文章中陈述那些技术上的内容和观点,最重要的是她还需要给它起个名字。还是那个问题,如果用“情绪计算”和“情绪技术”,就会让人产生主观性和非理性的联想,而这种联想正是她竭力避免的。最终,她决定用“情感”。“情感”这个词,在心理学上指对感受的体验,用来做学术上的限定词很合适。
在“情感计算”中,皮卡德细细陈述了自己截至1995年初的研究成果以及收集的相关证据。这篇文章她只给实验室里一些思想比较开放的同行传阅了一下,她想看看大家会有什么反应。不出所料,反应不一。有个学生觉得她的观点太有趣了,居然抱着一大摞有关情绪的书,出现在皮卡德的办公室。“你应该读读这些”,他跟她说。典型的那种麻省理工师生间独有的相处方式。而有一些老师则没这么兴致高昂,或者完全不知道该做何想。对很多人而言,这是他们在真实的个人生活中也没有怎么关注过的方面。“我没什么感受。”不只一个人这么说,他们相信事实就是如此,也隐约表示他们觉得因为情绪模糊朦胧,既无关紧要,也不可测量。
然而,随着时间推移,接受这一观点的人慢慢多了起来。皮卡德发现自己对情绪和情绪测量方法,写的东西越来越多,讲得也越来越多。报刊和电视也做了相关报道,从中可以看出大众对她这项研究表现出浓厚兴趣。1997年,在签订了出版合同九个月之后,皮卡德终于完成了与她那篇初期论文同名的作品《情感计算》。这部书将她那些大胆新颖的观点呈现给世人,从此也为人工智能和计算机科学开启了一个崭新的学科分支。
虽然她很担心不被看重,但很快就发现,在这个几乎没什么人听说过的领域,她已然成为领军人物。另外,一直让她非常忐忑的终身教授申请,尽管里面的各项成果之间严重缺乏连贯性,乃至被部分评审委员称为“精神分裂似的”,但提交后也被顺利接受了。皮卡德的申请材料中,有对基于内容的检索系统的同行评审书面材料。也有一些有关信号分析的论文,这是她为参加研讨会写的,所以不那么正式。最后还有她新出版的那本书,作为增色的补充材料。虽然这几乎完全不是她的初衷,但很快,她冒的风险就给她带来了数倍的回报。
然而,从很多角度讲,对她而言如今简单的部分已成过去。怎样设计出能正确测量情绪的计算机,怎样着手筹备世界上第一个情感计算实验室,种种挑战正摆在她面前,等待着她去解决。