我们已经彻底探索了狭义AI的世界。无人驾驶汽车、记忆你偏爱温度的自动调温器以及电邮文件夹中的垃圾邮件过滤器都是由狭义AI驱动的。是的,这些都是技术上的奇迹,但请不要试图咨询它们中的任何一个,你应该给你的配偶送什么圣诞礼物。另一方面,通用人工智能(AGI)是一种至少和你我一样聪明的智能。你可以要求它做任何事情,包括它从未被编程设定过的任务,它会想出如何执行这样的任务,然后尝试去做。问它6乘以7等于多少,你会得到答案。问它你是否应该娶你的女朋友,你同样会得到答案。
我们将如何着手建造这样一个设备呢?第一步是要弄懂人类拥有一般智力的机制——即我们的大脑的运作机理,这似乎是一个合理的开始。
郑重声明,我是人类大脑的超级粉丝。我就有一颗大脑,我几乎每天都在使用它。但是我们对大脑的内部运作了解多少呢?答案是“非常少”,这着实令人惊讶。而之所以吃惊,是你原以为我们现在对它已经了解很多了,但其实并没有。当然,在过去的20年里对大脑的研究已取得了非凡的进展,可我们对记忆是如何编码的仍旧茫然无知,更不用说如何用化学或数学方程来表示记忆了,更是无从下手。
为什么大脑对它的秘密守口如瓶呢?有两个原因。首先,大脑被封闭在头骨中,我们至今也没有找到什么方法在它运转的时候研究它。死的大脑对研究来说远不如死的心脏那么有用。其次,它是已知宇宙中最复杂的东西。大脑中神经元(neuron)[1]的数量大致相当于银河系中恒星的数量,大约1000亿个。说来奇怪,这个数字大到让我们的大脑都无法理解它自己。其中的每个神经元都与其他1000个相连。想象一下整个银河系。然后在每颗恒星和其他1000颗恒星之间架设一条电缆。现在你的脑海里勾勒出了一个近似于大脑复杂度的东西。这些电缆类似于人脑中的突触(synapse)[2],一个简单的数学运算就能揭示出,大脑中有100万亿个突触。有些人认为神经元的数量可能接近千万亿,或者1000万亿。除此之外,还有神经胶质细胞(glial cell)[3],它们几乎多到数不清。也许在一个大脑中就有数万亿个。它们为神经元提供支持和保护,并以我们尚不了解的方式辅助认知。如果这还不够令人印象深刻的话,还有别的数据,每秒钟至少有10万个不同的化学反应在人脑中发生。所有这些细胞、突触和化学反应,以一种神秘的方式共同作用,电光石火间造就了你和你们。尽管世界上运行速度最快的超级计算机需要消耗数千万瓦特的电力,但它们的能力仍然远远逊色于我们功率仅为20瓦的大脑。
我们不理解大脑的原因不仅仅是因为它的复杂性,还因为我们甚至不知道最简单的大脑是如何工作的。想想不起眼的线虫(nematode worm)[4]吧,它们可以说是地球上最有成就感的动物。它们似乎在地球的任何角落都能茁壮成长:海底、沙漠、湖底和山脉。令人惊讶的是,地球上80%的动物都属于百万余种线虫中的一种。你没看错:80%的动物都是线虫。
一般来说,线虫的体长为一毫米。秀丽隐杆线虫(Caenorhabditis elegans)[5],线虫中一个特殊种类,是第一个被基因组测序的多细胞生物。所以我们对它了解较多。事实上,几十年来,成千上万的科学家一直密切关注这种特殊的线虫。研究它似乎应该很简单。毕竟,秀丽隐杆线虫只有959个细胞,它们的大脑只有302个神经元。每一个神经元都与大约30个其他神经元相连,形成大约10 000个突触。
所以想想吧。如果说你大脑里的神经元和银河系里的星星一样多,那么线虫大脑中神经元数量就相当于一碗麦片的数量。因此,人们可以合理地假设,我们能为线虫的大脑建模,或者我们可以理解线虫是如何做它所做的事情的。
但一无所获。不知何故,线虫以我们还远未了解的机制做一些相当复杂的事情。它们可以靠近或远离热源,寻找食物,寻找伴侣,对触摸做出反应,它们寻常的行为方式使它们成为现在最成功的动物。
这并不是说人们没有试图去解决这个谜题。通过对线虫的每个细胞建模,我们正努力在计算机上建立一个完整的、生物学上真实的线虫模拟系统。希望线虫的各种行为能够集体出现。想想这应该是可行的,对吧?只要弄清楚一个神经元是如何活动的,再模拟302个带有10 000个突触的神经元,很快,你就会在计算机里生成一个像线虫般行为方式的东西。但同样,我们没有做到这一点。对于从事这一研究的被称为OpenWorm项目的参与者们,甚至对“目前是否有可能构建这样一个模型”都还没有达成共识。有一件事似乎是肯定的:在理解线虫的大脑是如何运作的之前,我们肯定无法理解人脑是如何运作的。而且,如果OpenWorm项目最终成功了,那么在计算机内存中游动的线虫真的是活的吗?如果不是,那又为什么不是呢?它可是由一个细胞在一个指定的时间从头开始构建的,一旦完成,它的全部行为就如真的线虫一样。
从某种意义上说,线虫的大脑比人类的大脑更具吸引力。“我们有一大堆神经元。当然可以做复杂的事情。但线虫只有302个神经元,然而它也能表现出复杂的行为”。
有人认为这意味着我们还远远没有开始了解大脑是如何运作的。在麻省理工学院任教60多年的博学家诺姆·乔姆斯基(Noam Chomsky)就是其中之一。他坚持认为,人工智能领域的工作“并没有真正让人们洞察到思维的本质……我不认为这很令人惊讶……即使要了解巨型乌贼的神经元如何区分食物和危险也是一个难题。更何况试图去探寻‘人类智能’或‘人类选择’的本质了,这远远超出了当代科学的极限”。
人脑大约有3磅重,略轻于半加仑牛奶。所以它只占你体重的2%,却消耗了你20%的能量。它有60%的脂肪,这意味着我们都是一群肥脑袋。占它重量四分之三的是水,它像明胶一样晃动。其中包含数万英里的血管。
大脑是一个令人难以置信的多功能器官,可以在需要时动态地重新分配空间。当一个未成年人的部分大脑因医疗原因被切除时,它会重新连接以维持被切除部分的功能。除了生物学最初给我们的五种感官,它甚至可以学习接受新的感官输入。例如,神经学家大卫·伊格曼(David Eagleman)开发了一种让聋人“听”的方法,即利用声波触发紧身背心不同部位的振动。一段时间后,这个人“听到”了,也就是说,他不必一步步对震动带给身体的压力进行解码,而是能够无意识地理解其含义。伊格曼相信,最终聋人将以与非聋人同样的方式听到声音。
我们了解大脑的进度正在加快。一个令人惊叹的例子来自技术先锋玛丽·卢·杰普森(Mary Lou Jepsen)正在做的工作。她开发了一种系统,当人们在YouTube上观看一系列视频时,可以对他们进行脑部扫描。计算机会记录他们看到视频内容时的大脑活动。之后,测试对象会看到新的视频,计算机必须根据测试对象的大脑活动来判断他们看到了什么。结果令人难以置信,竟然成功了。虽然不是很完美,但确实奏效了。他们的大脑正在被解读。这些技术有助于解开大脑的许多谜团。
然而,关于大脑,我们所不知道的事情还是多到令人羞愧。我们不知道自己是如何在大脑中编码和检索信息的。试试这个:回想一下你得到第一辆自行车的情景。想象一下那辆自行车的颜色,以及骑它的感觉。你小时候骑车去过哪些地方?现在再试着思考一下这是如何被“写入”你的大脑的。它不像一个小自行车图标存储在那里的某个地方。此外,想想回忆起这个场景有多么容易,即使你已经很多年没有想过了。当然,大脑科学家对此有理论和预感,但我们还远不知道答案。我们确实知道很多关于大脑不同区域的功能,但我们对其中大部分是如何运作的仍然一无所知。
通常,大脑被比作计算机,但就结构而言,它们根本不像计算机。两者最主要的相似之处是,计算机被建造出来做大脑目前所做的事情。虽然你既可以在炉子上做爆米花,也可以在微波炉里做,但这并不代表炉子和微波炉在现实中很相似。如果你要“头对头”地比较大脑和计算机(或者我猜是头脑对CPU),目前还是大脑更强大。虽然计算机可以比人类更快地进行2+2这样的计算,但大脑可以在许多其他任务中胜过计算机,因为大脑是大规模并行思维,可以同时做很多事情。
你的大脑能做什么?首先,有一个荒诞的说法是“你只利用了大脑的10%”。但这个所谓的“事实”很快就不攻自破了。实际上你几乎调用了你大脑的所有部分。话虽如此,但有些人能用他们的大脑做出惊人事情。我给大家举三个简单的例子:
一个叫金·皮克(Kim Peek)的人可以同时用不同的眼睛一次读两页书,每分钟读10 000字。英国数学家比尔·图特(Bill Tutte)只用一支笔和一沓纸就破解了纳粹的洛伦茨密码(Lorenz code)。他甚至从未见过洛仑茨密码机,但当意外截获了德国人两次发送的相同信息时,他就找到破解密码的方法了。
1939年,加州大学伯克利分校的研究生乔治·丹齐格(George Dantzig)上课迟到了。他看到教授在黑板上写了两道题,以为它们是那周的家庭作业,所以他把它们抄了下来,他不知道这两道题其实是著名的尚未解决的统计学问题——你现在可能已经猜到了——他解出了答案。后来他说,这些问题“似乎比平常更难一些”。
然而,大脑有一些特质。首先,它有数百种认知偏差(cognitive biases)。这就是大脑可能得出错误答案的原因,因为它有特定的内在偏好。我最喜欢的例子是“韵律偏差效应”(rhyme-as-reason effect),它描述了人们更容易相信押韵的语句所表述的内容。“小洞不补,大洞吃苦”是真的吗?我不知道,但我倾向于这样想。当我还是个孩子的时候,和百岁的邻居一起玩多米诺骨牌(dominos)。她会责怪我出牌时的犹豫不决,说:“想多错多。”这句话确实有一定的道理,至少比“想多错少”更有道理。1980年以前出生的人都记得强尼·科克伦(Johnnie Cochran)[6]在辛普森案(O. J. Simpson trial)[7]审判中反复提到的那只手套:“如果手套不合手,那你们就必须判他无罪。”陪审团同意科克伦的观点。
也许这些偏差并不是我们大脑源代码中的错误,而是某些实际用途的副作用,可能只有从某个特定的角度来看才显得它们不理性。我常常想,如果企业家们知道他们成功的真实概率,那么选择创业的企业家就会少得多。但由于在这类事情上的乐观偏见,许多人认为:“当然,大多数事情都会失败,但我的不会!”他们选择继续创业。从社会的角度来看,这可能是最佳选择。如果我们领先于计算机的方式是做出他们永远不会做出的个人非理性决定,那将是令人欣喜的,不是吗?
大脑还会做一些其他的事情来欺骗我们,但出于某种已知的或未知的原因,这些事情是有用的。跳视掩蔽(Saccadic masking)就是一个例子。人们第一次观察到这种现象是在19世纪末,它是说大脑在眼球运动过程中作了一些视觉处理,使得个人无法察觉到眼球轻微跳动造成的图像的小幅晃动。尝试一下:站在镜子前,从一只眼睛到另一只眼睛来回看。你看不到你的眼睛在动,但显然观察你的人可以看到你眼球的运动。
我讲这些细节是为了让大家了解大脑有多复杂,进而了解智能有多复杂。尽管我们可以忽视大脑的运作方式,制造出一个AGI,但计算机智能也不太可能因此变得更简单。智能是很难达到的。人工智能的杰出人物之一马文·明斯基这样描述智能:
牛顿发现了三个简单的定律,几乎解释了我们所看到的所有机械现象。一两个世纪后,麦克斯韦(Maxwell)对电能也做了同样的事情……许多心理学家试图模仿物理学家,把这些(关于大脑如何工作的理论)简化为几个简单的定律,但并没有奏效。
在已知宇宙的所有物体中,人脑本身就属于一个单独的类别。制造一台机器来完成它所做的事情,要么是雄心勃勃,要么是傲慢自大。如果这样做的难度还不够大的话,要想成就真正的智能,它还必须有心灵。
人类的心灵
大脑和心灵的区别是什么?大脑是一个由3磅黏性物质组成的器官,以机械的方式运作。心灵是你能做的所有心理层面的事情,看起来比这个黏糊糊的东西可能做成的事要困难得多。心灵是情感、想象力、判断力、智力、决断力和意志力的源泉。音乐之所以能够触发你的抑郁,全因心灵的存在,正是心灵使我们能够畅想未来。
想想吧,一个器官怎么会有创造力呢?3磅的人体组织怎么会坠入爱河?单纯的神经元怎么会认为某件事很有趣呢?
心灵的概念已经渗透到我们的日常语言中,并被每个人所使用。我们问人们是否疯了(out of their mind),我们寻求内心的平静(seek peace of mind),我们告诉人们我们在想什么(what's on our mind)。我们被告知英雄所见略同(great minds think alike)。我们可能对某件事犹豫不决(of two minds),或者相反,我们也会认死理(one-track mind)。人们心智健全(of sound mind),事情可以让你心醉神迷(blow your mind),你可以下定决心(make up your mind)。关于心灵,还有数百种更通俗的俗语,如果用“大脑(brain)”这个词来代替,它们的意思似乎都不太一样。
然而,当人们援引心灵这个概念时,他们要表达的意思是非常不同的。回到我们的基本问题,如果你是一元论者或者你相信人是机器,你可能会说:“心灵只是一个笼统的短语,用来描述大脑所做的那些我们并不真正理解的事情。但是大脑所做的一切只是正常的心理过程。心灵可能是大脑的一个涌现性,但即使如此,它也只是简单的生物学问题。”
二元论者或相信人类不仅仅是机器的人可能会说:“心灵就是你。它存在于物理定律之外。它可能是由大脑创造的,但它与单纯的器官功能完全不同。你永远无法把它变成一个化学公式,因为它本质上就不是物质的。”
AGI可以绕开混沌的心灵概念而建立吗?不可以,因为很遗憾,“心灵”使得构建AGI变得更加困难。根据定义,AGI必须比动物王国里的任何生物都聪明得多。如果你做了一个像最聪明的海豚一样聪明的计算机海豚AI,没有人会称它为AGI。想想电影《我,机器人》(I, Robot)中的对话,威尔·史密斯(Will Smith)饰演的警探史普纳(Detective Spooner)正在审问一个名叫桑尼(Sonny)的机器人:
史普纳警探:机器人能编写交响乐吗?机器人能在画布上画出美丽的画吗?
桑尼反问:你能吗?
写交响乐和画漂亮画的能力肯定来自心灵,不管它是什么,我们希望AGI能够做到这两件事,因为要成为真正的通用智能,它必须具有人类水平的认知能力。所以必须正视心灵的作用。
那么,心灵是如何产生的呢?心灵有一个特性,它是你头脑中的声音,是那个内在的“你”,观察着世事变化。单凭大脑怎么可能做到呢?毕竟,线虫也有大脑,但它302个神经元中是否能对世界产生动态的连续评论是值得怀疑的。因为不管那个声音是什么,也不管心灵是什么,那个声音是心灵的一个方面。如果你还记得,这是我们最基本的问题之一:“你的‘自我’是什么?”
正如你们可能记得的,对于自我,有三种可能的解释,由此延伸到心灵。
首先,你的自我是大脑的一个把戏。提醒一下,这个把戏是说,大脑如何将感官体验结合成一个集成流,以及当大脑的不同部分想表达自己的时候,是怎么“掌握发言权”的。对于心灵是什么,这个观点认为,你没有心灵,本身只有一个大脑,所有我们不了解的能力,比如创造力和情感,只是正常的大脑功能。
第二种选择是,你的“自我”是大脑的一种涌现属性。难道心灵就是这样吗?你可能还记得,涌现是指事物的整体呈现出某一个体所没有的特性和能力。早些时候,我提到了蚁群。即使蚂蚁个体都不聪明,蚁群也表现出聪明的行为。单看细胞的任何部分都不是活的,但是整个细胞却是活的。在这种观点下,大脑是由1000亿个神经元的所有活动以某种方式创造出来的。确切地讲,还不明确涌现是如何在物理系统中发生的,所以“心灵是大脑的一种涌现属性”的说法,只是把这个问题又抛给了另一个问题。尽管如此,这也是一种关于心灵之源的普遍信念。
“自我”的最后一个解释是,它是你的灵魂,是你存在于物理定律之外的一个部分。你的心灵可能是你身体的非实体部分,在你的肉体死亡后,它有可能存活下来。从这个观点来看,情绪、创造力以及心灵的所有属性都不是数十亿神经元活动的产物,而是灵魂的某些方面。这就解释了为什么科学很难理解这些能力。
如果这三个观点中的第一个是正确的,那么创建AGI成功的可能性就非常高。随着时间的推移,心灵将被揭开神秘的面纱,计算机将能够以这样或那样的方式复制心灵的能力。如果第二个选项是正确的,那么通往AGI的道路就有点棘手了,因为我们也许需要以某种方式在机器中制造涌现现象。鉴于我们对涌现现象的理解,很难确定我们是否能够机械地再现它,但鉴于它是一种物理现象,结果还是很乐观的。但如果第三个选择是正确的,你的心灵就是你的灵魂,那么创建AGI的可能性就会大大降低。