生活和下棋不一样,被将死后游戏仍将继续。
——艾萨克·阿西莫夫,《神奇旅程2:目的地大脑》
历史学家和技术专家戴维·奈(David Nye)认为“工具的意义和与它相关的故事密不可分”。在人工智能的背景下,这些故事已被人工智能系统所玩的游戏所占据。
故事从肯佩伦的下棋机器“土耳其机器人”开始。尽管那台自动机是一个骗局,但它在很长的一段时间内为计算机科学家树立了先例,甚至可以说引起了狂热。根据印第安纳大学计算机科学教授内森·恩斯门格的说法,计算机界的许多人,包括诺贝尔奖获得者赫伯特·西蒙都相信,一旦一台机器掌握了国际象棋——用西蒙的话来说是“卓越的智力游戏”——“它就似乎已经渗透到了人类智力活动的核心”。
1965年,苏联数学家亚历山大·克朗罗德(Alexander Kronrod)将国际象棋称为“人工智能的果蝇”。他的意思是,游戏之于人工智能研究,就如同果蝇之于遗传学的研究:这是该领域最大创意的试验平台,可以立即使用,足以进行简单的实验,又足够复杂可供学习。果蝇易在小型实验室中饲养,繁殖周期仅需一到两周(使研究人员能够在几个月内研究多个世代),并且带有人类60%以上的致病基因。正如国家果蝇理事会前主席戴维·比尔德(David Bilder)所指出,在过去的85年中,果蝇研究以种种形式获得了五个诺贝尔奖。计算机科学家认为,国际象棋可能会对人工智能产生类似的影响。恩斯门格几年前曾指出:“不管是历史上的、哲学上的还是技术上的,对人工智能的讨论最终几乎都会归结到下象棋的计算机上。”
计算机科学家不是唯一相信国际象棋是人工智能最重要的部分的人。1997年5月11日,IBM的深蓝计算机击败了加里·卡斯帕罗夫,引起了媒体和公众的狂热关注。这似乎证明了计算机的合法地位,表明它们现在可以在具有数学难度和技术难度的任务上——其中艺术和科学的成分一样多——模仿甚至击败人类。库布里克的HAL 9000[6]指日可待吗?
最初的激动情绪平息之后,评论者开始质疑这一成果对机器智能的真正意义。达特茅斯人工智能研讨会的组织者约翰·麦卡锡在1997年《科学》杂志上发表的一篇文章中写道:“计算机象棋的发展已达到某个水平,如果遗传学家从1910年开始将精力集中在竞速果蝇的育种上,也许也能达到这一水平。这里头有一些科学成就,但主要成果只是一些发育非常快的果蝇。”
这不是一个完全标新立异的评论。1990年,麻省理工学院教授罗德尼·布鲁克斯(Rodney Brooks)辩称,该领域对游戏的痴迷是有问题的,因为它将智能锚定在符号系统上,而不是锚定在支持和推动人类智能的物理现实上。“传统的人工智能试图在贫瘠的领域展示复杂的推理。”罗德尼·布鲁克斯在名为《大象不下棋》的文章中写道。他说,程序员的目标应该是让人工智能执行比赢得象棋比赛冠军更简单,但能在“嘈杂的复杂领域”而不是游戏提供的“符号的海洋”中稳定地执行的任务,例如理解自然语言或是操纵真实世界中的物体。可是程序员们没有听取他的建议。游戏方便地提供了一种场景,在其中,人工智能系统可以与排名最高的人类竞争,也可以互相竞争,从而轻松地量化发展进度。
“Jeopardy!”[7]是他们的下一块试金石。2011年,IBM的Watson,一台基于超级计算机的自然语言处理(NLP)和问题解答系统,击败了这一热门电视游戏节目历史上的两名最佳玩家肯·詹宁斯(Ken Jennings)和布拉德·鲁特(Brad Rutter)。研究表明,为了超越人类的“Jeopardy!”冠军,一台计算机必须比1997年的“深蓝”更多才多艺。举个例子,“Jeopardy!”不是回合制的,相反,玩家必须快速决定自己对答案是否有足够信心。它还需要能够选择类别和线索,需要制定打赌策略。Watson对这些任务都得心应手。游戏结束时,电脑赢了77 147美元,詹宁斯赢了24 000美元,鲁特赢了21 600美元。詹宁斯以幽默感回应了他的失利。在他的“Jeopardy!”决赛现场直播中,在感言的最后他写道:“我欢迎我们的电脑新霸主。”
IBM后来将Watson商业化,今天IBM正在尝试应用该框架来协助教育、医疗、人力资源管理、供应链管理和法律等领域的从业人员。
2014年,谷歌收购了英国的初创公司DeepMind(这是一家专门研究人工智能和神经网络的公司)并将注意力转向了新的棋盘——围棋。如第五章所述,2016年3月,谷歌的AlphaGo程序以4比1击败了围棋国际冠军李世石。
那么接下来呢?是像《我的世界》(Minecraft)[8]这样的新潮玩意儿吗?还是既需要大脑又需要身体的运动?为了超越人类,什么样的游戏会将机器推向人性的新境界呢?计算的历史表明,我们要征服的东西决定了下一步的发展方向。在弱人工智能杀遍国际象棋之后,科学家变得更加雄心勃勃,再次瞄准了几十年前许多人放弃的通用人工智能。一台赢得“Jeopardy!”的计算机不算进入了HAL的领地,即使赢得了围棋的计算机也不算。但是下一个人工智能“果蝇”可以告诉我们一些关于未来的信息。
在2005年《AI杂志》25周年特刊的一篇文章中,计算机科学家尼尔斯·尼尔森(Nils Nilsson)宣称:“实现真正的人类级人工智能,必然意味着人类执行的大多数有偿任务都可以自动化。与其构建专用系统来实现自动化的目标,我主张开发通用的、可学习的系统,该系统可以学习和被教导,以执行人类可以执行的数千种工作中的任何一种。”换句话说,我们可以使用“就业测试”作为另一种智力考核标准,代替使用图灵测试或象棋和围棋之类的游戏来衡量智力。人工智能系统将接受以人类为中心的现实生活中的各种职业考试,并且可以通过人工智能系统可以执行的工作数量多少(从前台到地理学家再到婚姻顾问)来追踪进度。“随着人工智能程序通过的测试数量的增加,我认为人工智能会相应地向‘人类智能’进化。”尼尔森写道。在他看来,很清楚,“成功”的人工智能系统所要做的不只是掌握单个游戏的技艺。我们要做的工作比象棋、围棋或“Jeopardy!”需要更多的知识和技能!
管理咨询公司麦肯锡(McKinsey and Company)在2017年进行的一项研究调查了可以使用当前技术实现自动化的工作。这项研究审查了对有关职业至关重要的2000项活动。其分析表明,这2000项活动中有将近一半可以通过现有技术实现自动化。机器学习推动了这种能力的发展。
牛津大学哲学家尼克·博斯特伦(Nick Bostrom),人类未来研究所及其战略人工智能研究中心的负责人对人工智能领域最具影响力的人士进行了调查,询问他们相信何时计算机将达到人类的智能水平,或者能够被称为通用人工智能(AGI)。十分之一的参与者认为,到2022年时我们将达到这一水平,50%的参与者相信到2040年时将达到,90%的参与者相信到2075年时将达到。简而言之,距离尼尔森对通用人工智能愿景实现的时代可能并不遥远了。
软件系统能比人类更有效地处理数据不足为奇。它们在感知任务上达到人类水平所需的、较新的才能更令人吃惊,但依然不是科幻小说中的东西。我认为,我们能力中最独特之处就是做决定——在目标之间、人之间、行动之间进行选择。当今的技术正在进入这一领域,但无论是自动驾驶汽车还是疾病诊断,风险都很高。随着我们将更多此类活动交给智能算法,开发一些非常人性化的工具(一套权利、责任和法规)来管理甚至推动我们的技术创新就显得越来越重要。
卡罗尔:对基准汇率[9]你还有很多要做的
泰德:我是缆线[10]卖家,总共130[11]
泰德:希望再来几个同道,我们就能组团上了
卡罗尔:我们也是卖家,40
鲍勃:我能能我我所有其他东西
爱丽丝:球有零对我对我对我对我对我对我对我对我
我从聊天机器人开始此书,也以聊天机器人结束此书。Tay迎接我们进入讨论,爱丽丝目送我们离开。
上面的对话是现实生活中两段对话的混搭。前四条对话由汇率交易员输入,他们在私人聊天室中输入了这些文字,试图操纵英镑/美元基准汇率。作为调查的一部分,美国商品期货交易委员会(US Commodity Futures Trading Commission)取得了这些对话文本,该调查导致五家国际银行在2014年被罚款总计34亿美元。其中的术语和速记符号使这些句子对你我这样的人毫无意义,但监管机构能够对它们进行解码并识别其中的不当行为。
最后两句对话来自Facebook开发的两个机器人的谈判。这项研究的目的是探讨具有不同目标的人工智能系统是否可以协商、处理可能出现的任何冲突以及达成共同商定的决定。研究者向机器人展示了一系列物品,并指示它们协商,分配这些物品。每个机器人都想为自己取得更多物品,但如果无法与另一个机器人达成协议,则可能会一无所获。这些机器人经过编程,可以模拟对话在它们互相回应时的演变过程。如果它们能够比人类更好(或者也许不比人类更差)地谈判,那么将标志着人工智能新前沿的到来。
研究人员用人类成千上万次的协商博弈对机器人进行了训练。此外,和训练AlphaGo下围棋的方法类似,人工智能系统还使用试错法来探索练习博弈中的不同谈判策略。该方法同样有效。尽管人们常常会情绪激动并逃离谈判桌,但研究人员发现,聊天机器人会为了达成协议而更努力地谈判。机器人通常会装出对低价值物品感兴趣,但只是为了之后通过妥协让步以换取其他有价值的东西——这是人们经常使用的高级谈判策略。这种行为不是由开发人员进行编程的,是机器人自己学会的。
但是,这些机器人有时在交流过程中会说一些并不正儿八经的英语。其中最令人难忘的交流之一就是上面提到的爱丽丝与鲍勃的交流。即使这样的交流看起来很荒谬,但对话仍在严肃进行,没有任何混乱的迹象,并经常取得成功的结果。似乎聊天机器人已经开发出一种速记符号来提高交流效率。事后看来,这并不奇怪,因为专业人士(无论是商人、医生、律师还是海豹突击队)通常会生成代码和速记符号以便进行更有效的沟通。阅读这段文本的人可能不能理解这段对话,但人工智能程序可以理解。
为了解决这个问题,研究人员限制了聊天机器人的行为,以防止它们偏离标准英语。他们还让机器人与人类进行了谈判。有趣的是,大多数人没有发现自己正在与机器人沟通。这些聊天机器人不仅欺骗了人类,而且最好的人工智能程序的表现实际上可以与人类相匹敌。
但是获得媒体关注的并不是机器人的成功。相反,爱丽丝与鲍勃不寻常的交流引起了人们的注意,刨根问底可能会将你带入兔子洞,陷入深深的疑问与思考,最后无法自拔。语言的用途是什么?人工智能系统是否有权发明自己的语言?我们能管得了这些吗?但是,这也提出了一个问题,正是本书的核心问题:如果技术无法为我们设定界限,我们该把界限设在哪里呢?
在这个案例中,研究人员注意到了问题,进行了干预,并为人工智能程序的行为设定了界限。这代表着一个测试用例被成功管理,但其他测试用例依然会不可避免地接连发生,而且它们不一定发生在实验室环境中,不一定只对真实世界产生最小的影响。
我最近与纪录片制片人和《我们最后的发明》的作者詹姆斯·巴拉特进行了交谈。他一直在研究人工智能及其含义。在谈话的某个时刻,我们聊到了游戏主题。我问他,连围棋都被征服了,计算机科学家和他们的人工智能系统还可以搞什么游戏。他靠着椅背,考虑了一会儿,最后说了一些我至今无法忘怀的东西:“我不认为还剩下了什么游戏。下一场游戏就是现实。”
[1] 同一次研究还发现69%的瑞典受访者(请对比美国样本的93%)认为自己位于前50%。“优于常人效应”似乎在美国人身上体现得更显著。实际上,如果你在20世纪90年代中期到印度来,在高考前调研我和朋友们的话,你也许会看到“差于常人效应”,我们90%的人都认为自己低于平均线。我们的教育体系有一种独特的方法,让我们感到羞愧而不得不加倍努力。不过这个问题我最好去和治疗师聊,而不是和读者们聊。
[2] 3年后的1916年11月,斯佩里和一名已婚的纽约名媛在进行某种空中“探戈”时,碰掉了自动驾驶系统里的陀螺仪,飞机坠毁了。两人赤身**摇摇晃晃栽进了长岛的大南湾中,幸运地被猎鸭人捞了起来。斯佩里坚称是坠机的力量撕掉了他们身上的衣服,猎鸭人们也许笑破了肚皮。事后不久媒体就将斯佩里誉为“空震俱乐部(Mile High Club)”之父。〔马克·格奇克(Mark Gerchick),“空震俱乐部简史”, The Atlantic, January/February 2014, www.theatlantic.com/magazine/archive/2014/01/a-brief-history-of-themile-high-club/355733.〕
[3] 塔帕努利热出现在阿瑟·柯南·道尔爵士1913年所写的夏洛克·福尔摩斯短篇小说《垂死侦探历险记》中。故事中,卡尔弗顿·史密斯先生,苏门答腊岛的农场主,培育了一种细菌,使他的侄子感染上了一种神秘的疾病。夏洛克·福尔摩斯解开了这个谜。科学家把塔帕努利热的症状和东南亚已知的传染病进行了比较,相信柯南·道尔可能是受了类鼻疽的启发虚构出了塔帕努利热,这是1912年首次在缅甸发现的一种传染病。今天的人工智能系统也许在比较疾病症状和历史病例方面更为拿手。另外,就在伦敦贝克街福尔摩斯住所不远处,英国警方正在试验一种基于人工智能的侦察系统。每当新的案件发生,系统会检索数以百万计的警方档案,基于时间、地点和作案方式,从中识别出相关的其他案件。在人工智能时代,夏洛克·福尔摩斯的故事也许会完全不一样了。(Setu K. Vora, MD, “Sherlock Holmes and a Biological Weapon,” JR** 95, no. 2 [February 2002]: 101–3, www.ncbi.nlm.nih.gov/pmc/articles/PMC1279324; Timothy Revell, “AI Detective Analyses Police Data to Learn How to Crack Cases,” New Scientist, May 10, 2017, www.newscientist.com/article/mg23431254–000-ai-detective-analyses-police-data-to-learn-how-tocrack-cases.)
[4] 根据美国开国元勋之一的亚历山大·汉密尔顿本人经历改编的音乐剧,于2015年8月6日在百老汇首演,后斩获美国剧场最高奖项托尼奖多项大奖。
[5] 许多人认为,人工智能面临的挑战同样严峻。企业家和创新家伊隆·马斯克长期以来是人工智能灾难的主要预言者。在一次美国州长会议上,他称人工智能为“我们的文明所面临的最大风险”,并敦促政府在规范人工智能方面做得更好。但是这个话题充满争议。马克·扎克伯格(Mark Zuckerberg)称马斯克的立场“不负责任”,暗示马斯克是耸人听闻。这激发了马斯克发出推文“我已经和马克聊过这事了,他对这个问题的理解有限”。
[6] 由斯坦利·库布里克执导、根据科幻小说家亚瑟·克拉克小说改编的美国科幻电影,于1968年上映的《2001太空漫游》中的号称有完美记录从不犯错的人工智能电脑。
[7] 美国出名的电视问答游。我的世界是一款堆方块、不断冒险的游戏。
[8] 《我的世界》是由瑞典Mojang AB和4J Studios开发的一款高自由度沙盒游戏,每一个玩家可在三维空间中自由地创造和破坏不同种类的方块。
[9] 基准汇率原文为fix,是London WMR 4pm Fix的简称,由World Markets Company和汤森路透(Thomson Reuters)在伦敦时间下午4点整发布,是全球外汇市场中最重要的基准汇率之一。
[10] 缆线原文为cable,指英镑/美元货币对。1858年英美在两国之间的大西洋铺设了用于传输电报信息的缆线。至今这些缆线仍在传递两国间的货币交易信息,因此英镑/美元货币对也被称作“缆线。
[11] 此处数字单位默认为百万。