许多关于人工智能和机器学习的当代文章都存放在一个名为
“arXiv”的开放在线文档库中。arXiv中的文章使用简单的编号方案,类似于arXiv: 1412.6572。我们可以通过访问https://arxiv.org并输入编号(在本例中为“1412.6572”)来获取相关文章。
序言
1. http://tinyurl.com/y7zc94od
2. http://tinyurl.com/yxk3xurl
第一章 图灵的电子大脑
[1]. 霍奇斯,《艾伦·图灵传:如谜的解谜者》,贝内特图书/哈钦森出版社,1983年。
[2]. 除了惊人的科学成就,图灵在英国还有着深远的社会影响。经过长期公开高调的运动,英国政府在2014年对他进行了赦免。不久之后,所有根据同一法律被起诉的人都获得了赦免。
[3]. 这是检查质数最直观的方法,但绝不是最优雅或最有效的方法。自古以来,人们就知道埃拉托斯特尼筛法(由希腊数学家埃拉托斯特尼提出的一种简单检定质数的算法。)更为简单清晰。
[4]. 此后我将不再区分图灵机和通用图灵机,都用图灵机来表述。
[5]. 图灵将解决判定问题的荣耀与普林斯顿大学数学家阿隆佐·邱奇分享,后者先于图灵独立获得了一个截然不同的结果证明。然而,图灵的证明被认为是决定性的:它更直接、更完整、更易懂,而且影响巨大。他据此发明了图灵机,改变了世界。
[6]. 严格地说,算法就是一种方法,而程序是一种用实际编程语言(比如Python或者Java)编码的算法。因此,算法独立于编程语言。
[7]. 图灵机的编程实际上更为原始,我在这里列出的指令是典型的相对低级的编程语言,但仍然比图灵机程序所使用的抽象得多(也更容易理解)。
[8]. 科尔曼和李维斯特,《算法导论》(第一版),麻省理工学院和麦格劳-希尔出版社,1990年。
[9]. 图灵,《计算机器与智能》,《心智》, 40, 1950年,第433-460页。
[10]. 这段对话是由苹果麦金塔电脑附带的ELIZA版本生成的。如果你有苹果电脑,可以自己试试。打开Applications文件夹,再打开里面的Uti lties文件夹,然后双击终端应用程序图标来启动终端程序。在终端窗口会出现一大堆傻乎乎的东西,当它稳定下来以后,按Esc键(在键盘左上角),然后按X键,然后键入“doctor”,再按回车键。好啦,看看吧。但请记住:它不是真的!
[11]. http://tinyurl.com/y7nbo58p
[12]. 不幸的是,文献中的术语并不精确,也不统一。大多数人似乎用“通用人工智能”指代能够产生类似人类智能行为的机器,而不关心诸如它们是否具有自我意识之类的哲学问题。从这个意义上说,通用人工智能大致相当于希尔勒所指的弱人工智能。然而,混淆视听的是,有时候这个词又被用来表示更像希尔勒所指的强人工智能。在本书中,我用它来表示弱人工智能。
[13]. http://tinyurl.com/y76xdfd9
第二章 黄金年代
[14]. 其中最有影响力的技术来自约翰·麦卡锡的一种叫作分时的概念。他意识到,人们使用计算机的时候,大部分时间计算机都是空闲的,等待人们输入东西或者运行程序。他意识到这个“空闲时间”可以和其他用户共享,允许多人同时使用计算机。这个概念使昂贵的计算机得到更有效的利用。
[15]. 实际上它代表“Lisp处理器”。LISP进行符号运算,而符号列表正是实现这一点的关键。
[16]. 娜萨,《美丽心灵》,西蒙与舒斯特出版公司,1998年。
[17]. 麦卡锡等人,《关于达特茅斯夏季人工智能研究项目的建议》,1955年(转载于《人工智能》, 24(4), 2006年,第12-14页)。
[18]. 威诺格拉德,《理解自然语言》,学术出版社,1972年。
[19]. 在语言学中,用“他”“她”和“它”等词来指代先前在对话中出现的实体,称为复指。一个试图理解或建立自然语言对话的计算机程序必须能够解决复指指代的具体对象问题,这在当今仍然是一个挑战。SHRDLU(有限的)处理回指能力被认为是突破性的。
[20]. 菲克斯和尼森,《STRIPS:定理证明应用于问题求解的新途径》,《人工智能》, 2(3-4), 1971年,第189-208页。
[21]. 控制SHAKEY的电脑是一台PDP-10, 20世纪60年代末最先进的主机电脑,它重达1吨多,需要一个大房间才能容纳。一台PDP-10可以配备高达1兆字节的内存——我口袋里的智能手机内存容量比它高大概4000多倍,而且速度快得不可思议。
[22]. http://tinyurl.com/yxu8hwoq
[23]. http://tinyurl.com/n6lf8t6
[24]. 这并非精确的数字,只是一个近似值,让我们对涉及的数字比例有一些了解。
[25]. 从技术上讲,假设b为搜索问题的分支因子,d是搜索树的深度,如此,搜索树的底层(深度为d的那一层)将包含bd种状态,即b的d次幂,b×b×b×b×……×b(d次)。分支因子表现出的增长速度在技术上称为指数型增长,一些参考文献使用几何级数增长这一术语,尽管我认为我从来没有在人工智能领域相关文献见过这个术语。
[26]. 跳棋游戏,美国称之为“checkers”,英国称之为“draughts”,因为塞缪尔是美国人,所以作者表述跳棋的原文用了“checkers”。另外,在人工智能领域,这个程序通常被称为“塞缪尔的跳棋程序”(Samuel's checkers player),如果把它称为“Samuel's draughts player”会显得很怪异。
[27]. 哈特、尼尔森和拉斐尔,《最小成本路径启发式测定的正式基础》,《IEEE系统科学与控制论汇刊》, 4(2), 1968年,第100-107页。
[28]. 类似这样的计算问题都被命名了,本例叫作“独立集”。
[29]. 正文中旅行推销员问题是简化描述,更精准的描述如下:有一个城市列表C,对于C之中的每一对城市i和j,我们都有一个距离di, j,定义di, j等于i和j之间的距离。另外,存在一个“上限”B,这是旅行商在消耗完燃料之前可以行驶的总路程。现在我们要回答的问题是,是否有一个游览所有城市的方案(即用某种方式对C中的元素进行排序),使得按照这个方案从每一个城市到下一个城市,最终回到出发时的城市,总行程不超过B。
[30]. P代表多项式时间,在多项式时间内能够运行完成的算法,才是解决问题的可行算法。如果你想了解更多有关NP完全问题和P与NP问题的知识,可以参见延伸阅读中提到的参考文献。
第三章 知识就是力量
[31]. 温斯顿和霍恩,《LISP》(第三版),培生出版集团,1989年。
[32]. 肖特利夫,《基于计算机的医学诊断系统:MYCIN》,美国爱思唯尔出版集团,1976年。
[33]. 尚克和亚伯森,《脚本、计划、目标和理解:对人类知识结构的探究》,心理学出版社,1977年。
[34]. 伍兹,《链接中有什么?语义网络基础》,博罗和A·柯林斯编,《认知科学中的表征和理解研究》,摩根·考夫曼出版社,1975年。
[35]. 麦克德莫特,《塔斯基语义学,或称无意指不表达!》,《认知科学》, 2(3):第277-282页,1978年。这个标题有点像美国独立战争时期的口号“无代表不纳税”(麦克德莫特就是在1976年美国独立200周年庆祝活动前后写了这篇文章)。
[36]. 麦卡锡,《逻辑人工智能的概念》,未发表。
[37]. 克罗克森和梅利什,《PROLOG编程》,施普林格出版社,1981年。
[38]. PROLOG中使用的演绎形式被称为解析,最初是在20世纪60年代出现的,它可以有效实现PROLOG中使用的规则。
[39]. 沃伦,《生成有条件的计划和编程》,《第二届夏季人工智能行为与模拟会议论文集》(AISB-76),爱丁堡,1976年7月。
[40]. 古哈和莱纳特,《Cyc:中期报告》,《人工智能杂志》,11(3), 1990年。
[41]. 普拉特,《CYC报告》,未发表,1994年,访问地址:http://tinyurl.com/y4q4aoqj
[42]. 赖特,《默认推理逻辑》,《人工智能》, 13, 1980年,第81-132页。
[43]. 这个例子被称为尼克松菱形,用图形表示的话,图形呈菱形。
第四章 机器人与其合理性
[44]. 布鲁克斯,《无表征智能》,《人工智能》, 47, 1991年,第139-159页。
[45]. 有趣的是,人类智力的这些更高级的方面是由大脑内叫作新皮质的部分来处理的。而人类进化的记录告诉我们,大脑新皮质部分的进化相对时间靠后。对于人类来说,推理和解决问题是比较新兴的能力:在进化史的大部分时间里,我们的祖先都不具备这些能力。
[46]. 罗素和苏布拉曼尼亚,《可证明的有边界最优智能体》,《人工智能研究杂志》, 2, 1995年。
[65]. https://www. irobot.co.uk
[47]. 布鲁克斯,《一个走路的机器人:进化网络的应急行为》,《机器人与自动化会议论文集》, 1989年,亚利桑那州斯科茨戴尔,1989年5月。
[48]. 弗格森,《旅行机:有态度的自主智能体》,《IEEE计算机》,25(5),第51-55页,1992年。“旅行机”这个名字显然是在隐喻
“图灵机”〔英文中“Turing Machines”(图灵机)和“Touring Machines”(旅行机)读音一样〕。25年来,旅行机的开发者因内斯·弗格森一直是我的好朋友,但我不确定是否要原谅他。如果他知道30年后的人们还在写这种笑话,或许他就不会觉得这么好笑了。
[49]. 维尔和比克莫尔,《基础智能体》,《计算智能》, 6, 1990年,第41-60页。
[50]. 出于历史准确性的考虑,我应该指出,图形用户界面和桌面界面的雏形并不是由苹果公司发明的。这应该归功于施乐公司帕洛阿尔托研究中心(PARC)的研究人员。然而,苹果公司认识到其潜力,并将其制成了产品。
[51]. http://tinyurl.com/y9qxdko5
[52]. 梅斯,《智能体能够帮助人们减少工作量和信息过载》,《ACM通讯》, 37(7), 1994年,第30-40页。
[53]. 埃齐奥尼和威尔德,《基于软件机器人的互联网交互》,《ACM通讯》, 37(7), 1994年,第72-76页。
[54]. 冯·诺依曼和摩根斯坦,《博弈论与经济行为》,普林斯顿大学出版社,1944年。
[55]. 为简单起见,我把钱和效用等价。在实践中,货币和效用也是经常相关的,但它们并不是同一概念,如果你认为经济效用只是与钱有关,那么你会惹恼诸多经济学家。实际上,效用理论只是用数值的方式捕捉和计算偏好。
[56]. 罗素和诺维格,《人工智能:现代方法》(第三版),培生出版集团,2016年,第611页。
[57]. 墨菲,《人工智能机器人简介》,麻省理工学院出版社,2001年。
[58]. 珀尔,《智能系统中的概率推理:合理推理网络》,摩根·考夫曼出版社,1988年。
[59]. 伍尔德里奇,《多智能体系统引论》(第二版),威利出版公司,2009年。
[60]. 鲁宾斯坦和奥斯本,《博弈论课程》,麻省理工学院出版社,1994年。
[61]. 塞尔曼、莱维斯克和米契尔,《一种解决难满足性问题的新方法》,第十届国际人工智能会议论文集(AAAI_1992),美国加利福尼亚州圣何塞,1992年。
第五章 深度突破
[62]. 深度思维的收购价各个媒体的报道不尽相同,《卫报》报道的数字为4亿英镑。http://tinyurl.com/kvyueye
[63]. 明斯基和帕普特,《感知器:计算几何导论》,麻省理工学院出版社,1969年。
[64]. http://tinyurl.com/ycu4ngsg
[81]. 鲁梅尔哈特和麦克莱兰(编),《并行分布式处理》(2卷),麻省理工学院出版社,1986年。
[66]. 鲁梅尔哈特、辛顿和威廉姆斯,《利用反向传播错误学习表征》,《自然》, 323, 1986年,第533-536页。
[67]. 古德费洛,本吉奥和库维尔,《深度学习》,麻省理工学院出版社,2016年。
[68]. 从历史增长率来看,我们可以预期在40年左右的时间里,神经网络能达到与人脑相同数量的人工神经元。不过,这并不意味着人工神经网络将在40年内实现人类水平的智能,因为大脑不仅仅是一个神经网络,它还有结构。
[69]. http://www.image-net.org
[70]. https://wordnet.princeton.edu
[71]. 克里泽夫斯基、苏茨科弗和辛顿,《基于深度卷积神经网络进行网络图像分类》,神经信息系统大会,2012年,第1106-1114页。
[72]. 古德费洛等人,《解释和利用对抗性案例》, arXiv: 1412.6572。
[73]. 姆尼赫等人,《使用强化深度学习来玩雅达利游戏》, arXiv: 1312.5602v1。
[74]. 姆尼赫等人,《通过强化深度学习实现人类水平控制》,《自然》, 518, 2015年,第529-533页。
[75]. 西尔弗等人,《使用深度神经网络和搜索树掌握围棋游戏》,《自然》, 529, 2016年,第484-489页。
[76]. http://tinyurl.com/ydafuhj p
[77]. 西尔弗等人,《脱离人类知识干预掌握围棋游戏》,《自然》,50, 2017年,第354-359页。
[78]. https://www.captionbot.ai
[79]. https://translate.google.com
[80]. 这一段是由苏格兰作家兼翻译家斯科特·蒙克利夫翻译的,他的翻译是文学史上最著名的译本,被认为是不逊于原著的杰作。尽管也有人批评他滥用了普鲁斯特的语言。
第六章 人工智能的今天
[82]. https://tinyurl.com/y2k5aeq4
[83]. https://tinyurl.com/y8bu8xx8
[84]. https://tinyurl.com/y5y75rgs
[85]. https://blog.cardiogr.am/tagged/research
[86]. 这个数字可能会受到生产过程中死亡以及夭折的人口比例影响,一位成年人有机会活到我们现在所认为合理的年龄。
[87]. http://tinyurl.com/yc5gv8jg
[88]. 德法乌等人,《深度学习在视网膜疾病诊断及转诊方面的临床应用》,《自然医学》, 24, 2018年,第1342-1350页。
[89]. http://tinyurl.com/yakkuyg2
[90]. 赫尔曼、布伦纳和斯塔德勒,《自动驾驶》,爱莫瑞德出版社,2018年。
[91]. https://corporate.ford.com/innovation/autonomous-2021.html
[92]. https://www.riotinto.com/media/media-releases-237_23991.aspx
第七章 杞人忧天——我们想象中的人工智能会出什么错
[93]. http://ti nyurl.com/ybsrkr4a
[94]. 库兹韦尔,《奇点临近》,企鹅出版集团,2005年。
[95]. 温格,《即将到来的技术奇点:如何在后人类世代生存》,美国宇航局刘易斯研究中心,《21世纪展望:网络空间世代的跨学科科学与工程》,第11-22页。
[96]. 沃尔什,《奇点可能永远不会临近》, arXiv:1602.06462v1。
[97]. https://tinyurl.com/y622vm6k
[98]. 威尔德和埃齐奥尼,《机器人学第一定律:召唤武器》,《国际人工智能会议论文集》, 1994年,第1042-1047页。
[99]. 富特,《堕胎问题和双重效应理论》,《牛津评论》,第5期,1967年。
[100]. http://tinyurl.com/ybl8l uoe
[101]. 阿瓦德等人,《道德实验机器》,《自然》, 563, 2018年,第59-64页。
[102]. http://tinyurl.com/ydf26689
[103]. http://ti nyurl.com/jslm95f
[104]. 为了透明起见,我应该说明,两次促成阿西洛玛人工智能准则的会议都曾邀请我参加,我本来很想去。可惜很不凑巧,两次都因为承诺了别的事情而不得不食言。
[105]. http://tinyurl.com/y28osmtw
[106]. http://tinyurl.com/y29v4rrd
[107]. http://tinyurl.com/yc3vgkgv
[108]. http://tinyurl.com/y2egvzxx
[109]. 迪格努姆,《负责任的人工智能》,施普林格出版社,2019年。
[110]. 博斯特罗姆,《超级智能》,牛津大学出版社,2014年。
[111]. 汉森,《什么是平等偏好》,《哲学逻辑杂志》, 25(3),1996年,第307-332页。
[112]. 吴恩达和罗素,《逆向强化学习算法》,《第十七届机器学习国际会议论文集》, 2000年。
第八章 现实中的人工智能会导致什么问题
[113]. 贝内迪克特·弗雷和奥斯本,《就业的未来:电脑化将如何影响工作》,《技术预测与社会变革》, 114, 2017年1月。
[114]. https://rodneybrooks.com/blog/
[115]. https://tinyurl.com/yytefewg
[116]. http://tinyurl.com/ydb9bpz4
[117]. http://tinyurl.com/ycq6jk35
[118]. http://tinyurl.com/y74yfk8a
[119]. 奥斯瓦尔德等人,《算法风险评估-治安模型:从杜伦HART模型与“实验性”相称中所学到的经验》,《信息与通信技术法》, 27:2,2018年,第223-250页。
[120]. http://tinyurl.com/y6narok3
[121]. https://www.predpol.com
[122]. http://tinyurl.com/y242nn5u
[123]. http://tinyurl.com/ycef9mqv
[124]. http://tinyurl.com/y4elgklp
[125]. 我认为这种场景是由著名人工智能专家斯图尔特·罗素提出的。
[126]. http://tinyurl.com/yy7szdxm
[127]. 阿尔金,《控制致命行为:将伦理嵌入混合审议/反应机器人架构中》,技术报告GIT- GVU- 07-11,佐治亚理工学院计算机学院。
[128]. https://www.stopki l lerrobots.org/
[129]. 上议院人工智能特别委员会,2017—2019届报告,《人工智能在英国:准备好了吗?愿意接受吗?可行吗?》, HL Paper 100,2018年4月。
[160]. http://tinyurl.com/l btnkse
[130]. https://tinyurl.com/y9juww8v
[131]. https://tinyurl.com/y7dzz46v
[132].《自然》, 563, 2018年11月27日,第610-611页。
[133]. 卡罗琳·克里亚多·佩雷斯,《看不见的女人:在为男性设计的数据里暴露偏见》,查托温德斯出版社,2019年。
[134]. http://tinyurl.com/y9cd9x7f
[135]. http://tinyurl.com/y25dhf9k
[136]. 脸书允许你查看他们为你建立的偏好图。http://tinyurl.com/j4ys4hq
[137]. http://tinyurl.com/y7mcrysq
[138]. https://tinyurl.com/yyc6botm
[139]. http://tinyurl.com/yaypy567
[140]. http://tinyurl.com/yd36fdva
[141]. http://tinyurl.com/y6uoewyg
[142]. http://tinyurl.com/y8vgslkb
[143]. http://tinyurl.com/y6wx5tz7
第九章 通往有意识的机器之路
[144]. http://ti nyurl.com/yxwlrrkq
[145]. 内格尔,《成为蝙蝠是什么样的感受》,《哲学评论》, 83:4,1974年,第435-450页。
[146]. 卡尼曼,《思考:快与慢》,企鹅出版集团,2012年。
[147].“谁能理解车夫,并能控制自己的思想,他就会到达旅程的终点,那是无所不在的至高无上的居所。”(《卡达奥义书》, 1.3)
[148]. 苏恩等人,《人脑自由决策的无意识因素》,《自然:神经科学》, 11, 2008年,第543-545页。
[149]. 更确切地说,邓巴感兴趣的是大脑皮层的大小。新皮层是大脑处理感知、推理和语言的部分。
[150]. 丹尼特,《意向立场》,麻省理工学院出版社,1987年。
[151]. 丹尼特,《认知行为学中的意向系统》,《行为与脑科学》,6, 1983年,第342-390页。
[152]. 肖汉,《面向智能体编程》,《人工智能》, 60(1), 1993年,第51-92页。
[153]. 麦卡锡,《机器具有心理因素》, V·利夫希茨(编辑),《形式化常识:约翰·麦卡锡论文集》,阿尔布利克斯出版社,1990年。
[154]. http://ti nyurl.com/yc2knerv
[155]. 这里的关键词是“有意义”。每当有人提出类似测试时,总有人会试图找到某种方法来在测试中玩点诡计,这样他们就可以宣称自己成功了,即使是以一种你没有预料到的方式做到的。当然,这正是图灵测试所发生的事情。我所追求的是能够以实质性的方式实现这一点的程序,而不是利用烟幕弹和镜像回答的组合来通过测试的程序。
[156]. 西蒙·拜伦-科恩,A. M. 莱斯利和U. 弗里斯,《自闭症孩子拥有心智理论吗》,《认知》, 21(1), 1985年,第37-46页。
[157]. 西蒙·拜伦-科恩,《心智盲症:一篇关于自闭症和心智理论的文章》,麻省理工学院出版社,1995年。
[158]. 拉比诺维茨等人,《心智机器理论》, arXiv: 1802.07740。
[159]. 我不是进化心理学方面的专家:本节我的指南是罗宾·邓巴的《人类进化》(企鹅出版集团,2014年),我很高兴向感兴趣的读者介绍更多细节。