深度学习为人工智能的应用打开了大门,在21世纪的第二个10年里,自从20世纪90年代万维网出现以来,还没有另一门新技术如人工智能这样吸引人们的注意力。每个拥有数据和需要解决问题的人都忍不住要问,深度学习是否能够帮助他们——在很多情况下,答案是肯定的。人工智能已经出现在我们生活的方方面面,我们随时都能感受到它的存在。但凡涉及技术的领域,都有人工智能的身影:教育、科学、工业、商业、农业、医疗保健、娱乐、媒体和艺术等各个领域。未来,或许有些领域会有非常明显的人工智能痕迹,有些领域则不会。人工智能将悄然无声地嵌入我们的世界,就像今天的计算机一样。正如计算机和万维网,人工智能也将改变我们的世界。我无法为你列举出人工智能的全部应用,就像我无法列举所有的电脑软件一样。但我会跟你分享一些我喜欢的过去几年中出现的案例。
你可能还记得,2019年4月,世界上第一张黑洞的照片问世[82]。在一次令人难以置信的实验中,天文学家利用分布在世界各地的八台射电望远镜收集的数据,构建出一个直径400亿英里[1]、距离地球5500万光年的黑洞图像。这幅图像是本世纪最引人注目的科学成就之一。但你可能不知道的是,黑洞图像是通过人工智能实现的:人们使用先进的计算机视觉算法来重建图像,“预测”图片中缺失的元素。
2018年,来自计算机视觉处理器公司英伟达的研究人员证明了人工智能软件能够创造出虚假的人物照片,并且能够完全令人相信它是真实的[83]。这些图片由被称为生成性对抗网络的全新神经网络制造。照片看起来简直是不可思议:乍一看,它们十分逼真,很难相信那不是真人。我们的眼睛告诉我们,这就是真实的照片——但事实上它们是由神经网络创造的。这种技术在21世纪刚开始的时候难以想象,而在未来它会成为虚拟现实(Virtual reality, VR)的关键组成部分:人工智能正在构建令人分辨不清的虚拟现实。
2018年末,深度思维的研究人员在墨西哥的一次会议上公开发布了AlphaFold,这是一个能根据基因序列来预测蛋白质3D结构的程序,能够解决名为“蛋白质折叠”的问题[2] [84]。蛋白质折叠问题包括预测蛋白质分子的形状,了解它们将对治疗类似阿尔茨海默病等疾病有极其重要的意义。不幸的是,这个问题非常艰难。而AlphaFold使用经典的机器学习技术来学习如何预测蛋白质结构,这意味着在理解蛋白质性状方面迈出了一大步。
在这一部分,我想详细讲述人工智能应用最突出的两个方面:第一个是人工智能在医疗领域的应用,第二个是长久以来无数人的梦想——无人驾驶汽车。
人工智能医疗
人们应该停止培养放射科医生了。很明显,在五年之内,深度学习的系统会比放射科医生做得更好。
——杰夫·辛顿(2016)
Cardiogram可以担任您的个人健康助理。我们会把可穿戴设备变成一个持续的健康监测仪,不仅可以用来追踪睡眠和健康状况,而且或许在未来的某一天,可以预防中风、挽救您的生命。
——Cardiogram公司网页[85]
哪怕是对政治和经济最不敏感的人都能意识到,不管是对政府还是对企业而言,医疗卫生都是全球最重要的经济问题之一。一方面,在过去的两个世纪里,医疗卫生的改善可能是工业化和科技世界带给人们的最大福祉。1800年,欧洲人的寿命预测不会超过50岁[86],而今天,预测一个人能活到70岁是非常合理的;在发达国家,产妇因分娩而死亡的情况十分少见。这些巨变一定程度上是因为人们对卫生有了更好的认识,但不可否认,药物研究和疾病治疗研究的飞速发展也起到了同样重要的作用。尤其是20世纪40年代抗生素的出现,首次为细菌感染提供了可靠、有效的治疗方法。当然,这些进步目前还没有覆盖全球所有地区。在我撰写本文的时候,中非共和国的国民预期寿命仍然只有51岁,世界上还有许多地方,分娩对母亲和孩子而言都不啻闯一次鬼门关。但是,总的来说,发展趋势是积极的,这当然值得庆贺。
但这些可喜的进展又带来了新的问题。首先,人类的平均寿命增长了,老年人通常比年轻人需要更多的医疗卫生资源,这就意味着医疗卫生的成本在整体上升。第二,随着我们开发更多的治疗疾病的新方法和研制更多新的药品,可以治疗疾病的总体范围增加了,这也导致了更多的医疗支出。当然,医疗费用昂贵的一个根本原因是,提供医疗保障服务所需要的资源昂贵,具备相应技能和资质的人也很少:在英国,要成为一名合格的全科医生,至少要培训10年。
由于这些问题,医疗卫生——尤其是相关的资金——向来都是政客们争论不休的长期问题。在英国,国家医疗服务(NHS)于20世纪40年代作为一项国家服务建立,通过税收支付,目的是为每个人提供免费的医疗保障。而关于如何资助国家医疗服务的争论从来就没停止过。我们都喜欢国家医疗服务,但都无休止地争论应该给它多大程度的资助。
医疗保障至关重要,但实现起来也困难重重。那么,如果有一项技术能够解决问题,那简直就太美妙了,不是吗?
人工智能应用在医学领域也不是新鲜事了,我们在之前就了解过MYCIN专家系统,它在诊断人类血液疾病病因方面表现得比人类医生更专业,因此广受赞誉。早在20世纪80年代初,医疗卫生资金就跟现在一样成为令人头疼的难题。出于之前讲述的原因,制造出能够捕捉医疗专业能力的专家系统程序,这个想法让人兴奋不已。所以在MYCIN以后,类似的医疗卫生系统如雨后春笋般涌现出来,也没什么好奇怪的。不过公平地说,几乎没有多少系统在离开实验室以后还能起作用。不过这些年,人们对人工智能用于医疗的兴趣开始报复性反弹,有新的进展表明,人工智能在医疗应用方面前途无量。
个人医疗健康管理系统是人工智能在医疗健康领域的重要新机遇。可穿戴设备——以Apple Watch为代表的智能手表,还有以Fitbit为代表的运动健身智能手环之类的出现,使个人医疗健康管理成为可能。这些设备持续监测我们的生理数据,比如心率和体温等。大量的用户不断生成当前健康状况的数据流,人工智能系统可以对这些数据进行分析,不管是本地的系统(比如你的智能手机)还是将数据上传至互联网上的人工智能系统。
千万不要低估这项技术的潜力,这是有史以来第一次,我们能够对自己的健康状况进行持续监测。在最基本的层面上,基于人工智能的医疗健康管理系统能够为我们的健康管理提供合理的建议。从某种意义上来说,这正是智能手环、智能手表正在做的事情:它们监测我们的运动,还可以为我们设定目标(“每天万步行走挑战赛”就是一个明显的成功案例)。经验证明,我们可以通过将运动目标进行游戏化的方式来提高人们对目标的遵从性。将目标转化为竞赛或者游戏,还可以借助社交媒体来进行交互。
大众市场的可穿戴设备还处于初级阶段,但有许多迹象表明未来的发展潜力。2018年9月,苹果推出了第四代Apple Watch,首次包含了心脏监护仪。手表上的心电图应用程序可以监控心率跟踪器提供的数据,并且能够识别心脏病的症状。如果有必要,甚至可以为使用者呼叫救护车。应用程序可以监测心房颤动难以捉摸的迹象——不规则的心跳,这可能是中风或其他突发性疾病的征兆。智能手机中的加速计应用可以用来识别坠落,如果需要,可以代为呼叫救援。这样的系统只需要相当简单的人工智能技术:现在我们可以随身携带一台功能强大的智能手机,它可以保持互联网连接,并且可以连接到配备了一系列生理传感器的可穿戴设备上。
某些个人健康管理应用甚至不需要传感器,只需要一台智能手机。我在牛津大学的同事们相信,仅仅从使用智能手机的方式就可以检测出阿尔茨海默病的发病征兆。人们使用手机方式的改变,或者手机记录的行为模式发生改变,或许都是某些疾病的前兆。这些征兆大多发生在人们注意到病人有明显症状、医生正式下达诊断之前。阿尔茨海默病是一种毁灭性的疾病,对人口老龄化的社会构成了巨大挑战,可以辅助早期诊断或者管理阿尔茨海默病的工具将非常受欢迎。当然,这项工作还处于起步阶段,但它至少提供了未来的一种可能性。
这些新技术的出现令人兴奋,它们带来了机遇,同时也带来了潜在的隐患,其中最明显的就是隐私问题。可穿戴设备跟人进行亲密接触,它不断监视我们,虽然它获取的数据能够给我们提供帮助,但也为数据滥用埋下了隐患。
保险业是一个值得关注的领域。2016年,健康保险公司Vitality开始随保险单附送苹果手表。手表监视你的运动情况,然后根据你的运动状况设定保险费用承诺。如果,某个月,你决定不做任何运动,就躺在沙发上当个懒虫,你可能需要支付全额保费,但你也可以在下个月通过疯狂节食来抵扣,以降低保费。这样的计划或许没什么直接的问题,但它确实暗示了一些令人不安的情况。例如,2018年9月,美国约翰汉考克人寿保险公司宣布,今后只向准备佩戴追踪运动数据的可穿戴设备的个人提供保险单[87]。这一声明引来了大众的批评。
进一步说,如果我们想获得国家医疗保障计划(或者其他国家福利),就必须接受监督并且达到锻炼目标,这又将如何?你想要医疗保险?那每天走一万步再说!有些人会觉得这没什么问题,但对另一些人来说,这是对我们基本人权的严重侵犯和对监测数据的滥用。
自动化诊断是人工智能在医疗保健领域的又一个令人兴奋的潜在应用。在过去的10年里,诸如X射线机和超声波扫描仪之类的医疗成像设备,其成像数据用机器学习的方式来进行分析,受到了极大关注。在撰写本书的时候,有一篇新的研究成果发表,文章表示人工智能系统可以有效识别医学图像中的异常。这是机器学习的一个经典应用:我们通过正常的图像和异常的图像示例来训练机器学习程序,最终的目的是让程序能够识别出图像中的异常。
在这项领域中有一个广为人知的案例。2018年,深度思维公司宣布正在与伦敦的摩菲眼科医院合作,开发从眼部扫描检查中自动识别疾病和异常的技术[88]。眼部扫描检查是摩菲眼科医院的主要检查之一,他们通常每天要做1000次眼部扫描检查,分析扫描检查结果是医院工作中的一个重要部分。
深度思维的系统使用了两个神经网络,第一个用于“分割”扫描图像(识别图像的各个部分),第二个用于诊断。第一个网络大约训练了900个图像,学习人类专家如何对扫描图像进行区分识别。第二个网络训练了大约15 000个案例。实验表明,该系统的性能已经达到甚至超过了专家水平。
这些结果都很好,你也可以随手在网上搜出一大堆其他的引人注目的例子,说明当前的人工智能技术是如何被用来建立具有类似能力的系统的——在X光片上识别恶性肿瘤、通过超声扫描诊断心脏病等等。杰夫·辛顿,你可能还记得他是非常成功的图像识别程序AlexNet的创立者之一,他非常确信机器学习将为医学影像诊断提供解决方案,因此他对放射科医生做了一个相当大胆的声明——就在这一小节开始的时候,我引用过。不出所料,这激怒了放射科的医生,很快就有人指出,当好一个放射科医生所需要的技能可不仅仅是看X光片[89]。
也有不少人认为,我们需要谨慎地推动人工智能在医疗领域的应用。首先,医疗卫生行业是一个人文学科,可能比起任何职业都更需要与人互动和与人交往的能力。全科医生需要“解读”病人,了解病人的社会背景,了解哪些治疗方案对这个病人可能更有效,而哪些方案是无效的,等等。所有证据表明,我们目前建立的人工智能系统,在分析医疗数据方面确实已经达到人类专家的水准,但这只是人类医疗工作者工作的一小部分(尽管是非常重要的一部分)。
另一个反对在医疗卫生行业广泛应用人工智能的论点认为,有些人更倾向于依赖人的判断,而不是机器的判断。他们愿意和人打交道,这里有两个问题需要说明。
首先,把人类专家的判断奉若圭臬,实在是太过天真的想法。每个人都会有缺陷,即使是最勤奋、最有经验的医生,也会有感到疲惫或情绪化的时候。而且,不管我们怎么努力去克服,都难免或多或少带有偏见以及经验主义。另外,我们人类并不太擅长做理性决策,而机器可以做出与人类专家同等水准的判断,医疗卫生行业的挑战或者说机遇,应该是将机器的这种能力用最佳的方式利用起来。我的信念是,人工智能的作用并不是取代人类的医疗卫生专业人员,而是用来增强他们的能力,让他们从某些烦琐的工作中解脱出来,更专注于专业领域中真正困难的部分;以及,提供另一种角度的观点以供参考,让他们的思考更加全面。
其次,在我看来,选择人类医生还是人工智能医疗程序那是发达国家的人才会抱怨的问题,对世界上许多地方的人来说,要么接受人工智能,要么就无人处理。在专业医生极度缺乏的地区,人工智能可以做很多事情。它让获取医疗卫生资源困难地区的人们有了更多的希望,这才是真正最令人激动的前景。在人工智能给予我们的所有机遇中,这可能是会产生最大社会影响的一个。
无人驾驶汽车
制造比空气还重的飞行机器是不可能成功的。
——开尔文(Kelvin)勋爵,皇家学会会长,1895年
在撰写本文的时候,全球每年有超过100万人死于和汽车有关的交通事故,仅中国和印度就占了其中的四分之一;每年还有5000万人在跟汽车有关的交通事故中受伤。这些数字触目惊心,想象一下,如果出现一种每年可以夺取100万人性命的新型流感病毒,那一定会引起全球性恐慌。然而,我们却习惯了公路上的危险——我们似乎已经接受这就是现代社会的现状。不过,人工智能能够带来大幅降低交通事故的前景:在发展智能中期内出现无人驾驶汽车,已经成为可能。最终,它能够拯救无数人的生命。
当然,无人驾驶汽车还有许多其他好处。利用计算机程序来控制汽车驾驶,显然更高效,能够更好地利用稀缺和昂贵的燃料或动力资源,从而产生更环保、运行成本更低的汽车。计算机程序在利用电子地图和导航方面也更具备优势,例如,可以为拥挤的交通道路带来更好的通行能力。如果汽车变得安全,它们就不再需要如此昂贵和沉重的保护底盘,这将再次降低汽车的价格和油耗。甚至有一种观点认为,无人驾驶汽车会减少私家车的拥有量,因为无人驾驶的出租车又便宜又方便,那么,拥有自己的私家车在经济上就没多大意义了。
由于上述以及更多原因,无人驾驶汽车显然是一个非常有前景的研发领域,因此,这一领域有着悠久的研发历史,也不足为奇。汽车在20世纪20至30年代成为大众市场的产品,由它引发的伤亡规模——主要是驾驶员人为操作失误——立刻引发了人们对汽车自动驾驶可能性的讨论。虽然自20世纪40年代以来,人们在自动驾驶领域就不断地尝试,但直到70年代微处理器技术出现以后,它们才真正变得可行。不过,无人驾驶汽车面临的挑战也是艰巨的,最根本的问题就是感知。如果你能够找到一种方法,让一辆汽车能够随时准确地知道它自己在哪里,周围环境是怎么样,那么恭喜你,你已经找到解决无人驾驶问题的方法了。而要解决感知问题,我们需要采用现代机器学习技术:没有它们,无人驾驶汽车无法实现。
由欧洲泛政府研究组织欧洲研究协调局(EUREKA)出资赞助的普罗米修斯工程,是无人驾驶汽车技术的先驱。普罗米修斯工程从1987年延续到1995年,并在1995年进行了一次示范表演。一辆汽车在无人驾驶的情况下从德国慕尼黑开到丹麦的欧登塞,然后返回。虽然平均5.5英里就需要进行一次人工干预,但是在没有人工干预的情况下,最长的一次无人驾驶距离约为100英里。这是一个了不起的壮举,鉴于当时的计算机有限的计算力,这个成就更加令人惊叹。虽然普罗米修斯工程只是为了证实无人驾驶的概念是可以成为现实的,它仍然引导了不少现代商用汽车创新的风向,比如智能巡航控制系统。最重要的是,普罗米修斯工程昭示了这项技术可以商业化。
2004年,美国国防高级研究计划局(DARPA)组织了一场无人驾驶汽车顶级挑战赛,邀请研究人员组队参加挑战赛,让无人驾驶的车辆穿越150英里的美国乡村。共有106支来自大学研究院和汽车公司的参赛队,每个参赛队都渴望能赢取第一名的100万美金DARPA大奖。最后,有15支参赛队伍进入决赛,但在这一届比赛中,没有一支队伍完成超过8英里的赛程,有的车辆甚至都没能驶离出发区。跑得最远的是来自卡内基-梅隆大学的无人驾驶汽车,虽然它仅仅前行了7.5英里就偏离了航道,卡在堤坝上。
我对这件事情的记忆是这样的:大多数人工智能研究人员都把2004年的挑战赛作为证据,证明无人驾驶汽车技术离实际应用还有一段距离。听说计划局立即宣布在2005年的竞赛中奖金翻一番,达到200万美元,让我有点吃惊。
2005年的比赛吸引了更多的参赛者,总共有195支队伍参赛,最终闯入决赛的有23支。决赛在2005年10月8日举行,挑战目标是让无人驾驶车辆穿越132英里的内华达沙漠。这次,有5支参赛队伍完成了挑战。最终的冠军被斯坦福大学研究团队摘得,获得了200万美元的奖金。斯坦福大学获胜的汽车名叫STANLEY,由塞巴斯蒂安·特隆(Sebastian Thrun)带领的团队打造。它是由一辆大众途锐汽车改造的,用了不到7个小时就完成了比赛,平均时速20英里。STANLEY配备了7台车载电脑,它们需要解读GPS、激光测距仪、雷达和视频传输中的数据。
2005年的无人驾驶汽车挑战赛是人类历史上最伟大的科技成就之一。从那一天开始,无人驾驶汽车成了已经解决的问题,就像一个多世纪以前,比空气更重的飞机成为已经解决的问题那样。莱特兄弟的第一次飞行只持续了12秒,在这段时间里,飞行器离地面只有120英尺。但那12秒的飞行历程证明了,比空气更重的飞机已经成为现实——2005年的挑战赛以后,无人驾驶汽车也如此。
紧随其后的是一系列挑战赛,其中最重要的可能是2007年的无人驾驶汽车城市挑战赛。2005年的比赛是在乡村道路上进行的,而2007年则是在城市环境中。无人驾驶汽车必须完成整个赛程,同时遵守加利福尼亚州道路交通法规,并应对停车、十字路口通行和交通拥堵等日常情况。有36支队伍参加了全国预选赛,其中11支队伍闯入决赛。2007年11月3日,在南加州一个废弃机场,决赛开始了。6支队伍成功完成了挑战,获胜者来自卡内基-梅隆大学,在4小时内跑完全程,平均车速每小时14英里。
从那以后,无人驾驶汽车技术领域获得了大量投资,既有老牌汽车公司不顾一切地拒绝被时代车轮甩掉,也有新公司发现有机会来抢夺传统汽车制造商的蛋糕。
2014年,美国自动化工程师协会提供了一个实用的分级方案,为自动驾驶分级制定了标准[90]:
Level 0:人工驾驶。汽车没有自动控制功能,驾驶员始终自主控制车辆(尽管车辆会提供警告和其他数据用来辅助驾驶员驾驶)。如今公路上的绝大部分汽车都是L0级。
Level 1:辅助驾驶。汽车提供了一定程度的控制,通常是在常规驾驶方面,但驾驶员仍须在驾驶过程中保持全神贯注。自适应巡航控制系统是辅助驾驶的一个例子,它可以使用刹车和油门来控制车速。
Level 2:部分自动化。在这个等级,汽车可以参与转向和速度的自主控制,但驾驶员同样需要持续监控驾驶环境,并准备好在必要的时候进行干预。
Level 3:有条件自动驾驶。在这个等级,驾驶员已经不再需要持续监控驾驶环境,尽管汽车可能会要求用户在遇到无法应对的情况下进行控制。
Level 4:高度自动化驾驶。在这个等级,汽车能够自动完成正常驾驶操作,不过驾驶员仍然可以干预驾驶行为。
Level 5:全自动驾驶。你只需要坐上一辆车,说出你的目的地,然后剩下的所有事情都交给汽车自动处理。这种汽车甚至连方向盘都没有。
在撰写本书时,最先进的商用无人驾驶汽车系统可能是特斯拉的自动驾驶系统,最初出现在特斯拉S型车上。2012年发布的特斯拉S型是高规格电动车系列中的旗舰车型,在发布之时,它或许是全世界技术最先进的市售电动车。从2014年9月起,所有特斯拉S型车都配备了摄像头、雷达和声程传感器。2015年10月,特斯拉发布了新款车用软件,启用了这些高科技套件,完成“自动驾驶”功能——当然,是一种有限的自动驾驶能力。
媒体立刻开始盛赞自动驾驶仪实现了第一款无人驾驶汽车,尽管特斯拉不厌其烦地指出了这项技术的局限性。特斯拉特别强调,当自动驾驶仪接通时,驾驶员应始终把手放在方向盘上。就上述自动驾驶分级而言,特斯拉的自动驾驶仪似乎处于L2级。
无论这项技术有多先进,很明显,涉及自动驾驶仪的严重事故还是会发生,而第一例特斯拉自动驾驶仪导致人员死亡的事故很快成为全世界的头条新闻。2015年5月,佛罗里达州的一位特斯拉车主在路上与一辆18轮卡车相撞,不幸身亡。有报道称,汽车的传感器被白色卡车在明亮的天空下的景象给迷惑了,结果汽车的人工智能系统未能识别出路上还有另一辆车存在,直接高速撞上卡车,司机当场死亡。
其他的事件也凸显了目前无人驾驶技术的一个关键问题。在L0级人工驾驶模式下,对驾驶员的期望是非常清晰的:驾驶员必须掌控车的一切。而在L5级的全自动驾驶模式下,同样很清晰:驾驶员什么也不用做。但是,在这两个极端之间,对驾驶员的期望就相对比较模糊了。佛罗里达州的事故和其他类似事故表明,驾驶员似乎对自动驾驶技术期望过高:把它当成L4或者L5级的自动化驾驶系统,事实上它的功能远远没有达到这个等级。驾驶员期望的功能和自动驾驶仪实际能够实现的功能之间如此不匹配,至少在一定程度上是媒体过于兴奋地鼓吹所造成的,它们似乎不太能理解和传达技术等级能力的微妙之处(特斯拉给这个系统命名为“自动驾驶仪”也得负点儿责任)。
2018年3月,另一起涉及无人驾驶汽车的事故引发了人们对这项技术的进一步质疑。2018年3月18日,在亚利桑那州的坦佩市,优步公司的一辆无人驾驶汽车在无人驾驶模式下撞死了49岁的行人伊莱恩·赫茨伯格(Elaine Herzberg)。与这类事故的典型情况一样,引发事故的原因是复杂的。这辆车当时的速度已经超过了自动紧急制动系统能够处理的速度,所以当汽车意识到需要紧急制动的时候,已经来不及了。虽然汽车传感器意识到前方有“障碍物”(受害者伊莱恩·赫茨伯格),需要紧急制动,但软件似乎规避了这个行为(在程序员看来,这似乎在说明软件系统有缺陷,至少是存在优先级处理不当的问题)。而且,最重要的是,车上的“人类驾驶员”应该干预这样的事情,可她似乎一直在用智能手机看电视,对外界环境关注甚少。很可能她盲目信任了汽车的无人驾驶能力。伊莱恩·赫茨伯格不幸遇难的悲剧是完全可以避免的:这个问题是人为的,而不是技术上的。
令人沮丧的是,在看到实用的、大众化的无人驾驶汽车之前,还会有更多这类悲剧发生。我们需要尽己所能合理地预测和避免这类悲剧,但无论如何,它们总是会发生的。当它们发生以后,我们需要从中吸取教训。就像飞机的飞行控制器发展史告诉我们的,从长远来看,总会出现更加安全的交通工具。
目前围绕无人驾驶汽车的一系列活动表明,这项技术已经日趋成熟,但是离它进入我们的现实生活还有多久呢?我们什么时候可以跳上一辆无人驾驶汽车,只需要说出自己的目的地,就可以轻松抵达呢?在这方面做得最公正和权威的是美国加利福尼亚州的无人驾驶监管机构。无人驾驶汽车公司必须向该机构提供详细的相关信息,才能获取在加州公共道路进行无人驾驶汽车测试的许可证,其中最重要的信息是自动驾驶汽车脱离报告。脱离报告的内容说明公司相关车辆在无人驾驶情况下行驶的英里数,以及在测试期间发生过多少次脱离接触。脱离接触是指人类驾驶员不得不干预汽车行驶,接管汽车控制权的情况——这是伊莱恩·赫茨伯格的悲剧中驾驶员应该做的事情。脱离接触并不意味着如果没有人工干涉就一定会出现事故(更别提死亡事故了),但它仍然是衡量自动驾驶技术性能的标准。自动驾驶时,每千英里中出现脱离接触的次数越少越好。
2017年,有20多家公司向加利福尼亚州提交了自动驾驶汽车脱离报告。从行驶里程数和每千英里最低脱离次数来看,一家名为Waymo的公司遥遥领先,该公司的自动驾驶汽车平均每行驶5000英里才报告1次脱离。表现最差的是汽车巨头梅赛德斯-奔驰,每千英里不少于774次脱离。Waymo是谷歌旗下的无人驾驶汽车公司,最初,它是谷歌内部的一个项目,运营负责人是塞巴斯蒂安·特隆,他曾经率领团队赢得2005年美国国防高级研究计划局组织的无人驾驶汽车挑战赛。2016年,Waymo成为谷歌的子公司,2018年,Waymo的报告说,该公司旗下无人驾驶汽车已经达到平均行驶超过11 000英里才报告1次脱离的水准。
那么,这些数据告诉我们什么呢?尤其是,无人驾驶汽车还要多久才能进入我们的日常生活?
好吧,从宝马、梅赛德斯-奔驰和大众等传统汽车巨头相对较差的表现中,我们可以得出的第一个结论是:汽车行业经验的积累并不是无人驾驶汽车技术取得成功的关键条件。仔细想想这并不奇怪:无人驾驶汽车的关键不是内燃机,而是软件——人工智能软件。因此,美国汽车巨头通用公司在2016年收购了无人驾驶汽车公司Cruise Automation,金额保密(但显然数额巨大),而福特公司给自动驾驶初创公司Argo AI投资10亿美元。两家公司都公开了推出无人驾驶汽车的雄心勃勃的声明:福特公司预测将在2021年前投入运营一款“完全自动驾驶”的商用汽车[91]。
当然,我们并不知道汽车公司各自采用的在何时需要进行脱离接触的确切标准,也许梅赛德斯-奔驰只是过于谨慎而已,但看上去我们不得不承认一个结论:至少在撰写本书的时候,Waymo公司遥遥领先。
我们将脱离接触和人类驾驶员安全行驶做个有趣的对比。对于后者,虽然没有明确的统计数据,不过在美国,人类驾驶员出现严重事故的平均驾驶里程约为10万英里,甚至100万英里。这就表明,即使是市场领导者Waymo,也必须将其技术提高两个数量级,才能达到与人类驾驶员相当的道路安全驾驶水准。当然,并不是Waymo报告的所有脱离都会导致事故,因此这种比较也不够科学,但至少可以说明,无人驾驶汽车公司现在仍然面临艰巨的挑战。
有趣的是,与无人驾驶汽车技术工程师交谈会发现,他们认为这项技术的关键难点在于如何应对突发事件。我们可以训练汽车应对大多数可能出现的危险,但当汽车遇见一种与训练中任何事件都不同的情况,会发生什么呢?虽然大多数驾驶场景都是常规和可预期的,但难免会出现完全无法预计的突发状况。在这样的情况下,人类驾驶员可以凭借丰富的经验进行处理,利用经验思考处理方案,如果实在来不及思考,也会凭借直觉处理。而无人驾驶汽车没有直觉这种奢侈的东西——在可以预见的未来,它们也不会拥有。
另一个艰难的挑战是如何从我们的道路现状(道路上所有车辆都是由人类驾驶),到一个混合过渡(即道路上的车辆部分由人类驾驶,部分自动驾驶),最终过渡到完全无人驾驶。一方面,无人驾驶汽车在驾驶时的行为与人类不同,这会让与之共用道路的人类驾驶员感到困惑和不安。另一方面,人类驾驶员的行为是不可预测的,他们不一定会严格遵守交通法规,这就使人工智能很难理解他们的行为,并与之安全地互动。
鉴于我对无人驾驶汽车技术进步的乐观评价,以上的问题听起来可能让人十分悲观。所以,让我尽可能解释一下我认为未来几十年内,事情会怎样发展。
首先,我的的确确相信无人驾驶汽车技术在某种形式上很快就会在日常生活中应用——当然,是在未来10年内。然而,这并不意味着L5级的自动驾驶可以很快实现。相反,我认为,我们将开始看到无人驾驶技术在特定的“安全”领域开始推广,并逐渐走向更广阔的世界。
那么,这些技术将率先在哪些领域开始推广呢?我认为采矿业是一个很好的例子,也许从澳大利亚西部或加拿大阿尔伯塔省的大型露天矿开始:那里地广人稀,行人和喜欢骑自行车蛇行或做出其他危险动作的人也少得多。事实上,采矿业已经大规模使用自主汽车驾驶技术。例如,横跨英国和澳大利亚的跨国矿业集团力拓集团于2018年宣称,在西澳大利亚皮尔巴拉地区,他们的大型自动卡车车队已经运送超过10亿吨矿石和矿产[92]。从公开的信息看,这些自动卡车离L5级别的全自动驾驶还差得远——更偏向“自动化”而不是“自主驾驶”。不过这是个很好的例子,说明无人驾驶汽车在有限的环境中能够发挥巨大作用。
同样,无人驾驶车辆似乎非常适用于工厂、港口或者军事设施区域。我相信在未来几年内,无人驾驶技术将在这些领域得到大规模应用。
除了这些特殊领域的应用,对于日常使用的无人驾驶技术,还有几种可能的情况,其中有一部分已经成为现实。或许在一些受限制的城市环境,抑或特定的路线上可以看到低速行驶的“微型出租车”。事实上,在撰写本文的时候,已经有几家公司在试用类似服务了,尽管使用范围受到严格限制(而且,至少目前,微型出租车车厢里面有人类“安全驾驶员”保驾护航,用以处理紧急情况)。在伦敦这样的城市里,这类低速行驶的车辆完全不是问题,因为众所周知,伦敦的交通状况总是很糟糕,行车速度一直都很缓慢。
另外一种可能性是在城市和主要高速公路上设置无人驾驶汽车专用车道。大多数城市已经设置有机动车道和自行车专用道,那为什么不设置无人驾驶汽车专用道呢?这样的车道可以通过传感器和其他技术来辅助自动驾驶车辆,无人驾驶汽车专用道的存在也会向与之共用道路的人类驾驶员发出一个明确的信号:小心机器人司机!
至于L5级别的全自动驾驶,恐怕离我们还有一段距离。但它终究会出现,我最乐观的预测是,从撰写本书之时往后20年,或许L5级别的全自动驾驶才能普及。我敢打赌,我的孙辈将觉得他们的祖父竟然要亲自开车上路,真是既可怕,又充满了乐趣。