第十六章 游戏规则(1 / 1)

亿亿万万 卡尔·萨根 4532 字 4个月前

合乎道德的事来自以下4种原则:全面理解或探索真理;保持有组织的社会,社会中的每个人都能各取所需,并履行自己的责任;高尚精神带来的伟大和力量;每件事都按规则及中庸原则,有节制地去说和去做。

西塞罗(Cicero)

《论义务》(De Officiis, I,公元前45—前44年)

我记得那是很久以前的事了,事情发生在1939年某个愉快美好的一天即将结束之际——那一天发生的事彻底改变了我的思想。那一天,我的父母带着我参观纽约世界博览会的种种奇观,时间已经很晚了,早就超过我该睡觉的时间。我稳稳地骑在父亲的双肩上,两手抓住他的双耳,妈妈紧紧地跟随在旁边,我则转过头看着博览会的标志建筑:尖角塔和圆球(Trylon and Perisphere),它们闪烁着淡蓝色的光芒。我们抛下这个未来的“明日世界”,朝BMT线的地铁方向走去。当我们走进地铁站,停下来整理行装的时候,父亲开始和一个矮小的男子攀谈起来。他看上去很疲倦,颈上挂着一个平盘,他在卖铅笔。我的父亲从携带的小包中翻出我们带来的棕纸袋,里面装着我们没吃完的午餐,拿出了一个苹果,并将苹果给了那个男子。我开始哭闹。我那时不喜欢苹果,中饭和晚饭都拒吃它们。可是,我觉得这还是我的苹果,而父亲要把我的苹果给一个陌生、外貌又很可笑的人——而这个人,还木然地看着我们,这种态度令我更生气了。

虽然我的父亲是个有无限耐心和爱心的人,但是我可以看得出来他对我很失望。他把我从肩上抱下来,亲了我一下,说道:“他是个很可怜的人,他失业了。”他小声地对我说,不让这个人听到,“他今天一天没吃东西了。我们吃够了。我们有能力给他一个苹果。”

我想了一下,抑制了自己的抽泣声,不再耍脾气,并渴望地瞄了一眼“明日世界”的方向,然后感激地在父亲的双臂中睡着了。

何谓正直的事

道德规范可以用来管理人类行为。这些道德规范不仅自人类文明初露光辉以来就和我们共存,甚至在更早之前的古文明时期,就存在于我们群居着进行狩猎采集活动的祖先当中。不同的社会有不同的法规。可是在许多文化中,往往说的是一回事,做的又是另一回事。在几个较幸运的社会中,一名受神灵启示的立法者立下一套人人要遵守的法规(他不止一次地声称上帝训令他,叫他立下这些法规。如果不说是上帝的训令,就没有人会遵守这些法规)。

例如,印度的阿育王(Ashoka)、古巴比伦的汉谟拉比(Hammurabi)、斯巴达(希腊古国,以好战为名)的莱克格斯利(Lycurgus),以及梭伦(Solon)制定的曾一度支配强大文明古国的法典,但现在这些古代的法规大都已经失去效力。也许是这些法典的创始人误估了人性,对我们的要求太高。也可能是一个时代或一个国家的法典,不适用于另一个时代或另一个国家。

令人诧异的是,今日竟有人下功夫——虽是试验性质的,但仍在不断尝试——用科学的方法去研究这问题。

在我们的日常生活中,以及国家的重要关系间,我们必须决定:做正直的事是什么意思?我们应不应当帮助有急需的陌生人?我们该如何应付敌人?我们应不应当利用对我们仁慈的人?如果我们被朋友伤害了,或被敌人帮助了,我们是否该以其人之道还治其人之身?我们过去的整体表现远比最近的脱轨行为更好?

例如:你的表姐不在意你对她的轻待和冷落,邀请你去她家共享圣诞大餐,你该不该接受她的邀请?我们该给慈善机构多少钱?压迫当地黑人原居民几个世纪后,南非的国民党(Nationalist Party)领袖克勒克(F. W. de Klerk)向南非非洲人国民大会(African National Congress,ANC)示好,反对白人统治的黑人领袖纳尔逊·曼德拉(Nelson Mandela)及南非非洲人国民大会是否也应当友好回应?一名同事当着老板的面让你难堪,你要不要报复?我们在填报所得税表时,该不该欺瞒所得以逃税?如果我们真能逃掉呢?如果一家石油公司支持一个交响乐团,或者支持一个质量优良的电视剧,我们该不该对其造成的环境污染问题视而不见?我们该不该友好对待年长的亲戚,即使这位长者的表现令我们抓狂?我们在玩牌时该不该作弊?在更大的场合呢?我们该不该处决谋杀者?

黄金法则:以德报怨

在做这类决定时,我们不仅关心做正直的事,也关心有哪些事是我们可以做的——可以使我们和社会的其他组成分子感到更愉快、更有安全感。在我们所谓的道德和实用主义之间存在着一种紧张关系。如果以长远眼光来看,某些道德行为是自我挫败的,这样做只会落得愚蠢之名,并非道德义举(我们声称我们尊敬原则,可是一旦要付诸实行时,就将原则抛诸脑后)。在认识了人类行为的复杂性及多元性后,我们问:究竟有没有一些真正可以付诸实践的简单原则决定我们该如何行事——不论我们称之为道德还是实用主义?

我们如何决定要做什么?我们对这个问题的反应,部分取决于自己的利益。我们以其人之道还治其人之身,或反其道而行,是因为我们希望自己的行为可以引来期望的结果。各国聚集在一起协商,或选择引爆核武器的原因,都是不希望被其他国家耍弄。我们以德报怨的原因是如果我们这么做,有时就能触动人们的良知,或者,我们认为报之以德可以使他们感到羞耻。有时,我们这么做的动机并非出于自私的心理,有些人的本性就是善良的。我们接受长者或儿女的无理要求,是因为我们爱他们,想要他们快乐,即使我们有些损失也不要紧。有时,我们严格要求儿女,使他们感到不安,是因为我们要塑造他们的性格,我们相信这么做能在以后为他们带来超过短期宠爱所能带来的快乐。

没有哪件事是相同的,人和国家也不例外。我们需要智慧,以从迷阵中寻到一条出路。但是,了解了人类行为的多元性及复杂性后,不管我们称呼它们为道德或实用主义,究竟有没有一些真正行得通的简单原则指引我们呢?或者我们应当避免去想这些问题,只去做我们“觉得正直”的事?可是,即使如此,我们该如何确定什么才是“觉得是正直”的事?

至少在西方,最受人赞扬的典型行为是黄金法则(Golden Rule),首创于拿撒勒的耶稣。众所周知的黄金法则来自《马太福音》:你们想要人怎样待你们,你们也要怎样待人。几乎没有人遵行这条黄金法则行事。有人询问中国的哲学家孔子对“以德报怨”这条黄金法则(在那时已经是众人皆知)的看法,孔子的回答是:“以德报怨,何以报德?”一个妒忌邻居富有的贫妇,是不是要把她仅有的一切都给这个富有的邻居呢?是不是一个受虐者可以去虐待邻居呢?别人打了你的左脸一巴掌后,你是不是真的能把右脸凑上去再让他打一巴掌呢?对一个没有良心的敌人,这样做难道不只会让自己再多受些痛苦吗?

白银法则:己所不欲,勿施于人

白银法则(Silver Rule)就不同了:“己所不欲,勿施于人。”世界各处都有这样的说法,包括比耶稣早1个世纪的犹太拉比(是犹太人中的一个特别阶层,是老师也是智者的象征)希勒尔(Hillel)的著作也提到过。20世纪最激励人的白银法则典范是印度的甘地及美国的黑人领袖马丁·路德·金(Martin Luther King)。他们对被压迫者的教诲,不是以暴制暴,而是文明的不服从、不顺从。他们主张不使用暴力的不服从——把你的身体放在第一线,给那些压迫者看,而且你愿意为了反对不公的法律接受惩罚。他们的目的是软化那些压迫者的心(并使那些还没打定主意的人被感动,从而支持他们)。

马丁·路德·金将“非暴力不合作运动”的功劳归于甘地,说他是历史上第一个,把黄金法则或白银法则转变成有效工具,以促成社会改变的人。而甘地曾明确表示:“我从我的妻子身上学到不用暴力的教诲。我曾经一直强迫她服从我的意志。一方面,她有很坚强的反抗心;而另一方面,她静默地忍受了我的愚蠢给她造成的痛苦。最后,她的行为使我感到惭愧,从而医好了‘我一生下来就有统治她的权利’这种愚蠢思想。”

在20世纪,非暴力不合作运动给政治带来了很大的改变——把印度从英国的钳制下解放出来,促进了全球殖民主义的垮台,也替非裔美国人争取到了民权——虽然其他人所主张的暴力威胁也有助于此,但甘地和马丁·路德·金都极力反对暴力。南非非洲人国民大会是在甘地的精神感召下成长的。可是到了1950年,事实已经很明显,这种非暴力不合作运动对当地执政的白人国民党毫无影响力,因而各种民权运动毫无进展。1961年,曼德拉及他的同僚组建了南非非洲人国民大会的鹰派组织——国家之矛(Umkhonto we Sizwe)。他们站在反甘地的立场,宣称唯一能让白人清醒的就是武力。

黄铜法则:以眼还眼

即使连甘地本人也对如何协调非暴力原则与必要的暴力自卫以对付那些缺乏高尚道德的行为,感到头痛。他说:“我没有资格去教授我的生活哲学,我勉强有的是实践我所相信的哲学,我只是一个可怜的、挣扎中的灵魂,渴望能做到……完全的诚实,及在思想、言行方面做到非暴力,可是我一直都不能达到这个目标。”

孔子说:“以直报怨,以德报德。”这可以写成黄铜法则(Razen Rule):以其人之道还治其人之身。这就是同态复仇,即《圣经·旧约》的教诲:“以眼还眼,以牙还牙”和“一件好事后面就应当跟上另一件好事”。这在人类(及人猿)的实际行为中都可看到,是我们很熟悉的典型标准。“如果敌人倾向于和平,你也要倾向于和平。”这是克林顿总统在以色列和巴勒斯坦达成和平协议时,引用的《古兰经》原文。不必诉诸人性善的一面,我们建立起一种心理学上所谓的“操作性条件反射”(operant conditioning)行为,如果他们对我们好,就奖励他们,如果他们对我们坏,就惩罚他们。我们不是懦弱的对手,可是也不是不懂宽恕的人。这个法则听起来颇为可行,但或者“负负不能得正”[18]?

铁律与锡律

再低一级的就是铁律(Iron Rule):“只要没被处罚,你可以为所欲为。”有时铁律的陈述是:“法规是有黄金的人制定的。”这样的陈述不仅是在强调铁律和黄金法则的不同,还是对黄金法则的一种蔑视。如果能逃避惩罚的话,这将成为许多人的格言。这也是有权有势者之间的默契。

最后,我应当提起另外两条全球都通用的规则。它们可以解释世界上的许多事情。一条是:向上谄媚拍马,向下滥用特权。这是典型的恃强凌弱者的格言,是非人类的灵长类(如人猿)社会中的正常行为。它可以说是以黄金法则对付强者,以铁律对付弱者。因为没有金和铁的合金,我们只好把这条规则叫作适应律或锡律(Tin Rule)。另一个普通的规则是:“尽量给你的亲戚一切方便,对其他的人你爱怎么做都可以”。这是所谓的裙带法则(Nepotism Rule)。进化生物学者把它称为亲属选择(kin selection)。

黄铜法则的致命缺点

黄铜法则看上去很实际,可是它有一样致命缺点:持续不断的血仇。暴行从谁开始都不要紧,暴行后面永远跟着另一暴行,一方永远有恨另一方的理由。“没有走向和平的道路,”马斯特(A. J. Muste)说,“和平才是道路。”可是和平很难维持而暴行很容易开始。即使几乎每一个人都倾向和平,只要一个孤注的报复,就可以动摇此局面,比如一个哭哭啼啼的寡妇及哀哭的小孩在我们的面前诉苦,老年人和女性回忆他们童年时遭遇的暴行。我们的理智是想要保持和平,可是我们的情感呼喊着要报复。敌对双方的极端分子都能利用我们。他们联合起来对付我们,并对我们提出要相互了解及相互关爱的呼吁表示轻蔑。几个暴躁的人就可以迫使谨慎及理智的人投入残酷的暴行及战争中。

许多西方世界的人都很疑惑,为什么各国会同希特勒在1938年签订可憎的《慕尼黑协定》,人们无法理解为什么这些国家不能各自合作,还对坏人漠视不理。我们从不判断表态及建议的优劣点,就已经判定这个敌人坏透了,他的一切让步都是没有信用的,武力是他唯一的武器。也许我们对希特勒做这样的判断是正确的。可是一般说来,这是不对的,即使我也希望在1938年可以用武力阻止德国侵略莱茵区。然而,这样的想法煽动双方的敌忾情绪,使战争爆发的可能性大为增加。在一个有核武器的世界中,不可妥协的敌忾心理带来的危险尤为可怕。

哪种法则最好?

我要说,要切断互相报复的长链实非易事。有些民族无法逃出这种互相报复的循环,最终使自己弱小到几乎灭族。那些发生在南斯拉夫、卢旺达及其他地区种族间的内战都是很好的例子。黄铜法则似乎太不宽容了,黄金法则及白银法则又似乎太宽容了。后二者在惩罚残酷和剥削上是彻底失败的。它们希望用种种仁慈的表现把人从罪恶之途引上正道。可是社会上存在反社会人格(sociopath),这一群人对别人根本没有任何感情。我们很难想象,将仁慈的楷模摆放在希特勒眼前,就可以使这个恶魔感到羞耻而改过。是否在黄金法则、白银法则,及黄铜法则、铁律、锡律之外,有一种比这些规则更好的规则?

有了这么多的规则,你如何知道用哪一种,以及哪一种有效?即使在同一个人身上,也可以应用不止一种规则。我们是否命中注定去猜测,或依赖直觉,或像鹦鹉一样去复诵别人教导我们的规则?让我们先撇开所有我们学过的规则及我们从内心深处——也许是来自一种深植在心中的正义感——觉得一定是对的规则。

假定我们不要盲目跟随或否认我们学过的规则,而是要去寻觅那些是真正可行的规则。有没有方法去测试不同的伦理法则?即使真实世界要比任何的模拟情境要复杂得多,我们能不能以科学方法来探究这件事?

零和游戏只求输赢

我们很熟悉有人赢有人输的游戏。每次对方赢1分,我们就输1分。“输-赢”的游戏似乎是很自然的事,许多人无法想象没有输赢的游戏。在输-赢的游戏中,输赢刚好平衡相抵。这就是为什么它们被称为“零和”(zero-sum)游戏。在这种游戏中,双方的意向十分清楚:在游戏规则的许可范围之内,不择手段地击败对手。

许多儿童在第一次玩输赢游戏时,一旦沦为“输”方,往往会觉得非常可怕。在玩“大富翁”时,他们要求特别减免(如要求免租金等),一旦其他玩家不同意,可能就会放声大哭,或大骂游戏没良心——这话说得一点都没错(我曾经见过输了的一方,在暴怒中,打翻游戏盘,乱丢游戏卡,而且有时打翻乱丢的当事人还不是儿童)。按照大富翁的游戏规则,玩家没有方法彼此合作使大家一起受益。这是游戏的设计。同样,在拳击、足球、冰上曲棍球、垒球、篮球、棒球、网球、壁球、下棋、游艇及汽车竞赛、皮纳克尔纸牌游戏(pinochle)、踢方块(儿童游戏),及政党政治中也没有共同受益的方法。在这些游戏中,黄金法则或白银法则完全不适用,甚至黄铜法则也不适合,只可用铁律或锡律。如果我们尊崇黄金法则,为什么我们极少在游戏中教人们恪守黄金法则呢?

经过100万年打打停停的部落生活后,零和模式深入人心,因而我们把任何来往都看成一种竞赛或冲突。核战争(及许多的传统战争)、经济萧条,及对全球环境的攻击都是双输之局(没有赢家)。而像这些对人类最重要的关怀,如爱、友谊、亲情、音乐、艺术,及求知,则都是双赢的游戏。如果我们只知道输-赢的游戏,我们的视野就会过于狭隘,以至陷入危险。

囚徒困境

研究这些事项的科学领域,我们称之为“博弈论”(game theory)。它被广泛地运用在军事战略(术)、贸易策略、企业竞争、限制环境污染,及核战争的计划上。一个典型的游戏是“囚徒困境”(Prisoner's Dilemma)。它绝不是零和游戏。该游戏的结果包括输-赢、赢-赢、输输3种。在这类问题上,“圣书”可以给我们的提示或洞见很少。这完全是一种实用的游戏。

囚徒困境的问题如下:假设你和你的朋友因犯下重罪而双双被捕。就游戏而言,你和你的朋友到底有没有犯罪不是问题所在。最重要的是,警察认为你们犯下了重罪。你们两人在可以商讨串供之前,就被隔离在不同的房间内接受审问。在那里,他们不顾及你的米兰达权利[19],就开始审问,想要你招供。就如在真实世界中有时警察会做的一样,他们告诉你,你的朋友已经招供了,说你是主谋(这是什么朋友?)。警察说的可能是真话,也可能在说谎。你有两种选择:声明没有犯罪(不认罪)或俯首认罪。如果你想要被判最轻的刑,那么最好的策略是什么?

以下是可能的后果:

如果你否认犯下这项重大罪行,你的朋友也矢口否认,则这个案子就缺少人证,因此不容易证明两个人都有罪。因此即使有惩罚,惩罚也会很轻。如果你招认了,你的朋友也招认了,那么政府花在这案子上的费用会很少。因此,法官可能给你们两人都判轻刑,但还是会比你们两人都否认的重一些。

可是如果你声称无罪,而你的朋友招认了,政府可能给你判最重的刑,而你的朋友则会被判轻刑或无罪开释。嗯!你可能被出卖了,在博弈论中,将其称为“背叛”(defection)。而如果你和你的朋友共同“合作”(cooperate)——两人都不认罪(或都认罪),你们就可逃避最坏的惩罚。如果出于安全考虑,你是否愿意接受一个不重不轻的惩罚,选择招认呢?这么一来,如果你的朋友不认罪而你认了,算他倒霉,你可能会因此躲过牢狱之灾。

当你把事情想个透彻后,你就知道,不论你的朋友怎么做,你最好的策略是背叛而不是合作。最使人生气的是,这结论也可用在你的朋友身上。但如果你们二人都采用背叛策略,则后果会比两人合作更坏。这就是囚徒困境。

让相同的参与者,再玩一次囚徒困境游戏。从上一次的游戏惩罚中,他们知道了对方怎样招供(有罪或无罪)。他们从上一次的游戏中学到了对方的策略(及性格)。他们会不会在第二次的时候学会合作,即双方都否认有罪,即使告密的报酬更大?

看了上一回的游戏结果后,你可以尝试选择合作或背叛。如果你合作太多了,对方就可能利用你的善良天性。如果你背叛过多,你的朋友也会经常背叛你,而这对双方都不利。你知道你的对手对你以往的背叛记录知之甚详。怎样最好地选择背叛和合作?就如大自然界中的其他规律一样,这就变成了一个可以用实验研究的问题。

以牙还牙:合作跟进

密歇根大学社会学者罗伯特·阿克塞尔罗(Robert Axelrod)写了一本相当出色的书《合作的演变》(The Evolution of Cooperation)。在书中,他探讨了囚徒困境的问题,他用计算机去模拟一个持续不断的多游戏者循环赛。不同的行为法则正面对垒,最后看谁是赢家(谁的总累积坐牢期最短)。最简单的策略也许是一直合作,不管对方怎样对你;或一直背叛,不管从合作中可以累积多少的益处。这两种方法就是黄金法则和铁律。结果是这两个策略总是输家,前者输的原因是太仁慈,后者输的原因则是太无情。如果对背叛的惩罚不够快,你也会成为输家——部分原因是这样做就在暗示对方不合作也能赢。黄金法则非但是不成功的策略,对其他的游戏者也是危险的。因为其他的游戏者在短期中可能赢,可是长期下去会被利用者消灭。

是不是你应当最先选择背叛,等到与你的对手合作一次后,你就一直采取合作策略呢?或者,是不是你应当先与对手合作,等到你的对手背叛一次后,你就一直采取背叛策略呢?这个策略也失败了。和运动不同,你不能老是想着你的对手会打败你。

在这种循环竞赛中,最有效的策略是以牙还牙。很简单:你先合作,然后在接下来的游戏中你的对手做什么,你也跟着做什么。你惩罚背叛者,可是一旦你的对手合作了,你就既往不咎,也随之合作。在这游戏中,起初收获平平,可随着比赛的进行,其他过度仁慈或过度无情的策略都会失败,而这个采行中间路线的策略就会脱颖而出。唯一要记住的就是,第一步一定要仁慈。以牙还牙就是黄铜法则。它(在第二步)对合作给出及时的奖励,对背叛给出及时的惩罚。它的最大好处是让你的对手清楚地知道,你用的是什么策略(不明确的模糊策略是致命的)。

游戏规则建议

黄金法则 你们想要人怎样待你们,你们也要怎样待人。

白银法则 己所不欲,勿施于人。

黄铜法则  以其人之道,还治其人之身。(以眼还眼,以牙还牙)

律 只要没被处罚,你就可以为所欲为。

以牙还牙  先同对方合作,然后再用黄铜法则的以眼还眼,以牙还牙。

如果有好几个游戏者都用以牙还牙的策略,他们的分数会一起上来。想要成功,以牙还牙的策略家一定要找到愿意以相同策略回报的对手,那么他们就可以合作。在最初几个回合中,有些使用黄铜法则的出人意料地赢了,因此有些玩家觉得这策略太仁慈了。在下一回合中,他们尝试去多用些背叛来利用对方的仁慈。可是,毫无例外,他们后来都输了。即使有经验的策略谋士都低估了宽恕及和解的力量。以牙还牙应用了好和坏的癖性:最初的友好态度,宽恕的意愿,以及毫无顾忌的报复。

类似的现象在动物界中俯拾皆是,尤其是在最接近我们的亲戚——人猿的社会中,目前这方面的研究也进行得非常不错。生物学家罗伯特·泰弗士(Robert Trivers)把这种现象称为“报答性利他主义”(reciprocal altruism)。动物们互相施恩,希望对方会回报——虽然不是每一次都有回报,不过回报次数已足够对施恩者有利。这绝不是一种一成不变的道德策略,而且普遍存在。因此没有必要去争论这些法则的来源,如黄金法则、白银法则、黄铜法则、以牙还牙,也不必分辨《利未记》中道德规范的优先顺位。这些道德规范也都不是得到上帝启示的立法者所发明出来的。它们的源头深深地埋藏在我们过去的进化过程中。在我们还不是人类时,它们已经和我们祖先共存了。

囚徒困境是一个很简单的游戏,真实的世界要复杂得多。我的父亲给了那个铅笔贩子一个苹果,他是否可能收到一个苹果的回报?当然不是从这个铅笔贩子手中,我们以后可能不会再看到他。可是,普遍慈善工作是不是会使经济复苏,因而使我的父亲得到加薪?或者我们给这个铅笔贩子一个苹果是为了在情感上得到愉悦的回报,而不是金钱上的?还有,和囚徒困境不同的是,人类及国家相互交流的时候,已经有了预先设定的、传统的或是文化上的特点。

可是在这个不复杂的囚徒困境循环游戏中,中心教训是:要表态明确;妒忌心招致自我挫败;长期利益比短期利益更重要;暴政及做代罪羔羊的危险性;特别是,要把在生活中应遵行哪些法则看成可以研究的问题。博弈理论也告诉我们,渊博的历史知识是生存的关键工具之一。