没什么东西比细菌更保守了,主宰地球30亿年,自始至终都是细菌;也没什么东西比真核细胞更激进了,引发了寒武纪大爆发,物种开始肆意创造。从细菌进化为真核细胞,似乎不像达尔文所说的渐进式,而更像一场命运邂逅引发的突变。
“植物学家就是赋予相似的植物以相似的名称,不同的植物以相异的名称。这样对众人来说,事物就显得清楚明了。”这是伟大的瑞典分类学者卡尔·林奈的评论,而他本人正是一位植物学家。或许我们现在会为这微不足道的抱负感到惊讶,但是林奈正是通过将生命世界依据其物种分类,为现代生物学奠定了基础。他必定对自己的成就十分自豪,“上帝创造万物,林奈整理万物。”他总是如此说。而他必定认为,现在的科学家应该继续使用他的分类系统,将所有生物分成界、门、纲、目、科、属、种。
这种将万物分类,从混沌中理出秩序的欲望,让我们周围的世界变得有意义,同时也为许多学科打下根基。没有元素周期表,化学将不知所云;没有宙代纪世,地质学也将无以为继。但是生物学和它们存在巨大差异,因为只有在生物学里,分类学仍然是主流的研究领域。那株“生命树”,也就是那幅标示所有生物彼此关系的图谱该如何绘制,至今仍是平常谦恭的科学家彼此争执与敌视的源头。加拿大的分子生物学家福特·多利特,是最彬彬有礼的科学家之一,他有一篇文章的标题忠实地传达了这种情绪——《带一把斧头走向生命树》。
他们并不是在斤斤计较一些细枝末节,而是在计较区别所有物种最重要的部分。我们大部分人都和林奈一样,会直观地将世界分成动物、植物与矿物,毕竟这些确实就是我们所能看到的。他们有什么相同的地方呢?动物由复杂的神经系统指挥,四处巡弋,以植物或其他动物为食。植物以二氧化碳与水为原料,利用太阳能来制造自身所需之物,它们根系固定,也不需要大脑。至于矿物则完全就是非生物,虽然矿物的生长现象曾误导了林奈——说来有点尴尬,这位植物学家也把它们分类了。
生物学就以此为基础,分成动物学与植物学两大分支,好长时间里相安无事,互不干涉。即使发现了微生物之后也很少动摇过。“微小动物”的变形虫因会四处游动被归到动物界,并获得原生动物之名(protozoa,原生动物,拉丁文意为“最原始的动物”),而有颜色的藻类与细菌则被分到植物界。林奈如果泉下有知,一定十分高兴地看到他的分类系统仍在使用,但也一定会目瞪口呆地发现自己竟被外表欺骗。现在我们发现动物与植物在分类上的差距其实并不大,然而细菌却与其他复杂生物之间有一道巨大的鸿沟。如何横跨这道鸿沟正是引起科学家争执的原因:生命如何从原始的简单形态,走向复杂的动物与植物?同样的情况也会在宇宙他处发生,还是只有我们如此?
为了让这些不确定性不被那些主张“一切都是上帝的安排”的人所利用,我要说科学家其实并不缺少好主意。只是得看证据,特别是如何诠释这些证据,将它们与遥远的时间连接起来,这段时间可能有20亿年,第一个复杂细胞差不多在那时出现。而我们最大的问题是,为何复杂的生命在我们行星的生命史中只出现过一次?毫无疑问,所有的动物与植物都有关联,意味着我们拥有同一个祖先。复杂的生命形态并不是在不同的时间点由细菌分别进化出来——不是说植物由某株细菌进化出来,动物由另外某株进化出来,而藻类与真菌又由别的细菌进化出来。事实上,细菌只有一次偶然的机会进化成复杂细胞,然后这一细胞的后裔分化出整个复杂生命王国:动物、植物、真菌与藻类。而这个最早的细胞,这个所有复杂生命的祖先,和细菌长得非常不同。让我们在脑中想想这棵生命树,细菌组成树的根部,而各种复杂有机体家族组成上面的枝叶,什么组成树干呢?虽然我们认为单细胞生物比如说变形虫,位于根与叶之间,但是事实上,它们很多方面的复杂程度,都更接近于动物和植物。它们的准确位置是在比较低的树枝上,但是仍然高于树干。
细菌与其他所有生物间的鸿沟,其实在于细胞的组织结构。至少从形态学的角度来看,也就是从细胞的大小、形状与内容物等方面来看,细菌都十分简单。它们最常见的形状有扁平、球状和杆状。这些形状由一层围绕在外的细胞壁支撑,里面则没什么东西,就算用电子显微镜来看也一样。细菌将独立生活的配备降至最低,如此无情地精简都是为快速繁殖做准备。大部分的细菌都尽可能地保留生存所需的最少量基因,而当环境压力变大时,它们会习惯性地从其他细菌那里捡拾额外的基因,增加自己的基因库,一旦不需要了就立刻丢弃。因为基因组很小,所以复制速度很快。有些细菌每20分钟就可以复制一次,只要原料充足就会看到它们以惊人的指数级速度增长。如果给予足够的资源(当然这是不可能的),一个重量只有万亿分之一克的细菌,能在不到两天的时间内长出重量等同于地球的庞大族群。
现在来看看复杂细胞,很高兴它们有一个了不起的名字:真核细胞(eukaryote)。我希望它们有个更平易近人的名称,它们实在太重要了。地球上几乎所有有点名堂的东西都由真核细胞构成,我们谈论过的所有复杂生命都是。这个名字源于希腊文,“真”(eu-)意指“真实的”,“核”(karyon)则是“细胞核”。因此真核细胞有真正的细胞核,这让它们与细菌不同,细菌是原核细胞(prokaryote),原核细胞并没有核。就某方面来讲,原核生物的前缀“原”(pro-)这个字,其实带有价值判断的味道,因为等于宣称原核细胞的出现早于真核细胞。虽然我认为这很有可能是真的,不过有少数科学家并不同意。不管细胞核是在何时进化出来的,它都是用来判断真核细胞的最重要特征之一。然而如果我们不了解细胞核为何以及如何出现,还有为什么细菌从来就没有发展出细胞核,那就不可能解释它们的进化过程。
细胞核是细胞的“指挥中心”,里面装满了DNA,也就是基因的物质基础。除了核本身以外,真核细胞的遗传物质还有几个方面与细菌不同。真核细胞并不像细菌一样有一条环状的染色体。它们的染色体形状笔直,还有好几条,而且经常成双结对。基因本身的排列法也不一样,细菌的基因连成一长串如同念珠一般,真核细胞的基因则常常被切分成好几个片段,中间塞满了许多段长长的非编码DNA序列。不知为何,我们这些真核细胞的基因总是这样“支离破碎”。最后,我们的基因并不像细菌那样“**在外”,它们以奇妙的方式与蛋白质缠绕在一起,有点像现在礼品塑料包装一样,因此不易受到损害。
图4.1 简单的原核细胞如细菌(左),与复杂的真核细胞(右)之间的差异。真核细胞内有许多“家具”,包含细胞核、细胞器和内膜系统。本图并没有依照真实比例绘制,真核细胞的体积平均来说是细菌的1万~10万倍。
除了细胞核之外,真核细胞和原核细胞也像来自完全不同的世界(见图4.1)。真核细胞通常远大于细菌,平均来说体积是细菌的1万~10万倍。再者它们里面塞满了东西,有叠成堆的膜状构造,有大量密封的囊泡,还有机动性极高的细胞骨架,可以用来维持细胞的结构,也可以随时分解然后重新组装,让细胞可以改变形状或移动。或许其中最重要的就属细胞器了,这些微小的器官在细胞中各司其职,就好像身体里的肾脏或肝脏也都各有任务。细胞器中最重要的当属线粒体,又被称为细胞的“发电厂”,因为它会产生ATP形式的能量。一个典型的真核细胞常带有数百个线粒体,不过有一些细胞可携带多至10万个。线粒体曾是独立生活的细菌,它被细胞捕获之后产生的影响将占本章的大量篇幅。
上面讲的都只是外形的差异而已。真核细胞在行为上也一样引人注目,而且和细菌大不相同。可以说除了少数的例外,几乎所有的真核细胞都有**。首先它们会产生**和卵子之类的生殖细胞,再重新结合成一个细胞,其中一半的基因来自父亲,一半的基因来自母亲(有关内容会在下一章详细讨论)。所有的真核细胞在分裂的时候,染色体都像在跳一支迷人的加沃特舞曲,先两两配对,之后成对排列在微管组成的纺锤体上,然后各自往细胞的两极退场,弯曲的样子像在鞠躬致礼。关于真核细胞的怪异行为清单还可以一直列下去,不过在这里我只想提最后一个,那就是吞噬作用,也就是一个细胞把其他细胞吞到体内然后消化掉的能力。虽然有少数几种生物已经遗忘了这种能力,比如真菌和植物细胞,但是这个特征似乎非常古老。举例来说,虽然大部分的动物和植物细胞并不会四处巡回狼吞虎咽,但是当免疫细胞遇到细菌时,会用和变形虫一样的方式把细菌吃掉。
上述特征和所有的真核细胞都密切相关,不管是动物细胞、植物细胞或变形虫。当然这些细胞彼此之间还是有些许差异,但这些差异和它们的共同点一比,就显得微不足道。比如说,大部分的植物细胞都有进行光合作用的叶绿体。叶绿体和线粒体一样,很久以前曾经是独立生活的细菌(叶绿体过去曾经是蓝细菌),在偶然的机会下被所有植物和藻类的共祖完整地吞到肚里。不知为何,这个共祖没有办法把蓝细菌消化掉,结果这位消化不良的患者反而变成了只需阳光、水和二氧化碳就可以自给自足的细胞。因为这一口,引发了一连串的事件,最后导致静态的植物世界与动态的动物世界从此分道扬镳。然而细看植物细胞,你会发现这只不过是它与其他细胞成千上万个共同点之外的少数差异之一。我们还可以再讲几个差异。植物和真菌后来在外面建造了细胞壁,让整体结构强化,有些细胞还有液泡等细胞器。然而所有这些真核细胞间的差异其实都无关紧要,和细菌与真核细胞之间的天壤之别一比,就显得不足挂齿。
但是这个所谓的天壤之别说起来又十分作弄人,因为它亦真亦假。在我们讨论的所有特征中,真核细胞和细菌之间还是有一些模糊地带。有一些非常巨大的细菌,也有很多很小的真核细胞,它们的尺寸有重叠。细菌的细胞壁也有内部细胞骨架,而且组成骨架的纤维和真核细胞的非常相似,而且有时甚至也有机动性。也有一些细菌有棒状(而非环状)的染色体,有一些有类似细胞核的结构,有些内部有膜状结构。有些细菌没有细胞壁,或至少在某些阶段没有。有些细菌可以组成结构十分复杂的菌落,对于那些细菌的拥护者来说,这很有可能是多细胞生物的前身。甚至有一两个例子指出,有的细菌体内含有另一个更小的细菌。这真是让人费解,因为在现今已知的细菌中,没有一种可以通过吞噬作用吃掉其他细胞。我个人认为,细菌曾经尝试过往真核细胞的方向发展,但是因为某个不明原因,很快就停止了,最终它们无法继续发展下去。
你当然可以认为,重叠和连续其实是同一件事,所以没有什么需要解释的。如果在这条连续进化之路的一端是极度简单的细菌,另一端是极度复杂的真核细胞,那就会有一连串的中间产物。就某方面来说,没错,但我认为这种看法存在误导的可能。确实,这两条路有某种程度的重叠,但是这仍是两条分开的路。其中一条属于细菌,从“极度简单”走到“有限复杂”然后就断了。而另一条路属于真核细胞,明显成长了许多,从“有限复杂”到“吓死人的复杂”。是的,这两条路有些重叠,但是细菌从来没有像真核细胞那样走这么远,只有真核细胞走了很远很远。
历史清楚地显示了这种差异。地球上出现生命的最初30亿年间(从40亿年前到10亿年前),细菌主宰一切。它们彻底改造了居住环境,但它们自身却很少改变。细菌改变环境的幅度大到让人咋舌,连现代人类都难以望其项背。比如说,所有空气中的氧气都由光合作用产生,这可全是在早期由蓝细菌一手包办的。大约在22亿年前发生的“大氧化事件”,让空气与阳光照耀的海面都充满了氧气,彻底且永久地改变了地球,但这些改变几乎没有影响到细菌。那次事件仅仅改变了生态系统,也就是让好氧菌出头而已。就算一种细菌变得比另一种更适宜生存,但它们还是彻头彻尾的细菌。其他所有值得书写的历史事件也是一样,比如细菌曾经让海底充满让人窒息的硫化氢长达20亿年之久,但它们本身还是细菌。又比如说细菌让大气中的甲烷氧化沉淀,导致全球降温,最后造成第一次雪球地球事件,但是细菌还是细菌。在所有事件里面改变最大的,或许是由真核细胞所组成的多细胞生物造成的,那大概发生在6亿多年前。真核细胞生物给细菌提供了一些新的生活方式,比如让细菌可以通过在真核细胞生物间传染生活。但尽管如此,细菌还是细菌。再也没有什么东西比细菌还要保守了。
从那以后,历史由真核细胞来书写。这是史上第一次开始发生一连串的新事件,而不再是恒久的了无新意。甚至有些时候事情发生得快得离谱。比如说寒武纪大爆发,就是一件典型的真核细胞事件。这是众人等待的一刻,也是地质学上重要的一刻,持续了大约几百万年。史上第一次有大型动物实实在在地留下具体的化石记录,而不再是试探性地露个脸,或只是虫子蠕行的痕迹。各种奇形怪虫明目张胆公然亮相走秀,其中有些怪虫出现得如此之快,却又转瞬消失。好像哪位发了失心疯的创造者,有一天忽然醒来,决定立即开工,着手弥补以往流失的时光。
学界称这种爆炸现象为“辐射”,就是一种特定形态的原型生物不知何故开始繁衍,短暂地进入一段毫无羁绊的进化时光。各种新式生物不断以原型为圆心往各种方向进化,就好像自行车轮的辐条一般。寒武纪大爆发当然是最为知名的一次事件,但是还有很多其他的例子,比如生物登上陆地开始繁衍、开花植物的出现、草原的蔓延、哺乳动物的多样性发展等,种类繁多,写也写不完。每当有前途的基因遇到环境中的机遇时,似乎必定会出现这种现象,就像每次大灭绝之后必定会出现复苏时期。不论原因为何,这种壮观的辐射现象,可是百分之百由真核生物造成的。每一次都只有真核生物旺盛繁衍,而细菌自始至终都还是细菌。有时候不得不承认,我们极为重视,并试图在宇宙其他角落寻找生命的特质——人类智慧与知觉,似乎不可能由细菌产生。至少在地球上,这些特质是真核生物独有的。
这两者的差异非常明显,尽管细菌拥有种种让我们真核生物汗颜的生物化学反应机制,但它们潜力完全局限在微小的外形中。它们几乎不可能发展出随处可见的奇迹,比如蜂鸟或木槿花之类的东西。而简单细菌过渡为复杂真核细胞,恐怕也是我们星球上最为重要的转变了。
达尔文并不太喜欢断层。因为自然选择的基本概念是一系列渐进的变化,一点一点改良个体。这也就是说,理论上我们应该可以找到更多的中间过渡形态。达尔文在他的《物种起源》里面提到了这个问题,根据他的定义,所有现在所见“进化终点”的生物都会比过去任何过渡阶段的生物适应性更强。根据自然选择,比较差劲的形态会输给较佳的竞争者。显然,翅膀发育良好的小鸟能顺利飞翔,应该会比其他只能勉强用笨拙“残肢”的同类过得舒服。就好像新的计算机软件会慢慢取代旧的版本。你还记得上次看到Windows 286或386系统(指微软在1988年出的Windows 2.1系统软件)是什么时候吗?这些系统软件过去都是了不起的产品,就好像原型翅膀与其他同时代产物相比较一样。然而随着时间推移,旧的系统软件渐渐消失退出历史舞台,仿佛现在的软件(就说Windows XP好了[1])出现之前是一大段空白。虽然我们都知道Windows系统随着时间在改进,但是如果只看正在使用的系统软件,恐怕很难证明这点,除非偶尔在仓库里找到一些已经报废了的老古董计算机。对于生命来说也是如此,如果我们想证明渐进进化是存在的,那一定要细细分析化石记录,要细细分析那段改变发生时期的记录。
化石记录当然还有很多漏洞,但是已知的中间型化石远多于那些宗教狂热者愿意承认的。在达尔文写书的年代,人类和人猿之间确实有一段“缺失的环节”,那时候还没有找到带有中间型特征的人科化石。但是半个世纪过去了,人类考古学家已经找到很多化石,每一个特征都正如预测,刚好落在进化该有的位置上,不管是脑容量或步态。现在的数据不是不够,而是多到让人犯难。我们不知道在众多化石中到底哪一个(如果在其中的话)才是人类的直系祖先,而哪一些又毫无理由地凭空消失了。因为我们尚未找到答案,所以一直会听到有人大声宣称缺失的环节从来没有被找到。这显然严重违背了真理与事实。
不过身为一个生物化学家,对我来说,化石虽然漂亮却容易让人迷失。因为形成化石的过程罕见且充满不确定性,同时无可避免地对那些躯体柔软生物不利,比如水母,以及生活在旱地的动物与植物。理论上,化石不可能完整地保存过去。如果它们真的保存了所有的记录,我们反而会觉得是场骗局。在偶然的机会下,万一有化石真的保存了完整的历史记录,那科学家会高兴得像挖到宝一样,这可是需要一连串多如繁星的事件,奇迹似的彼此配合才能办到。但是再高兴,化石证据也只是用来验证自然选择的证据之一。而其他重要的证据其实一直在我们手中,在这个遗传学的时代,它们就存在于基因序列里。
基因序列保存了比化石更多的关于自然选择的证据。随便挑一段基因来看,它的序列是一长串的字母,字母顺序编码了构成蛋白质的氨基酸序列。一个蛋白质通常由好几百个氨基酸组成,其中每一个氨基酸都由DNA序列的三联密码编码(请见第二章)。我们前面说过,真核细胞的基因里经常夹杂着大段大段的非编码DNA序列,把可编码的序列切割成许多小片段。两者相加,一个基因序列会有好几千个字母。生物都有好几万个基因,每个基因都这样组成。整体来说,基因组是一长条写满了亿万个字母的缎带,而这些字母的顺序,可以告诉我们缎带主人数不尽的进化故事。
从细菌到人类,都可以找到某些相同的基因编码相同的蛋白质,它们做着相同的工作。在进化的漫长历史中,基因序列如果发生有害突变,就会被自然选择剔除。这会造成一种结果,就是让相同基因的相同位置,尽量保持相同的字母。从实用的观点来看,这让我们可以辨识出不同生物体内的相关基因,尽管这些生物可能在不知道多久以前就分家了。不过根据经验,一个基因的数千个字母里面往往只有一小部分是真正的关键,其他部分则因为影响较小,允许有一定改动而不至于被剔除,随着时间流逝,这些突变也会累积下来。时间越久累积越多,两个基因序列间的差异就越大。刚从同一个共祖分家出来的两个物种,比如说黑猩猩和人类,就有非常多的基因序列一模一样。而共祖比较久远的物种,比如说黄水仙和人类,相同的基因序列就相对较少。其实和语言的变迁很像,语言也会随着时间与人类迁移而改变,慢慢地失去与共祖的相似性,但是在某些地方还是会不经意地流露出彼此曾有的关联。
基因树就是根据不同物种基因序列之间的差异来绘制的。虽然说基因突变的累积有一定程度的随机性,不过在对比基因中数千个字母时,这种随机性会被平均掉,最后可以得到亲缘关系的统计概率。单单比对一个基因,我们就可以建立起所有真核生物的谱系树,而且它的准确度是以前的化石猎人一辈子都不敢想象的。如果你对这个谱系树有任何怀疑,那只要再找第二个基因重复一次,看看结果是否相同就行了。所有真核生物共有的基因,没有数千也有数百个,所以科学家可以一再重复同样的比对,一次又一次把新算出来的谱系树重叠在旧的上面。借助现代计算机的威力,最后我们可以画出一棵“一致的”谱系树,显示出所有真核生物之间最可能的亲缘关系。该方法和研究化石断层有很大的差异。它可以清楚地告诉我们,人类和植物、真菌、藻类等生物到底有多少差异(见图4.2)。达尔文对于基因当然是一无所知,但是今天却靠着基因,才能够弭平达尔文世界观中各种讨人厌的断层。
不过方法虽然好,却也不是万无一失。麻烦主要来自统计学度量久远时光时出现的误差问题。简单来说因为DNA只有四个字母,而突变(至少此处对我们来说有用的那种突变)会把原来的字母换成另一个字母。如果每个字母都只突变一次,那就没有问题,但不巧的是,在漫长的时光中,每个字母都会突变很多次。既然每次突变就像抽奖一样,我们其实并不知道这个字母是被换了五次还是十次。如果基因中一个字母和共祖一样,我们其实不会知道这个字母是从来就没突变过,还是已经突变了很多次,而每次都有25%的机会换回原来的字母。因为这种比对分析法的基础是统计概率问题,到了某个时间点我们将无法分辨出任何差异。更不巧的是,好像屋漏逢连夜雨,这个即将溺毙我们的统计不确定性模糊的时间点,差不多就是真核细胞出现的时刻。原核细胞过渡到真核细胞的关键时刻,就这样被一波波基因的不确定浪潮所淹没。唯一的解决之道,就是要用更细致的统计筛子,慎选比对所用的基因。
图4.2 一棵典型的生命树,显示所有真核生物与原始共祖之间的差异与距离,这个共祖很可能是活在10亿年前的真核单细胞生物。越长的树枝代表着越长的进化距离,也就表示两者之间的基因序列差异越大。
真核细胞体内的基因大致分为两大类:一类和细菌一样,另一类则归真核细胞独有,也就是在细菌世界中尚未发现类似的基因。[2]这些独特的基因被我们称为“真核标志基因”,而它们的来源则是现在生物学家激烈争执的源头。有些人主张这些基因证明真核生物的历史和细菌一样古老到令人刮目相看。他们认为真核细胞之所以有这么多独特的基因,一定是因为它们早在盘古开天辟地以来就和细菌分家了。但是假设它们分异的速率不变(也就是说如果突变像一座分子时钟一样嘀嗒嘀嗒地以稳定的速率发生的话),那么根据现在这些基因差异的程度来看,我们应该相信真核细胞在50亿年前就出现了,也就是比地球的出现还要早近4亿年。借用英国擅长揭丑的讽刺杂志《第三只眼》所说的挖苦名言:其中必有错误吧。(“Shurely shome mishtake”,最初由该杂志模仿醉酒的编辑所创造的句子,故意拼写错误,原是“surely some mistake”意为“肯定有些错误”。)
其他人则认为,既然我们不可能知道基因过去进化得有多快,也没理由相信基因分异的速率会像时钟般稳定发生,那真核标志基因根本无法告诉我们多少真核细胞进化来源的信息,况且我们确实也知道某些基因进化的速度快过其他基因。用分子时钟去测量遥远的过去得到如此奇怪的结果,意味着两种可能:要么生命是从外太空播种到地球上的(但对我来说这不过是个借口而已),不然就是这个分子时钟坏了。可是为什么这个时钟会错得如此离谱呢?因为事实上,基因进化的速率受很多因素影响,不同生物的基因进化速率也不一样。比如之前我们讲过,细菌本身就非常保守,它们永远都是细菌,但是真核细胞则倾向发生剧烈的改变,会造成如寒武纪大爆发之类的事件。不过从基因的观点来看,大概没有什么事件会比形成真核细胞本身要更剧烈了,我们有理由相信真核细胞在早期进化的日子里,基因改变的速度必定非常惊人。如果如大部分学者所想,真核细胞出现于细菌之后,那它们的基因应该与细菌差异很大,因为它们曾进化得非常快速,不断地突变、结合、复制然后再突变。
那么由于真核标志基因发展得太快,快到把它们的源头淹没在遥远的时间之雾里,已经无法再告诉我们什么。那么另外一类基因呢?那些和细菌共有的基因呢?现在这些基因就显得有用多了,我们可以比对它们的相似性。真核细胞和细菌共有的基因所负责的,往往都是细胞的核心程序,比如说核心代谢反应(产生能量的方式,或用来制造构成细胞的基本材料,如氨基酸和脂质等),或者是核心信息处理方式(比如读取DNA序列然后转录成有用蛋白质的方式)。这些核心程序进化的速度往往比较缓慢,太多东西都依赖它们。制造蛋白质程序的任何一点点改变就会改变所有的蛋白质,而不止是一两个。同样,稍微改变一点点产生能量的方式,就可能干扰整个细胞的运作。因为篡改核心程序比较容易受到自然选择的惩罚,所以这些基因进化缓慢,让我们可以有机会细细分析进化的痕迹。利用这类基因建立的生命树,理论上来说应该可以显示出真核细胞与细菌之间的关联。它们应该可以指出真核细胞来自哪些细菌,搞不好还可以告诉我们为什么。
美国的微生物学家卡尔·乌斯在20世纪70年代末首先完成了这种生命树。乌斯选择了一个负责细胞核心信息处理的基因,具体来说,他选择的是编码核糖体的部分基因,而核糖体正是帮细胞合成蛋白质的细胞器。因为某种技术上的原因,乌斯并没有直接比对这个基因,而是用了这个基因转录出来的RNA序列(叫作核糖体RNA或rRNA),一被转录出来就会马上嵌进核糖体。乌斯从许多细菌和真核细胞中把这些rRNA分离出来,判读它们的序列,然后互相比对建立起一棵树。实验的结果非常惊人,直接挑战了传统学界对于生命分类方式的看法。
乌斯发现,我们地球上的所有生命可以大致分为三大类,或者称为三域(见图4.3)。如大家所预期的,第一大类就是细菌(属于细菌域),而第二大类是真核细胞(真核生物域)。但是剩下的第三大类,如今称为古细菌的(属于古菌域),不知从哪里冒出来登上世界舞台。虽然距离人类发现少量的古细菌已过去近一个世纪,但在乌斯提出他的生命树模型之前,古细菌一直被认为只是属于细菌的一个小分支而已。但在乌斯看来,这些古细菌和真核细胞一样重要,尽管在外形上它们看起来和细菌一模一样。它们体积极小,通常外围都有细胞壁,缺乏细胞核,细胞质里面也一样乏善可陈。同时古细菌从来就不会聚集成结构复杂的菌落,你绝不可能把它们和多细胞生物搞混。对很多人来说,抬高古细菌的身价,等同于藐视我们所属的生命世界,等于把植物、动物、真菌、藻类和原虫等各式各样的生物挤到无足轻重的角落去,而让原核生物占据生命树的大部分位置,如此重组世界未免太过鲁莽。这等于乌斯要我们相信,动物和植物之间的种种明显差异,相较于细菌与古细菌中间那道看不见的鸿沟,其实轻如鸿毛。该主张激怒了当时许多德高望重的生物学家,比如恩斯特·迈尔和琳恩·马古利斯等人。多年后《科学》杂志回顾了这场激烈交锋,写文评价乌斯是“微生物界的疤面革命先锋”。
图4.3 由 rRNA 为基础绘制的生命树。乌斯根据它将生命分成三大域:细菌域、古菌域与真核细胞(真核生物域)。
如今风暴过去之后,大部分的科学家都渐渐接受了乌斯的生命树,或者至少认可了古细菌的重要性。从生物化学的角度来看,不管在哪方面古细菌和细菌都大相径庭。首先,组成两者细胞膜的脂质不同,而且是由两套不同的酶系统制造的。古细菌的细胞壁成分和细菌的完全不一样,体内的生物化学代谢过程也相去甚远。另外我们在第二章曾说过,这两种细菌控制DNA复制的基因也没有太大的关联。如今全基因组分析技术已如家常便饭,因此我们知道古细菌只有不到三分之一的基因和细菌一样,剩下的全都特立独行。总结来说,乌斯碰巧用RNA建立的基因树,凸显了古细菌与细菌之间一系列的生物化学差异。尽管这些差异从外表来看是如此低调不引人注意,但所有证据加起来都支持乌斯大胆的分类主张。
乌斯的生命树所带来的第二个意料之外的发现,则是真核生物与古细菌之间的密切关联。它们两者有相同的祖先,和细菌关系较远(见图4.3)。换句话说,古细菌与真核细胞本来有一个共祖,且很早以前就和细菌分家了,之后才各自形成现在的古细菌与真核细胞。而生物化学上的证据,至少在十分重要的几个方面,支持乌斯的这项结论。特别是古细菌与真核细胞的核心信息处理方式有许多相似之处。两者的DNA都缠绕在相似的蛋白质(组蛋白)上面,基因复制与读取的方式也很相近,而制造蛋白质的整套机制也无分别。这一切一切的细节,都和细菌十分不同,所以从某些方面来看,古细菌填补了一些缺失的环节,它们横跨了真核细胞与细菌之间的那道鸿沟。大体来说,古细菌在外表和行为上和细菌一样,不过在处理蛋白质与DNA的方式上,开始有一些真核生物的特色了。
然而乌斯的生命树有个问题,它是依照单一基因绘制,无法与其他的基因树重叠以达到统计上的效力。只有相信一个基因可以确实反映真核细胞的遗传与起源的情况下,我们才能采用单一基因来绘制生命树。而要验证这点唯一的办法,就是去比对其他进化速度一样缓慢的基因,看看它们是不是也显示出相同的生命树分支结构。但是当我们这么做了之后,结果却让人十分困惑。如果我们只使用三者共有的基因(也就是在细菌、古细菌和真核生物三域里都可以找到的基因),那么建立的生命树很清楚地显示出细菌与古细菌的关系,但是真核细胞却不行,真核细胞混杂的程度让人完全摸不着头脑。我们细胞中有些基因似乎来自古细菌,其他的似乎来自细菌。最近一次大规模的分析,收集了165种不同种的生物,结合了5700个基因分析比对,绘制出了一株“超级生命树”。然而科学家发现,研究越多基因,越发现真核细胞并非遵循传统达尔文式进化,反而比较像通过某种庞大的基因融合而进化。从遗传学的观点来看,第一个真核细胞应该是个“嵌合体”,也就是半个真细菌、半个古细菌。
根据达尔文的观点,生命是经由慢慢累积的一连串变异,渐渐变得多元,而每一分支也因此与它们共同祖先渐渐分道扬镳,最终会形成一株繁茂的生命树。所以生命树无疑最适合用来描绘我们可见的众多生物进化过程,特别是大部分大型的真核生物。然而反过来看,生命树明显不是用来描绘微生物进化最好的方式,不管是古细菌、真细菌或真核细胞。
有两个过程总是会干扰达尔文式的基因树,那就是“水平基因转移”与“全基因组融合”。对于微生物系统分类学者来说,在试图建立细菌与古细菌之间的亲缘关系时,频繁发生的水平基因转移总是让人沮丧。这个复杂术语的意思,简单来说就是基因被传来传去,像钞票一样由一个细菌传给另一个。这样会造成一种结果,那就是一个细菌传给后代的基因组,可能与它的亲代一样,也可能不一样。有些基因倾向“垂直”遗传,一代传给下一代,像乌斯使用的rRNA。但是也有很多基因会被大家换来换去,而且常发生在毫无关联的微生物间。[3]因此最后描绘出来的图像往往会介于树状与网状之间,根据某些核心基因(如rRNA)可以画出树形图,但是用其他的基因则会画出网状图。有没有任何一群核心基因从来没有被水平基因转移传来传去过?该问题一直让众人争执不休。如果没有这样一群基因,那么想追溯真核细胞的祖先到某几群特定原核细胞的想法,无异缘木求鱼。这样一群基因必须一直通过直系继承,而不会被随机传来传去,才有可能被当成历史身份的标记。但是反过来说,如果只有一小群核心基因从来没有被传来传去,而所有其他基因都被传来传去,那这小群基因又怎么能代表身份呢?如果大肠菌有99%的基因都被随机置换掉,那它还是大肠菌吗?[4]
基因组融合也带来了类似问题,它让达尔文式的生命树走回头路,不但不发散,反而开始收敛。这样一来问题就变成了到底哪两位(或更多)父母的基因才代表进化路径。如果我们只追踪rRNA的话,那确实会得到一株达尔文式的生命树,然而如果考虑更多的基因,或把整个基因组都算进去,那会得到一个环状树,它的树杈一开始发散出去,但是后来则会收敛,最后合并在一起(见图4.4)。
图4.4 这就是生命之环,最早的生命共祖在底部,然后分开形成代表细菌的左边,与代表古细菌的右边,最后两枝再合而为一形成上方的真核细胞嵌合体。
真核细胞是一个嵌合体,这点毫无疑问。现在的问题是,典型的达尔文式进化有多重要,猛烈的基因融合又有多重要,或者换个方式来问,真核细胞的所有特质里,有多少是经由母细胞一点一点进化得到的,又有多少是在基因融合发生之后才诞生的?过去几十年来,科学家提出各式各样关于真核细胞起源的理论,范围从天马行空的(如果你不想称之为捏造的话)到利用生物化学证据一点点推理的都有,但至今无一被证实。所有的理论都可以归为两大类,一类强调达尔文式的渐渐分散进化,另一类强调剧烈的基因融合。事实上,这两大类理论恰好反映了生物学早期两派激烈的争执,一派强调进化是经由一连串渐进式的改变而来;另一派则强调一段长期而稳定的静止或平衡,会被突如其来的巨变打断继而进化。以前有人曾经揶揄这两派进化论:奴才进化论对上笨蛋进化论[5]〔evolution by creeps(谄媚奉承的人;缓慢)versus evolution by jerks(傻瓜;快进),可以意指“缓慢的进化对上急变的进化”或“奴才进化论对上笨蛋进化论”〕。
而在真核细胞的起源上,诺贝尔奖得主克里斯蒂安·德·杜维称这两派为“原始吞噬细胞”假说与“命运邂逅”假说。原始吞噬细胞假说在概念上是达尔文式的,有牛津大学的汤姆·卡瓦利埃-史密斯与杜维支持。该假说的基本原则就是,真核细胞的祖先会慢慢累积各种现代真核细胞的特质,这些特质包括细胞核、性行为、细胞骨架,以及最重要的一项,吞噬能力,让细胞可以四处漫游,改变形状吞噬其他细胞然后在体内慢慢消化。原始吞噬细胞和现代真核细胞唯一不同的,就是它缺少线粒体这个利用氧气来产生能源的小器官。我们假设原始吞噬细胞依赖发酵作用产生的能量生存,当然发酵作用的效率很差。
但对于一个吞噬细胞来说,吞掉线粒体的祖先也不过就是日常工作的一部分。可不是吗?难道还有更简单的办法让一个细胞进入另一个细胞?这种结合一定会为原始吞噬细胞带来巨大利益,因为它彻底改变了吞噬细胞产生能源的方式,但是对外表却没有太大的影响。在吞掉线粒体以前,它已经是吞噬细胞,在吞掉之后还是,只不过拥有更多能源。但是,这种结合也会让许多基因从这个被奴役的线粒体传到宿主细胞的细胞核里,然后和宿主基因融合在一起,造成现代真核细胞的基因组看起来像嵌合体。线粒体的基因在本质上是细菌,所以支持原始吞噬细胞假说的人,并不反对现代真核细胞其实是嵌合体这件事,但是他们坚持认为曾有一个非嵌合的吞噬细胞,一个虽原生的原始真核细胞成为了线粒体的宿主。
时光拉回20世纪80年代,那时候卡瓦利埃-史密斯强调有上千种看起来十分原始的单细胞真核生物,它们都没有线粒体。他认为,这里面或许有少数几种,从远古时代真核细胞诞生之初就一直活到现在,它们是那些从来就没有线粒体的原始吞噬细胞的直系后裔。如果是这样,这些细胞的基因应该毫无嵌合迹象,因为它们只会遵循纯达尔文式进化。但是二十几年过去了,研究结果显示,这些真核细胞全部都是嵌合体。就像这些细胞都曾有过线粒体,其中有一些因故遗失了,或者变成了其他东西。所有已知的真核细胞若不是还留有线粒体,就是过去曾经拥有线粒体。如果以前真有缺少线粒体的原始吞噬细胞,那很不幸它们没有留下任何直系子嗣。这并不是说它们不曾存在,只是说目前它们的存在纯属推测。