第四章 复杂细胞——命运的邂逅(1 / 1)

没什么东西比细菌更保守了,主宰地球30亿年,自始至终都是细菌;也没什么东西比真核细胞更激进了,引发了寒武纪大爆发,物种开始肆意创造。从细菌进化为真核细胞,似乎不像达尔文所说的渐进式,而更像一场命运邂逅引发的突变。

“植物学家就是赋予相似的植物以相似的名称,不同的植物以相异的名称。这样对众人来说,事物就显得清楚明了。”这是伟大的瑞典分类学者卡尔·林奈(Carlus Linnaeus)的评论,而他本人正是一位植物学家。或许我们现在会为这微不足道的抱负感到惊讶,但是林奈正是通过将生命世界依据其物种分类,为现代生物学奠定了基础。他必定对自己的成就十分自豪,“上帝创造万物,林奈整理万物。”他总是如此说。而他必定认为,现在的科学家应该继续使用他的分类系统,将所有生物分成界、门、纲、目、科、属、种。

这种将万物分类,从混沌中理出秩序的欲望,让我们周围的世界变得有意义,同时也为许多学科打下根基。没有元素周期表,化学将不知所云;没有宙代纪世,地质学也将无以为继。但是生物学和它们存在巨大差异,因为只有在生物学里,分类学仍然是主流的研究领域。那株“生命树”,也就是那幅标示所有生物彼此关系的图谱该如何绘制,至今仍是原本谦恭的科学家彼此争执与敌视的源头。加拿大的分子生物学家福特·多利特(Ford Doolittle),是最彬彬有礼的科学家之一,他有一篇文章的标题忠实地传达了这种情绪——《带一把斧头走向生命树》。

他们并不是在斤斤计较一些细枝末节,而是在计较区别所有物种最重要的部分。我们大部分人都和林奈一样,会直观地将世界分成动物、植物与矿物,毕竟这些确实就是我们所能看到的。它们有什么相同的地方呢?动物由复杂的神经系统指挥,四处巡弋,以植物或其他动物为食。植物以二氧化碳与水为原料,利用太阳能来制造自身所需之物,它们根系固定,也不需要大脑。至于矿物则完全就是非生物,虽然矿物的生长现象曾误导了林奈——说来有点尴尬,这位植物学家也把它们分类了。

生物学就以此为基础,分成动物学与植物学两大分支,好长时间里相安无事,互不干涉。即使发现了微生物之后也很少动摇过。“微小动物”的变形虫因会四处游动被归到动物界,并获得原生动物之名(protozoa,原生动物,拉丁文意为“最原始的动物”),而有颜色的藻类与细菌则被分到植物界。林奈如果泉下有知,一定十分高兴地看到他的分类系统仍在使用,但也一定会目瞪口呆地发现自己竟被外表欺骗。现在我们发现动物与植物在分类上的差距其实并不大,然而细菌却与其他复杂生物之间有一道巨大的鸿沟。如何横跨这道鸿沟正是引起科学家争执的原因:生命如何从原始的简单形态,走向复杂的动物与植物?同样的情况也会在宇宙他处发生,还是只有我们如此?

为了让这些不确定性不被那些主张“一切都是上帝的安排”的人所利用,我要说科学家其实并不缺少好主意。只是得看证据,特别是如何诠释这些证据,将它们与遥远的时间连接起来,这段时间可能有20亿年,第一个复杂细胞差不多在那时出现。而我们最大的问题是,为何复杂的生命在我们行星的生命史中只出现过一次?毫无疑问,所有的动物与植物都有关联,意味着我们拥有同一个祖先。复杂的生命形态并不是在不同的时间点由细菌分别进化出来——不是说植物由某株细菌进化出来,动物由另外某株进化出来,而藻类与真菌又由别的细菌进化出来。事实上,细菌只有一次偶然的机会进化成复杂细胞,然后这一细胞的后裔分化出整个复杂生命王国:动物、植物、真菌与藻类。而这个最早的细胞,这个所有复杂生命的祖先,和细菌长得非常不同。让我们在脑中想想这棵生命树,细菌组成树的根部,而各种复杂有机体家族组成上面的枝叶,什么组成树干呢?虽然我们认为单细胞生物比如说变形虫,位于根与叶之间,但是事实上,它们很多方面的复杂程度,都更接近于动物和植物。它们的准确位置是在比较低的树枝上,但是仍然高于树干。

细菌与其他所有生物间的鸿沟,其实在于细胞的组织结构。至少从形态学的角度来看,也就是从细胞的大小、形状与内容物等方面来看,细菌都十分简单。它们最常见的形状有扁平、球状和杆状。这些形状由一层围绕在外的细胞壁支撑,里面则没什么东西,就算用电子显微镜来看也一样。细菌将独立生活的配备降至最低,如此无情地精简都是为快速繁殖做准备。大部分的细菌都尽可能地保留生存所需的最少量基因,而当环境压力变大时,它们会习惯性地从其他细菌那里捡拾额外的基因,增加自己的基因库,一旦不需要了就立刻丢弃。因为基因组很小,所以复制速度很快。有些细菌每20分钟就可以复制一次,只要原料充足就会看到它们以惊人的指数级速度增长。如果给予足够的资源(当然这是不可能的),一个重量只有万亿分之一克的细菌,能在不到两天的时间内长出重量等同于地球的庞大族群。

现在来看看复杂细胞,很高兴它们有一个了不起的名字:真核细胞(eukaryote)。我希望它们有个更平易近人的名称,它们实在太重要了。地球上几乎所有有点名堂的东西都由真核细胞构成,我们谈论过的所有复杂生命都是。这个名字源于希腊文,“真”(eu-)意指“真实的”,“核”(karyon)则是“细胞核”。因此真核细胞有真正的细胞核,这让它们与细菌不同,细菌是原核细胞(prokaryote),原核细胞并没有核。就某方面来讲,原核生物的前缀“原”(pro-)这个字,其实带有价值判断的味道,因为等于宣称原核细胞的出现早于真核细胞。虽然我认为这很有可能是真的,不过有少数科学家并不同意。不管细胞核是在何时进化出来的,它都是用来判断真核细胞的最重要特征之一。然而如果我们不了解细胞核为何以及如何出现,还有为什么细菌从来就没有发展出细胞核,那就不可能解释它们的进化过程。

细胞核是细胞的“指挥中心”,里面装满了DNA,也就是基因的物质基础。除了核本身以外,真核细胞的遗传物质还有几个方面与细菌不同。真核细胞并不像细菌一样有一条环状的染色体。它们的染色体形状笔直,还有好几条,而且经常成双结对。基因本身的排列法也不一样,细菌的基因连成一长串如同念珠一般,真核细胞的基因则常常被切分成好几个片段,中间塞满了许多段长长的非编码DNA序列。不知为何,我们这些真核细胞的基因总是这样“支离破碎”。最后,我们的基因并不像细菌那样“**在外”,它们以奇妙的方式与蛋白质缠绕在一起,有点像现在礼品塑料包装一样,因此不易受到损害。

图4.1 简单的原核细胞如细菌(左),与复杂的真核细胞(右)之间的差异。真核细胞内有许多“家具”,比如细胞核、细胞器和内膜系统。本图并没有依照真实比例绘制,真核细胞的体积平均来说是细菌的1万~10万倍。

除了细胞核之外,真核细胞和原核细胞也像来自完全不同的世界(见图4.1)。真核细胞通常远大于细菌,平均来说体积是细菌的1万~10万倍。再者它们里面塞满了东西,有叠成堆的膜状构造,有大量密封的囊泡,还有机动性极高的细胞骨架,可以用来维持细胞的结构,也可以随时分解然后重新组装,让细胞可以改变形状或移动。或许其中最重要的就属细胞器了,这些微小的器官在细胞中各司其职,就好像身体里的肾脏或肝脏也都各有任务。细胞器中最重要的当属线粒体,又被称为细胞的“发电厂”,因为它会产生ATP形式的能量。一个典型的真核细胞常带有数百个线粒体,不过有一些细胞可携带多至10万个。线粒体曾是独立生活的细菌,它被细胞捕获之后产生的影响将占本章的大量篇幅。

上面讲的都只是外形的差异而已。真核细胞在行为上也一样引人注目,而且和细菌大不相同。可以说除了少数的例外,几乎所有的真核细胞都有**。首先它们会产生**和卵子之类的生殖细胞,再重新结合成一个细胞,其中一半的基因来自父亲,一半的基因来自母亲(有关内容会在下一章详细讨论)。所有的真核细胞在分裂的时候,染色体都像在跳一支迷人的加沃特舞曲,先两两配对,之后成对排列在微管组成的纺锤体上,然后各自往细胞的两极退场,弯曲的样子像在鞠躬致礼。关于真核细胞的怪异行为清单还可以一直列下去,不过在这里我只想提最后一个,那就是吞噬作用,也就是一个细胞把其他细胞吞到体内然后消化掉的能力。虽然有少数几种生物已经遗忘了这种能力,比如真菌和植物细胞,但是这个特征似乎非常古老。举例来说,虽然大部分的动物和植物细胞并不会四处巡回狼吞虎咽,但是当免疫细胞遇到细菌时,会用和变形虫一样的方式把细菌吃掉。

上述特征和所有的真核细胞都密切相关,不管是动物细胞、植物细胞或变形虫。当然这些细胞彼此之间还是有些许差异,但这些差异和它们的共同点一比,就显得微不足道。比如说,大部分的植物细胞都有进行光合作用的叶绿体。叶绿体和线粒体一样,很久以前曾经是独立生活的细菌(叶绿体过去曾经是蓝细菌),在偶然的机会下被所有植物和藻类的共祖完整地吞到肚里。不知为何,这个共祖没有办法把蓝细菌消化掉,结果这位消化不良的患者反而变成了只需阳光、水和二氧化碳就可以自给自足的细胞。因为这一口,引发了一连串的事件,最后导致静态的植物世界与动态的动物世界从此分道扬镳。然而细看植物细胞,你会发现这只不过是它与其他细胞成千上万个共同点之外的少数差异之一。我们还可以再讲几个差异。植物和真菌后来在外面建造了细胞壁,让整体结构强化,有些细胞还有液泡等细胞器。然而所有这些真核细胞间的差异其实都无关紧要,和细菌与真核细胞之间的天壤之别一比,就显得不足挂齿。

但是这个所谓的天壤之别说起来又十分作弄人,因为它亦真亦假。在我们讨论的所有特征中,真核细胞和细菌之间还是有一些模糊地带。有一些非常巨大的细菌,也有很多很小的真核细胞,它们的尺寸有重叠。细菌的细胞壁也有内部细胞骨架,而且组成骨架的纤维和真核细胞的非常相似,而且有时甚至也有机动性。也有一些细菌有棒状(而非环状)的染色体,有一些有类似细胞核的结构,有些内部有膜状结构。有些细菌没有细胞壁,或至少在某些阶段没有。有些细菌可以组成结构十分复杂的菌落,对于那些细菌的拥护者来说,这很有可能是多细胞生物的前身。甚至有一两个例子指出,有的细菌体内含有另一个更小的细菌。这真是让人费解,因为在现今已知的细菌中,没有一种可以通过吞噬作用吃掉其他细胞。我个人认为,细菌曾经尝试过往真核细胞的方向发展,但是因为某个不明原因,很快就停止了,最终它们无法继续发展下去。

你当然可以认为,重叠和连续其实是同一件事,所以没有什么需要解释的。如果在这条连续进化之路的一端是极度简单的细菌,另一端是极度复杂的真核细胞,那就会有一连串的中间产物。就某方面来说,没错,但我认为这种看法存在误导的可能。确实,这两条路有某种程度的重叠,但是这仍是两条分开的路。其中一条属于细菌,从“极度简单”走到“有限复杂”然后就断了。而另一条路属于真核细胞,明显成长了许多,从“有限复杂”到“吓死人的复杂”。是的,这两条路有些重叠,但是细菌从来没有像真核细胞那样走这么远,只有真核细胞走了很远很远。

历史清楚地显示了这种差异。地球上出现生命的最初30亿年间(从40亿年前到10亿年前),细菌主宰一切。它们彻底改造了居住环境,但它们自身却很少改变。细菌改变环境的幅度大到让人咋舌,连现代人类都难以望其项背。比如说,所有空气中的氧气都由光合作用产生,这可全是在早期由蓝细菌一手包办的。大约在22亿年前发生的“大氧化事件”,让空气与阳光照耀的海面都充满了氧气,彻底且永久地改变了地球,但这些改变几乎没有影响到细菌。那次事件仅仅改变了生态系统,也就是让好氧菌出头而已。就算一种细菌变得比另一种更适宜生存,但它们还是彻头彻尾的细菌。其他所有值得书写的历史事件也是一样,比如细菌曾经让海底充满让人窒息的硫化氢长达20亿年之久,但它们本身还是细菌。又比如说细菌让大气中的甲烷氧化沉淀,导致全球降温,最后造成第一次雪球地球事件,但是细菌还是细菌。在所有事件里面改变最大的,或许是由真核细胞所组成的多细胞生物造成的,那大概发生在6亿多年前。真核细胞生物给细菌提供了一些新的生活方式,比如让细菌可以通过在真核细胞生物间传染生活。但尽管如此,细菌还是细菌。再也没有什么东西比细菌还要保守了。

从那以后,历史由真核细胞来书写。这是史上第一次开始发生一连串的新事件,而不再是恒久的了无新意。甚至有些时候事情发生得快得离谱。比如说寒武纪大爆发,就是一件典型的真核细胞事件。这是众人等待的一刻,也是地质学上重要的一刻,持续了大约几百万年。史上第一次有大型动物实实在在地留下具体的化石记录,而不再是试探性地露个脸,或只是虫子蠕行的痕迹。各种奇形怪虫明目张胆公然亮相走秀,其中有些怪虫出现得如此之快,却又转瞬消失。好像哪位发了失心疯的创造者,有一天忽然醒来,决定立即开工,着手弥补以往流失的时光。

学界称这种爆炸现象为“辐射”,就是一种特定形态的原型生物不知何故开始繁衍,短暂地进入一段毫无羁绊的进化时光。各种新式生物不断以原型为圆心往各种方向进化,就好像自行车轮的辐条一般。寒武纪大爆发当然是最为知名的一次事件,但是还有很多其他的例子,比如生物登上陆地开始繁衍、开花植物的出现、草原的蔓延、哺乳动物的多样性发展等,种类繁多,写也写不完。每当有前途的基因遇到环境中的机遇时,似乎必定会出现这种现象,就像每次大灭绝之后必定会出现复苏时期。不论原因为何,这种壮观的辐射现象,可是百分之百由真核生物造成的。每一次都只有真核生物旺盛繁衍,而细菌自始至终都还是细菌。有时候不得不承认,我们极为重视,并试图在宇宙其他角落寻找生命的特质——人类智慧与知觉,似乎不可能由细菌产生。至少在地球上,这些特质是真核生物独有的。

这两者的差异非常明显,尽管细菌拥有种种让我们真核生物汗颜的生物化学反应机制,但它们的潜力完全局限在微小的外形中。它们几乎不可能发展出随处可见的奇迹,比如蜂鸟或木槿花之类的东西。而简单细菌过渡为复杂真核细胞,恐怕也是我们星球上最为重要的转变了。

达尔文并不太喜欢断层。因为自然选择的基本概念是一系列渐进的变化,一点一点改良个体。这也就是说,理论上我们应该可以找到更多的中间过渡形态。达尔文在他的《物种起源》里面提到了这个问题,根据他的定义,所有现在所见“进化终点”的生物都会比过去任何过渡阶段的生物适应性更强。根据自然选择,比较差劲的形态会输给较佳的竞争者。显然,翅膀发育良好的小鸟能顺利飞翔,应该会比其他只能勉强用笨拙“残肢”的同类过得舒服。就好像新的计算机软件会慢慢取代旧的版本。你还记得上次看到Windows 286或386系统(指微软在1988年出的Windows 2.1系统软件)是什么时候吗?这些系统软件过去都是了不起的产品,就好像原型翅膀与其他同时代产物相比较一样。然而随着时间推移,旧的系统软件渐渐消失退出历史舞台,仿佛现在的软件(就说Windows XP好了[1])出现之前是一大段空白。虽然我们都知道Windows系统随着时间在改进,但是如果只看正在使用的系统软件,恐怕很难证明这点,除非偶尔在仓库里找到一些已经报废了的老古董计算机。对于生命来说也是如此,如果我们想证明渐进进化是存在的,那一定要细细分析化石记录,要细细分析那段改变发生时期的记录。

化石记录当然还有很多漏洞,但是已知的中间型化石远多于那些宗教狂热者愿意承认的。在达尔文写书的年代,人类和人猿之间确实有一段“缺失的环节”,那时候还没有找到带有中间型特征的人科化石。但是半个世纪过去了,人类考古学家已经找到很多化石,每一个特征都正如预测,刚好落在进化该有的位置上,不管是脑容量或步态。现在的数据不是不够,而是多到让人犯难。我们不知道在众多化石中到底哪一个(如果在其中的话)才是人类的直系祖先,而哪一些又毫无理由地凭空消失了。因为我们尚未找到答案,所以一直会听到有人大声宣称缺失的环节从来没有被找到。这显然严重违背了真理与事实。

不过身为一个生物化学家,对我来说,化石虽然漂亮却容易让人迷失。因为形成化石的过程罕见且充满不确定性,同时无可避免地对那些躯体柔软的生物不利,比如水母,以及生活在旱地的动物与植物。理论上,化石不可能完整地保存过去。如果它们真的保存了所有的记录,我们反而会觉得是场骗局。在偶然的机会下,万一有化石真的保存了完整的历史记录,那科学家会高兴得像挖到宝一样,这可是需要一连串多如繁星的事件,奇迹似的彼此配合才能办到。但是再高兴,化石证据也只是用来验证自然选择的证据之一。而其他重要的证据其实一直在我们手中,在这个遗传学的时代,它们就存在于基因序列里。

基因序列保存了比化石更多的关于自然选择的证据。随便挑一段基因来看,它的序列是一长串的字母,字母顺序编码了构成蛋白质的氨基酸序列。一个蛋白质通常由好几百个氨基酸组成,其中每一个氨基酸都由DNA序列的三联密码编码(请见第二章)。我们前面说过,真核细胞的基因里经常夹杂着大段大段的非编码DNA序列,把可编码的序列切割成许多小片段。两者相加,一个基因序列会有好几千个字母。生物都有好几万个基因,每个基因都这样组成。整体来说,基因组是一长条写满了亿万个字母的缎带,而这些字母的顺序,可以告诉我们缎带主人数不尽的进化故事。

从细菌到人类,都可以找到某些相同的基因编码相同的蛋白质,它们做着相同的工作。在进化的漫长历史中,基因序列如果发生有害突变,就会被自然选择剔除。这会造成一种结果,就是让相同基因的相同位置,尽量保持相同的字母。从实用的观点来看,这让我们可以辨识出不同生物体内的相关基因,尽管这些生物可能在不知道多久以前就分家了。不过根据经验,一个基因的数千个字母里面往往只有一小部分是真正的关键,其他部分则因为影响较小,允许有一定改动而不至于被剔除,随着时间流逝,这些突变也会累积下来。时间越久累积越多,两个基因序列间的差异就越大。刚从同一个共祖分家出来的两个物种,比如说黑猩猩和人类,就有非常多的基因序列一模一样。而共祖比较久远的物种,比如说黄水仙和人类,相同的基因序列就相对较少。其实和语言的变迁很像,语言也会随着时间与人类迁移而改变,慢慢地失去与共祖的相似性,但是在某些地方还是会不经意地流露出彼此曾有的关联。

基因树就是根据不同物种基因序列之间的差异来绘制的。虽然说基因突变的累积有一定程度的随机性,不过在对比基因中数千个字母时,这种随机性会被平均掉,最后可以得到亲缘关系的统计概率。单单比对一个基因,我们就可以建立起所有真核生物的谱系树,而且它的准确度是以前的化石猎人一辈子都不敢想象的。如果你对这个谱系树有任何怀疑,那只要再找第二个基因重复一次,看看结果是否相同就行了。所有真核生物共有的基因,没有数千也有数百个,所以科学家可以一再重复同样的比对,一次又一次把新算出来的谱系树重叠在旧的上面。借助现代计算机的威力,最后我们可以画出一棵“一致的”谱系树,显示出所有真核生物之间最可能的亲缘关系。该方法和研究化石断层有很大的差异。它可以清楚地告诉我们,人类和植物、真菌、藻类等生物到底有多少差异(见图4.2)。达尔文对于基因当然是一无所知,但是今天却靠着基因,才能够弭平达尔文世界观中各种讨人厌的断层。

图4.2 一棵典型的生命树,显示所有真核生物与原始共祖之间的差异与距离,这个共祖很可能是活在10亿年前的真核单细胞生物。越长的树枝代表着越长的进化距离,也就表示两者之间的基因序列差异越大。

不过方法虽然好,却也不是万无一失。麻烦主要来自统计学度量久远时光时出现的误差问题。简单来说因为DNA只有四个字母,而突变(至少此处指对我们来说有用的那种突变)会把原来的字母换成另一个字母。如果每个字母都只突变一次,那就没有问题,但不巧的是,在漫长的时光中,每个字母都会突变很多次。既然每次突变就像抽奖一样,我们其实并不知道这个字母是被换了五次还是十次。如果基因中一个字母和共祖一样,我们其实不会知道这个字母是从来就没突变过,还是已经突变了很多次,而每次都有25%的机会换回原来的字母。因为这种比对分析法的基础是统计概率问题,到了某个时间点我们将无法分辨出任何差异。更不巧的是,好像屋漏逢连夜雨,这个即将溺毙我们的统计不确定性模糊的时间点,差不多就是真核细胞出现的时刻。原核细胞过渡到真核细胞的关键时刻,就这样被一波波基因的不确定浪潮所淹没。唯一的解决之道,就是要用更细致的统计筛子,慎选比对所用的基因。

真核细胞体内的基因大致分为两大类:一类和细菌一样,另一类则归真核细胞独有,也就是在细菌世界中尚未发现类似的基因。[2]这些独特的基因被我们称为“真核标志基因”,而它们的来源则是现在生物学家激烈争执的源头。有些人主张这些基因证明真核生物的历史和细菌一样古老到令人刮目相看。他们认为真核细胞之所以有这么多独特的基因,一定是因为它们早在盘古开天辟地以来就和细菌分家了。但是假设它们分异的速率不变(也就是说如果突变像一座分子时钟一样嘀嗒嘀嗒地以稳定的速率发生的话),那么根据现在这些基因差异的程度来看,我们应该相信真核细胞在50亿年前就出现了,也就是比地球的出现还要早近4亿年。借用英国擅长揭丑的讽刺杂志《第三只眼》所说的挖苦名言:其中必有错误吧。(“Shurely shome mishtake”,最初由该杂志模仿醉酒的编辑所创造的句子,故意拼写错误,原是“surely some mistake”意为“肯定有些错误”。)

其他人则认为,既然我们不可能知道基因过去进化得有多快,也没理由相信基因分异的速率会像时钟般稳定发生,那真核标志基因根本无法告诉我们多少真核细胞进化来源的信息,况且我们确实也知道某些基因进化的速度快过其他基因。用分子时钟去测量遥远的过去得到如此奇怪的结果,意味着两种可能:要么生命是从外太空播种到地球上的(但对我来说这不过是个借口而已),要么就是这个分子时钟坏了。可是为什么这个时钟会错得如此离谱呢?因为事实上,基因进化的速率受很多因素影响,不同生物的基因进化速率也不一样。比如之前我们讲过,细菌本身就非常保守,它们永远都是细菌,但是真核细胞则倾向发生剧烈的改变,会造成如寒武纪大爆发之类的事件。不过从基因的观点来看,大概没有什么事件会比形成真核细胞本身更剧烈了,我们有理由相信真核细胞在早期进化的日子里,基因改变的速度必定非常惊人。如果如大部分学者所想,真核细胞出现于细菌之后,那它们的基因应该与细菌差异很大,因为它们曾进化得非常快速,不断地突变、结合、复制然后再突变。

那么由于真核标志基因发展得太快,快到把它们的源头淹没在遥远的时间之雾里,已经无法再告诉我们什么。那么另外一类基因呢?那些和细菌共有的基因呢?现在这些基因就显得有用多了,我们可以比对它们的相似性。真核细胞和细菌共有的基因所负责的,往往都是细胞的核心程序,比如说核心代谢反应(产生能量的方式,或用来制造构成细胞的基本材料,如氨基酸和脂质等),或者是核心信息处理方式(比如读取DNA序列然后转录成有用蛋白质的方式)。这些核心程序进化的速度往往比较缓慢,太多东西都依赖它们。制造蛋白质程序的任何一点点改变就会改变所有的蛋白质,而不止是一两个。同样,稍微改变一点点产生能量的方式,就可能干扰整个细胞的运作。因为篡改核心程序比较容易受到自然选择的惩罚,所以这些基因进化缓慢,让我们可以有机会细细分析进化的痕迹。利用这类基因建立的生命树,理论上来说应该可以显示出真核细胞与细菌之间的关联。它们应该可以指出真核细胞来自哪些细菌,搞不好还可以告诉我们为什么。

美国的微生物学家卡尔·乌斯(Carl Woese)在20世纪70年代末首先完成了这种生命树。乌斯选择了一个负责细胞核心信息处理的基因,具体来说,他选择的是编码核糖体的部分基因,而核糖体正是帮细胞合成蛋白质的细胞器。因为某种技术上的原因,乌斯并没有直接比对这个基因,而是用了这个基因转录出来的RNA序列(叫作核糖体RNA或rRNA),一被转录出来就会马上嵌进核糖体。乌斯从许多细菌和真核细胞中把这些rRNA分离出来,判读它们的序列,然后互相比对建立起一棵树。实验的结果非常惊人,直接挑战了传统学界对于生命分类方式的看法。

乌斯发现,我们地球上的所有生命可以大致分为三大类,或者称为三域(见图4.3)。如大家所预期的,第一大类就是细菌(属于细菌域),而第二大类是真核细胞(真核生物域)。但是剩下的第三大类,如今称为古细菌的(属于古菌域),不知从哪里冒出来登上世界舞台。虽然距离人类发现少量的古细菌已过去近一个世纪,但在乌斯提出他的生命树模型之前,古细菌一直被认为只是属于细菌的一个小分支而已。但在乌斯看来,这些古细菌和真核细胞一样重要,尽管在外形上它们看起来和细菌一模一样。它们体积极小,通常外围都有细胞壁,缺乏细胞核,细胞质里面也一样乏善可陈。同时古细菌从来就不会聚集成结构复杂的菌落,你绝不可能把它们和多细胞生物搞混。对很多人来说,抬高古细菌的身价,等同于藐视我们所属的生命世界,等于把植物、动物、真菌、藻类和原虫等各式各样的生物挤到无足轻重的角落去,而让原核生物占据生命树的大部分位置,如此重组世界未免太过鲁莽。这等于乌斯要我们相信,动物和植物之间的种种明显差异,相较于细菌与古细菌中间那道看不见的鸿沟,其实轻如鸿毛。该主张激怒了当时许多德高望重的生物学家,比如恩斯特·迈尔(Ernst Mayr)和琳恩·马古利斯(Lynn Margulis)等人。多年后《科学》杂志回顾了这场激烈交锋,写文评价乌斯是“微生物界的疤面革命先锋”。

图4.3 由 rRNA为基础绘制的生命树。乌斯根据它将生命分成三大域:细菌域、古菌域与真核细胞(真核生物域)。

如今风暴过去之后,大部分的科学家都渐渐接受了乌斯的生命树,或者至少认可了古细菌的重要性。从生物化学的角度来看,不管在哪方面古细菌和细菌都大相径庭。首先,组成两者细胞膜的脂质不同,而且是由两套不同的酶系统制造的。古细菌的细胞壁成分和细菌的完全不一样,体内的生物化学代谢过程也相去甚远。另外我们在第二章曾说过,这两种细菌控制DNA复制的基因也没有太大的关联。如今全基因组分析技术已如家常便饭,因此我们知道古细菌只有不到三分之一的基因和细菌一样,剩下的全都特立独行。总结来说,乌斯碰巧用RNA建立的基因树,凸显了古细菌与细菌之间一系列的生物化学差异。尽管这些差异从外表来看是如此低调不引人注意,但所有证据加起来都支持乌斯大胆的分类主张。

乌斯的生命树所带来的第二个意料之外的发现,则是真核生物与古细菌之间的密切关联。它们两者有相同的祖先,和细菌关系较远(见图4.3)。换句话说,古细菌与真核细胞本来有一个共祖,且很早以前就和细菌分家了,之后才各自形成现在的古细菌与真核细胞。而生物化学上的证据,至少在十分重要的几个方面,支持乌斯的这项结论。特别是古细菌与真核细胞的核心信息处理方式有许多相似之处。两者的DNA都缠绕在相似的蛋白质(组蛋白)上面,基因复制与读取的方式也很相近,而制造蛋白质的整套机制也无分别。这一切的细节,都和细菌十分不同,所以从某些方面来看,古细菌填补了一些缺失的环节,它们横跨了真核细胞与细菌之间的那道鸿沟。大体来说,古细菌在外表和行为上和细菌一样,不过在处理蛋白质与DNA的方式上,开始有一些真核生物的特色了。

然而乌斯的生命树有个问题,它是依照单一基因绘制,无法与其他的基因树重叠以达到统计上的效力。只有相信一个基因可以确实反映真核细胞的遗传与起源的情况下,我们才能采用单一基因来绘制生命树。而要验证这点唯一的办法,就是去比对其他进化速度一样缓慢的基因,看看它们是不是也显示出相同的生命树分支结构。但是当我们这么做了之后,结果却让人十分困惑。如果我们只使用三者共有的基因(也就是在细菌、古细菌和真核生物三域里都可以找到的基因),那么建立的生命树很清楚地显示出细菌与古细菌的关系,但是真核细胞却不行,真核细胞混杂的程度让人完全摸不着头脑。我们细胞中有些基因似乎来自古细菌,其他的似乎来自细菌。最近一次大规模的分析,收集了165种不同种的生物,结合了5700个基因分析比对,绘制出了一株“超级生命树”。然而科学家发现,研究越多基因,越发现真核细胞并非遵循传统达尔文式进化,反而比较像通过某种庞大的基因融合而进化。从遗传学的观点来看,第一个真核细胞应该是个“嵌合体”,也就是半个真细菌、半个古细菌。

根据达尔文的观点,生命是经由慢慢累积的一连串变异,渐渐变得多元,而每一分支也因此与它们共同祖先渐渐分道扬镳,最终会形成一株繁茂的生命树。所以生命树无疑最适合用来描绘我们可见的众多生物进化过程,特别是大部分大型的真核生物。然而反过来看,生命树明显不是用来描绘微生物进化最好的方式,不管是古细菌、真细菌或真核细胞。

有两个过程总是会干扰达尔文式的基因树,那就是“水平基因转移”与“全基因组融合”。对于微生物系统分类学者来说,在试图建立细菌与古细菌之间的亲缘关系时,频繁发生的水平基因转移总是让人沮丧。这个复杂术语的意思,简单来说就是基因被传来传去,像钞票一样由一个细菌传给另一个。这样会造成一种结果,那就是一个细菌传给后代的基因组,可能与它的亲代一样,也可能不一样。有些基因倾向“垂直”遗传,一代传给下一代,像乌斯使用的rRNA。但是也有很多基因会被大家换来换去,而且常发生在毫无关联的微生物间。[3]因此最后描绘出来的图像往往会介于树状与网状之间,根据某些核心基因(如rRNA)可以画出树形图,但是用其他的基因则会画出网状图。有没有任何一群核心基因从来没有被水平基因转移传来传去过?该问题一直让众人争执不休。如果没有这样一群基因,那么想追溯真核细胞的祖先到某几群特定原核细胞的想法,无异缘木求鱼。这样一群基因必须一直通过直系继承,而不会被随机传来传去,才有可能被当成历史身份的标记。但是反过来说,如果只有一小群核心基因从来没有被传来传去,而所有其他基因都被传来传去,那这小群基因又怎么能代表身份呢?如果大肠菌有99%的基因都被随机置换掉,那它还是大肠菌吗?[4]

基因组融合也带来了类似问题,它让达尔文式的生命树走回头路,不但不发散,反而开始收敛。这样一来问题就变成了到底哪两位(或更多)父母的基因才代表进化路径。如果我们只追踪rRNA的话,那确实会得到一株达尔文式的生命树,然而如果考虑更多的基因,或把整个基因组都算进去,那会得到一个环状树,它的树杈一开始发散出去,但是后来则会收敛,最后合并在一起(见图4.4)。

图4.4 这就是生命之环,最早的生命共祖在底部,然后分开形成代表细菌的左边,与代表古细菌的右边,最后两枝再合而为一形成上方的真核细胞嵌合体。

真核细胞是一个嵌合体,这点毫无疑问。现在的问题是,典型的达尔文式进化有多重要,猛烈的基因融合又有多重要,或者换个方式来问,真核细胞的所有特质里,有多少是经由母细胞一点一点进化得到的,又有多少是在基因融合发生之后才诞生的?过去几十年来,科学家提出各式各样关于真核细胞起源的理论,范围从天马行空的(如果你不想称之为捏造的话)到利用生物化学证据一点点推理的都有,但至今无一被证实。所有的理论都可以归为两大类,一类强调达尔文式的渐渐分散进化,另一类强调剧烈的基因融合。事实上,这两大类理论恰好反映了生物学早期两派激烈的争执,一派强调进化是经由一连串渐进式的改变而来;另一派则强调一段长期而稳定的静止或平衡,会被突如其来的巨变打断继而进化。以前有人曾经揶揄这两派进化论:奴才进化论对上笨蛋进化论[5]〔 evolution by creeps(谄媚奉承的人;缓慢)versus evolution by jerks(傻瓜;快进),可以意指“缓慢的进化对上急变的进化”或“奴才进化论对上笨蛋进化论”〕。

而在真核细胞的起源上,诺贝尔奖得主克里斯蒂安·德·杜维称这两派为“原始吞噬细胞”假说与“命运邂逅”假说。原始吞噬细胞假说在概念上是达尔文式的,牛津大学的汤姆·卡瓦利埃-史密斯(Tom Cavalier-Smith)与杜维本人都支持这种假说。该假说的基本原则就是,真核细胞的祖先会慢慢累积各种现代真核细胞的特质,这些特质包括细胞核、性行为、细胞骨架,以及最重要的一项,吞噬能力,让细胞可以四处漫游,改变形状吞噬其他细胞然后在体内慢慢消化。原始吞噬细胞和现代真核细胞唯一不同的,就是它缺少线粒体这个利用氧气来产生能源的小器官。我们假设原始吞噬细胞依赖发酵作用产生的能量生存,当然发酵作用的效率很差。

但对于一个吞噬细胞来说,吞掉线粒体的祖先也不过就是日常工作的一部分。可不是吗?难道还有更简单的办法让一个细胞进入另一个细胞?这种结合一定会为原始吞噬细胞带来巨大利益,因为它彻底改变了吞噬细胞产生能源的方式,但是对外表却没有太大的影响。在吞掉线粒体以前,它已经是吞噬细胞,在吞掉之后还是,只不过拥有更多能源。但是,这种结合也会让许多基因从这个被奴役的线粒体传到宿主细胞的细胞核里,然后和宿主基因融合在一起,造成现代真核细胞的基因组看起来像嵌合体。线粒体的基因在本质上是细菌,所以支持原始吞噬细胞假说的人,并不反对现代真核细胞其实是嵌合体这件事,但是他们坚持认为曾有一个非嵌合的吞噬细胞,一个原生的原始真核细胞成为了线粒体的宿主。

时光拉回20世纪80年代,那时候卡瓦利埃-史密斯强调有上千种看起来十分原始的单细胞真核生物,它们都没有线粒体。他认为,这里面或许有少数几种,从远古时代真核细胞诞生之初就一直活到现在,它们是那些从来就没有线粒体的原始吞噬细胞的直系后裔。如果是这样,这些细胞的基因应该毫无嵌合迹象,因为它们只会遵循纯达尔文式进化。但是二十几年过去了,研究结果显示,这些真核细胞全部都是嵌合体。就像这些细胞都曾有过线粒体,其中有一些因故遗失了,或者变成了其他东西。所有已知的真核细胞若不是还留有线粒体,就是过去曾经拥有线粒体。如果以前真有缺少线粒体的原始吞噬细胞,那很不幸它们没有留下任何直系子嗣。这并不是说它们不曾存在,只是说目前它们的存在纯属推测。

第二类理论全都可以归入“命运邂逅”的大旗下。这些理论都假设两种或多种原核细胞间有某种程度的协作,最终进化成一个彼此紧密相连的细胞群落——一个嵌合体。但如果一个宿主细胞本身不是吞噬细胞,而是带有细胞壁的古细菌,那最大的问题就是,其他细胞是如何进去的?这一派的支持者,代表者有琳恩·马古利斯和马丁(我们在第一章介绍过他),提出很多种可能。比如马古利斯就指出,某些掠食性细菌可以强行在其他细菌身上打洞穿入(确有实例)。而马丁则主张另一种细胞间互惠代谢式的生活形态,他说,不同细胞之间交换彼此所需的代谢材料。[6]然而在这种情况中还是很难想象,没有吞噬作用的话一个细胞如何能够进入另外一个细胞?马丁举出了两个例子,指出这可以在细菌之间发生(见图4.5)。

命运邂逅假说基本上是非达尔文式的,因为它并非累积一连串的小变异来进化,而主张相对剧烈的结合产生新个体。最关键的部分是,它假设所有真核生物具有的特质都是命运邂逅的结果。这些互相合作的细菌本身是百分之百的原核生物,没有吞噬作用,没有**,没有机动性的细胞骨架,没有细胞核之类的东西。这些特质只有在某些结合之后才会出现,暗示结合过程本身有某些特别之处,可以让结构保守、从不改变的原核细胞,转型成为完全相反的高速拼装车,变成不断变化的真核细胞。

图4.5 生活在其他细菌体内的细菌。许多γ-变形菌(浅灰色)生活在几个β-变形菌(深灰色)体内,然后全部都在同一个真核细胞体内,图中央偏下处布满斑点的地方为真核细胞细胞核。

但是我们怎么有办法检验这两种可能性?之前我们已经提过,靠真核标志基因是办不到的。我们怎么知道这些特质是40亿年前还是20亿年前进化出来的,是在细胞有了线粒体之前还是之后进化出来?即使从原核生物那半边得来的缓慢进化基因也不可靠,依然要看我们选哪一个基因。如果我们采用乌斯的rRNA生命树,那数据就适用于原始吞噬细胞假说。因为在乌斯的生命树模型里,真核细胞与古细菌是“姐妹群”,有一个共同的祖先,它们来自“同样的父母”。也就是说,真核细胞并不是从古细菌进化来的,而是平辈关系。在这个模型里几乎可以确定共祖是某个原核细胞(否则的话只能是所有的古细菌都遗失了它们的细胞核)。但除此之外,其他就没有什么事情是确定的了。至于真核细胞是否在吞入线粒体之前就已经变成原始吞噬细胞,对于这个推测则完全没有基因上的证据。

如果我们选择更多的基因来绘制一株较复杂的生命树,那真核细胞和古细菌之间的平辈关系就不存在了,看起来反而像真核细胞来自古细菌,虽然具体来自哪一株还不清楚。我前面提过的用了5700个基因绘出超级生命树的研究,是现今最大规模的研究,结果显示最早的宿主细胞确实是古细菌,或许和现代海底热泉附近的古细菌有密切关联。这意味着最早的宿主细胞很可能是古细菌(也就是原核细胞,没有细胞核、**、活动细胞骨架、吞噬作用等等),那它一定不会是原始吞噬细胞。那命运邂逅假说就一定是对的,真核细胞来自原核细胞形成的联盟。原始吞噬细胞从来就不存在,找不到它存在的证据,反过来就是它不曾存在的证明。

然而到目前为止这也不像最后的答案。事实上,这一切都依赖我们用来分析的菌种和所选择的基因,以及筛选的条件。每次参数一改变,生命树的长相与分支模式就会一起改变,在统计学前提、原核细胞间平行基因转移或其他未知的因素之间打转。这种情况到底会因为有更多数据而好转,或者根本就不是遗传学所能回答的(就像是生物学界的不确定原理,越接近事实就越模糊),大家都还在猜测。但是如果遗传学真的没有办法解决问题,难道我们要永无止境地陷在这种对立科学家互相攻讦的泥沼中吗?一定有别的出路。

所有的真核细胞若不是保留着线粒体,就是曾经拥有线粒体。很有趣的是,所有的线粒体至今都扮演着线粒体的角色,也就是说,在功能上利用氧气来产生能量,同时保有一小部分基因,这一小撮基因是它们的前世记忆,前世中它们还是独立生活的细菌。我认为这一小撮基因其实正藏着真核细胞最深的秘密。

真核细胞在过去20亿年间不断分异,在这段时间内它们都遗失了线粒体基因。总计来说大约有96%~99.9%的线粒体基因都不见了,或许有大部分被转移到细胞核里,不过没有任何一个线粒体,可以丢掉所有的基因而不失去利用氧气的能力。这并不是随机现象。把所有的基因转移到细胞核里,其实非常合理,因为当99.9%的基因在细胞核里都有备份的时候,又何必在细胞各处,同时存放数百个一模一样的基因?而且保有全部基因也代表着,要在每个线粒体里面,都存放读取基因以及把基因转换成蛋白质的整套机器。这种挥霍的行为应该会惹火会计师,而自然选择应该可以算是会计师的始祖守护神。

线粒体其实也不是存放基因的好地方。它经常被称为细胞的发电厂,事实上,这小名非常恰当。线粒体会在膜的两侧产生电位差,利用厚约百万分之几毫米的薄膜,可以生成几乎和闪电一样大的电压,是家用电路的好几千倍。在这个地方存放基因,有如把大英图书馆最最珍贵的书籍放在一座发电厂里。这个缺点并不只是理论推测,事实上,线粒体基因突变的速度确实要比细胞核里的快得多。把酵母菌作为实验模型可证明,线粒体基因突变率快了差不多一万倍。撇开这些细节不管,最重要的是两者(细胞核和线粒体)的基因运作一定要配合得天衣无缝。因为真核细胞要产生高压电,需要这两组基因转译出来的蛋白质。如果它们不能互相配合,那后果将是死亡,不只是细胞死亡,个体也会死亡,所以两者一定要顺利合作一起产生能量。既然合作失败会导致死亡,偏偏线粒体基因突变的速率又比细胞核里的快一万倍,这就让密切合作变成了不可能的任务。而线粒体中还保留的这一小撮基因绝对是真核细胞最罕见的特征。如果把这种现象仅当作一种怪癖而忽略它,就好像教科书都做的那样,就等于对地球上的珠穆朗玛峰视而不见。如果剔除所有的线粒体基因有好处的话,那自然选择毫无疑问会这样筛选,或至少会产生一个这样的物种。但自然没有这样选择,因此这些被保存下来的基因一定有它们的理由。

那线粒体到底为什么要留下部分基因呢?根据艾伦的猜想(在第三章讨论光合作用时,我们介绍过这位充满想象力的科学家),答案就是为了控制呼吸作用。除此以外,别无其他。呼吸对每个人来说都有不同的意义。对一般人来说,呼吸就是吸气吐气。然而对于生物化学家来说,呼吸标示着细胞等级的吸气吐气,代表了一系列细致的生物化学反应,让食物和氧气反应去产生强如闪电的内在高电压。我想不出来还有哪一种自然选择压力会比保有呼吸作用更迫切,从分子角度来看,呼吸作用对于细胞而言也一样重要。使用氰化物这种东西可以阻断细胞的呼吸作用,让细胞停止工作,速度比在头上套塑料袋快多了。不过就算在正常工作的情况下,细胞也要依照细胞的能量需求来微调呼吸作用。艾伦想法中关键的一点就是,用这种微调方式供应能量,细胞需要不间断地做出反应,而这只能通过区域性的基因调节才能做到。就好像战场上把军队调出去之后,就不再由中央政府遥控指挥。同理,细胞核也不适合去指挥细胞中数百个线粒体该工作快点或慢点。

艾伦的想法未经证实,不过有人正在寻找相关证据。如果他是对的,那将有助于解释真核细胞的进化。如果真核细胞真的需要遍布四处的基因来控制呼吸作用,那就是说大而复杂的细胞无法自行调节呼吸作用。现在来想想细菌和古细菌会面临的选择压力,它们两者产生ATP的方式和线粒体一样,也是利用一道薄膜产生电压。不过原核细胞只能利用细胞外膜,可以看作它们是利用皮肤在呼吸,这就限制了细胞的尺寸。为什么会限制尺寸?我们可以用削马铃薯皮作为例子。如果要获得一吨重的马铃薯肉,你一定会挑最大的来削,因为这样才能削最少的皮就得到最多的马铃薯肉。相反,削小号马铃薯则会削出一大堆皮。细菌就像马铃薯一样,它们用皮肤呼吸,长得越大相对皮肤越少,就越难呼吸。[7]

原则上,细菌可以借由向内延伸产生能源的膜来解决呼吸不足的问题,而在某种程度上它们确实这样做了。如同我们前面提过,有些细菌带有内膜,让它们外表看起来像真核细胞。然而细菌没有继续发展下去,就算是一般的真核细胞用来产生能量的内膜,比起最厉害的细菌也要好上几百倍。这如同所有其他的细胞特质一样,细菌有往真核细胞的方向发展的趋势,但是很快就停滞了。为什么呢?我猜这是因为细菌无法控制更大范围的内膜呼吸作用。要这么做的话细菌必须分出好几组基因,如同放在线粒体里的基因一样,这绝对不是件简单的事。所有细菌面临自然选择压力采取的策略,比如快速繁殖、丢掉大部分基因只保留最基本的,都不允许细菌往更复杂的方向发展。

但是这些却正好是成为吞噬细胞的条件。吞噬细胞必须够大才能吞入其他细胞,它需要非常多能量才有办法四处移动,改变形状,吞下猎物。问题就在这里,当细菌变得更大时,它自身消耗越大,也就越无法提供多余的能量用在四处移动与改变形状上。我认为小型细菌很有可能因为其设置更适合快速繁殖,所以在能源竞争上处处赢过大细菌,让大细菌没有充足的时间好好发展各种所需技能,所以最终没有成为吞噬细胞。

不过“命运邂逅”假说就完全是另外一回事了。在此模式中两种原核细胞以互惠互利的方式和谐地生活在一起,为彼此提供所需的服务。自然界中这样的共生关系在原核细胞群里非常常见,更像一般规律而非例外。比较罕见的(但是仍有被报道过的)反而是一个细胞吞下另一个。不过一旦吞进去之后,整个细胞(包含住在里面的细菌)就会一起进化。它们仍然像以前一样各取所需,但是其他多余的功能则会渐渐消失,直到被吞入的细菌最后只为宿主细胞提供某项特定服务。在细菌变成线粒体的例子里,提供的服务就是生产能源。

线粒体带给细胞最大的礼物,同时也是让细胞快速进化的关键,就在于它们带来早已准备好的可以制造能量的内膜,以及整套可以就地调节呼吸作用的基因。只有当细胞装备了线粒体之后,它才可能升级为大而活跃的吞噬细胞,而免于因为过多的能量消耗而畏首畏尾。如果上面的推论都正确,那么缺少线粒体的原始吞噬细胞应该不曾存在,因为没有线粒体就不可能有吞噬作用。[8]两个细菌之间的结盟,可以解除细菌永远只是细菌的禁锢。一旦这道禁锢解除,细菌就可能开启一种全新的生活方式,也就是吞噬作用。真核细胞只进化过一次,正是因为两种原核细胞间的结盟关系,也就是一个细胞进入另一个细胞的结盟方式,实在是太罕见了,这是如假包换的“命运邂逅”。所有现在我们珍视的生命特征,所有世上奇妙美好的万物,其实都源自一次同时包含了偶然与必然的事件。

在本章开始之初我曾提过,只有当我们领悟了用来定义真核细胞的特征——也就是那个细胞核的重要性时,我们才有可能了解或解释真核细胞的起源。现在作为本章的结尾,是时候来谈谈细胞核了。

图4.6 核膜的构造,图中显示核膜会与细胞里其他膜状构造连接在一起(特别是内质网)。核膜就是由这些囊泡结合在一起形成的。核膜在结构上和任何细胞外膜都没有相似处,这表示核膜并不是来自生活在一个细胞里的另一个细胞。

科学家对细胞核的起源,就像对细胞本身的起源一样,也有着各种理论和想象,从最简单的,比如细胞膜上冒出了一个小泡,到复杂的,比如来自一个被吞入的细胞。不过大部分的假设往往在一开始就被摒除了。比如说,大部分的理论首先就与核膜的结构不符。细胞核膜并不像外面的细胞膜那样是一整片连续而平滑,它比较像一堆被压扁的小囊,连接着细胞里面其他的膜状构造,同时上面还布满谜一般的孔洞(见图4.6)。剩下的理论也无法解释为什么细胞有核会比没有核要好。最标准的答案就是细胞核可以“保护”基因,但接下来的问题就是,从谁手里保护?小偷还是强盗?如果说细胞核真的有某些普遍性优势,比如说让基因免于伤害,那为什么细菌从来就没有发展出细胞核呢?而我们已经提过有些细菌也发展出内膜构造,应该可以当作细胞核来用。

既然现在还没有任何确切的证据,我要在这里介绍另一个优秀而充满想象力的假说,这是我们在第二章介绍过的天才双人组——马丁和库宁提出的。他们的假说解释了两个问题,一个是解释了为什么一个嵌合体细胞会需要进化出细胞核,特别是这种一半细菌一半古细菌的嵌合体细胞(我们刚说过这最有可能是真核细胞的始祖)。该假说同时也解释了为什么几乎所有的真核细胞的核里,都塞满了一大堆毫无用处的DNA,而不像细菌那样简洁。我认为我们需要寻找的正是这种想法,尽管它未必正确,但是它确实提出了许多原始真核细胞会面临的问题,而它们一定要想出解决办法才行。他们的假说好似在科学里面加了些魔术,我希望他们是对的。

马丁和库宁思考的,正是真核细胞“支离破碎的基因”这令人费解的结构,可以算是20世纪生物学上最让人惊讶的事情之一。真核细胞的基因不像细菌的基因排列连续又有条理,它们被许多冗长的非编码序列分割成为一小段一小段。这些非编码序列又称为内含子,关于它们的进化历史,长久以来一直困扰着科学家,直到最近才有了新的发现。

虽然各个内含子之间有许多差异,不过现在通过辨认共有序列,我们了解到它们的来源都是某一种跳跃基因,这种基因会疯狂地复制自己,然后感染其他基因组,是一种自私的基因。它们的把戏其实也很简单,当一个跳跃基因被转录成为RNA时(通常是插在其他序列里面被一起读出),它会自动折成特殊的形状,变成RNA剪刀,把自己从长段序列上剪下来,接着以自己为模板,不断地把自己复制成DNA。这些新的DNA序列随后或多或少地会被任意插回基因组,变成自私基因的众多复制品。跳跃基因有很多不同的种类,但都是类似模式的变形。人类基因组计划和其他的大型基因组测序计划,都可以证明这些跳跃基因在进化上的成功实在让人惊叹。人类基因组几乎有一半都是跳跃基因或其衰退的(突变的)残片,总计来说,人类全部的基因里大致有三类自私的跳跃基因,不管是死是活。

就某方面来说,死掉的跳跃基因(就是突变到一定的程度然后完全失去功能,因而无法跳跃)比活着的跳跃基因危害更大。因为活着的跳跃基因至少会把自己从RNA序列上切下来,而不至于造成任何实质上的伤害。而死掉的基因呢?它不会切掉自己,只会阻碍正常程序。如果这段基因不会切掉自己,那宿主细胞就要想办法除去它,不然它会进入蛋白质制造程序,从而引发大灾难。早期真核细胞刚进化出来的时候,确实发明了一些机制来切掉不想要的RNA。这些机制很有趣,细胞其实只是利用跳跃基因自己的RNA剪刀,然后包上一些蛋白质就成了。所有现存的真核生物,从植物到真菌到动物,都在使用这些古老的剪刀,来切掉不想要的非编码RNA序列。因此,现在我们看到了真核细胞里面极为怪异的情况就是,真核细胞的基因组里缀满了自私的跳跃基因制造出来的内含子。每一次细胞读取一个基因的时候,就用从跳跃基因那里偷来的RNA剪刀,把这些不要的片段从RNA序列上剪掉。问题是,这些古老的剪刀速度有些缓慢,而这正是细胞需要细胞核的原因。

原核细胞无法忍受跳跃基因或内含子。原核细胞的基因和制造蛋白质的整套机器之间并没有区隔。在没有核的情况下,制造蛋白质的小机器(核糖体)直接和DNA混杂在一起,基因在被转录成RNA的同时也被转译成蛋白质。问题就是,核糖体转译蛋白质的速度奇快无比,但是RNA剪刀切掉内含子的速度却比它慢,当剪刀正在剪内含子的时候,细菌的核糖体早就制造出好几套因夹杂内含子而功能不良的蛋白质了。细菌如何让自己免受跳跃基因和内含子之害,至今仍不清楚细节(或许是通过整个族群的负选择),但是事实是它们办到了。大部分的细菌几乎都剔除了所有的跳跃基因和内含子,只有少数细菌(包含线粒体的祖先)还带有一些。这些细菌的基因组里面,大概只有三十几个跳跃基因,相较之下真核细胞的基因组里,可是有上千到上百万套乱糟糟的跳跃基因。

真核细胞的嵌合体祖先似乎屈服于来自线粒体的跳跃基因大肆入侵。这样说是因为看起来事情就是如此。真核细胞里的跳跃基因,在结构上和细菌体内发现的少数跳跃基因十分相似。特别是绝大部分真核生物相同基因的内含子,都插在同一个位置,从变形虫到蓟花是如此,从苍蝇、真菌到人类亦是如此。根据推测,这很有可能是早期跳跃基因入侵时,不断地复制自己散布到全基因组中,但是后来因渐渐衰退而死去,结果就在真核细胞共同祖先的基因组里留下了这些固定的内含子。但是为何当初跳跃基因会在早期的真核细胞里造成这种大混乱呢?一个可能的原因是,当初细菌的跳跃基因在古细菌宿主体内四处跳来跳去的时候,古细菌宿主细胞根本无法处理这些东西。另一个原因则可能是早期嵌合体细胞族群还太小,无法像大型细菌族群那样利用负选择来淘汰有问题的个体。