虽然细胞核是细胞内最大、最明显的细胞器,但由于细胞核生化成分的分离难度较高,因此针对细胞核内生化过程的研究比细胞质研究更为困难。得益于过去10年间[1]的技术革新,我们现在已经知晓细胞核是细胞中最致密,也可能是最活跃的地方。DNA、RNA的合成以及核糖体的组装涉及了核质间的大量相互作用以及核内容物的持续性重定位活动。接下来,我们将由外而内地对细胞核结构进行阐述。
首先,让我们一起了解一下细胞核与细胞质之间的边界——核被膜。核被膜将细胞核内容物与细胞质间隔开,同时控制着这两部分之间持续而大量的分子交换行为。那么,为什么细菌等原核生物没有细胞核也能以惊人的速度增殖,而真核生物却要给自己制造出这么一个麻烦呢?事实上,就细菌而言,在数量上它们的确是成功的,但本质上细菌也仅有此“一技之长”。尽管繁殖能力很强,同时保留有足够的遗传变异性(从而导致抗药性菌株的不断出现),但作为简单的单细胞生物,细菌已经达到了自己的极限。如果将地球上生命体的数量多寡与是否成功挂钩,那么细菌无疑可以排在首位。然而,就生物的复杂性而言,细菌却是地球上最简单也是最原始的生物。此外,细菌还是地球上最古老的生命体,距今已存在大约40亿年,因此,细菌也为所有后续出现的生命提供了原材料。地球上生物进化的最重要一步是从原核细胞转化为真核细胞,即出现了包含遗传物质且具有独立膜结构的细胞核,这才进一步促成了我们今天所知道的这些生命的增殖与巨大变化的发生。细胞核是如何出现的目前还不清楚,但这可能是小细菌被大细菌吞噬的结果。被吞噬后,较小的细菌“接管”了较大的细菌,或是随着DNA在核膜内的分配而发生内共生(endosymbiosis)。尽管细胞生物学界普遍认为线粒体和叶绿体起源于吞噬作用,但对于细胞核的起源,目前尚无共识。
细胞将其遗传蓝图封存于细胞内的小室中,这一举措促使了单细胞与多细胞真核生物的多样性发展。每个人类个体均可以产生大约15万种不同的蛋白质,但这些蛋白质并非存在于每一个细胞中,而是分布于全身各种组织中。尽管我们只有23 600个基因,但由于基因信息可以在转录(从DNA到RNA的信息传递)后在细胞核内部以及外部(通过添加脂质与糖类等简单的化学结构)进行修改,因此大大增加了我们体内蛋白质的总数量。如进行对比,那么在灵长类**中发现的生殖道支原体可能是最简单的细菌,含有大约500个基因;大肠杆菌作为常见的肠道细菌,含有4300个基因;而最小的流感病毒(需要劫持感染的宿主细胞来完成自我复制)则含有11个基因。
核内容物与细胞质的分离使得真核细胞与原核生物相比,有可能变得更大、更复杂。细菌中的环状DNA分子可以附着在细胞膜内侧的不同位置,并可能遍布于整个细胞。这对于如大肠杆菌一般拥有460万个核苷酸碱基对(携带着遗传密码)的DNA基因组而言是没有问题的。但对于人类细胞,其DNA长度约为大肠杆菌的1000倍。只有DNA集中在细胞核内部时,才能很容易地从31亿个碱基对中找到长度相当于几百个碱基对的特定基因。此外,将DNA束缚于细胞核中还可以避免细胞骨架和细胞质中的细胞器对其潜在的干扰。原核生物则不存在这样的问题,因为原核生物的DNA很短(且为环形结构),并且细胞内几乎不存在任何细胞骨架结构。
核被膜与核孔复合体
核被膜由两种不同的生物膜组成。外核膜由内质网形成,内质网通过核周空间与内核膜相间隔(如图5a所示)。内核膜衬有纤维蛋白网,进而形成一种被称为核纤层的结构。两种核膜与其下的核纤层均被核孔复合体所穿透,除了能够直接穿过核被膜的极小分子,其他物质进出细胞核都受到核孔复合体的控制。在哺乳动物细胞的细胞核表面分布着大约5000个核孔复合体,它由50种蛋白质(核孔蛋白)组成,是细胞内最大的分子机器。核孔连接着内核膜与外核膜,将8种线缆状蛋白投射到细胞质中,同时将另外8种纤维投入细胞核中,形成一个篮筐状结构(如图7d、7e所示)。待入核的分子货物首先附着于核孔外延的纤维上,然后穿过核膜上的通道并从“篮筐”中脱出,进入细胞核中。如果用一个宏观的例子来类比核孔运输行为,大概可以将一个短的排水管比作核孔通道,含有网球、高尔夫球以及弹珠的混合物以每秒1000次的速度在这一排水管中进行双向运输。核膜上的物质流动由核孔蛋白所控制。核孔蛋白封装于核孔通道中,可以对各种分子进行分选,并推动其在正确方向上运输。
图7 细胞核结构
a.一个完整的细胞核切片;b.细胞核表面,通过去除部分被核孔覆盖的核被膜,使得内部染色质得以暴露;c.核仁及去除DNA的细胞核骨架;d.e.分别从细胞核外部及细胞核内部观察核孔;f.含有畸变细胞核的白血病细胞(leukaemia cell)
每个蛋白质货物都由一段氨基酸序列“标记”,这些序列就如同行李标签,可以确保蛋白质到达核膜上的正确位置。若想通过核孔,蛋白质需要与“伴侣蛋白”相连。“伴侣蛋白”包括核输入蛋白与核输出蛋白两种,它们可以随着蛋白质一同穿过核孔。当蛋白质离开孔隙时,“伴侣蛋白”会被切断并重新附着到其他蛋白质上。核糖体由RNA(在细胞核中合成)与蛋白质(在细胞质中合成)组装而成,因此,无论其他核/质交换情况如何,核糖体的组装均会引发高强度的核孔运输行为。海拉细胞每天可以产生约1000万个核糖体,即每分钟产生约7000个。由于每个核糖体中均含有大约80种蛋白,因此,海拉细胞每分钟需要在细胞质中产生约50万个蛋白质。某些疾病与核孔蛋白直接相关。原发性胆汁性肝硬化患者体内会产生攻击核孔蛋白的蛋白质(自身免疫性抗体),这最终导致了肝脏的完全硬化。
虽然核被膜将细胞核与细胞质清晰地分隔开来,但它也将二者通过物理的方式连在一起。一种被称为Nesprin的蛋白被锚定在内核膜上,它可以穿过外核膜与核周空间延伸到细胞质中,并在此处与细胞骨架相连。Nesprin蛋白是细胞中最大的蛋白质之一。这种从细胞核内部延伸到细胞骨架元件(细胞骨架本身又与细胞质膜相连)的分子附着现象,意味着从细胞表面到细胞核之间存在一种潜在的分子间的直接联系。这是一种有趣但至今仍无法完全解释的现象。
核纤层
核纤层最初在电子显微镜下被观察到,呈现出纤维基质状结构,位于内核膜内部。这些蛋白丝可以抵抗拉伸作用并形成“高张力线缆”,同时与细胞骨架中的中间丝密切关联。因此,核纤层可以保护核内容物免受机械应力的影响,并将细胞核锚定在细胞中特定的位置,从而为细胞质中的细胞骨架提供附着位点。一种被称为中心体的结构是细胞主要的微管组织中心,它也是通过附着于核纤层使自身保持在细胞核表面附近。除了机械性功能外,核纤层在核内容物的整体组织中也起着重要的作用,并可对基因调控及遗传信息向细胞质的传递过程产生重要影响。引起核被膜与核纤层受损的基因突变将导致严重的后果,引发的疾病被称为“核被膜相关疾病”或“核纤层相关疾病”,是无法治愈的遗传性疾病,其中包括一些极为罕见的肌营养不良症。因细胞组分功能失调而产生的遗传病相对稀少,可能使它们显得微不足道,但更可能的原因是,机体在合子(zygote)发育早期即识别出缺陷基因的存在,从而使胚胎停止生长。
细胞核的遗传组分
虽然早在17世纪下半叶,安托尼·范·列文虎克(Antonie van Leeuwenhoek)很可能已经发现了细胞核,但直到1831年,一位名为罗伯特·布朗(Robert Brown,曾发现花粉颗粒在水中可进行“布朗运动”)的苏格兰植物学家才正式报道了兰花表皮细胞中存在细胞核这一特殊结构。1879年,沃尔瑟·弗莱明(Walther Flemming)观察到细胞核在细胞分裂时可分裂成小的片段,即染色体。随后,染色体将在子细胞中重新组成新的细胞核。直到1902年,沃尔特·萨顿(Walter Sutton)与西奥多·博佛里(Theodor Boveri)才将染色体与哺乳动物遗传直接联系在一起。20世纪初,托马斯·摩根(Thomas Morgan)通过研究果蝇确定了染色体沿其长度定位的特征。1944年,奥斯瓦尔德·艾弗里(Oswald Avery)证实了细胞内遗传物质是DNA。大约9年后,詹姆斯·沃森(James Watson)与弗朗西斯·克里克(Francis Crick)发现了DNA双螺旋结构,而莫里斯·威尔金斯(Maurice Wilkins)也在此过程中提供了相关证据。因此,他们三人共同获得了1962年诺贝尔奖。在解密DNA结构的过程中,X射线衍射图至为关键。但遗憾的是,该图的作者,来自威尔金斯实验室的罗莎琳德·富兰克林(Rosalind Franklin)于1958年因癌症去世,终年37岁,因此未能获得诺贝尔奖。1953年,沃森与克里克提出了经典的双螺旋模型。当沃森将最后一块DNA拼图拼好之后,突然意识到核苷酸碱基,包括腺嘌呤与胸腺嘧啶,以及鸟嘌呤与胞嘧啶的配对,不仅为DNA的“螺旋梯子”提供了“阶梯”使其连在一起,而且为DNA的精确复制提供密码,以及为蛋白质组装提供了模板。之后,克里克继续研究并阐明了编码蛋白质所需的碱基配对,从而诞生了“DNA产生RNA, RNA产生蛋白质”这一基本“法则”。DNA结构的发现标志着生物学的巨大进步,这可能是继达尔文发表《物种起源》以来最为重要的事件。
我们有许多DNA
如果将人类细胞核中的双链DNA排成单条分子,那么其总长将达到1.5米左右。DNA携带的遗传信息储存于胞嘧啶(C)、鸟嘌呤(G)、腺嘌呤(A)与胸腺嘧啶(T)这四个核苷酸碱基的排列顺序之中。其中每三个碱基编码一个氨基酸(例如TTA编码亮氨酸,TTT编码苯丙氨酸)。一个基因可能需要成百上千个碱基才能产生一个蛋白质。对于储存在DNA上的信息而言,需要200本电话簿才能将30亿个碱基序列印全。然而,人类23 600个基因仅占用了DNA大约2厘米的长度,我们仍不清楚DNA其余98.5%的功能。这些DNA最开始被认为是“无价值”的DNA。“无价值”这个词在某种程度上体现了早期研究者的无知,因此,“非编码”(不编码基因)是一个更合适的描述。由于细胞不太可能在每次分裂时无缘无故地复制超过十分之九的多余DNA,因此我们应考虑这些大量的DNA可能具有未知的功能,而非没有功能。一些非编码DNA对细胞十分重要,与编码区一样,非编码区的DNA损伤也可引起细胞死亡。此外,非编码DNA中还包含有假基因,即不再用于制造蛋白质的序列。这可能是进化过程中积累下来的信息。尽管这些信息可能沉寂了数百万年的时光,但也可以被重新激活并积极地发生转录。几乎可以肯定的是,一些非编码DNA源于细胞遭受感染后与病毒DNA的结合。一旦遭受感染,人体很难完全清除病毒DNA。随着进化的进行,这一部分DNA可以达到相当大的数量,估计可以达到人类基因组的8%。
基因本身具有复杂的结构,其起始端含有一个起始密码子,即启动子,末端含有一个终止密码子,即终止子。在基因的编码序列即外显子(exon)中,存在嵌入其中的非编码序列,即内含子(intron),这些非编码序列在翻译前须被去除。一般来说,如果一个原始的生命体含有某一个特定的基因,那么那些更为复杂的生命体中会含有大量与该特定基因相关的基因,其数量与进化时间密切相关。这表明,随着时间的推移,基因通常会被复制,并进一步实现其序列的进化。
DNA是如何包装的
若想将一条长达1.5米的双链DNA塞进一个直径仅为其三万分之一的球形细胞核中,很显然,DNA必须以一种相当复杂的方式进行包装(packaging)。在包装这样一条长链分子的同时,基因必须易于被其他分子接近,并且整条DNA分子能够被完整复制,如此才能保证DNA能被正确复制,并且传递至每个子细胞中。在细胞分裂的过程中,原本散布在细胞核内无法直接观察到的DNA分子经过卷曲与超螺旋凝缩(condensation)过程形成了清晰可见的染色体,这是我们在遗传学书籍中可以常常看到的图像(如图8c、8d、8e所示)。在染色体凝缩的过程中,核被膜会瓦解,染色体被分配至每个子细胞中(详见第4章内容)。随后,每个子细胞会重新形成细胞核,而在此期间,刚性与棒状的染色体将失去其独立结构特性,重新解体并合并至子细胞的细胞核中。在非分裂时期(间期)中,染色体位于细胞核何处的问题在一个世纪后终于有了答案,这要归功于1969年乔·盖尔(Joe Gall)与玛丽-卢·帕杜(Mary-Lou Pardue)所研发的荧光原位杂交技术。染色体涂染是一种基于荧光原位杂交原理的技术,可通过多个荧光探针识别在间期细胞核内的单条染色体。染色体涂染的结果显示,每条染色体在细胞核内均占据一片独立区域,通常附着于核纤层,所有染色体约占细胞核空间的一半,而其余的空间则被细胞核内其他成分,如核仁与卡哈尔体所填充(详见下文)。细胞核的内容物并非静止不动,而是会通过耗能作用,在长距离或短距离范围内匀速流动。
虽然DNA在原核生物中呈“**”状,但在真核细胞中,它常常与其他分子相结合,并通过一系列步骤完成其包装过程。人类的DNA首先与一组被称为组蛋白的结构蛋白相结合。在包装的第一阶段,8个组蛋白分子将DNA进行两次包裹,呈现出“串珠”状的外观,这一结构被称为核小体(如图8a所示)。随后,相邻的核小体通过与另一种H1组蛋白以锯齿状相互连接,形成了直径为10纳米的纤维。最后,该纤维进一步被扭成直径为30纳米的中空螺线管结构,即染色质。染色质是真核生物DNA经过包装后所形成的标准结构(如图8b所示),可进一步细分为两种形式,分别为异染色质与常染色质。异染色质的包装更为紧密,染色时呈现出较深的颜色,常常分布于细胞核内部边缘区域(如图7a所示)。异染色质中的大多数DNA具有重复了数千次的短核苷酸碱基序列(重复DNA),很可能行使结构功能而非遗传功能,将DNA锚定于细胞核内。与之相反,常染色质的凝缩程度相对较低,染色也相对较浅,但几乎包含了DNA中所有的遗传组分。当间期的染色体在分裂前进行最终的凝缩时,常染色质与异染色质将沿着染色体所在位置形成明暗交替的区块,经染色后呈现出连续的明暗相间的条带模式。这种纵向的条带为我们提供了一个“路线图”——不仅可以将某个基因准确定位于某条染色体上,还可以将其定位于该染色体的特定位置上。在染色体的最终凝缩过程中,染色质将实现进一步环化、折叠、卷曲与超螺旋,从而将总DNA长度大大减小,此时染色体中DNA的包装比将达到10 000∶1(如图8c、8d、8e所示)。我们可以通过以下类比来直观感受一下:染色体DNA的折叠就像把一根横跨足球场长度的跳绳折叠至大约半英寸(1.27厘米)长。最近的研究表明,人类最大的染色体(1号染色体)的DNA有2.46亿个碱基对,其序列的破坏与包括癌症、神经系统疾病和发育异常在内的350多种人类疾病密切相关。
图8 DNA与染色体
a.**的DNA与核小体组成“串珠”结构;b.细胞核内的染色质纤维;c.一组人类染色体(称为核型,karyotype);d.最终凝缩过程中的染色体;e.人体细胞分裂中期的染色体
目前,人类已完成了基因组测序工作,因此可能会有人提出染色体本身变得不那么重要了,毕竟个体的DNA已经可以通过计算机进行分析,并与正常或异常的情况进行对比。但值得注意的是,直到撰写本文的这一刻,地球上仅有7个人的DNA被完整测序。这些人包括DNA解码的先驱克雷格·文特尔(Craig Venter)与詹姆斯·沃森、两名韩国人、一名中国人、一名优鲁巴人(来自尼日利亚部落的一位成员)和一名白血病患者。在2003年,完成第一个人类基因组测序的费用约为5亿美元,而最近一次检测的费用也接近25万美元。为了使测序成为切实可行的诊断程序,其成本需要控制在1000美元以内。随着技术革新,这一目标很可能将在不久的将来得以实现[2]。然而,阻碍基因组应用于医学的主要原因在于癌症、糖尿病或阿尔茨海默病等疾病总是与多种DNA变异相关,因此很难为药物干预或诊断指标提供明确的靶标,从而限制了基于个人基因组的个性化医疗的发展(至少目前仍是如此)。在本书写作时,惠康基金会(Wellcome Foundation)公布了一项计划,拟对包括健康人与罹患不同疾病的人群在内的1000名个体进行基因组测序,这将为我们带来具有统计学意义的对比结果。
核仁
1774年,菲利斯·丰塔纳(Felice Fontana)首次发现了细胞核中的独立小体,将其命名为“核仁”。核仁是细胞核内最大的独立结构,每个细胞核中最多可含有五个核仁。无须进行特殊的染色,通过光学显微镜便可以清楚地观察到核仁结构。核仁由蛋白质与核酸构成。电子显微镜照片显示,核仁具有“三重成分”的内部结构,包括一个纤维状中心、致密纤维成分,以及颗粒成分(如图7c所示)。核仁的主要功能在于生产核糖体,其三组分结构反映了发生在核仁中的三个事件:核糖体RNA的转录(请参阅第4章),核糖体RNA的加工以及核糖体的组装。与这一过程相关的DNA位于人类的五个不同的染色体上,定位在核仁组织区处。这些区域在细胞分裂后将汇聚在一起,形成三个或四个核仁。随后,核糖体基因得以转录,核糖体亚基也被部分组装,准备从细胞核中运送出去。可以说,细胞将基因、转录机器、加工与组装集中在一个位点的行为使其生产速度达到了令人惊叹的水平——处于分裂中的人类细胞可以在一天之内产生1000万个核糖体。因此,核仁本质上就是一个核糖体工厂,其效率甚至让美国汽车大亨亨利·福特(Henry Ford)都羡慕不已。根据核糖体生产的需要,核仁还会对作用于细胞的各种压力做出显著的反应。例如,高温、低温、渗透压、病毒感染、营养缺乏以及多种药物作用均会使核仁结构发生改变。因此,若想得知细胞状态是否健康,应首先对细胞内的核仁结构进行检查。
卡哈尔体、核内小核糖核蛋白体与剪接体
1906年,来自马德里的拉蒙·卡哈尔(Ramony Cajal)与来自帕维亚的卡米洛·高尔基(Camillo Golgi)因在神经系统结构方面的工作成就而共同获得了诺贝尔奖。高尔基曾发现了以他名字命名的细胞结构或复合体,而卡哈尔则在核仁附近发现了致密染色的小体。卡哈尔最初将这一结构称为核仁附属体。之后,由于该结构中的主要蛋白质——coilin蛋白具有卷曲性质,又将其称为缠卷体。1999年,乔·加尔(Joe Gall)建议将这一结构命名为卡哈尔体。卡哈尔体包含了以Gems与Gall这一奇妙名称命名的剪接体与核内小核糖核蛋白体。它们与缠卷体类似,但仅存在于两栖类动物的卵母细胞核中,参与转录后RNA的加工过程。核内小核糖核蛋白体含有小核核糖核蛋白,而剪接体则是RNA剪接的发生位点。在过去的几年中,许多其他核内小体陆续被发现,包括PML体(也称为克雷默体)、斑体(speckle)、旁斑(paraspeckle)以及破碎体(clastosome)等结构,但其生物学功能仍未彻底阐明。
细胞核内部组织架构
新近研究表明,细胞核不单单是DNA的储存库,它与细胞质一样,在内容物与活性方面也呈现出多样化与动态平衡的特点。细胞质通过膜结构划分出不同的细胞器,这有利于常规生化分离与分析工作的进行。与之不同,细胞核中不同成分的鉴定工作较难开展,原因在于其亚组分缺乏“边界”结构。但值得庆幸的是,核仁的高密度特点使其可以通过一种声波探针实现分离。基于此原理,通过邓迪大学的安格斯·拉蒙德(Angus Lamond)领导的一项欧洲合作项目,迄今为止人们已经通过质谱技术鉴定出了大约700种人类的核仁蛋白。
在间期,染色体占据细胞核总体积的一半左右,不同的染色体由染色体间区域间隔开。染色体间区域充满了黏稠的**,即细胞核基质,这与细胞质基质相类似。现在我们知道,除了拥有自己的“结构域”,间期染色质还可以在细胞核内部不停移动。富含基因的染色体(具有更多的常染色质并且携带有大多数活性基因的染色体)往往位于转录活性最高的细胞核中央区域。相应地,缺乏基因的染色体(具有更多异染色质的染色体)则位于更外围靠近核被膜的区域。在核被膜处,核纤层蛋白提供了一个锚定核内容物的完美的纤维网络。因此,如果核纤层出现缺陷,本应锚定在核被膜附近的非活性染色质可能会流入细胞核的转录活性区域,从而导致异常表达的出现,这一现象发生于某些核纤层病(laminopathies)如杜兴氏肌营养不良症等疾病中。
尽管电子显微镜为揭示细胞质运作奥秘提供了大量的信息,但对于细胞核而言,电子显微镜的作用却很小。这是由于核内含物具有紧密包装与纤维化的特性,因此无法利用透射电子显微镜对样品切片中的染色质结构进行观察。此外,由于细胞核体积较大,约为线粒体体积的1000倍,因此在尝试进行任何三维重建工作之前,需要完成20~300张的连续切片,并且每张切片需拍摄约100张图像,而这一要求目前尚无法满足。一些新兴的方法,如选择性删减细胞核某些组分,可以将这一过程简化。当去除DNA与染色质后,我们可以通过扫描电镜观察到细胞核的纤维结构。其中位于细胞核纤维网络中较厚区域的部分被称为细胞核基质骨架(如图7c所示)。由于并非直接观察原始组织,并且在准备过程中大量的生化处理可能会导致新结构(假象)的产生,因此这一方法最初是存在争议的。然而,关于细胞核内部存在纤维支持网络(细胞核骨架)的观点目前已被广泛接受。
[1] 本书原版成书于2011年。
[2] 到2018年,个人基因组测序费用已降至600美元。