转录是利用遗传信息产生新的蛋白质的第一步。DNA中的一条链(称为编码链)将作为模板,进而生成一段RNA序列(信使RNA, mRNA)(如图11所示)。这一段信使RNA将在之后作为蛋白质合成的模板。
与DNA复制相类似,RNA的合成也是沿着DNA模板进行的,但这一过程所用到的蛋白酶是RNA聚合酶而非DNA聚合酶。此外,mRNA使用了另一种核苷酸碱基——尿嘧啶(U),而非DNA中的胸腺嘧啶(T)。在新转录的RNA离开细胞核之前,其前端会进行加帽修饰,而其后端也会连上一个尾巴结构。在转录过程中,DNA序列中无法编码蛋白的部分将通过RNA剪接过程除去。之后,新合成的mRNA将被一个蛋白质所标记,进而通过核孔进入细胞质,与核糖体结合并开始形成新的蛋白质。
尽管转录的机制已被阐明,但基因如何被选中进行转录目前仍知之甚少。数十年来,上千位分子生物学家孜孜不倦地对“基因表达”的现象进行研究。研究发现,对于维持细胞良好工作状态所需的基本基因(管家基因)而言,它们可持续地进行表达,而许多其他基因则仅在生物体生长过程中的特定时间才会进行表达。一些基因,例如组成血红蛋白的两种球蛋白,主要来源于红细胞,约占其蛋白含量的90%以上,需求量非常大。此外,细胞还可以通过非常复杂的方式打开或关闭基因,而蛋白质与酶的生产或终止也是细胞响应环境变化的主要方式。我们体内大约有200种不同类型的细胞,它们均具有特殊的功能。这些不同组织中分化的细胞正是不同基因打开或关闭所产生的结果。细胞必须能够快速地通过打开与关闭基因的方式来响应外部变化,这些开关由3000种不同的蛋白质(称为转录因子)所控制。一些基因需要多种转录因子调控,而其他基因则仅需少量转录因子。转录因子位于细胞质中,必须进入细胞核才能与靶基因相接触。细胞快速响应反应需要转录因子可以快速进出核孔,为随时可能到来的“战斗”做好准备。
图11 DNA转录
RNA聚合酶是一种大型蛋白复合体,可在基因起始处与特定位点结合,解开DNA螺旋并复制其中的一条链,以产生互补的RNA链。RNA中的糖分子与DNA不同。其中四个碱基中的三个(A、C、G)相同,而T由U所取代。随着RNA聚合酶沿着DNA移动,模板DNA链将重新形成双螺旋结构