我们有许多DNA(1 / 1)

如果将人类细胞核中的双链DNA排成单条分子,那么其总长将达到1.5米左右。DNA携带的遗传信息储存于胞嘧啶(C)、鸟嘌呤(G)、腺嘌呤(A)与胸腺嘧啶(T)这四个核苷酸碱基的排列顺序之中。其中每三个碱基对应编码一个氨基酸(例如TTA编码亮氨酸,而TTT则编码苯丙氨酸)。一个基因可能需要成百上千个碱基才能产生一个蛋白质。对于储存在DNA上的信息而言,需要200本电话簿才能将30亿个碱基序列印全。然而,人类23 600个基因仅占用了DNA大约2厘米的长度,而我们仍不清楚DNA剩余98.5%的功能。这些DNA最开始被认为是“无价值”的DNA。“无价值”这个术语在某种程度上体现了早期研究者的无知,因此,“非编码”(不编码基因)是一个更合适的描述。由于细胞不太可能在每次分裂时无缘无故地复制超过十分之九的多余DNA,因此我们应考虑这些大量的DNA可能具有未知的功能,而非没有功能。一些非编码DNA对细胞十分重要,与编码区一样,非编码区的DNA损伤也可引起细胞死亡。此外,非编码DNA中还包含有假基因,即不再用于制造蛋白质的序列。这可能是进化过程中积累下来的信息。尽管这些信息可能沉寂了数百万年的时光,但也可以被重新激活并积极地发生转录。几乎可以肯定的是,一些非编码DNA源于细胞遭受感染后与病毒DNA的结合。一旦遭受感染,人体很难完全清除病毒DNA。随着进化的进行,这一部分DNA可以达到相当大的数量,估计可以达到人类基因组的8%。

基因本身具有复杂的结构,其起始端含有一个起始密码子,即启动子,末端含有一个终止密码子,即终止子。在基因的编码序列即外显子(exon)中,存在嵌入其中的非编码序列,即内含子(intron),这些非编码序列在翻译前须被去除。一般来说,如果一个原始的生命体含有某一个特定的基因,那么那些更为复杂的生命体中会含有大量该特定基因相关的基因,其数量与进化时间密切相关。这表明,随着时间的推移,基因通常会被复制,并进一步实现其序列的进化。