“DNA一致”是错误的

现如今,警察所开展的DNA侦查,被称作“DNA鉴定”。警方会从犯罪现场遗留物品中提取DNA,并将其与嫌疑人的DNA进行比对。

有许多人对DNA鉴定有所误解,它并不是将DNA全部进行比对。简易基因检测在这一点上也一样。可别太惊讶了。新闻当中经常说“DNA一致”,但直截了当地说,这是错误的。准确地说,应该是“核酸序列的部分模式相似度很高”。

当然了,除了同卵多胞胎或是克隆之外,人类所拥有的全部基因信息(见此处的人类基因组内容),也就是31亿个核碱基序列,偶然完全一致的概率低到令人难以置信。

但在眼下,想要分析每个人的人类基因组,在时间和费用上都有很大的难度(现行的主流DNA测序器需要花费10天,费用在7000元左右)。DNA鉴定都是通过几种方法,来研究DNA的核酸序列种类。

人类DNA的核酸序列中的绝大多数都和我们的生命活动没有直接关系。在这些与生命活动无关的核酸序列中,积累着许多突变(绝大多数突变也与维持生命无关)。

突变都是偶然发生的,存在非常大的个体差异。DNA鉴定利用的正是这一点。而突变也会被遗传,因此亲子间的突变会很相似。这也是能够通过DNA进行亲子鉴定的原因。

早期的DNA鉴定,是通过某种限制性核酸内切酶(参见此处)来剪切基因,并比较其模式来进行的。用同样的限制性核酸内切酶来剪切同一个DNA,就能够得到相同的结果(模式)。

DNA和身体每个细胞一样,从同一个人身上获得的样本,无论是分析血液、黏膜、皮肤,还是毛根,结果在理论上都是一致的。这种方法把结果的模式和指纹相比较,被称作DNA指纹法。

指纹也会被应用在刑事侦查中。指纹是能够特定到个人的有力间接证据。虽然有人认为同卵双胞胎会连指纹也相同,不过决定指纹纹路的并不只有基因。

DNA鉴定的机制

也就是说,DNA指纹法需要比较两条近乎完全等长的样本DNA(染色体)。但在刑事侦查中采集的样本大多数并不完整,这就会导致鉴定结果的重现性降低。

近年来所使用的方法被称为“STR法”,通过分析被称作“STR”的数个核酸序列的连续片段(当然对生命活动是没有影响的)来鉴定。STR法和DNA指纹法不同,是着眼于染色体的一部分的方法,即便样本不完整,也能够提高鉴定的成功率。

如果我们看一看2号染色体上的甲状腺过氧化物酶的基因(TPOX)中的内含子(不会被翻译为蛋白质的基因部分),就会发现“AATG”这一段STR,少的人有5个,多的人有14个。

这是因为遗传自父母的TPOX各有10种,可以由此把人类分为100种。如果在可分为100类的STR上仅研究5处,简单计算一下就会有100亿种可能性。

这基本上和通过血型分类是一样的。例如ABO血型有4种,Rh血型有2种,两类血型排列组合之后可以分出8种模式。

STR式的DNA鉴定,是将STR突变排列组合后,对可以用来识别个人的众多模式进行分类,并用于鉴定。日本警察目前使用的DNA鉴定会检查15处STR。每处STR虽然各不相同,不过都在4至30种模式之间。两个不同的人之间15处STR全都一致的概率大概是47,000亿分之一。日本的人口约为1亿2500万人(截至2015年1月1日的数据),日本人中出现STR完全一致的人,理论上只可能是同卵多胞胎(双胞胎或三胞胎)。

最近也有鉴定方法的研究是基于单核苷酸多态性(SNPs)开展的。“STR法”虽然比DNA指纹法更加先进,但如果染色体长度不够,就很难发现鉴定所需的STR片段。而通过SNPs来鉴定,可以把关注点放在更窄区域内的DNA上,针对提取状态不佳的DNA的检测灵敏度也能够提高。但每一处的模式就会减少,这样一来,就必须增加检测的部位。不过SNPs在基因组中存在几百万个,在理论上是没有问题的。

◆DNA鉴定的机制

用限制性核酸内切酶剪切从样本(A—C)中提纯、扩增的DNA,通过电泳将片段按长短顺序排列。相同的DNA就按照相同的模式来排列。上图中的A和B拥有相同的DNA,但C则与A、B不同。

基因位于DNA上,分为外显子(被翻译)和内含子(在加工过程中被剪切掉)。内含子中,存在着无意义的重复序列STR(上图中就是AAGG)。STR的重复数量因人而不同。我们可以通过检测几个有特点的STR来进行身份识别。例如,有10种基因分别可能重复1次到10次,理论上就能够分出100亿个种类。

DNA鉴定的问题

到这里为止,我一直在着重介绍DNA鉴定的优点,但这并不意味着DNA鉴定就不存在任何问题。其中之一,就是在开展鉴定时需要各个STR和SNPs的对象集团数据库。

大家想一想血型的例子应该就能够明白了。A、B、O、AB各种血型的人数占比并不均等,根据国家、民族的不同,占比也不尽相同。而STR法所用的各个STR,虽然一般认为它们的突变是各自独立的,但实际上也可能存在某种关联。这样一来,完全陌生的人之间,STR相同的概率也会提高。

而且概率归根究底也只是概率,虽然可能性只有数万亿分之一,但偶然一致的可能性也是存在的。实际上,在美国的一个几万人规模的数据库中,就已经出现了所有的STR模式全部相同的例子。

希望大家不要误会,就算是STR模式一致,但基因组整体是不同的。也就是说,STR一致只能代表部分模式一致。但在刑事侦查中,却可能因此将两个不同的人判断为同一个人。在这一点上,大家必须理解DNA鉴定并不是绝对的。DNA鉴定不过只是一种间接证据而已(虽然的确是很有力的证据)。

同时,在DNA鉴定中还有一点需要注意,那就是混入现场的目标外的基因。在犯罪现场所发现的细微物证,在鉴定之前是无法判断来自谁的。

尤其是DNA鉴定,需要从这些细微物证中提纯、扩增DNA,如果混入了不该出现的东西,就很可能会导致错误的结果。

有一个很有名的案件可以算作是教训,那就是欧洲的“海尔布隆幽灵杀手”案。事件起源于德国南部的巴登–符腾堡州的海尔布隆市,2007年这里发生了一起恶性犯罪案件。犯人袭击了警车,抢走了手枪,向两名警员开枪射击(其中一名女警死亡,一名男警重伤),之后逃逸。

侦查人员从现场残留的物证中提取出的DNA,居然和以德国为中心的欧洲各国的40起案件中的DNA一致。这些案件从杀人到偷盗、药物交易,类型繁多。甚至在2001年重新对一起1993年的杀人案样本进行分析时,也检测出了相同的DNA。DNA结果显示,它属于一位东欧或是俄罗斯裔的女性——长期在欧洲各国流窜的、潜藏于黑暗中的东欧犯罪组织的女性罪犯。

2009年,德国警察悬赏30万欧元,通缉这位神秘的女性罪犯(按照当时的汇率相当于约300万元人民币)。但更加离奇的是,事情却开始向着谁也没有想到的方向发展。在毫无关系的案件中(潜进学校偷窃的少年、烧死的男性难民),也检测出了这位神秘女性的DNA。

德国当局急忙重新开展调查,终于找出了海尔布隆幽灵杀手的“真面目”——一位来自东欧、在巴伐利亚州一家棉签工厂工作的女工。

当然了,她和什么犯罪组织以及一系列的案件都毫无关系。问题出在了生产棉签的工序上。她所在工厂里,工人们居然直接用手来包装棉签。而各国的警察都使用了这家工厂所生产的棉签来采集DNA鉴定中所需的微小物证。警察们所检测出的DNA,不过是在棉签工厂工作的女工的皮屑。

案件侦查也因此理所当然地从头开始。海尔布隆案件的犯人也在2011年被找到了。犯人因为在抢银行时没能摆脱警察的追捕,便烧车自焚了,警察通过他遗留的物品确定了他的身份。他的共犯之后也投案自首,案件就此落下帷幕。

你的隐私会被侵犯?

我想大家应该已经理解了,目前还不能百分之百信赖DNA侦查,它不过是一种间接证据而已。当然,随着进一步的研究、DNA测序器性能的提高,在我们能够从微小证据中提取的样本上分析出所有的DNA时,刑侦调查也许会进入一个全新的阶段。但到了那时,我们同时也需要采取不同的对策来保护个人隐私和维护社会道德。

举个极端的例子,假设我们将所有公民的基因检测结果登记在案。只要在犯罪现场提取到了DNA,立刻就能够比照出嫌疑人。这种政策如果在日本提出来,肯定会引发轩然大波。可实际上在2015年7月,科威特已经通过了一项法案,要求所有拥有永久居留权的居民都有义务将自己的基因检测数据登记在案。

如果拒绝提供或提供虚假数据,将被处以罚款或监禁。这项对策据说是为了防止恐怖袭击而采取的针对犯罪组织的,但强制推行这项政策的行为,却多少让人感到担忧。

如果必须这样做的话,既然已经拥有了难得的大数据,我还是希望能够将之用在像人类基因组计划这样的为人类健康谋福利的事业上。