一起强奸案引发了DNA检测软件的种种争议

在1977年圣诞节的两天后,警察发现雪莱·H死在她位于加州长滩的家中。年仅十七岁的她被先奸后杀。她躺在床尾,双脚着地,脖子上缠了一根电线。

在解剖中,对她的阴道进行了清理和取样,但是那个时候还没有DNA检测技术。所以这个样本被储存起来,而这个案子也就这样“冷藏”了三十年。

在2011年,一个私人DNA实验室给当年的样本进行配对,然后找到了名叫马特尔丘波斯的男人,当年他就住在长滩。马特尔的代理人表示,这组DNA是唯一能够将马特尔·丘波斯与受害者雪莱·H联系起来的证据。

而且这些DNA样本特别难读,除了雪莱之外还有其他一个或两个人的基因痕迹。这样的配对正确的可能性有多大? 计算机遗传学的匹斯堡公司的首席执行官,马克·培林博士说他的计算机程序可以把这个准确率计算出来。

在流行文化中,DNA经常被视为一件神奇的证据,它可以找到案件的真正罪犯,释放那些无辜的人。但是在现实生活中则要复杂的多,尤其是在雪莱这样涉及到多人的DNA样本的案子。在过去的十多年中,法医学专家已经发现那些对于“混合样本”的传统解释并不像人们之前想的那样可靠。

律师与遗传学家都表示这件事的问题在于这些公司声称计算机的破解过程是公司机密,所以也就没法验证根据研究结果指出的犯罪嫌疑人是否是真凶。

“这已经是个谜团了”,为丘波斯辩护的律师安格林·盖茨说。安格林现年56岁,是帕萨迪纳的一位律师,曾为1997年的一件谋杀指控辩护。审判将于洛杉矶举行,她正竭力阻止检方向法庭提出使用TrueAllee软件的要求。盖茨说:“作为被告,你有权利质疑’凭什么说你的结果就是正确的?’” 在她看来,培林博士会说:“谁管你的宪法权利,我只想要我的钱。”

2009年以来,TRueAlle软件已被应用在美国和英国的500多个案子中,用来指证抢劫犯,儿童性骚扰者,杀人犯或是强奸犯。此外,STRmix程序2012年以来被广泛应用于澳大利亚和新西兰。就在上个月,在两件谋杀案中,法官驳回了两位辩护律师申请审查TrueAllele源代码的要求。12月份,密歇根州的一位法官批准了STRmix在案件中的使用,这是批准该类软件在法庭合法应用的第一次尝试。

虽然这款软件十分高效实用,注重隐私的人士认为这也表明了另外一个更严重的问题:这种秘密数据对社会造成的影响正在逐步扩大但并无法验明真伪,比如脸书对用户做的News Feed情绪调查,1千1百万两大众汽车运用编程在车检中蒙混过关。“

“在很多事情上,这种算法对我们至关重要,”电子私人信息中心的杰拉德说。他们负责整合公共信息档案形成TrueAllele的源代码。“这些算法普通民众是不会知道的。”

由于DNA在每个人类基因组中的表达有无数种形式,每个人的基因代码都千差万别。

这种差别在制作两个或多个人的DNA样本非常棘手,这种情况常在案件涉及到枪支,衬衫或是手机的时候发生。根据接触过涉案物品的人的数量,接触时间的不同,物品上存留的基因序列的数量或大小也会有所变化。而且有时候一个人的遗传标记或是基因序列也许会和另一个人重合。尤其当基因标记非常小或者已被磨损时,有些标记会自动褪去,其他无关标记会混入其中。

至少10年前,科学家们已经了解了这些潜在的缺点。

去年春天,美国联邦调查局告知犯罪研究实验室,他们多年来使用的计算DNA证据与嫌犯配对几率额数据库中存在漏洞。德州因此找出数千件可能由于DNA样本检测出错而存在潜在问题的案子。

据2013年一项没发布的调查显示,国家技术标准研究所曾让108个实验室破解含有四人DNA的人工样本,然而嫌疑人的DNA并没有放入其中。结果又百分之七十的实验室都咋样本中标记出了嫌疑人DNA。

“这一点证明在破解DNA领域,真的没有国家标准可言了。” NIST的生物研究学者迈克尔·科布尔说道,他曾协助完成这项调查。

由于样本中的污染,目标DNA标记的不清晰,传统的识别外来代码的方法需要将看似是外来代码的DNA序列一一挑出去。对于只有一个人的DNA的样本来说,这种方法很好用。但是在混合样本里,这样做就会冒着很大的风险,也许会将影响分析结果的重要信息忽略。

TrueAllele软件经过分析混合样本里的成千上万的潜在目标计算每种情况的可能性。当所有可能的概率都得出后,再与嫌疑人的DNA进行对比。最后,TrueAllele会算出一个比例数值:样本中DNA与嫌疑人的DNA配对成功纯属处于偶然的概率是多少?一百分之一?还是一百万分之一?

比例数值的变化不一定可以改变陪审团的决定,比如当一种方案实施的结果是万百万分之一的可能性是错误的,但是另一个方案却证实有810亿分之一的可能性是错误的。但是当两种方案得出的结果相差巨大,那么这两种比例数值具体是怎么得出的就十分重要了。

2011年,犹他州的索伦森取证公司在对雪莱案重新展开调查,在分析一份解剖样本时检测出了三个人的信息:两个人的精液加上受害者的信息。分析发现雪莱还有个同伴,但那位同伴并不是精液的主要来源。

长滩警方说,他们查询了地方的,本州的还有联邦犯罪实验室的所有DNA数据,发现一人与现场遗留DNA相符,随后则逮捕了丘波斯。 丘波斯之所以被记录在案,是因为他曾在加州犯过诸多罪行,例如暴力强奸,与未成年人口交,暴力鸡奸未成年人。

根据索伦森公司介绍,精液中的DNA与除丘波斯之外的另一名黑人相匹配的概率仅是1万分之1。但是,当洛杉矶县检察官将样品送到Cybergenetics为审判进行进一步测时,TrueAllele得出这种几率是在1千1百62万的三次方 (这个数字有16个零)。正因为错误几率如此之渺茫,原告律师得以运用这个这一点攻击被告。

但培林表示TrueAllele绝不是原告律师才可以利用。1989年,达利尔·皮金斯曾因强奸罪被判在印第安纳监狱服刑——TrueAllele分析表明他的DNA并没有出现在现场取样中。所以,现在在美国印第安纳大学的错误定罪诊所的律师们正试图利用这个结果保释他。尽管在Cybergenetics公司同行审议论文中提到了TrueAllele应用的数学计算概念,将基本等式转换成软件的具体方法还是机密。为了证明软件的作用,培林设计了一个像加州科恩县犯罪实验室实验一样的实验。第三方负责制作40个有含有DNA数量2到5个不等的混合样本,由实验室研究人员使用TrueAllele软件和人工方法对样本进行分析。 TrueAllele几乎每次都计算出正确结果,而研究人员们还纠结于样本中到底包含几个人的DNA。

“我能确定我给他已知样本,它会正常运行。”米勒说, “所以当我给它未知样品,我没有理由相信它会运行失常。” 培林说他的公司对每一个人开放免费试用,如果透露源代码将会使公司冒被抄袭的风险。尽管他们公司已经注册了该技术的专利,但是按他的话说,10个人的小公司可没有钱打专利纠纷官司。 有五家美国犯罪实验室使用TrueAllele软件和硬件,根据培林说,价格为 6万美金。其他机构则更愿意使用STRmix ,包括加利福尼亚司法部门,他们认为和TrueAllele相比,STRmix的结果更加可靠敏锐,重复分析次数更少。据发言人介绍,他们已经将STRmix应用于24个案件中。

澳大利亚和新西兰法医学家于2009年开始研究STRmix。他们已经在科学期刊上发表了其数学模型。 软件开发者约翰“在适当监管条件下索要源代码是可以的。”但是他认为那些绝非适当条件。STRmix表示,他们50多家客户包括了联邦调查局和美国陆军犯罪调查实验室。 在2014年12月,STRmix发现一个编码错误,导致软件重复运算22次。这个错误在一周内处理妥当,并没有影响任何分析结果。 “没有软件敢说自己是永远不犯错误的, ” STRmix发言人斯蒂芬·科比特说。

这样的类似情况使不少法律学家如履薄冰。

克兰丹,莱特州立大学的生物学家,曾作证反对TrueAllele,她说代码可以解答软件是怎样比较和衡量种种不同因素的,就像感知信号和噪声一样。 “这十几个难题一直被大家激烈争论了10到15年。如果一个程序说成功配对的概率是一百万分之一 , 你怎么就知道真正的几率不是1亿分之一或者1千万分之一呢?”加利福尼亚大学犯罪学法学教授威廉·汤普森质问道。 “你难道要运行一万亿,一百万次来看看你得到错误结果的频率吗? ”

但是,并不是每个人都认为原始代码很有用。 “我对实效更感兴趣:这个东西到底干的怎么样?”爱达荷州无罪项目指导者格雷格说道,他在Cybergenetics负责对错误判决案件的研究。 “从我的研究来看,结果已经很清楚了。 ”

电子私人信息中心的菲茨杰拉德作出了妥协:在律师和专家签署协议保证不透露或抄袭的前提下,他们可以参考软件的部分代码。 另一种选择是免费的开源软件,如LRmix工作室,由数据科学家欣达·汉内德创建。 汉内德和同事不断接受用户反馈,其中一人最近反馈了一个编码错误。

“我认为要想做一个好软件,并没必要开源, ” Haned说,“但是有的时候多东西不可以透露,和其他科学家的交流就变得很困难。 ”

丘波斯对雪莱的谋杀案并不认罪。他的律师盖茨曾要求公开TrueAllele的源代码,但去年的一份上诉表示她当时没有充分说明要求代码公开的原因。现在她正要求检察官证明TrueAllele的科学性以便在法庭上可以合法利用。 TrueAllele提供的样本报告证明了现场DNA与丘波斯匹配,这件事就差最后的确认了。

公众认为, DNA检验在很大程度上是万无一失的;无论是Cybergenetics,还是别的类似公司都证明这就是事实。

“培林这是在用别人下半生的牢狱之灾换取自己的经济利益,这一点上我与法庭那些人都有分歧。”盖茨说道。

加速会:加速你对世界的理解,内幕全在这里!请关注加速会微信公号:jiasuhuihao

加速会主编微信:leaderweb

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2016-03-16
一起强奸案引发了DNA检测软件的种种争议
在1977年圣诞节的两天后,警察发现雪莱·H死在她位于加州长滩的家中。年仅十七岁的她被先奸后杀。她躺在床尾,双脚着地,脖子上缠了一根电

长按扫码 阅读全文