一起強奸案引發(fā)了DNA檢測軟件的種種爭議

在1977年圣誕節(jié)的兩天后,警察發(fā)現(xiàn)雪萊·H死在她位于加州長灘的家中。年僅十七歲的她被先奸后殺。她躺在床尾,雙腳著地,脖子上纏了一根電線。

在解剖中,對她的陰道進行了清理和取樣,但是那個時候還沒有DNA檢測技術(shù)。所以這個樣本被儲存起來,而這個案子也就這樣“冷藏”了三十年。

在2011年,一個私人DNA實驗室給當(dāng)年的樣本進行配對,然后找到了名叫馬特爾丘波斯的男人,當(dāng)年他就住在長灘。馬特爾的代理人表示,這組DNA是唯一能夠?qū)ⅠR特爾·丘波斯與受害者雪萊·H聯(lián)系起來的證據(jù)。

而且這些DNA樣本特別難讀,除了雪萊之外還有其他一個或兩個人的基因痕跡。這樣的配對正確的可能性有多大? 計算機遺傳學(xué)的匹斯堡公司的首席執(zhí)行官,馬克·培林博士說他的計算機程序可以把這個準(zhǔn)確率計算出來。

在流行文化中,DNA經(jīng)常被視為一件神奇的證據(jù),它可以找到案件的真正罪犯,釋放那些無辜的人。但是在現(xiàn)實生活中則要復(fù)雜的多,尤其是在雪萊這樣涉及到多人的DNA樣本的案子。在過去的十多年中,法醫(yī)學(xué)專家已經(jīng)發(fā)現(xiàn)那些對于“混合樣本”的傳統(tǒng)解釋并不像人們之前想的那樣可靠。

律師與遺傳學(xué)家都表示這件事的問題在于這些公司聲稱計算機的破解過程是公司機密,所以也就沒法驗證根據(jù)研究結(jié)果指出的犯罪嫌疑人是否是真兇。

“這已經(jīng)是個謎團了”,為丘波斯辯護的律師安格林·蓋茨說。安格林現(xiàn)年56歲,是帕薩迪納的一位律師,曾為1997年的一件謀殺指控辯護。審判將于洛杉磯舉行,她正竭力阻止檢方向法庭提出使用TrueAllee軟件的要求。蓋茨說:“作為被告,你有權(quán)利質(zhì)疑’憑什么說你的結(jié)果就是正確的?’” 在她看來,培林博士會說:“誰管你的憲法權(quán)利,我只想要我的錢。”

2009年以來,TRueAlle軟件已被應(yīng)用在美國和英國的500多個案子中,用來指證搶劫犯,兒童性騷擾者,殺人犯或是強奸犯。此外,STRmix程序2012年以來被廣泛應(yīng)用于澳大利亞和新西蘭。就在上個月,在兩件謀殺案中,法官駁回了兩位辯護律師申請審查TrueAllele源代碼的要求。12月份,密歇根州的一位法官批準(zhǔn)了STRmix在案件中的使用,這是批準(zhǔn)該類軟件在法庭合法應(yīng)用的第一次嘗試。

雖然這款軟件十分高效實用,注重隱私的人士認(rèn)為這也表明了另外一個更嚴(yán)重的問題:這種秘密數(shù)據(jù)對社會造成的影響正在逐步擴大但并無法驗明真?zhèn)?,比如臉書對用戶做的News Feed情緒調(diào)查,1千1百萬兩大眾汽車運用編程在車檢中蒙混過關(guān)。“

“在很多事情上,這種算法對我們至關(guān)重要,”電子私人信息中心的杰拉德說。他們負(fù)責(zé)整合公共信息檔案形成TrueAllele的源代碼?!斑@些算法普通民眾是不會知道的?!?/p>

由于DNA在每個人類基因組中的表達有無數(shù)種形式,每個人的基因代碼都千差萬別。

這種差別在制作兩個或多個人的DNA樣本非常棘手,這種情況常在案件涉及到槍支,襯衫或是手機的時候發(fā)生。根據(jù)接觸過涉案物品的人的數(shù)量,接觸時間的不同,物品上存留的基因序列的數(shù)量或大小也會有所變化。而且有時候一個人的遺傳標(biāo)記或是基因序列也許會和另一個人重合。尤其當(dāng)基因標(biāo)記非常小或者已被磨損時,有些標(biāo)記會自動褪去,其他無關(guān)標(biāo)記會混入其中。

至少10年前,科學(xué)家們已經(jīng)了解了這些潛在的缺點。

去年春天,美國聯(lián)邦調(diào)查局告知犯罪研究實驗室,他們多年來使用的計算DNA證據(jù)與嫌犯配對幾率額數(shù)據(jù)庫中存在漏洞。德州因此找出數(shù)千件可能由于DNA樣本檢測出錯而存在潛在問題的案子。

據(jù)2013年一項沒發(fā)布的調(diào)查顯示,國家技術(shù)標(biāo)準(zhǔn)研究所曾讓108個實驗室破解含有四人DNA的人工樣本,然而嫌疑人的DNA并沒有放入其中。結(jié)果又百分之七十的實驗室都咋樣本中標(biāo)記出了嫌疑人DNA。

“這一點證明在破解DNA領(lǐng)域,真的沒有國家標(biāo)準(zhǔn)可言了?!?NIST的生物研究學(xué)者邁克爾·科布爾說道,他曾協(xié)助完成這項調(diào)查。

由于樣本中的污染,目標(biāo)DNA標(biāo)記的不清晰,傳統(tǒng)的識別外來代碼的方法需要將看似是外來代碼的DNA序列一一挑出去。對于只有一個人的DNA的樣本來說,這種方法很好用。但是在混合樣本里,這樣做就會冒著很大的風(fēng)險,也許會將影響分析結(jié)果的重要信息忽略。

TrueAllele軟件經(jīng)過分析混合樣本里的成千上萬的潛在目標(biāo)計算每種情況的可能性。當(dāng)所有可能的概率都得出后,再與嫌疑人的DNA進行對比。最后,TrueAllele會算出一個比例數(shù)值:樣本中DNA與嫌疑人的DNA配對成功純屬處于偶然的概率是多少?一百分之一?還是一百萬分之一?

比例數(shù)值的變化不一定可以改變陪審團的決定,比如當(dāng)一種方案實施的結(jié)果是萬百萬分之一的可能性是錯誤的,但是另一個方案卻證實有810億分之一的可能性是錯誤的。但是當(dāng)兩種方案得出的結(jié)果相差巨大,那么這兩種比例數(shù)值具體是怎么得出的就十分重要了。

2011年,猶他州的索倫森取證公司在對雪萊案重新展開調(diào)查,在分析一份解剖樣本時檢測出了三個人的信息:兩個人的精液加上受害者的信息。分析發(fā)現(xiàn)雪萊還有個同伴,但那位同伴并不是精液的主要來源。

長灘警方說,他們查詢了地方的,本州的還有聯(lián)邦犯罪實驗室的所有DNA數(shù)據(jù),發(fā)現(xiàn)一人與現(xiàn)場遺留DNA相符,隨后則逮捕了丘波斯。 丘波斯之所以被記錄在案,是因為他曾在加州犯過諸多罪行,例如暴力強奸,與未成年人口交,暴力雞奸未成年人。

根據(jù)索倫森公司介紹,精液中的DNA與除丘波斯之外的另一名黑人相匹配的概率僅是1萬分之1。但是,當(dāng)洛杉磯縣檢察官將樣品送到Cybergenetics為審判進行進一步測時,TrueAllele得出這種幾率是在1千1百62萬的三次方 (這個數(shù)字有16個零)。正因為錯誤幾率如此之渺茫,原告律師得以運用這個這一點攻擊被告。

但培林表示TrueAllele絕不是原告律師才可以利用。1989年,達利爾·皮金斯曾因強奸罪被判在印第安納監(jiān)獄服刑——TrueAllele分析表明他的DNA并沒有出現(xiàn)在現(xiàn)場取樣中。所以,現(xiàn)在在美國印第安納大學(xué)的錯誤定罪診所的律師們正試圖利用這個結(jié)果保釋他。盡管在Cybergenetics公司同行審議論文中提到了TrueAllele應(yīng)用的數(shù)學(xué)計算概念,將基本等式轉(zhuǎn)換成軟件的具體方法還是機密。為了證明軟件的作用,培林設(shè)計了一個像加州科恩縣犯罪實驗室實驗一樣的實驗。第三方負(fù)責(zé)制作40個有含有DNA數(shù)量2到5個不等的混合樣本,由實驗室研究人員使用TrueAllele軟件和人工方法對樣本進行分析。 TrueAllele幾乎每次都計算出正確結(jié)果,而研究人員們還糾結(jié)于樣本中到底包含幾個人的DNA。

“我能確定我給他已知樣本,它會正常運行?!泵桌照f, “所以當(dāng)我給它未知樣品,我沒有理由相信它會運行失常?!?培林說他的公司對每一個人開放免費試用,如果透露源代碼將會使公司冒被抄襲的風(fēng)險。盡管他們公司已經(jīng)注冊了該技術(shù)的專利,但是按他的話說,10個人的小公司可沒有錢打?qū)@m紛官司。 有五家美國犯罪實驗室使用TrueAllele軟件和硬件,根據(jù)培林說,價格為 6萬美金。其他機構(gòu)則更愿意使用STRmix ,包括加利福尼亞司法部門,他們認(rèn)為和TrueAllele相比,STRmix的結(jié)果更加可靠敏銳,重復(fù)分析次數(shù)更少。據(jù)發(fā)言人介紹,他們已經(jīng)將STRmix應(yīng)用于24個案件中。

澳大利亞和新西蘭法醫(yī)學(xué)家于2009年開始研究STRmix。他們已經(jīng)在科學(xué)期刊上發(fā)表了其數(shù)學(xué)模型。 軟件開發(fā)者約翰“在適當(dāng)監(jiān)管條件下索要源代碼是可以的?!钡撬J(rèn)為那些絕非適當(dāng)條件。STRmix表示,他們50多家客戶包括了聯(lián)邦調(diào)查局和美國陸軍犯罪調(diào)查實驗室。 在2014年12月,STRmix發(fā)現(xiàn)一個編碼錯誤,導(dǎo)致軟件重復(fù)運算22次。這個錯誤在一周內(nèi)處理妥當(dāng),并沒有影響任何分析結(jié)果。 “沒有軟件敢說自己是永遠不犯錯誤的, ” STRmix發(fā)言人斯蒂芬·科比特說。

這樣的類似情況使不少法律學(xué)家如履薄冰。

克蘭丹,萊特州立大學(xué)的生物學(xué)家,曾作證反對TrueAllele,她說代碼可以解答軟件是怎樣比較和衡量種種不同因素的,就像感知信號和噪聲一樣。 “這十幾個難題一直被大家激烈爭論了10到15年。如果一個程序說成功配對的概率是一百萬分之一 , 你怎么就知道真正的幾率不是1億分之一或者1千萬分之一呢?”加利福尼亞大學(xué)犯罪學(xué)法學(xué)教授威廉·湯普森質(zhì)問道。 “你難道要運行一萬億,一百萬次來看看你得到錯誤結(jié)果的頻率嗎? ”

但是,并不是每個人都認(rèn)為原始代碼很有用。 “我對實效更感興趣:這個東西到底干的怎么樣?”愛達荷州無罪項目指導(dǎo)者格雷格說道,他在Cybergenetics負(fù)責(zé)對錯誤判決案件的研究。 “從我的研究來看,結(jié)果已經(jīng)很清楚了。 ”

電子私人信息中心的菲茨杰拉德作出了妥協(xié):在律師和專家簽署協(xié)議保證不透露或抄襲的前提下,他們可以參考軟件的部分代碼。 另一種選擇是免費的開源軟件,如LRmix工作室,由數(shù)據(jù)科學(xué)家欣達·漢內(nèi)德創(chuàng)建。 漢內(nèi)德和同事不斷接受用戶反饋,其中一人最近反饋了一個編碼錯誤。

“我認(rèn)為要想做一個好軟件,并沒必要開源, ” Haned說,“但是有的時候多東西不可以透露,和其他科學(xué)家的交流就變得很困難。 ”

丘波斯對雪萊的謀殺案并不認(rèn)罪。他的律師蓋茨曾要求公開TrueAllele的源代碼,但去年的一份上訴表示她當(dāng)時沒有充分說明要求代碼公開的原因?,F(xiàn)在她正要求檢察官證明TrueAllele的科學(xué)性以便在法庭上可以合法利用。 TrueAllele提供的樣本報告證明了現(xiàn)場DNA與丘波斯匹配,這件事就差最后的確認(rèn)了。

公眾認(rèn)為, DNA檢驗在很大程度上是萬無一失的;無論是Cybergenetics,還是別的類似公司都證明這就是事實。

“培林這是在用別人下半生的牢獄之災(zāi)換取自己的經(jīng)濟利益,這一點上我與法庭那些人都有分歧?!鄙w茨說道。

加速會:加速你對世界的理解,內(nèi)幕全在這里!請關(guān)注加速會微信公號:jiasuhuihao

加速會主編微信:leaderweb

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-03-16
一起強奸案引發(fā)了DNA檢測軟件的種種爭議
在1977年圣誕節(jié)的兩天后,警察發(fā)現(xiàn)雪萊·H死在她位于加州長灘的家中。年僅十七歲的她被先奸后殺。她躺在床尾,雙腳著地,脖子上纏了一根電

長按掃碼 閱讀全文