文|腦極體
電影《讓子彈飛》里,有一段情節(jié)特別有意思:
鵝城之主黃四郎拿著張麻子的上任證件,大惑不解——
黃:這照片是你嗎。
張:是我。
黃:這就不是你。
張:我也說這TM根本就不是我。我去照相館照相,取照片的時(shí)候,他們給我的就是這張,我說這不是我,他們說這就是你,我說他不是我!他們說這就是你。沒辦法,我就把他貼在這了。
于是,張麻子就這么走馬上任了。
或許,你只覺得這段劇情特別搞笑,堪稱大型現(xiàn)實(shí)魔幻主義。但如果現(xiàn)實(shí)之中,尋找久別的親人、追查肇事的罪犯等,都只能依靠這種容易偽造、模糊不清的信息,會(huì)讓整個(gè)任務(wù)變得一籌莫展。
準(zhǔn)確鑒定一個(gè)人的身份乃至外貌,已經(jīng)成為一個(gè)必須解決的關(guān)鍵社會(huì)問題。而目前最為便捷與安全的解決方案無疑就是DNA技術(shù)。
人體內(nèi)的DNA具有唯一性(同卵雙胞胎可能具有同樣的DNA)和永久性,因此,DNA鑒定也具有絕對(duì)的權(quán)威性和準(zhǔn)確性,是目前世界范圍內(nèi)應(yīng)用最廣、也是最為成熟的犯罪偵查技術(shù)之一,也一直被認(rèn)為是尋找失蹤人口的黃金標(biāo)準(zhǔn)。
而且,DNA信息很難被徹底抹去,一件穿過的衣服、一塊嚼過的口香糖,一根跌落的頭發(fā),都可能采集到DNA樣本。試想一下,如果根據(jù)DNA能夠直接描繪出的長(zhǎng)相,是不是能夠快速拿到關(guān)鍵信息,從而加快團(tuán)聚的腳步、斷案的進(jìn)度呢?
舉個(gè)例子,前不久備受關(guān)注的徐州小花梅事件調(diào)查結(jié)果公布,通過DNA檢驗(yàn)比對(duì)確認(rèn)了楊某俠即小花梅的身份。同時(shí),又有網(wǎng)友對(duì)比了小花梅與楊某俠的照片,很多人都認(rèn)為不像同一個(gè)人。這種情況,如果能通過DNA預(yù)測(cè)并生成面部畫像,或許就能直觀且準(zhǔn)確地看到面貌特征,有效地說服質(zhì)疑者。
事實(shí)上,基于DNA信息對(duì)人類外部可見特征(EVCs)的預(yù)測(cè),早已被應(yīng)用到了刑偵身份確認(rèn)等領(lǐng)域當(dāng)中。那么,它究竟是不是尋人緝兇中,那顆重開身份迷霧的 “銀彈”silver bullet呢?
DNA to Face,靠譜嗎?
在全球范圍內(nèi),DNA表型都是一種極為重要的刑偵手段。當(dāng)偵查毫無頭緒的時(shí)候,DNA表型可以從個(gè)體DNA中提取某些基因來預(yù)測(cè)個(gè)體面部特征,幫助確定肇事者可能是什么樣子,進(jìn)一步縮小嫌疑人的范圍,加快調(diào)查過程。
對(duì)于渴望尋親的人來說,DNA表型也可以幫助TA快速定位出潛在親人的面貌,排除完全不具備相關(guān)遺傳變異的候選人,幫助人們?cè)缛請(qǐng)F(tuán)聚。
首先,通過分析遺傳變異點(diǎn)位SNP,確定身體和面部特征。這些點(diǎn)位差異,往往會(huì)影響人體相關(guān)的一系列信息,比如眼睛顏色,頭發(fā)顏色,年齡,性別,身高,遺傳病等。因此,通過比對(duì)SNP可以得到一個(gè)人的容貌特征數(shù)據(jù)樣本。
然后,基于人工智能算法和深度生成模型,提取與身體特征相關(guān)的信息,創(chuàng)建面部圖像。為了保證科學(xué)性,每個(gè)特征往往會(huì)用準(zhǔn)確率百分比的形式呈現(xiàn)。比如,對(duì)方可能有88.6%的概率,是一個(gè)白人男性,88.3%的概率有褐色的眼睛,有雀斑的概率則只有22%。
此外,即使案件已經(jīng)發(fā)生多年,DNA表型也可以與AI面部識(shí)別技術(shù)相結(jié)合,生成對(duì)方隨著時(shí)間流逝后的長(zhǎng)相,或者還原兒童時(shí)的長(zhǎng)相。如果一個(gè)孩子失蹤幾年了,那么從孩子的梳子上取下的一縷頭發(fā),可以用來創(chuàng)建一組年齡進(jìn)展圖像。
DNA 研究公司Parabon的生物信息學(xué)總監(jiān)Ellen McRae Greytak就曾分享過,該公司在過去七年中幫助解決了200多起案件。
2015年,哥倫比亞警方就通過現(xiàn)場(chǎng)收集的DNA,生成嫌疑人圖像,逮捕了一名男子,最終破獲了一個(gè)四年來毫無進(jìn)展的兇殺案。
DNA表型的3D圖像顯示,兇手應(yīng)該是一個(gè)非洲阿爾及利亞的男性,有著橄欖色的皮膚,綠色的眼睛,豐滿的嘴唇,很少或沒有雀斑。
基于DNA來生成的圖像,可以與其他調(diào)查信息一起,生成尋人或通緝海報(bào),無疑會(huì)讓進(jìn)展事半功倍。
不是銀彈,卻是尖刀
但在普通人眼中,這個(gè)技術(shù)好像有點(diǎn)用,又好像沒啥用。
因?yàn)椋壳癉NA技術(shù)還無法準(zhǔn)確預(yù)測(cè)多種面貌特征。臉部的形狀是由數(shù)以千計(jì)的基因決定的,某一處單個(gè)特征的標(biāo)記都可能影響整個(gè)面部表現(xiàn),讓臉型從男性化變得女性化,這種模糊性就給后續(xù)追查帶來挑戰(zhàn)。
另外,DNA表型只能反映基因遺傳特征,不能顯示出與后天成長(zhǎng)環(huán)境的相互作用。比如染發(fā)、斷鼻、掉牙等情況,都可能改變嫌疑人外表,卻無法反映在DNA中。所以僅憑DNA就不可能預(yù)測(cè)一個(gè)人精準(zhǔn)的樣子。
還有,大家都知道深度學(xué)習(xí)模型依賴于大規(guī)模的數(shù)據(jù)集訓(xùn)練,而目前許多面部識(shí)別系統(tǒng)的數(shù)據(jù)集中,不同種族的面部數(shù)據(jù)并不均衡,這就會(huì)導(dǎo)致對(duì)不同群體的識(shí)別準(zhǔn)確度大不相同,算法準(zhǔn)確率低的群體可能很容易被誤判和定罪,帶來新的不公平。
比如在2019年基于Hapmap數(shù)據(jù)集展開的一項(xiàng)DNA表型研究中,GLOBAL隊(duì)列(全球樣本)的表現(xiàn)就不如EURO隊(duì)列(歐洲樣本)好,原因之一,就是歐洲人在基因組方面的數(shù)據(jù)規(guī)模更大,因此模型的識(shí)別效果更好。
而且無論我們走到哪里,都會(huì)留下自己的DNA痕跡,比如地鐵上留下的一縷頭發(fā),或是咖啡館中玻璃杯上沾到的唾液……當(dāng)DNA樣本的易得性,遇上市場(chǎng)化服務(wù)和大規(guī)模數(shù)據(jù)庫的應(yīng)用,這項(xiàng)技術(shù)也就產(chǎn)生巨大的隱私風(fēng)險(xiǎn)。
2013 年,紐約藝術(shù)家杜威-哈格堡(Heather Dewey Hagborg)啟動(dòng)了一個(gè)藝術(shù)項(xiàng)目“陌生人視角景(Stranger Visions)”,從公共場(chǎng)所收集的遺傳物質(zhì)制作肖像雕塑。比如,從一根掉落的煙頭里,DNA顯示吸煙者是一個(gè)東歐血統(tǒng)的男性,眼睛是棕色的。
她將這些參數(shù)輸入到算法模型中,創(chuàng)建出人臉的3D模型,并用3D打印出雕塑。
不難想象,如果這項(xiàng)技術(shù)開始規(guī)?;瘧?yīng)用,而DNA樣本又無處不在,那么很可能你的所有行程、做了什么,都會(huì)被扒個(gè)底兒掉。
而這一天,已經(jīng)到來了。目前,很多海外生物機(jī)構(gòu)和科技企業(yè)會(huì)提供類似的服務(wù),比如Greytak、Parabon、Corsight等,Human Longevity早在 2017 年就曾使用 DNA 重建面部照片。哥倫比亞警方正是通過Parabon NanoLabs公司開發(fā)的程序Snapshot,創(chuàng)建出了嫌疑人的形象。
還有一些簡(jiǎn)單易用的面部DNA測(cè)試應(yīng)用,可以在網(wǎng)上免費(fèi)下載,幫人們判斷血統(tǒng)、確定親子關(guān)系、尋找親人。應(yīng)用程序Face IT DNA,就號(hào)稱可以通過60多個(gè)面部點(diǎn)匹配,來幫助用戶確認(rèn)關(guān)系,只需要進(jìn)行人臉識(shí)別掃描,匹配準(zhǔn)確率高達(dá)92%。
僅僅人臉識(shí)別當(dāng)然達(dá)不到這樣高的精度,而且很可能導(dǎo)致你的敏感個(gè)人信息泄露。
一些公開的DNA數(shù)據(jù)庫也已經(jīng)建立。GEDMatch就是一個(gè)可以免費(fèi)使用的DNA測(cè)試數(shù)據(jù)庫,但用戶把自己的DNA檔案上傳到GEDMatch等網(wǎng)站比對(duì)之后,相關(guān)信息也被美國(guó)警方拿到,然后抓捕了一位嫌疑人用戶。這種運(yùn)用不合理手段獲取個(gè)人因素?cái)?shù)據(jù)的行為,也引發(fā)了大量的反對(duì),要求GEDMatch限制對(duì)平臺(tái)數(shù)據(jù)的訪問。
面對(duì)這些DNA表型存在的現(xiàn)實(shí)問題,生物學(xué)家和工程師Yves Moreau認(rèn)為,它就像一把刀——人們低估了它能有多鋒利。
在向犯罪分子重磅出擊的時(shí)候,也可能先割傷普通人。
瑕不掩瑜,必不可少
既然DNA表型目前還有很多挑戰(zhàn)和不足之處,那還有研究的必要嗎?至少目前來說,作為一種新型的DNA技術(shù),是各國(guó)不可回避的領(lǐng)域。
從科學(xué)的角度來看,研究DNA表型,能夠幫助全人類更了解自己是誰,搞清楚人類的起源和演變。
DNA雖然不能精準(zhǔn)地反映個(gè)體的面貌細(xì)節(jié),卻是一個(gè)人生物血統(tǒng)和族裔血統(tǒng)最靠譜的證明。讀懂DNA中隱藏的信息,能夠了解人類歷史過程中的遷移動(dòng)向、族群選擇以及其他隨機(jī)影響。
舉個(gè)例子,位于Y染色體上的標(biāo)記,只能從父親傳給兒子,因此能夠完全反映出父系譜系中(男性)祖先的地理起源。
借助DNA表型測(cè)試系統(tǒng),可以大致確定個(gè)體血統(tǒng),并根據(jù)地理祖先推斷出某些外部可見的特征。像是金發(fā),藍(lán)眼睛和淺色皮膚的人,都至少有一部分歐洲血統(tǒng)。
從國(guó)家的角度看,目前,很多國(guó)家也都在建設(shè)自己的生物識(shí)別數(shù)據(jù)庫,被視作數(shù)字治理的重要組成部分。比如印度的Aadhar系統(tǒng),以及澳大利亞政府正在建立的面部識(shí)別系統(tǒng)“The Capability”,可以將監(jiān)控錄像中的人臉和駕駛執(zhí)照中的圖像信息相匹配。未來結(jié)合DNA表型預(yù)測(cè)肇事者的臉,快速?gòu)娜四様?shù)據(jù)庫中找到潛在嫌疑人,將不再是難事。
建立具有本國(guó)國(guó)民特征的規(guī)模數(shù)據(jù)庫,成為更好地應(yīng)用人臉識(shí)別、深度學(xué)習(xí)等技術(shù)的土壤。正如一些科學(xué)家所說的,識(shí)別的基因數(shù)據(jù)越多,這種技術(shù)就會(huì)越準(zhǔn)確。進(jìn)而更好地幫助親人團(tuán)聚、更早將犯罪分子繩之以法。
而對(duì)于個(gè)人來說,今天,人臉識(shí)別技術(shù)已經(jīng)應(yīng)用在門禁、安檢、移動(dòng)支付、進(jìn)出場(chǎng)館等諸多場(chǎng)合。想象一下,在未來世界里,一個(gè)人的外表可以僅從DNA中準(zhǔn)確地重建出來,身份證、護(hù)照、社會(huì)保障卡等證件或許就都不再需要了。這會(huì)大大提升人臉識(shí)別場(chǎng)景的準(zhǔn)確度和唯一性。
此外,DNA表型的相關(guān)算法模型,還可以擴(kuò)展到醫(yī)學(xué)圖像(如腦部掃描)與基因的聯(lián)系,為醫(yī)療診斷、遺傳分析等提供輔助,幫助研究阿爾茨海默氏癥等神經(jīng)退行性疾病。
無論我們走到哪里,都會(huì)留下一些DNA。讓這些信息被看見,或許那些不明身份的人,都能夠擁有自己的姓名。而作惡的人,也暴露在陽光下。
這就是技術(shù)的世界,讓一切真實(shí)無所遁形。