用AI尋找大屠殺后失散的親人!谷歌工程師研發(fā)人臉識別程序,可識別超70萬張二戰(zhàn)時期老照片
?AI面部識別領(lǐng)域又開辟新業(yè)務(wù)了?
這次,是鑒別二戰(zhàn)時期老照片里的人臉圖像。
近日,來自谷歌的一名軟件工程師Daniel Patt 研發(fā)了一項名為N2N(Numbers to Names)的 AI人臉識別技術(shù),它可識別二戰(zhàn)前歐洲和大屠殺時期的照片,并將他們與現(xiàn)代的人們聯(lián)系起來。
用AI尋找失散多年的親人
2016年,帕特在參觀華沙波蘭裔猶太人紀(jì)念館時,萌生了一個想法。
這一張張陌生的臉龐,會不會與自己存在血緣的聯(lián)系?
他的祖父母/外祖父母中有三位是來自波蘭的大屠殺幸存者,他想幫助祖母找到被納粹殺害的家人的照片。
二戰(zhàn)時期,由于波蘭裔猶太人眾多,且被關(guān)押在不同集中營,許多都下落不明。
僅僅通過一張發(fā)黃的照片,很難辨別其中的人臉是誰,更別提找到自己失落的親人。
于是,他回到家中,立馬把這個想法轉(zhuǎn)化為現(xiàn)實。
該軟件最初的設(shè)想是通過數(shù)據(jù)庫收集人臉的圖像信息,并利用人工智能算法幫助匹配相似度最高的前十個選項。
其中大部分的圖像數(shù)據(jù)來自美國大屠殺紀(jì)念館(The US Holocaust Memorial Museum),此外還有超過一百萬張圖像來自全國各地的數(shù)據(jù)庫。
用戶只需選擇電腦文件中的圖像,點擊上傳,系統(tǒng)便會自動篩選出匹配圖最高的前十個選項。
另外,用戶還可以點擊源地址查看該圖片的年份、地點、藏館等信息。
有個槽點是,如果輸入現(xiàn)代的人物圖像,檢索結(jié)果也可能會很離譜。
結(jié)果就是這?(黑人問號)
總之就是系統(tǒng)功能還需要完善。
此外,Patt還與谷歌的其他軟件工程師和數(shù)據(jù)科學(xué)家團(tuán)隊合作,旨在提高搜索的范圍與準(zhǔn)確度。
由于臉部識別系統(tǒng)存在隱私泄露的風(fēng)險,Patt表示,「我們不對身份作出任何評價, 我們只負(fù)責(zé)用相似度分?jǐn)?shù)呈現(xiàn)結(jié)果,并讓用戶自己去判斷」。
AI面部識別技術(shù)的發(fā)展
那么這項技術(shù)是如何對人臉進(jìn)行識別的呢?
最初,人臉識別技術(shù)還得從「如何判斷檢測的圖像是一張臉」開始。
2001年,計算機視覺研究人員 Paul Viola 和 Michael Jones 提出了一個框架,以高精度實時檢測人臉。
這個框架可基于訓(xùn)練模型來理解「什么是人臉,什么不是人臉」。
訓(xùn)練完成后,模型會提取特定特征,然后將這些特征存儲在文件中,以便可以將新圖像中的特征與之前存儲的特征在各個階段進(jìn)行比較。
為了幫助確保準(zhǔn)確性,算法需要在包含「數(shù)十萬正負(fù)圖像的大型數(shù)據(jù)集」上進(jìn)行訓(xùn)練,從而提高算法確定圖像中是否有人臉及其位置的能力。
如果所研究的圖像通過了特征比較的每個階段,則已檢測到人臉并且可以繼續(xù)操作。
盡管 Viola-Jones 框架在實時應(yīng)用程序中用于識別人臉精確度很高,但它存在一定的局限性。
例如,如果人臉戴上口罩,或者如果一張臉沒有正確定向,則該框架可能無法工作。
為幫助消除 Viola-Jones 框架的缺點并改進(jìn)人臉檢測,他們又開發(fā)了其他算法。
如基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò) (R-CNN) 和單鏡頭檢測器 (SSD)來幫助改進(jìn)流程。
卷積神經(jīng)網(wǎng)絡(luò) (CNN) 是一種用于圖像識別和處理的人工神經(jīng)網(wǎng)絡(luò),專門用于處理像素數(shù)據(jù)。
R-CNN 在 CNN 框架上生成區(qū)域提議,以對圖像中的對象進(jìn)行定位和分類。
雖然基于區(qū)域提議網(wǎng)絡(luò)的方法(如 R-CNN)需要兩個鏡頭——一個用于生成區(qū)域提議,另一個用于檢測每個提議的對象——但 SSD 只需要一個鏡頭來檢測圖像中的多個對象。因此,SSD 明顯快于 R-CNN。
近年來,深度學(xué)習(xí)模型驅(qū)動的人臉識別技術(shù),其優(yōu)勢顯著優(yōu)于傳統(tǒng)的計算機視覺方法。
早期的人臉識別多采用傳統(tǒng)機器學(xué)習(xí)算法,研究關(guān)注的焦點更多集中在如何提取更有鑒別力的特征上,以及如何更有效的對齊人臉。
隨著研究的深入,傳統(tǒng)機器學(xué)習(xí)算法人臉識別在二維圖像上的性能提升逐漸到達(dá)瓶頸。
人們開始轉(zhuǎn)而研究視頻中的人臉識別問題,或者結(jié)合三維模型的方法去進(jìn)一步提升人臉識別的性能,而少數(shù)學(xué)者開始研究三維人臉的識別問題。
在最出名的 LFW 公開庫上,深度學(xué)習(xí)算法一舉突破了傳統(tǒng)機器學(xué)習(xí)算法在二維圖像上人臉識別性能的瓶頸,首次將識別率提升到了 97% 以上。
即利用「CNN 網(wǎng)絡(luò)建立的高維模型」 ,直接從輸入的人臉圖像上提取有效的鑒別特征,直接計算余弦距離來進(jìn)行人臉識別。
人臉檢測已經(jīng)從基本的計算機視覺技術(shù)發(fā)展到機器學(xué)習(xí) (ML) 的進(jìn)步,再到日益復(fù)雜的人工神經(jīng)網(wǎng)絡(luò) (ANN) 和相關(guān)技術(shù),結(jié)果是持續(xù)的性能改進(jìn)。
現(xiàn)在,它作為許多關(guān)鍵應(yīng)用程序的第一步發(fā)揮著重要作用——包括面部跟蹤、面部分析和面部識別。
二戰(zhàn)期間,中國也遭受了戰(zhàn)爭的創(chuàng)傷,許多當(dāng)時照片中的人物早已無法辨別。
爺爺奶奶一輩的曾遭受戰(zhàn)爭創(chuàng)傷的人們,有許多親人朋友都下落不明。
這項技術(shù)的研發(fā)或許將幫助人們揭開塵封的歲月,為過去的人們尋找一些慰藉。
參考資料:https://www.timesofisrael.com/google-engineer-identifies-anonymous-faces-in-wwii-photos-with-ai-facial-recognition/?