面部識別必看!5篇論文了解如何實現(xiàn)人臉反欺詐、跨姿勢識別等(附鏈接)
[ 導(dǎo)讀 ]面部識別是計算機視覺中最大的研究領(lǐng)域之一。許多公司都投資于面部識別技術(shù)的研究和開發(fā)。
面部識別是計算機視覺中最大的研究領(lǐng)域之一?,F(xiàn)在,我們可以使用面部識別來解鎖手機,在安全門上驗證身份,并在某些國家/地區(qū)進(jìn)行刷臉支付。許多公司都投資于面部識別技術(shù)的研究和開發(fā),本文將重點介紹其中的一些研究,并介紹五篇有關(guān)人臉識別的機器學(xué)習(xí)論文。
1. 大規(guī)模多模式人臉反欺詐的數(shù)據(jù)集和基準(zhǔn)
隨著大量實際應(yīng)用,人臉識別技術(shù)變得越來越重要。從智能手機解鎖到人臉驗證付款方式,人臉識別可以在許多方面提高安全性和監(jiān)視能力。
但是,該技術(shù)也帶來一些風(fēng)險??梢允褂枚喾N面部欺詐方法來欺詐這些系統(tǒng)。因此,面部防欺詐對于防止安全漏洞至關(guān)重要。
為了支持面部反欺詐研究,本文的作者介紹了一種名為CASIASURF的多模式面部反欺詐數(shù)據(jù)集。截止本文撰寫之日,它是最大的面部反欺詐開放數(shù)據(jù)集。
具體來說,該數(shù)據(jù)集包括以RGB,深度和IR方式從1000個主題中拍攝的21000個視頻。除了數(shù)據(jù)集外,作者還提出了一種新穎的多模式融合模型,作為面部反欺詐的基準(zhǔn)。
發(fā)布/最近更新– 2019年4月1日
作者和投稿人–Shifeng Zhang (NLPR, CASIA, UCAS, China) , Xiaobo Wang (JD AI Research), Ajian Liu (MUST, Macau, China), Chenxu Zhao (JD AI Research), Jun Wan (NLPR, CASIA, UCAS, China), Sergio Escalera (University of Barcelona), Hailin Shi (JD AI Research), Zezheng Wang (JD Finance), Stan Z. Li (NLPR, CASIA, UCAS, China).。
https://arxiv.org/pdf/1812.00408v3.pdf
2. FaceNet:人臉識別和聚類的統(tǒng)一嵌入
在本文中,作者提出了一種稱為FaceNet的面部識別系統(tǒng)。
該系統(tǒng)使用深度卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化嵌入,而不是使用中間瓶頸層。作者指出,該方法最重要的方面是系統(tǒng)的端到端學(xué)習(xí)。
該團隊在CPU集群上訓(xùn)練了卷積神經(jīng)網(wǎng)絡(luò)1000到2000小時。然后,他們在四個數(shù)據(jù)集上評估了他們的方法。
值得注意的是,F(xiàn)aceNet在著名的野外標(biāo)記人臉(LFW)數(shù)據(jù)集上的準(zhǔn)確性達(dá)到99.63%,在Youtube Faces數(shù)據(jù)庫上達(dá)到95.12%。
發(fā)布/最近更新– 2015年6月17日
作者和撰稿人– Florian Schroff, Dmitry Kalenichenko, and James Philbin, from Google Inc.
https://arxiv.org/pdf/1503.03832v3.pdf
3. 概率臉部嵌入
用于面部識別的當(dāng)前嵌入方法,能夠在受控設(shè)置中實現(xiàn)高性能。這些方法通過拍攝一張臉部圖像并將有關(guān)該臉部的數(shù)據(jù)存儲在潛在的語義空間中而起作用。
但是,當(dāng)在完全不受控制的設(shè)置下進(jìn)行測試時,當(dāng)前方法無法正常執(zhí)行。這是由于在圖像中缺少面部特征或模棱兩可的情況。這種情況的一個例子是監(jiān)視視頻中的人臉識別,其中視頻的質(zhì)量可能很低。
為了幫助解決這個問題,本文的作者提出了概率面孔嵌入(PFE)。作者提出了一種將現(xiàn)有確定性嵌入轉(zhuǎn)換為PFE的方法。最重要的是,作者指出,這種方法有效地提高了人臉識別模型的性能。
發(fā)布/最新更新– 2019年8月7日
作者和貢獻(xiàn)者–Yichun Shi and Anil K. Jain, from Michigan State University.
https://arxiv.org/pdf/1904.09658.pdf
4. 人臉識別的魔鬼在噪音中
商湯研究院,加利福尼亞大學(xué)圣地亞哥分校和南洋理工大學(xué)的研究人員研究了大規(guī)模面部圖像數(shù)據(jù)集中的噪聲影響。
由于它們的規(guī)模和成本效益,許多大型數(shù)據(jù)集都容易產(chǎn)生標(biāo)簽噪聲。本文旨在提供有關(guān)標(biāo)簽噪聲源及其在人臉識別模型中的后果的知識。此外,他們的目標(biāo)是建立并發(fā)布一個名為IMDb-Face的干凈人臉識別數(shù)據(jù)集。
該研究的兩個主要目標(biāo)是發(fā)現(xiàn)噪聲對最終性能的影響,并確定注釋臉部身份的策略。為此,該團隊手動清理了兩個流行的張開面部圖像數(shù)據(jù)集,MegaFace和MS-Celeb-1M。他們的實驗表明,僅在其清理的MegaFace數(shù)據(jù)集的32%和MS-Celeb-1M清理的數(shù)據(jù)集的20%上訓(xùn)練的模型與在整個原始未清理的數(shù)據(jù)集上訓(xùn)練的模型具有相似的性能。
發(fā)布/最新更新– 2018年7月31日
作者和貢獻(xiàn)者–Fei Wang (SenseTime), Liren Chen (University of California San Diego), Cheng Li (SenseTime), Shiyao Huang (SenseTime), Yanjie Chen (SenseTime), Chen Qian (SenseTime), and Chen Change Loy (Nanyang Technological University).
https://arxiv.org/pdf/1807.11649v1.pdf
5. VGGFace2:用于識別跨姿勢和年齡的人臉的數(shù)據(jù)集
關(guān)于深度卷積神經(jīng)網(wǎng)絡(luò)的面部識別已經(jīng)進(jìn)行了許多研究。 反過來,已經(jīng)創(chuàng)建了許多大規(guī)模的面部圖像數(shù)據(jù)集來訓(xùn)練那些模型。 但是,本文的作者指出,先前發(fā)布的數(shù)據(jù)集并未包含有關(guān)面部姿勢和年齡變化的大量數(shù)據(jù)。
在本文中,牛津大學(xué)的研究人員介紹了VGGFace2數(shù)據(jù)集。 該數(shù)據(jù)集包含年齡,種族,照明和姿勢變化范圍廣泛的圖像。 數(shù)據(jù)集總共包含331萬張圖像和9,131個對象。