人臉識(shí)別有多牛?AIFR 技術(shù)分分鐘讓你變“明星”
原創(chuàng)【51CTO.com原創(chuàng)稿件】近日,經(jīng)常被類似“你最像哪位明星?”、“預(yù)測(cè)你未來的樣子”、“看看你們的年齡差?”…..這樣的一些基于臉部比對(duì)的照片刷屏。
圖[1]
如圖[1]是 “你最像哪位明星?”小應(yīng)用制作出來的對(duì)比照,看到這個(gè)對(duì)比過程,你肯定比較好奇這背后用到了哪些技術(shù),能想到的就是人臉識(shí)別、美顏。但具體細(xì)節(jié)就……下面是專業(yè)人士給出的正確姿勢(shì),給同樣感興趣的小伙伴們答疑解惑!
人臉識(shí)別技術(shù)的基本流程
當(dāng)下,人臉識(shí)別技術(shù)的細(xì)節(jié)多到數(shù)不清,工程技巧也是多種多樣,但基本流程已成定式:當(dāng)輸入某張人物照,利用人臉檢測(cè)技術(shù)找到人臉位置,在這基礎(chǔ)之上對(duì)關(guān)鍵點(diǎn),如眼睛、嘴巴等定位,之后經(jīng)過一些幾何、光學(xué)手段的校正等,提取人臉特征,進(jìn)而做到人臉識(shí)別。
各個(gè)公司間的差異在于關(guān)鍵提取的數(shù)量相,從幾個(gè)點(diǎn)到近百點(diǎn)、以及各個(gè)環(huán)節(jié)在細(xì)節(jié)上的一些追求。
“你最像哪位明星?”這張圖,圖一到圖二,用到的是人臉檢測(cè)技術(shù),基于一些算法,把人臉定位提取,也涉及到一小部分關(guān)鍵點(diǎn)的檢測(cè)技術(shù)。這個(gè)過程中,如何識(shí)別出照片,在不同年齡段的面部圖像是值得考究的點(diǎn)。
人臉識(shí)別中的年齡不變?cè)趯W(xué)術(shù)界被稱為 age-invariant face recognition(AIFR),AIFR 技術(shù)能夠識(shí)別出同對(duì)象同齡段的臉部圖像。
無視年齡變化,AIFR技術(shù)的應(yīng)用
面部特征隨著年齡的增長(zhǎng)產(chǎn)生變化
人的面部特征隨著年齡的增長(zhǎng)會(huì)產(chǎn)生非常明顯的變化。從圖形學(xué)的角度來看,這種變化可以分為輪廓變化和紋理變化。
輪廓變化,指五官和臉型的空間位置和結(jié)構(gòu)特征產(chǎn)生了變化。如嬰兒的臉型普遍偏肥,輪廓平滑圓潤(rùn);成年后,則發(fā)展成鵝蛋臉、國(guó)字臉和瓜子臉等更加豐富的臉型,五官也變得更為立體。
紋理變化,指人臉皮膚表面的膚質(zhì)感產(chǎn)生了變化。嬰兒皮膚圓潤(rùn)、細(xì)嫩、平滑,而成人皮膚則往往更加粗糙,多皺紋。
這些輪廓和紋理的變化,往往連人類自身也無法準(zhǔn)確理解。今天得益于人工智能技術(shù)的發(fā)展,AIFR 技術(shù)已逐漸成熟。
AIFR技術(shù)的兩大模型
目前,AIFR 技術(shù)方向繁雜,但總體上可分為生成模型和判別模型兩種:
生成模型
生成模型的基本思想是假設(shè)人臉隨年齡的變化過程具有一定規(guī)律,然后通過數(shù)學(xué)方法去求解變化規(guī)律本身。在洞悉規(guī)律后,算法即可通過某一年齡的面部特征,生成其他年齡的面部特征。
以圖[1]為例,具體實(shí)現(xiàn)步驟為:
- 分別抽取人臉輪廓特征 S 和紋理特征 T
- 進(jìn)行校正和均化
- 對(duì)面部特征分別建立數(shù)學(xué)模型并求解模型參數(shù),獲得生成模型
- 輸入待預(yù)測(cè)人的面部特征
- 使用生成模型預(yù)測(cè)此人其他年齡的面部特征
- 將輪廓特征和紋理特征重新合并
- 與實(shí)際未來面部進(jìn)行對(duì)比,即可知道是否為同一人或是相似的人
判別模型
判別模型與生成模型不同,判別類模型不尋求解決人臉的變化規(guī)律問題。判別模型假設(shè)有一部分人臉特征是不隨年齡而產(chǎn)生變化的,使用這類年齡無關(guān)的特征去判斷人臉的身份。
圖[2]
圖[2]顯示了深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)了非齡特征的抽取。
第一列是同一個(gè)人在不同年齡的照片 S1,S2,S3
通過卷積神經(jīng)網(wǎng)絡(luò),系統(tǒng)使用固定的特征臉組合 S' 來代表原圖
例如:
特征臉組合再進(jìn)入如隱藏因子分析器后,只選擇了最接近這張?zhí)卣髂樀慕M合。
例如:
可以看出,第三列人臉相似度已經(jīng)非常高了。
刷臉時(shí)代來了:人臉識(shí)別技術(shù)的典型應(yīng)用
除了上面提到的小應(yīng)用,現(xiàn)在人臉識(shí)別的用途越來越廣,各行各業(yè)都在嘗試用人臉識(shí)別提升客戶體驗(yàn)、優(yōu)化服務(wù)水平,不過總結(jié)起來主要有兩大類:人臉身份識(shí)別和人臉身份認(rèn)證。
二者表面看起來比較接近,但它們的技術(shù)原理并不相同:人臉身份識(shí)別是從一堆人里識(shí)別出你是誰,人臉身份認(rèn)證是確認(rèn)你是不是本人。比較典型的應(yīng)用如下:
人臉身份識(shí)別
- VIP人臉識(shí)別。這個(gè)應(yīng)用可以自動(dòng)在人群中捕捉 VIP 客戶,并識(shí)別出其身份,同時(shí)可以語音歡迎并經(jīng)后臺(tái)通知相關(guān)工作人員;
- 人臉黑名單。這個(gè)應(yīng)用可以在重點(diǎn)通道設(shè)置人臉黑名單,自動(dòng)識(shí)別重點(diǎn)嫌疑人等,一旦發(fā)現(xiàn)即可自動(dòng)報(bào)警。
人臉身份認(rèn)證
- 金融行業(yè)。該領(lǐng)域的應(yīng)用比較多,包括刷臉登錄、遠(yuǎn)程人臉開戶、自助人臉開卡等等,最早大規(guī)模應(yīng)用人臉識(shí)別的是民生銀行,在 2014 年初開始布局人臉識(shí)別平臺(tái),將人臉識(shí)別應(yīng)用于營(yíng)業(yè)廳、自助設(shè)備、柜臺(tái)系統(tǒng)以及移動(dòng)營(yíng)銷等。
這些是做身份認(rèn)證的輔助手段,以往無論是在何種應(yīng)用場(chǎng)景,身份認(rèn)證只有兩種模式:人工比對(duì)身份證和本人,容易出現(xiàn)比對(duì)標(biāo)準(zhǔn)不一致的情況;只認(rèn)證身份證,容易出現(xiàn)冒用、盜用他人身份證的問題。而人臉識(shí)別很好地解決了這些問題。
- 社保行業(yè)。比較典型的就是遠(yuǎn)程資格認(rèn)證,以往為了證明參保人員的生存狀態(tài),需要工作人員實(shí)地進(jìn)行資格認(rèn)證,對(duì)于那些年齡大、出行不便和距離遠(yuǎn)的異地參保人員就特別不方便。
而人臉識(shí)別可以通過遠(yuǎn)程進(jìn)行人臉身份認(rèn)證,不過為了防止照片作假,一般會(huì)加入活體檢測(cè)的環(huán)節(jié)。
- 教育行業(yè)。主要是高考、成人考試、人事考試等,借助指紋識(shí)別、人臉識(shí)別等生物識(shí)別技術(shù)確認(rèn)考生身份,可以確保人證合一,保證考試的公平性。
人臉識(shí)別仍存在安全隱患
人臉識(shí)別并不萬能,技術(shù)的背后仍存在風(fēng)險(xiǎn)和漏洞,比如仿真頭套、全息投影、人臉跟蹤等的不斷出現(xiàn),單一的人臉識(shí)別技術(shù)存在很大的局限性,安全系數(shù)和科技成分并不成正比。
因此,在涉及隱私、支付等高級(jí)別安全場(chǎng)景使用時(shí),一定注意將人臉與聲紋、指紋、虹膜及其他生物認(rèn)證信號(hào)相融合,而不是單一的采用人臉識(shí)別技術(shù),這樣安全的系數(shù)就會(huì)大大提升。
參考資料:
[1]Park U, Tong Y, Jain A K. Age-invariant face recognition[J]. IEEEtransactions on pattern analysis and machine intelligence, 2010, 32(5):947-954.
[2]Wen Y, Li Z, Qiao Y. Latent factor guided convolutional neural networks forage- invariant face recognition[C]//Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition. 2016: 4893-4901.
李季
CloudIn云英產(chǎn)品經(jīng)理
澳大利亞 University of Wollongong 計(jì)算機(jī)系碩士,曾在計(jì)算機(jī)世界、長(zhǎng)河網(wǎng)信等公司出任產(chǎn)品經(jīng)理和運(yùn)營(yíng)經(jīng)理,有 8 年產(chǎn)品經(jīng)驗(yàn),現(xiàn)就職于北京云英傳奇技術(shù)有限公司任大數(shù)據(jù)產(chǎn)品經(jīng)理。在深度學(xué)習(xí)和機(jī)器視覺領(lǐng)域主導(dǎo)過公安和網(wǎng)信辦相關(guān)的多個(gè)項(xiàng)目,希望通過人工智能技術(shù)為社會(huì)創(chuàng)造更多價(jià)值。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】