爆料!傳阿里人靠臉吃飯,真相是......
????從進(jìn)出辦公大樓到會(huì)議室,從取快遞到食堂吃飯,只需對(duì)準(zhǔn)攝像頭刷一下臉,就能輕松完成通行、支付、取件等操作。在阿里巴巴,“臉”已經(jīng)成為員工日常生活辦公的通行證。
?? ??
阿里園區(qū)食堂使用人臉支付
作為園區(qū)“刷臉”的主要技術(shù)支持方,阿里巴巴信息平臺(tái)事業(yè)部園區(qū)大腦技術(shù)團(tuán)隊(duì)負(fù)責(zé)人楊含飛(花名:少昊)表示,今年1月初,***臺(tái)人臉閘機(jī)才正式在園區(qū)落地。而現(xiàn)在,“人臉”已經(jīng)運(yùn)用在阿里園區(qū)的方方面面,平均每天會(huì)進(jìn)行20多萬(wàn)次的人臉識(shí)別。
此外,隨著會(huì)議活動(dòng)對(duì)安防要求的增加,一些大型展會(huì)對(duì)人臉識(shí)別的需求也變得越來(lái)越強(qiáng)烈。在今年9月云棲大會(huì)上,阿里內(nèi)部的這套人臉閘機(jī),支持現(xiàn)場(chǎng)12萬(wàn)人次的通行。
?? ??
云棲大會(huì)上的人臉門(mén)禁
那么,在這些大規(guī)模的人員識(shí)別場(chǎng)景中,阿里內(nèi)部的人臉識(shí)別究竟是如何做保障的?
今天,我們邀請(qǐng)少昊親自揭秘阿里巴巴人臉識(shí)別的優(yōu)化方案。
人臉識(shí)別時(shí),首先需要對(duì)方提供一張照片進(jìn)行人臉注冊(cè),然后在識(shí)別過(guò)程中,通過(guò)終端照片去檢測(cè)當(dāng)前畫(huà)面照片上是否有人臉出現(xiàn)。如果有就會(huì)去提取特征并與服務(wù)端算法進(jìn)行對(duì)比,來(lái)確認(rèn)兩者之間是否一致??梢?jiàn),人臉識(shí)別實(shí)際上是特征的“提取”與“對(duì)比”。
少昊認(rèn)為,在這一過(guò)程中,特征提取是否完整與充分,對(duì)比是否快速準(zhǔn)確,與識(shí)別算法、終端軟硬件以及人臉底庫(kù)照片都有關(guān)系。所以,信息平臺(tái)在做大型人員識(shí)別的優(yōu)化時(shí),主要從這三個(gè)方向入手:
終端的優(yōu)化
終端的優(yōu)化分為硬件與軟件。硬件上,主要針對(duì)攝像頭采用寬動(dòng)態(tài)技術(shù),IPS優(yōu)化,從捕捉畫(huà)面前景與背景處理上達(dá)到清晰均衡的要求,解決逆光問(wèn)題,讓人臉識(shí)別更加快速有效。
?? ??
軟件上,我們主要對(duì)拍攝清晰度做管理和控制。一般來(lái)說(shuō),在捕捉到識(shí)別圖像后,首先會(huì)對(duì)每幀圖像進(jìn)行數(shù)據(jù)監(jiān)控與評(píng)估。在經(jīng)過(guò)數(shù)據(jù)化打標(biāo)之后,會(huì)給圖像進(jìn)行分類(lèi),來(lái)考察不同清晰度下的圖像通過(guò)率。以及不同清晰度與角度下,圖像的實(shí)際分布情況。這能有效管控識(shí)別速度與識(shí)別距離,確保整個(gè)識(shí)別過(guò)程的通行效率。
識(shí)別算法的優(yōu)化
誤識(shí)率是人臉識(shí)別的基礎(chǔ),所以在識(shí)別算法上,技術(shù)人員一是對(duì)誤識(shí)進(jìn)行控制;二是對(duì)相似度進(jìn)行管理。
因?yàn)槭芩惴ㄐ阅苡绊?,隨著人臉底庫(kù)的增加,算法性能會(huì)逐步降低。如何在識(shí)別服務(wù)上進(jìn)行優(yōu)化,成為人臉識(shí)別的一大關(guān)鍵。
用戶(hù)行為產(chǎn)生的大量數(shù)據(jù),使數(shù)據(jù)預(yù)測(cè)成為可能。比如在杭州進(jìn)行人臉識(shí)別出現(xiàn)誤識(shí)別,本人有可能實(shí)際上正在北京出差或休假等。所以,如果結(jié)合數(shù)據(jù)算法模型來(lái)準(zhǔn)確的預(yù)測(cè)用戶(hù)行為,對(duì)人群進(jìn)行合理區(qū)分的話(huà),就能一定程度解決誤識(shí)別。
基于此,團(tuán)隊(duì)成員在誤識(shí)別上進(jìn)行的***個(gè)優(yōu)化就是——分組優(yōu)化。通過(guò)特征細(xì)分人群,降低誤識(shí),提高通過(guò)率。
分組優(yōu)化首先需要考慮時(shí)間與空間因素。如果把一個(gè)區(qū)域空間圈得越小,未來(lái)一定時(shí)間內(nèi)出現(xiàn)在該特定區(qū)域內(nèi)的人也會(huì)越少。同時(shí),時(shí)效越強(qiáng),在該區(qū)域該時(shí)段出現(xiàn)的人臉也會(huì)越少。
同時(shí),結(jié)合實(shí)際應(yīng)用場(chǎng)景,通過(guò)業(yè)務(wù)規(guī)則與特點(diǎn)的判斷,以及人臉識(shí)別算法的性能特性,就能更好確認(rèn)合理的空間、時(shí)間以及人數(shù)的分組規(guī)模情況。
以阿里巴巴園區(qū)人臉識(shí)別取件的分組優(yōu)化為例。從地域?qū)傩陨蟻?lái)看,每個(gè)小郵局都是一個(gè)固定的空間單元,有具體的位置。從時(shí)效性來(lái)看,當(dāng)包裹到達(dá)小郵局后,它的主人在一段時(shí)間內(nèi)會(huì)去拿包裹。從業(yè)務(wù)屬性上來(lái)看,小郵局是收取包裹快遞的地方。通過(guò)這三點(diǎn)屬性,就能基本確定取件場(chǎng)景的分組優(yōu)化方案。判斷哪些員工會(huì)去哪個(gè)小郵局的分組中。
此外,取件還會(huì)存在代領(lǐng)情況。這一情況在業(yè)務(wù)規(guī)則中就沒(méi)法確認(rèn),需要基于歷史行為去分析,一個(gè)包裹被別人代領(lǐng)的可能性是多少,以及被誰(shuí)代領(lǐng)的可能性更高。然后將這一預(yù)判結(jié)果加入到人臉識(shí)別的分組中。
?? ??
阿里園區(qū)小郵局通過(guò)人臉取件
通過(guò)一系列的算法模型學(xué)習(xí)優(yōu)化,提升模型預(yù)測(cè)的準(zhǔn)確性,不斷的改善人員分組質(zhì)量,目前人臉在支持阿里巴巴園區(qū)通行上,誤識(shí)率已經(jīng)有效控制在千分之一左右。
除了分組優(yōu)化外,在面對(duì)不同膚色與人種的情況下,團(tuán)隊(duì)還建立了不同種類(lèi)的算法模型與底庫(kù)。這樣可以針對(duì)特定膚色人種的通行率和誤識(shí)率,做針對(duì)性的優(yōu)化。
人員底庫(kù)照片的優(yōu)化
少昊表示,很多時(shí)候,人臉識(shí)別不成功并不是現(xiàn)場(chǎng)攝像頭或比對(duì)算法出了問(wèn)題,還是底庫(kù)照片的質(zhì)量太差,導(dǎo)致無(wú)法進(jìn)行人臉識(shí)別。除了讓對(duì)方重新提供照片圖像外,還可以通過(guò)算法進(jìn)行大小臉檢測(cè)、照片校正以及身份核實(shí),來(lái)確認(rèn)本人身份。
此外,算法還可以幫助底庫(kù)照片進(jìn)行自學(xué)習(xí)。通過(guò)人員照片序列的分析后,提取特征進(jìn)行圖片聚類(lèi)分析,隨后再通過(guò)圖片質(zhì)量分析后,對(duì)本人身份進(jìn)行核實(shí),進(jìn)而完成底庫(kù)照片的注冊(cè)與特征提取。
通過(guò)上述手段優(yōu)化,在人臉識(shí)別通過(guò)率保持不變的情況下,誤識(shí)率可以降到1‰。
今年雙11期間,阿里園區(qū)的這套人臉識(shí)別技術(shù)還應(yīng)用于雙11作戰(zhàn)指揮室與天貓雙11晚會(huì)現(xiàn)場(chǎng)的安防保障。
少昊表示,通過(guò)人臉屬性識(shí)別的進(jìn)一步豐富,硬件及算法能力的進(jìn)一步提升,未來(lái),人臉識(shí)別技術(shù)將會(huì)滿(mǎn)足更多商業(yè)場(chǎng)景需求,一個(gè)真正的刷臉時(shí)代就要來(lái)了。
【本文為51CTO專(zhuān)欄作者“阿里巴巴官方技術(shù)”原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)聯(lián)系原作者】