自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

深入解析人臉解鎖的前世今生

人工智能 人臉識(shí)別
目前市面上有很多產(chǎn)品,比如:支付寶,美顏相機(jī)還有人臉解鎖功能等等,很多都是應(yīng)用了Face++ 的技術(shù)。本文的作者喬梁先生,將從自己作為產(chǎn)品專家的角度,詳細(xì)解析人臉解鎖的前世今生。

??

[[211140]]

?

人工智能分為兩個(gè)階段,首先是感知階段,然后是認(rèn)知階段。目前整個(gè)人工智能還在比較初級(jí)的感知階段,而最主要的兩種感知途徑就是視覺和聽覺,目前我們主要做的是視覺方向。我們公司成立于 2012 年,在視覺方向研究了很多年,一直專注以人臉為核心的方向,那么為什么我們會(huì)做人臉呢?在我們看來(lái),人臉是信息量最大、商業(yè)價(jià)值最高的圖像數(shù)據(jù),我們可以通過(guò)一張圖像知道一個(gè)人的年齡、性別、顏值、以及該人是否為他本人等等很多信息。

手機(jī)解鎖在今年終于爆發(fā)了,它其實(shí)是人臉識(shí)別多年經(jīng)驗(yàn)積累的最終一個(gè)落地結(jié)果。我們先看一下手機(jī)安全的發(fā)展過(guò)程。

??

??

從 2008 年第一臺(tái)蘋果手機(jī)的發(fā)布到現(xiàn)在已有將近 10 年的時(shí)間。在 2009 年時(shí)候出現(xiàn)了密碼解鎖;在 2010 年的時(shí)候了出現(xiàn)圖形鎖之后出現(xiàn)了很多生物識(shí)別技術(shù)(見圖中藍(lán)色字體)。生物識(shí)別的出現(xiàn),最主要目的是為了解決用戶體驗(yàn),因?yàn)闀r(shí)常需要輸入密碼很麻煩,畫一個(gè)圖形解鎖也很麻煩,在 2013 年有了指紋解鎖之后,大家手指一按馬上就可以解鎖了。指紋、人臉識(shí)別、虹膜都是為了解決體驗(yàn)性問(wèn)題。

今年有兩款代表性的手機(jī)發(fā)布,讓人臉這種生物識(shí)別技術(shù)站到了臺(tái)前。第一個(gè)是上半年發(fā)布的三星 S8,三星 S8 是前置單攝的解鎖方案,也就是今年最普及的人臉解鎖方案;第二個(gè)是 iPhone 10。iPhone 10 是前置結(jié)構(gòu)光雙攝的解鎖方案,這個(gè)代表著人臉解鎖的未來(lái)趨勢(shì)。

那么是什么因素推動(dòng)了今年的人臉解鎖成為手機(jī)解鎖的主流呢?

我覺得最主要的因素是工業(yè)設(shè)計(jì)和制造工藝的提升。今年的全面屏成為工業(yè)設(shè)計(jì)上的主流趨勢(shì),大指紋設(shè)計(jì)挪到了手機(jī)背面,指紋的用戶體驗(yàn)優(yōu)勢(shì)降低了。人臉不僅彌補(bǔ)了體驗(yàn)上的不足,更重要的是,人臉只需要攝像頭就可以完成,不需要像指紋一樣占用更多屏幕面積,所以能夠大大提高屏占比。 

第二個(gè)原因是成本和收益問(wèn)題,如果廠商想要在手機(jī)那么小的空間內(nèi)裝一個(gè)指紋模組、虹膜模組,所要犧牲的手機(jī)內(nèi)部空間占用,換句話說(shuō)所需要的成本是巨大的。而人臉識(shí)別不會(huì)占用除攝像頭模組外更多的內(nèi)部空間。 

第三個(gè)是芯片處理能力的提升與人臉識(shí)別算法的成熟。一些硬件層的加速方案可以讓人臉識(shí)別的算法能在手機(jī)上跑得更快,新的活體技術(shù)可以讓刷臉變得更安全。這在后面會(huì)具體來(lái)講。 

第五個(gè)原因是攝像頭模組制造工藝的突破。其實(shí)結(jié)構(gòu)光在幾年前就有了,但是并沒有小型化到手機(jī)這么小的體積內(nèi),iPhone 是第一家推出這樣設(shè)備的廠商。除了結(jié)構(gòu)光之外,還包括普通的紅外 IO 攝像頭、TOF 攝像頭、攝像頭模組的小型化。 

最后一個(gè)原因是用戶體驗(yàn),大家在刷臉解鎖的過(guò)程中不需要做任何的配合式操作,可以拿起手機(jī)直接解鎖。而刷臉還可以抵抗一些常見的干擾,例如暗光、側(cè)臉、小范圍遮擋等。這讓刷臉成為一種體驗(yàn)更優(yōu)的生物識(shí)別方案。 

說(shuō)到用戶體驗(yàn)問(wèn)題,我們來(lái)對(duì)比一下現(xiàn)在最常見的手機(jī)解鎖方案的體驗(yàn)。 

??

??

首先在底庫(kù)采集方面,人臉解鎖只需要采集一張照片就可以了,但指紋需要采集多張。虹膜相對(duì)比較快,但虹膜需要把手機(jī)舉到面前然后等幾秒鐘。從解鎖速度來(lái)看,人臉解鎖速度是最快的,拿起手機(jī)直接解鎖,而指紋需要按到感應(yīng)器,虹膜也需要對(duì)齊眼部。指紋解鎖存在一些常見的干擾,比如指紋在手濕的時(shí)候完全不能解鎖,戴手套也不能解鎖。虹膜解鎖的時(shí)候,戴隱形眼鏡或者對(duì)著陽(yáng)光直射也會(huì)受到干擾。人臉識(shí)別也存在干擾場(chǎng)景,比如說(shuō)晚上家里燈全關(guān)了,或者戴墨經(jīng)、雙胞胎等等都會(huì)干擾,而我們現(xiàn)在解鎖已經(jīng)做到通過(guò)點(diǎn)亮屏幕的亮度就可以進(jìn)行解鎖。因此人臉在整個(gè)體驗(yàn)上比較具有優(yōu)勢(shì)。 

說(shuō)完用戶體驗(yàn),我們來(lái)說(shuō)一下解刷臉這件事到底安不安全。 

常見的生物識(shí)別,除了指紋、虹膜還包括指靜脈、鞏膜、視網(wǎng)膜等一些生物識(shí)別特征。傳統(tǒng)生物識(shí)別所采集到的都是隱私的特征,所以人臉是個(gè)比較另類的生物識(shí)別方式,它采集到的是一個(gè)沒有那么隱私的數(shù)據(jù),因?yàn)樵谖覀內(nèi)粘I钪?,你很容易暴露自己的照片?nbsp;

如上圖所示,從另一個(gè)角度來(lái)講,我們?nèi)搜酆茈y辨別這些指紋圖像是不是一個(gè)人,但我們能夠很輕松地知道右邊這些圖是否屬于同一個(gè)人。在我們?nèi)四X中有個(gè)區(qū)域叫梭狀回,這個(gè)區(qū)域就是用來(lái)做人臉識(shí)別的。梭狀回出了問(wèn)題,就是俗稱的臉盲癥,得了這個(gè)病的人就沒法做人臉識(shí)別。以上觀點(diǎn)是想說(shuō)明人臉相比其它生物識(shí)別是缺少私密性的,而且人臉更適合由人腦來(lái)做識(shí)別。所以將人臉識(shí)別放到解鎖上來(lái)做,需要更強(qiáng)的鑒別真?zhèn)蔚氖侄巍?nbsp;

那么人臉識(shí)別背后到底用了哪些技術(shù)?我們看一下手機(jī)解鎖的流程。 

第一步,我們拿起手機(jī),采集視頻序列幀,這時(shí)候需要檢測(cè)這些幀有沒有人臉,需要找到人臉。 

第二步,分析人臉上的一些屬性,包括人臉眼睛的睜閉狀態(tài),頭的角度等情況,根據(jù)這個(gè)去判斷其到底適不適合解鎖。比如眼睛閉著的時(shí)候就不適合解鎖,因?yàn)檫@說(shuō)明是別人在拿著我的手機(jī)對(duì)著我拍。第三個(gè)技術(shù)是活體檢測(cè),我們需要通過(guò)畫面進(jìn)行判斷你到底是本人在用手機(jī),還是別人在拿著你的翻拍照片進(jìn)行解鎖。第四項(xiàng)技術(shù)是人臉識(shí)別,我們通過(guò)把底庫(kù)的照片和這一幀所提取出來(lái)的人臉特征進(jìn)行比對(duì),判斷到底是不是屬于同一個(gè)人。 

??

??

人臉識(shí)別大家應(yīng)該很早之前就聽說(shuō)過(guò),但是實(shí)際上這技術(shù)的歷史并不是特別長(zhǎng)。2001 年人臉的檢測(cè)剛剛做到可以在 PC 上實(shí)時(shí)運(yùn)行,但沒有用到深度學(xué)習(xí)。2005 年的時(shí)候,歐姆龍第一次把人臉檢測(cè)做到了一臺(tái)相機(jī)里面,這樣相機(jī)在拍照的時(shí)候就可以對(duì)人臉進(jìn)行對(duì)焦。2012 年的時(shí)候,清華有三個(gè)同學(xué),大家一起做了一款游戲 APP,這個(gè)游戲會(huì)根據(jù)你的頭上下?lián)u動(dòng)來(lái)控制游戲里的主角,這是第一款基于人臉進(jìn)行控制的游戲。這三個(gè)同學(xué)就是我們的三位創(chuàng)始人。在手機(jī)上能運(yùn)算人臉識(shí)別算法,這對(duì)于之前又是一個(gè)很大的提升。2015 年的時(shí)候,馬云在漢諾威展上展示了支付寶刷臉支付的方案。大家都知道,支付對(duì)于安全有很高的要求,在這個(gè)方案里用到了各項(xiàng)人臉技術(shù),包括人臉檢測(cè)、人臉識(shí)別和各項(xiàng)活體檢測(cè)。但這個(gè)方案一直到今年才開始商用,在這幾年間刷臉支付得到了突飛猛進(jìn)的發(fā)展。我們?nèi)ツ晖瞥隽艘粋€(gè)產(chǎn)品,叫做 FaceID。大家在使用支付寶或者一些金融產(chǎn)品時(shí),有時(shí)候手機(jī)會(huì)要求你做一些配合式動(dòng)作,比如眨眼、搖頭,這就是 Face ID 做的事情。眨眼、搖頭不是用來(lái)做人臉識(shí)別的,是用來(lái)做活體檢測(cè),判斷人是不是活人。 

那什么是活體檢測(cè)?活體檢測(cè)背后用到了哪些技術(shù)? 

如果一個(gè)人有指紋、有虹膜,他是活體嗎?他不是活體,因?yàn)楣庥兄讣y和虹膜還不夠,你還需要辨別這個(gè)人是否還“活著”。比如,他的手指是熱的嗎?手指下的毛細(xì)血管里有血液在流動(dòng)嗎?這就是活體要解決的問(wèn)題。所以可以看到,其實(shí)任何一種生物識(shí)別方式,對(duì)活體的判別是基于人的一些先驗(yàn)知識(shí)。不管是人臉,指紋還是虹膜,其實(shí)現(xiàn)在只能從這些先驗(yàn)知識(shí)入手進(jìn)行判斷,如同管中窺豹,都存在很大的局限性。 

??

??

如上圖所示。大家覺得比較安全的指紋和虹膜,其實(shí)也可以被攻破。關(guān)于指紋攻擊,網(wǎng)上可以買到幾十元的硅膠模,只要有機(jī)會(huì)取到機(jī)主的指紋圖像,翻印成硅膠模就可以解鎖通過(guò)了,因此現(xiàn)在指紋模組也做了活體的優(yōu)化,比如判斷當(dāng)前手指的血液流速,從而證明你是活人。而關(guān)于虹膜,如果打印高清照片再配合一副隱形眼鏡,也能進(jìn)行攻擊。 

在刷臉的活體技術(shù)上,去年我們做過(guò)的線上金融場(chǎng)景,遇到過(guò)這幾類活體攻擊。第一類是換臉攻擊,比如說(shuō)這個(gè)人臉上貼成另一個(gè)人的臉。第二個(gè)是屏幕翻拍攻擊,類似于今年手機(jī)解鎖攻擊。第三個(gè)是通過(guò)計(jì)算生成一張 3D 假臉進(jìn)行攻擊。因?yàn)榻鹑趫?chǎng)景的特殊性,攻擊手段層出不窮。我們也分別做出了不同類型的活體算法,來(lái)防御這些攻擊。例如我們會(huì)要求用戶搖搖頭、眨眨眼,來(lái)判斷當(dāng)前進(jìn)行操作的對(duì)象是不是一個(gè)“活人”。 

手機(jī)解鎖對(duì)活體提出了更高要求。因?yàn)榻怄i需要拿起手機(jī)就完成檢驗(yàn),用戶不會(huì)愿意為了解個(gè)鎖還要搖搖頭、眨眨眼。怎么讓手機(jī)在那么短的時(shí)間內(nèi)、沒有任何配合動(dòng)作的條件下,也能分辨出你的真?zhèn)文兀?nbsp;

??

??

上面的三張圖,大家能看出哪個(gè)是真人嗎? 

??

??

上面那張還比較簡(jiǎn)單。這張圖呢? 

正確答案是最后兩張是真人。第一張其實(shí)很難分辨,但顴骨有個(gè)鼠標(biāo)指針;第二張是這個(gè)人背景虛化了,真實(shí)攝像頭是不會(huì)采集到背景虛化的人;第三個(gè)是我們將照片打印出來(lái)剪出來(lái)在攝像頭面前拍;然后第四個(gè)是屏幕翻拍。 

所以在手機(jī)解鎖的場(chǎng)景下需要進(jìn)行防范,首先需要定義攻擊場(chǎng)景有哪些。 

??

??

手機(jī)常見的攻擊場(chǎng)景,第一個(gè)是屏幕翻拍攻擊,第二個(gè)是照片打印攻擊。 

在這兩種攻擊場(chǎng)景下,會(huì)有一些漏洞被我們捕捉到。第一個(gè)是露邊框,手機(jī)屏幕在攻擊或者打印照的時(shí)候,會(huì)露出邊框;第二個(gè)是模糊問(wèn)題,如果手機(jī)攻擊離得非常近,邊框沒有了,但是畫面會(huì)模糊。類似的還包括像素點(diǎn)、摩爾紋、手機(jī)屏反光,變形,扭曲等等問(wèn)題。 

剛才我們給機(jī)器提供了大量的攻擊數(shù)據(jù)讓它去訓(xùn)練,機(jī)器看多了數(shù)據(jù),它就自然能辨別哪些是攻擊數(shù)據(jù)了。所以,機(jī)器最終做到的活體防御水平,要遠(yuǎn)遠(yuǎn)超過(guò)這 6 種我們?nèi)庋垡部梢苑直娴膱?chǎng)景,在活體防御上,機(jī)器要比我們的肉眼靠譜得多。 

??

??

下面說(shuō)幾個(gè)人臉識(shí)別中常見的誤區(qū)。 

第一個(gè),我們經(jīng)常遇到一些問(wèn)題,人臉識(shí)別安全程度打幾分?指紋幾分?安全標(biāo)準(zhǔn)從來(lái)不是可以用百分比數(shù)字來(lái)簡(jiǎn)單衡量的。判斷安全的標(biāo)準(zhǔn)是成本。我們拿鎖來(lái)舉例,A 級(jí)鎖的攻擊成本是一分鐘內(nèi)就可以去攻破;B 級(jí)鎖的供給成本差不多要 5 分鐘;有 C 級(jí)鎖,即金庫(kù)用的鎖,需要花三個(gè)小時(shí)才能夠把鎖給攻破。所以說(shuō)安全的標(biāo)準(zhǔn),其實(shí)是你的攻擊成本。iPhone X 的安全性更高,不是說(shuō)他的人臉識(shí)別率比單攝手機(jī)高了多少百分點(diǎn),而是他的攻擊成本更高。因?yàn)榻Y(jié)構(gòu)光攝像頭可以防御所有的平面攻擊手段,攻擊者需要造出立體的人臉模型才能攻擊。 

第二個(gè),紅外攝像頭是不是更安全?

??

?

如上圖,從一張圖像的數(shù)據(jù)量來(lái)看,普通攝像頭采集到的畫面數(shù)據(jù)量要遠(yuǎn)遠(yuǎn)大于紅外攝像頭的數(shù)據(jù)量,所以,并不能簡(jiǎn)單地說(shuō)紅外更安全。但紅外攝像頭確實(shí)可以提高安全性,它的安全性主要體現(xiàn)在對(duì) RGB 的補(bǔ)充上。我們?nèi)庋壑荒芸吹?RGB 圖像,而紅外光是我們?nèi)搜鄄豢梢姷墓狻Mㄟ^(guò)紅外光圖像,我們可以有效辨別到底哪些是人臉,哪些是手機(jī)屏。另外紅外光可以輔助在暗光的場(chǎng)景下進(jìn)行解鎖,對(duì)體驗(yàn)也有幫助。 

第三個(gè),人臉關(guān)鍵點(diǎn)不等于人臉特征。 

??

??

如上圖所示,左邊是關(guān)鍵點(diǎn)。我們拿出 10 個(gè)人的關(guān)鍵點(diǎn)來(lái)比較,可以發(fā)現(xiàn)每個(gè)人的關(guān)鍵點(diǎn)是非常相似的,因此通過(guò)對(duì)比關(guān)鍵點(diǎn)非常不靠譜。人臉特征是指對(duì)人臉的一串編碼數(shù)據(jù),你可以想象成有一個(gè)多維空間,每張人臉是多維空間的一個(gè)點(diǎn),如果采集到了你多張人臉的照片就是多個(gè)點(diǎn),那么點(diǎn)之間的距離越近就越可能是同一個(gè)人,越遠(yuǎn)就越可能不是同一個(gè)人,我們的邏輯是這樣計(jì)算的。 

今年除了蘋果外,所有的解鎖方面都是解鎖級(jí)的方案,遇到支付場(chǎng)景,還是需要依靠指紋或密碼來(lái)完成。我們認(rèn)為人臉解鎖的未來(lái)是人臉支付。而在支付上,只有特定的攝像頭硬件方案才能達(dá)到這種安全水準(zhǔn)。例如蘋果所采用的結(jié)構(gòu)光。 

結(jié)構(gòu)光雙攝,主要的原理是通過(guò)結(jié)構(gòu)光的發(fā)射器和接受器之間產(chǎn)生的相位差來(lái)計(jì)算出人臉的深度,并且針對(duì)這個(gè)深度來(lái)判別真?zhèn)?。所以從結(jié)構(gòu)光硬件本身是能夠防御所有的 2D 攻擊手段,包括屏幕和紙張。但由于支付場(chǎng)景的敏感性,攻擊者可能采用 3D 打印或者硅膠膜此類成本更高的攻擊手段來(lái)竊取機(jī)主的財(cái)產(chǎn)。 這便需要我們這樣的算法公司去解決該類活體問(wèn)題。 

前面有提到,刷臉支付在今年才真正落地。在杭州的一家肯德基門店,已經(jīng)布上了一臺(tái)刷臉支付機(jī),用戶不用帶錢包和手機(jī),只需要跑到機(jī)器前刷臉就能夠完成支付。在這臺(tái)支付設(shè)備的頂上安裝的是結(jié)構(gòu)光攝像頭。 

為了同時(shí)解決體驗(yàn)問(wèn)題和安全問(wèn)題,我們做出了一項(xiàng)新的突破性的活體技術(shù)。具體原理不方便多說(shuō),可以給大家看一下下面這張圖。 

??

??

如上圖所示,大家可以看到右上角的圖,左邊的人臉是個(gè)硅膠的三維人臉,有一個(gè)真人的手里著一張紙,紙上有打印出來(lái)的 2D 人臉。散斑結(jié)構(gòu)光打在這些材質(zhì)上會(huì)產(chǎn)生光斑,我們把采集到的結(jié)構(gòu)光光斑的畫面進(jìn)行運(yùn)算后,可以很有效的判斷出了哪個(gè)材質(zhì)是硅膠、哪個(gè)材質(zhì)是人手、哪個(gè)材質(zhì)是紙張。我們未來(lái)會(huì)有更多的新技術(shù),來(lái)提升手機(jī)刷臉支付場(chǎng)景的安全性。 

展望未來(lái),我們認(rèn)為刷臉支付的場(chǎng)景未來(lái)會(huì)拓展到各行各業(yè),因?yàn)樗⒛槻恍枰浜?,也不需要做任何的操作,用戶沒有感知就可以完成,所以不僅是線上可以用來(lái)做支付,線下可以在新零售、無(wú)人超市,用刷臉來(lái)解決支付問(wèn)題。 

責(zé)任編輯:龐桂玉 來(lái)源: AI前線
相關(guān)推薦

2021-08-26 10:36:02

人臉識(shí)別人工智能技術(shù)

2011-08-12 16:06:01

2011-08-23 09:52:31

CSS

2025-02-12 11:25:39

2014-07-30 10:55:27

2015-11-18 14:14:11

OPNFVNFV

2011-08-15 09:36:01

2016-12-29 13:34:04

阿爾法狗圍棋計(jì)算機(jī)

2013-05-23 16:23:42

Windows Azu微軟公有云

2014-07-15 10:31:07

asyncawait

2021-06-17 07:08:19

Tapablewebpack JavaScript

2012-05-18 16:54:21

FedoraFedora 17

2014-07-21 12:57:25

諾基亞微軟裁員

2016-12-29 18:21:01

2019-06-04 09:00:07

Jenkins X開源開發(fā)人員

2016-11-08 19:19:06

2016-11-03 13:33:31

2011-05-13 09:43:27

產(chǎn)品經(jīng)理PM

2013-11-14 16:03:23

Android設(shè)計(jì)Android Des

2019-08-05 10:08:25

軟件操作系統(tǒng)程序員
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)