人臉識(shí)別新工具:數(shù)據(jù)少也能認(rèn)識(shí)“國際臉”
日前,亞馬遜的一款人臉識(shí)別工具錯(cuò)誤地將28位美國國會(huì)議員與罪犯相匹配,這一新聞引發(fā)關(guān)注。人臉識(shí)別工具為何出現(xiàn)這樣的錯(cuò)誤?其實(shí),機(jī)器與人類一樣,見到陌生的外國人也會(huì)有“臉盲”,只能識(shí)別“當(dāng)?shù)厝?rdquo;,對(duì)于來自其他國家/地區(qū)的“外地人”識(shí)別精度較低,這一問題如何解決呢?
引用公開的個(gè)人信息進(jìn)行研究與驗(yàn)證 鄧偉洪團(tuán)隊(duì)供圖
研究團(tuán)隊(duì)在討論 鄧偉洪團(tuán)隊(duì)供圖
其關(guān)鍵在于讓人臉識(shí)別工具盡量多地認(rèn)識(shí)全球各地居民的臉,而這一過程卻并不容易實(shí)現(xiàn)。北京郵電大學(xué)教授鄧偉洪告訴《中國科學(xué)報(bào)》,人臉識(shí)別工具研發(fā)過程中,使用的訓(xùn)練數(shù)據(jù)越多、越齊全,精度就會(huì)越高。但由于不同國家/地區(qū)對(duì)公民個(gè)人信息的保護(hù),這些信息收集越來越難。沒有訓(xùn)練數(shù)據(jù)就意味著人臉識(shí)別工具只認(rèn)識(shí)“熟人”,而對(duì)于訓(xùn)練數(shù)據(jù)中缺失的人群的識(shí)別精度較低。
近日,鄧偉洪研究團(tuán)隊(duì)的一項(xiàng)研究獲得新進(jìn)展,該團(tuán)隊(duì)揭示了當(dāng)前人臉識(shí)別算法中普遍存在跨國家/地區(qū)識(shí)別偏差問題,構(gòu)建了評(píng)價(jià)偏差程度的人臉數(shù)據(jù)集RFW,提出了減小識(shí)別偏差的信息最大化自適應(yīng)神經(jīng)網(wǎng)絡(luò),以改進(jìn)對(duì)目標(biāo)域的識(shí)別能力。10月27日,相關(guān)研究結(jié)果在由IEEE主辦的國際計(jì)算機(jī)視覺大會(huì)(ICCV)上發(fā)表。
人臉識(shí)別工具的地域之困
卷積神經(jīng)網(wǎng)絡(luò)是人工智能的代表算法之一,具有很強(qiáng)的圖像表征學(xué)習(xí)能力。2012年,深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域興起,其出現(xiàn)極大地推進(jìn)了人臉識(shí)別的發(fā)展,并成為人臉識(shí)別領(lǐng)域的主流技術(shù)。
目前,全球的人臉識(shí)別工具大多根據(jù)深度卷積神經(jīng)網(wǎng)絡(luò)的技術(shù)開發(fā),但該技術(shù)的人臉數(shù)據(jù)的源域基于西方人的面部特征,面對(duì)不同的目標(biāo)域,即不同國家/地區(qū)居民的面部信息識(shí)別需求往往“力不從心”。
鄧偉洪表示,由于缺乏基準(zhǔn)測(cè)試庫,這一領(lǐng)域的研究長(zhǎng)期進(jìn)展緩慢。一款人臉識(shí)別工具即使在當(dāng)?shù)氐淖R(shí)別率很高,也難以精準(zhǔn)到全球人類。這就造成了人臉識(shí)別工具較強(qiáng)的地域性。
為了推動(dòng)該研究,鄧偉洪研究團(tuán)隊(duì)構(gòu)建了一個(gè)新的測(cè)試庫——RFW,以科學(xué)客觀地評(píng)測(cè)人臉識(shí)別中的偏差。
在RFW數(shù)據(jù)庫的基礎(chǔ)上,研究人員驗(yàn)證了微軟、亞馬遜、百度、曠視的商業(yè)API和學(xué)術(shù)界最先進(jìn)的4個(gè)算法。
“這種識(shí)別的偏差確實(shí)存在,一些地區(qū)的錯(cuò)誤率甚至高于西方國家的兩倍。”鄧偉洪說。
該論文的評(píng)審專家表示,RFW與現(xiàn)有數(shù)據(jù)庫相比,該數(shù)據(jù)庫中的數(shù)據(jù)分布更均勻,這將成為跨國家/地區(qū)識(shí)別的一個(gè)較好的基準(zhǔn)評(píng)價(jià)數(shù)據(jù)。
為了探究這種偏差是否是由訓(xùn)練數(shù)據(jù)的分布不平衡引起的,研究人員收集了一個(gè)涵蓋全球各地區(qū)人類信息的訓(xùn)練數(shù)據(jù)庫,最終發(fā)現(xiàn)偏差的發(fā)生受到數(shù)據(jù)和算法兩方面影響。
該論文第一作者、北京郵電大學(xué)博士生王玫解釋,數(shù)據(jù)庫訓(xùn)練數(shù)據(jù)平衡、算法相同,但某些國家/地區(qū)人類的面部信息識(shí)別難度較大,導(dǎo)致識(shí)別準(zhǔn)確率較低。
如何在數(shù)據(jù)少、面部識(shí)別難的情況下提高識(shí)別率?研究人員并沒有放棄,他們決定進(jìn)一步的研究算法,借助算法讓人臉識(shí)別工具舉一反三。
學(xué)習(xí)靠“自覺”
傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)庫搭建過程中需要人工標(biāo)注個(gè)人信息,這一操作面臨隱私泄露的風(fēng)險(xiǎn)。用于物體識(shí)別的無監(jiān)督域自適應(yīng)方法給了研究人員啟發(fā)。
該方法采用無監(jiān)督學(xué)習(xí)的方式,將源域和目標(biāo)域映射到域不變的特征空間,并提高目標(biāo)域性能。研究人員想通過算法解決這一問題,讓機(jī)器自行學(xué)習(xí)。
“這就相當(dāng)于研究人員把試卷出好,機(jī)器作答。”鄧偉洪說。
實(shí)現(xiàn)并不簡(jiǎn)單,在具體操作層面,物體識(shí)別不同于人臉識(shí)別。物體識(shí)別的源域和目標(biāo)域可以重疊,且信息獲取相對(duì)便宜,充足的源域數(shù)據(jù)使識(shí)別工具能夠區(qū)分和判別目標(biāo)域信息。
因此,研究人員提出了一種信息最大化自適應(yīng)網(wǎng)絡(luò)。王玫介紹,該方法一方面減小源域和目標(biāo)域的全局分布差異,另一方面能夠?qū)W習(xí)有區(qū)分性的目標(biāo)域特征。
“也就是說,卷積神經(jīng)網(wǎng)絡(luò)可以在無監(jiān)督的情況下,‘自覺’地學(xué)習(xí)目標(biāo)域人臉的特征。”王玫說。
為了解決兩個(gè)域之間類別不重疊的問題,信息最大化自適應(yīng)網(wǎng)絡(luò)采用譜聚類算法生成“偽標(biāo)簽”,并在監(jiān)督下利用偽標(biāo)簽對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)適應(yīng),初步提高目標(biāo)域的性能。
這種聚類方案與其他不適用于人臉識(shí)別的域自適應(yīng)方法有著本質(zhì)區(qū)別。王玫解釋,新方法可以在全新的目標(biāo)域上自主學(xué)習(xí),不需要人工干預(yù),避免了隱私泄露的風(fēng)險(xiǎn)。
為了進(jìn)一步提高網(wǎng)絡(luò)輸出的鑒別性,研究人員還提出了一種新的基于互信息的自適應(yīng)方法,它以無監(jiān)督的方式在目標(biāo)域的特征之間產(chǎn)生更大的間距。
與一般的有監(jiān)督的損失和有監(jiān)督的互信息不同,該方法具有無監(jiān)督的特性,其可以利用所有無標(biāo)簽的目標(biāo)域數(shù)據(jù),無論這些數(shù)據(jù)是否被成功地分配了偽標(biāo)簽。
基于公開數(shù)據(jù)進(jìn)行驗(yàn)證
這套方案是否能在非監(jiān)督的情況下,提高人臉識(shí)別工具對(duì)不同國家/地區(qū)居民臉部信息的識(shí)別率呢?
研究人員采用全球各地名人的公開數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果表明,信息最大化自適應(yīng)網(wǎng)絡(luò)可以成功地將識(shí)別能力從源域應(yīng)用到其他國家/地區(qū)的目標(biāo)域人群中,且識(shí)別性能優(yōu)于其他域自適應(yīng)方法。消融實(shí)驗(yàn)研究發(fā)現(xiàn),互信息損失對(duì)減少識(shí)別偏差有重要作用。
王玫補(bǔ)充,信息最大化自適應(yīng)網(wǎng)絡(luò)在跨姿態(tài)、跨場(chǎng)景的應(yīng)用上也有很好的泛化性能。
鑒于較好的實(shí)驗(yàn)結(jié)果,研究團(tuán)隊(duì)已經(jīng)對(duì)外發(fā)布RFW數(shù)據(jù)集,以推進(jìn)研究進(jìn)一步深入。
目前,已有哈佛大學(xué)、帝國理工學(xué)院、清華大學(xué)、思科、華為、NEC、IBM等20多個(gè)國家的科研院所、企業(yè)的科研團(tuán)隊(duì)申請(qǐng)使用RFW進(jìn)行多人種人臉識(shí)別研究。
值得一提的是,該方法在進(jìn)行自適應(yīng)學(xué)習(xí)的同時(shí),仍然需要利用源域地區(qū)采集的標(biāo)注數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練。這就意味源域數(shù)據(jù)具有隱私泄露風(fēng)險(xiǎn)。如何在源域數(shù)據(jù)不外傳的情況下進(jìn)行目標(biāo)域的自適應(yīng)學(xué)習(xí),將是非常值得研究的問題。
鄧偉洪表示,下一步希望在完全不采集目標(biāo)域數(shù)據(jù)的情況下,提出具有更強(qiáng)泛化能力的新算法,直接提高人臉識(shí)別工具在未知目標(biāo)域的準(zhǔn)確率。
相關(guān)論文信息:http://whdeng.cn/RFW/index.html