自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="svye0"></sub>

<style id="svye0"></style>

<abbr id="svye0"><rp id="svye0"></rp></abbr>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

人臉識(shí)別新工具：數(shù)據(jù)少也能認(rèn)識(shí)“國際臉”

作者：佚名 2019-10-29 09:55:59

新聞人臉識(shí)別

日前，亞馬遜的一款人臉識(shí)別工具錯(cuò)誤地將28位美國國會(huì)議員與罪犯相匹配，這一新聞引發(fā)關(guān)注。

日前，亞馬遜的一款人臉識(shí)別工具錯(cuò)誤地將28位美國國會(huì)議員與罪犯相匹配，這一新聞引發(fā)關(guān)注。人臉識(shí)別工具為何出現(xiàn)這樣的錯(cuò)誤？其實(shí)，機(jī)器與人類一樣，見到陌生的外國人也會(huì)有“臉盲”，只能識(shí)別“當(dāng)?shù)厝?rdquo;，對(duì)于來自其他國家/地區(qū)的“外地人”識(shí)別精度較低，這一問題如何解決呢？

引用公開的個(gè)人信息進(jìn)行研究與驗(yàn)證鄧偉洪團(tuán)隊(duì)供圖

研究團(tuán)隊(duì)在討論鄧偉洪團(tuán)隊(duì)供圖

其關(guān)鍵在于讓人臉識(shí)別工具盡量多地認(rèn)識(shí)全球各地居民的臉，而這一過程卻并不容易實(shí)現(xiàn)。北京郵電大學(xué)教授鄧偉洪告訴《中國科學(xué)報(bào)》，人臉識(shí)別工具研發(fā)過程中，使用的訓(xùn)練數(shù)據(jù)越多、越齊全，精度就會(huì)越高。但由于不同國家/地區(qū)對(duì)公民個(gè)人信息的保護(hù)，這些信息收集越來越難。沒有訓(xùn)練數(shù)據(jù)就意味著人臉識(shí)別工具只認(rèn)識(shí)“熟人”，而對(duì)于訓(xùn)練數(shù)據(jù)中缺失的人群的識(shí)別精度較低。

近日，鄧偉洪研究團(tuán)隊(duì)的一項(xiàng)研究獲得新進(jìn)展，該團(tuán)隊(duì)揭示了當(dāng)前人臉識(shí)別算法中普遍存在跨國家/地區(qū)識(shí)別偏差問題，構(gòu)建了評(píng)價(jià)偏差程度的人臉數(shù)據(jù)集RFW，提出了減小識(shí)別偏差的信息最大化自適應(yīng)神經(jīng)網(wǎng)絡(luò)，以改進(jìn)對(duì)目標(biāo)域的識(shí)別能力。10月27日，相關(guān)研究結(jié)果在由IEEE主辦的國際計(jì)算機(jī)視覺大會(huì)（ICCV）上發(fā)表。

人臉識(shí)別工具的地域之困

卷積神經(jīng)網(wǎng)絡(luò)是人工智能的代表算法之一，具有很強(qiáng)的圖像表征學(xué)習(xí)能力。2012年，深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域興起，其出現(xiàn)極大地推進(jìn)了人臉識(shí)別的發(fā)展，并成為人臉識(shí)別領(lǐng)域的主流技術(shù)。

目前，全球的人臉識(shí)別工具大多根據(jù)深度卷積神經(jīng)網(wǎng)絡(luò)的技術(shù)開發(fā)，但該技術(shù)的人臉數(shù)據(jù)的源域基于西方人的面部特征，面對(duì)不同的目標(biāo)域，即不同國家/地區(qū)居民的面部信息識(shí)別需求往往“力不從心”。

鄧偉洪表示，由于缺乏基準(zhǔn)測(cè)試庫，這一領(lǐng)域的研究長(zhǎng)期進(jìn)展緩慢。一款人臉識(shí)別工具即使在當(dāng)?shù)氐淖R(shí)別率很高，也難以精準(zhǔn)到全球人類。這就造成了人臉識(shí)別工具較強(qiáng)的地域性。

為了推動(dòng)該研究，鄧偉洪研究團(tuán)隊(duì)構(gòu)建了一個(gè)新的測(cè)試庫——RFW，以科學(xué)客觀地評(píng)測(cè)人臉識(shí)別中的偏差。

在RFW數(shù)據(jù)庫的基礎(chǔ)上，研究人員驗(yàn)證了微軟、亞馬遜、百度、曠視的商業(yè)API和學(xué)術(shù)界最先進(jìn)的4個(gè)算法。

“這種識(shí)別的偏差確實(shí)存在，一些地區(qū)的錯(cuò)誤率甚至高于西方國家的兩倍。”鄧偉洪說。

該論文的評(píng)審專家表示，RFW與現(xiàn)有數(shù)據(jù)庫相比，該數(shù)據(jù)庫中的數(shù)據(jù)分布更均勻，這將成為跨國家/地區(qū)識(shí)別的一個(gè)較好的基準(zhǔn)評(píng)價(jià)數(shù)據(jù)。

為了探究這種偏差是否是由訓(xùn)練數(shù)據(jù)的分布不平衡引起的，研究人員收集了一個(gè)涵蓋全球各地區(qū)人類信息的訓(xùn)練數(shù)據(jù)庫，最終發(fā)現(xiàn)偏差的發(fā)生受到數(shù)據(jù)和算法兩方面影響。

該論文第一作者、北京郵電大學(xué)博士生王玫解釋，數(shù)據(jù)庫訓(xùn)練數(shù)據(jù)平衡、算法相同，但某些國家/地區(qū)人類的面部信息識(shí)別難度較大，導(dǎo)致識(shí)別準(zhǔn)確率較低。

如何在數(shù)據(jù)少、面部識(shí)別難的情況下提高識(shí)別率？研究人員并沒有放棄，他們決定進(jìn)一步的研究算法，借助算法讓人臉識(shí)別工具舉一反三。

學(xué)習(xí)靠“自覺”

傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)庫搭建過程中需要人工標(biāo)注個(gè)人信息，這一操作面臨隱私泄露的風(fēng)險(xiǎn)。用于物體識(shí)別的無監(jiān)督域自適應(yīng)方法給了研究人員啟發(fā)。

該方法采用無監(jiān)督學(xué)習(xí)的方式，將源域和目標(biāo)域映射到域不變的特征空間，并提高目標(biāo)域性能。研究人員想通過算法解決這一問題，讓機(jī)器自行學(xué)習(xí)。

“這就相當(dāng)于研究人員把試卷出好，機(jī)器作答。”鄧偉洪說。

實(shí)現(xiàn)并不簡(jiǎn)單，在具體操作層面，物體識(shí)別不同于人臉識(shí)別。物體識(shí)別的源域和目標(biāo)域可以重疊，且信息獲取相對(duì)便宜，充足的源域數(shù)據(jù)使識(shí)別工具能夠區(qū)分和判別目標(biāo)域信息。

因此，研究人員提出了一種信息最大化自適應(yīng)網(wǎng)絡(luò)。王玫介紹，該方法一方面減小源域和目標(biāo)域的全局分布差異，另一方面能夠?qū)W習(xí)有區(qū)分性的目標(biāo)域特征。

“也就是說，卷積神經(jīng)網(wǎng)絡(luò)可以在無監(jiān)督的情況下，‘自覺’地學(xué)習(xí)目標(biāo)域人臉的特征。”王玫說。

為了解決兩個(gè)域之間類別不重疊的問題，信息最大化自適應(yīng)網(wǎng)絡(luò)采用譜聚類算法生成“偽標(biāo)簽”，并在監(jiān)督下利用偽標(biāo)簽對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)適應(yīng)，初步提高目標(biāo)域的性能。

這種聚類方案與其他不適用于人臉識(shí)別的域自適應(yīng)方法有著本質(zhì)區(qū)別。王玫解釋，新方法可以在全新的目標(biāo)域上自主學(xué)習(xí)，不需要人工干預(yù)，避免了隱私泄露的風(fēng)險(xiǎn)。

為了進(jìn)一步提高網(wǎng)絡(luò)輸出的鑒別性，研究人員還提出了一種新的基于互信息的自適應(yīng)方法，它以無監(jiān)督的方式在目標(biāo)域的特征之間產(chǎn)生更大的間距。

與一般的有監(jiān)督的損失和有監(jiān)督的互信息不同，該方法具有無監(jiān)督的特性，其可以利用所有無標(biāo)簽的目標(biāo)域數(shù)據(jù)，無論這些數(shù)據(jù)是否被成功地分配了偽標(biāo)簽。

基于公開數(shù)據(jù)進(jìn)行驗(yàn)證

這套方案是否能在非監(jiān)督的情況下，提高人臉識(shí)別工具對(duì)不同國家/地區(qū)居民臉部信息的識(shí)別率呢？

研究人員采用全球各地名人的公開數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果表明，信息最大化自適應(yīng)網(wǎng)絡(luò)可以成功地將識(shí)別能力從源域應(yīng)用到其他國家/地區(qū)的目標(biāo)域人群中，且識(shí)別性能優(yōu)于其他域自適應(yīng)方法。消融實(shí)驗(yàn)研究發(fā)現(xiàn)，互信息損失對(duì)減少識(shí)別偏差有重要作用。

王玫補(bǔ)充，信息最大化自適應(yīng)網(wǎng)絡(luò)在跨姿態(tài)、跨場(chǎng)景的應(yīng)用上也有很好的泛化性能。

鑒于較好的實(shí)驗(yàn)結(jié)果，研究團(tuán)隊(duì)已經(jīng)對(duì)外發(fā)布RFW數(shù)據(jù)集，以推進(jìn)研究進(jìn)一步深入。

目前，已有哈佛大學(xué)、帝國理工學(xué)院、清華大學(xué)、思科、華為、NEC、IBM等20多個(gè)國家的科研院所、企業(yè)的科研團(tuán)隊(duì)申請(qǐng)使用RFW進(jìn)行多人種人臉識(shí)別研究。

值得一提的是，該方法在進(jìn)行自適應(yīng)學(xué)習(xí)的同時(shí)，仍然需要利用源域地區(qū)采集的標(biāo)注數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練。這就意味源域數(shù)據(jù)具有隱私泄露風(fēng)險(xiǎn)。如何在源域數(shù)據(jù)不外傳的情況下進(jìn)行目標(biāo)域的自適應(yīng)學(xué)習(xí)，將是非常值得研究的問題。

鄧偉洪表示，下一步希望在完全不采集目標(biāo)域數(shù)據(jù)的情況下，提出具有更強(qiáng)泛化能力的新算法，直接提高人臉識(shí)別工具在未知目標(biāo)域的準(zhǔn)確率。

相關(guān)論文信息：http://whdeng.cn/RFW/index.html

責(zé)任編輯：張燕妮來源：中國科學(xué)報(bào)

人臉識(shí)別人工智能亞馬遜

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)