自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

人臉識(shí)別新工具:數(shù)據(jù)少也能認(rèn)識(shí)“國際臉”

新聞 人臉識(shí)別
日前,亞馬遜的一款人臉識(shí)別工具錯(cuò)誤地將28位美國國會(huì)議員與罪犯相匹配,這一新聞引發(fā)關(guān)注。

 日前,亞馬遜的一款人臉識(shí)別工具錯(cuò)誤地將28位美國國會(huì)議員與罪犯相匹配,這一新聞引發(fā)關(guān)注。人臉識(shí)別工具為何出現(xiàn)這樣的錯(cuò)誤?其實(shí),機(jī)器與人類一樣,見到陌生的外國人也會(huì)有“臉盲”,只能識(shí)別“當(dāng)?shù)厝?rdquo;,對(duì)于來自其他國家/地區(qū)的“外地人”識(shí)別精度較低,這一問題如何解決呢?

引用公開的個(gè)人信息進(jìn)行研究與驗(yàn)證 鄧偉洪團(tuán)隊(duì)供圖

[[280604]]

研究團(tuán)隊(duì)在討論 鄧偉洪團(tuán)隊(duì)供圖

其關(guān)鍵在于讓人臉識(shí)別工具盡量多地認(rèn)識(shí)全球各地居民的臉,而這一過程卻并不容易實(shí)現(xiàn)。北京郵電大學(xué)教授鄧偉洪告訴《中國科學(xué)報(bào)》,人臉識(shí)別工具研發(fā)過程中,使用的訓(xùn)練數(shù)據(jù)越多、越齊全,精度就會(huì)越高。但由于不同國家/地區(qū)對(duì)公民個(gè)人信息的保護(hù),這些信息收集越來越難。沒有訓(xùn)練數(shù)據(jù)就意味著人臉識(shí)別工具只認(rèn)識(shí)“熟人”,而對(duì)于訓(xùn)練數(shù)據(jù)中缺失的人群的識(shí)別精度較低。

近日,鄧偉洪研究團(tuán)隊(duì)的一項(xiàng)研究獲得新進(jìn)展,該團(tuán)隊(duì)揭示了當(dāng)前人臉識(shí)別算法中普遍存在跨國家/地區(qū)識(shí)別偏差問題,構(gòu)建了評(píng)價(jià)偏差程度的人臉數(shù)據(jù)集RFW,提出了減小識(shí)別偏差的信息最大化自適應(yīng)神經(jīng)網(wǎng)絡(luò),以改進(jìn)對(duì)目標(biāo)域的識(shí)別能力。10月27日,相關(guān)研究結(jié)果在由IEEE主辦的國際計(jì)算機(jī)視覺大會(huì)(ICCV)上發(fā)表。

人臉識(shí)別工具的地域之困

卷積神經(jīng)網(wǎng)絡(luò)是人工智能的代表算法之一,具有很強(qiáng)的圖像表征學(xué)習(xí)能力。2012年,深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域興起,其出現(xiàn)極大地推進(jìn)了人臉識(shí)別的發(fā)展,并成為人臉識(shí)別領(lǐng)域的主流技術(shù)。

目前,全球的人臉識(shí)別工具大多根據(jù)深度卷積神經(jīng)網(wǎng)絡(luò)的技術(shù)開發(fā),但該技術(shù)的人臉數(shù)據(jù)的源域基于西方人的面部特征,面對(duì)不同的目標(biāo)域,即不同國家/地區(qū)居民的面部信息識(shí)別需求往往“力不從心”。

鄧偉洪表示,由于缺乏基準(zhǔn)測(cè)試庫,這一領(lǐng)域的研究長(zhǎng)期進(jìn)展緩慢。一款人臉識(shí)別工具即使在當(dāng)?shù)氐淖R(shí)別率很高,也難以精準(zhǔn)到全球人類。這就造成了人臉識(shí)別工具較強(qiáng)的地域性。

為了推動(dòng)該研究,鄧偉洪研究團(tuán)隊(duì)構(gòu)建了一個(gè)新的測(cè)試庫——RFW,以科學(xué)客觀地評(píng)測(cè)人臉識(shí)別中的偏差。

在RFW數(shù)據(jù)庫的基礎(chǔ)上,研究人員驗(yàn)證了微軟、亞馬遜、百度、曠視的商業(yè)API和學(xué)術(shù)界最先進(jìn)的4個(gè)算法。

“這種識(shí)別的偏差確實(shí)存在,一些地區(qū)的錯(cuò)誤率甚至高于西方國家的兩倍。”鄧偉洪說。

該論文的評(píng)審專家表示,RFW與現(xiàn)有數(shù)據(jù)庫相比,該數(shù)據(jù)庫中的數(shù)據(jù)分布更均勻,這將成為跨國家/地區(qū)識(shí)別的一個(gè)較好的基準(zhǔn)評(píng)價(jià)數(shù)據(jù)。

為了探究這種偏差是否是由訓(xùn)練數(shù)據(jù)的分布不平衡引起的,研究人員收集了一個(gè)涵蓋全球各地區(qū)人類信息的訓(xùn)練數(shù)據(jù)庫,最終發(fā)現(xiàn)偏差的發(fā)生受到數(shù)據(jù)和算法兩方面影響。

該論文第一作者、北京郵電大學(xué)博士生王玫解釋,數(shù)據(jù)庫訓(xùn)練數(shù)據(jù)平衡、算法相同,但某些國家/地區(qū)人類的面部信息識(shí)別難度較大,導(dǎo)致識(shí)別準(zhǔn)確率較低。

如何在數(shù)據(jù)少、面部識(shí)別難的情況下提高識(shí)別率?研究人員并沒有放棄,他們決定進(jìn)一步的研究算法,借助算法讓人臉識(shí)別工具舉一反三。

學(xué)習(xí)靠“自覺”

傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)庫搭建過程中需要人工標(biāo)注個(gè)人信息,這一操作面臨隱私泄露的風(fēng)險(xiǎn)。用于物體識(shí)別的無監(jiān)督域自適應(yīng)方法給了研究人員啟發(fā)。

該方法采用無監(jiān)督學(xué)習(xí)的方式,將源域和目標(biāo)域映射到域不變的特征空間,并提高目標(biāo)域性能。研究人員想通過算法解決這一問題,讓機(jī)器自行學(xué)習(xí)。

“這就相當(dāng)于研究人員把試卷出好,機(jī)器作答。”鄧偉洪說。

實(shí)現(xiàn)并不簡(jiǎn)單,在具體操作層面,物體識(shí)別不同于人臉識(shí)別。物體識(shí)別的源域和目標(biāo)域可以重疊,且信息獲取相對(duì)便宜,充足的源域數(shù)據(jù)使識(shí)別工具能夠區(qū)分和判別目標(biāo)域信息。

因此,研究人員提出了一種信息最大化自適應(yīng)網(wǎng)絡(luò)。王玫介紹,該方法一方面減小源域和目標(biāo)域的全局分布差異,另一方面能夠?qū)W習(xí)有區(qū)分性的目標(biāo)域特征。

“也就是說,卷積神經(jīng)網(wǎng)絡(luò)可以在無監(jiān)督的情況下,‘自覺’地學(xué)習(xí)目標(biāo)域人臉的特征。”王玫說。

為了解決兩個(gè)域之間類別不重疊的問題,信息最大化自適應(yīng)網(wǎng)絡(luò)采用譜聚類算法生成“偽標(biāo)簽”,并在監(jiān)督下利用偽標(biāo)簽對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)適應(yīng),初步提高目標(biāo)域的性能。

這種聚類方案與其他不適用于人臉識(shí)別的域自適應(yīng)方法有著本質(zhì)區(qū)別。王玫解釋,新方法可以在全新的目標(biāo)域上自主學(xué)習(xí),不需要人工干預(yù),避免了隱私泄露的風(fēng)險(xiǎn)。

為了進(jìn)一步提高網(wǎng)絡(luò)輸出的鑒別性,研究人員還提出了一種新的基于互信息的自適應(yīng)方法,它以無監(jiān)督的方式在目標(biāo)域的特征之間產(chǎn)生更大的間距。

與一般的有監(jiān)督的損失和有監(jiān)督的互信息不同,該方法具有無監(jiān)督的特性,其可以利用所有無標(biāo)簽的目標(biāo)域數(shù)據(jù),無論這些數(shù)據(jù)是否被成功地分配了偽標(biāo)簽。

基于公開數(shù)據(jù)進(jìn)行驗(yàn)證

這套方案是否能在非監(jiān)督的情況下,提高人臉識(shí)別工具對(duì)不同國家/地區(qū)居民臉部信息的識(shí)別率呢?

研究人員采用全球各地名人的公開數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果表明,信息最大化自適應(yīng)網(wǎng)絡(luò)可以成功地將識(shí)別能力從源域應(yīng)用到其他國家/地區(qū)的目標(biāo)域人群中,且識(shí)別性能優(yōu)于其他域自適應(yīng)方法。消融實(shí)驗(yàn)研究發(fā)現(xiàn),互信息損失對(duì)減少識(shí)別偏差有重要作用。

王玫補(bǔ)充,信息最大化自適應(yīng)網(wǎng)絡(luò)在跨姿態(tài)、跨場(chǎng)景的應(yīng)用上也有很好的泛化性能。

鑒于較好的實(shí)驗(yàn)結(jié)果,研究團(tuán)隊(duì)已經(jīng)對(duì)外發(fā)布RFW數(shù)據(jù)集,以推進(jìn)研究進(jìn)一步深入。

目前,已有哈佛大學(xué)、帝國理工學(xué)院、清華大學(xué)、思科、華為、NEC、IBM等20多個(gè)國家的科研院所、企業(yè)的科研團(tuán)隊(duì)申請(qǐng)使用RFW進(jìn)行多人種人臉識(shí)別研究。

值得一提的是,該方法在進(jìn)行自適應(yīng)學(xué)習(xí)的同時(shí),仍然需要利用源域地區(qū)采集的標(biāo)注數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練。這就意味源域數(shù)據(jù)具有隱私泄露風(fēng)險(xiǎn)。如何在源域數(shù)據(jù)不外傳的情況下進(jìn)行目標(biāo)域的自適應(yīng)學(xué)習(xí),將是非常值得研究的問題。

鄧偉洪表示,下一步希望在完全不采集目標(biāo)域數(shù)據(jù)的情況下,提出具有更強(qiáng)泛化能力的新算法,直接提高人臉識(shí)別工具在未知目標(biāo)域的準(zhǔn)確率。

相關(guān)論文信息:http://whdeng.cn/RFW/index.html

 

 

責(zé)任編輯:張燕妮 來源: 中國科學(xué)報(bào)
相關(guān)推薦

2021-11-10 15:13:45

人臉識(shí)別人工智能數(shù)據(jù)

2020-11-25 08:24:13

人臉識(shí)別

2021-03-17 22:36:51

人臉識(shí)別隱私安全

2021-11-03 10:49:33

人臉識(shí)別人工智能技術(shù)

2021-11-03 13:32:28

MetaFacebook人臉識(shí)別

2017-09-15 13:48:58

支付寶

2021-03-19 14:44:08

人臉識(shí)別安全數(shù)據(jù)

2017-09-19 09:28:55

2023-05-13 09:09:54

AR谷歌

2010-06-29 10:59:44

Windows 8人臉識(shí)別

2017-09-28 15:42:03

2020-11-05 18:59:23

指紋識(shí)別人臉識(shí)別生物識(shí)別

2017-09-17 09:11:35

支付寶螞蟻金服人臉識(shí)別

2021-08-10 15:52:56

人臉識(shí)別AI人工智能

2021-05-10 11:08:00

人工智能人臉識(shí)別

2020-12-03 18:41:53

人臉識(shí)別監(jiān)視監(jiān)管

2021-04-18 14:18:17

人臉識(shí)別人工智能AI

2018-04-04 14:17:11

有臉識(shí)別指紋識(shí)別信息泄露

2020-12-28 12:39:53

面部識(shí)別人工

2023-05-15 20:19:26

谷歌AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)