自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

你的人臉數(shù)據(jù)都去了哪兒?

人工智能 人臉識(shí)別
無(wú)處不在的人臉識(shí)別,當(dāng)采集人臉數(shù)據(jù)的渠道越來(lái)越廣,很多人會(huì)疑惑,我們的人臉數(shù)據(jù)最終都流向了哪里?

在AI換臉軟件ZAO和曠視校園人臉識(shí)別的風(fēng)波后,17萬(wàn)人臉數(shù)據(jù)被公開掛在網(wǎng)上商城出售的消息“接踵而至”,人臉突然成了“危險(xiǎn)品”。

無(wú)處不在的人臉識(shí)別,當(dāng)采集人臉數(shù)據(jù)的渠道越來(lái)越廣,很多人會(huì)疑惑,我們的人臉數(shù)據(jù)最終都流向了哪里?

在刷臉解鎖手機(jī),付款,進(jìn)出入高鐵站、機(jī)場(chǎng)的時(shí)代,你的臉可能在研究人員的數(shù)據(jù)集中,也可能在暗網(wǎng)的黑產(chǎn)交易中,也可能被Deepfake后換到了另一個(gè)身體上……

人臉數(shù)據(jù)都去了哪兒?數(shù)據(jù)集或成為隱患

AI時(shí)代下,科技公司會(huì)通過(guò)數(shù)十億張人臉圖片的訓(xùn)練來(lái)改進(jìn)面部識(shí)別算法,你的臉很有可能就是“訓(xùn)練樣本”之一,那么軟件公司又通常從哪些渠道獲取人臉圖像“喂養(yǎng)”自家的算法呢?

早年,人臉識(shí)別還沒有進(jìn)入到深度學(xué)習(xí)的階段,人臉數(shù)據(jù)收集還是打著隱私的烙印,研究人員需要獲得志愿者同意,才能采集人臉數(shù)據(jù)納入到數(shù)據(jù)庫(kù)中。比如早期由耶魯大學(xué)計(jì)算視覺與控制中心創(chuàng)建的Yale人臉數(shù)據(jù)庫(kù),只包含了15位志愿者的165張圖片。

但是到了后期,尤其是深度學(xué)習(xí)技術(shù)的快速應(yīng)用普及,幾百?gòu)堉驹刚叩娜四槍?duì)于數(shù)據(jù)訓(xùn)練來(lái)說(shuō)只是杯水車薪,人臉數(shù)據(jù)的收集也開始走向不可控。

人臉數(shù)據(jù)集通常情況下是為圖像識(shí)別賽事準(zhǔn)備的,比如微軟的MS Celeb 1M,這個(gè)由微軟在2016年發(fā)布,包含了10萬(wàn)個(gè)名人,近1000萬(wàn)張面部圖片的數(shù)據(jù)庫(kù),就是用來(lái)服務(wù)當(dāng)時(shí)最高水平圖像識(shí)別賽事之一的MSR IRC。

 

你的人臉數(shù)據(jù)都去了哪兒?

同樣還有業(yè)界“黃金標(biāo)準(zhǔn)”之稱的人臉識(shí)別算法測(cè)試FRVT,其背后由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)提供人臉數(shù)據(jù)集支持。

此時(shí)以學(xué)術(shù)研究為目的的人臉數(shù)據(jù)集還處在可控范圍內(nèi),但是到了后期,誰(shuí)也無(wú)法控制這些人臉數(shù)據(jù)到底被用作什么,數(shù)據(jù)訓(xùn)練之外,它又流向了哪里?

如果我們?cè)谒阉饕胬镦I入關(guān)鍵詞“人臉數(shù)據(jù)集”,會(huì)發(fā)現(xiàn)海量的人臉數(shù)據(jù)庫(kù)可以被下載獲取,就像在網(wǎng)上下載資源一樣,輕點(diǎn)一下,跳轉(zhuǎn)到下載軟件,幾個(gè)G的人臉數(shù)據(jù)包就“屬于”你了。

 

你的人臉數(shù)據(jù)都去了哪兒?

成千上萬(wàn)張被標(biāo)記的人臉數(shù)據(jù),如此輕易被獲得,細(xì)思極恐。問題隨之而來(lái),數(shù)據(jù)集中的人臉到底從何而來(lái)?

鎂客網(wǎng)粗略統(tǒng)計(jì)了幾個(gè)包含人臉數(shù)據(jù)較多,且常用的人臉數(shù)據(jù)集,從發(fā)布機(jī)構(gòu)來(lái)看,多為科技公司和高校,獲取渠道有三個(gè):1、爬取互聯(lián)網(wǎng)數(shù)據(jù);2、源自雅虎旗下網(wǎng)絡(luò)相冊(cè)Flickr;3、新聞機(jī)構(gòu)、商業(yè)公司等。

 

你的人臉數(shù)據(jù)都去了哪兒?

這些人臉數(shù)據(jù)集有的已經(jīng)做好標(biāo)注,囊括了人臉關(guān)鍵點(diǎn)檢測(cè)、人臉表情、人臉年齡和性別、人臉姿態(tài)等信息。

多數(shù)數(shù)據(jù)集在開放的時(shí)候,都會(huì)寫上不可商用的補(bǔ)充協(xié)議,強(qiáng)調(diào)是在知識(shí)共享許可(CC協(xié)議)下抓取和搜索圖像,根據(jù)CC協(xié)議中:照片可以重新用于學(xué)術(shù)研究,但照片中的人物并不一定授權(quán)許可,而是版權(quán)所有者授權(quán)。然而數(shù)據(jù)集公布后,發(fā)布機(jī)構(gòu)也無(wú)法掌管它的使用。

 

你的人臉數(shù)據(jù)都去了哪兒?

不然,微軟也不會(huì)在被媒體大面積曝光后,悄悄地刪除了這個(gè)世界上最大的公開人臉識(shí)別數(shù)據(jù)庫(kù)。之后另外兩個(gè)學(xué)術(shù)單位也刪除了相關(guān)的數(shù)據(jù)集:分別是杜克大學(xué)的Duke MTMC監(jiān)控?cái)?shù)據(jù)集,和斯坦福大學(xué)的Brainwash數(shù)據(jù)集。

當(dāng)初衷是為了推動(dòng)學(xué)術(shù)研究的人臉數(shù)據(jù)集,都有被商用以及濫用的風(fēng)險(xiǎn),更何況那些源自其他渠道的人臉數(shù)據(jù)。

以人臉數(shù)據(jù)買賣為例,早在2016年,知乎上就出現(xiàn)了網(wǎng)友在淘寶買人臉數(shù)據(jù)的話題。除了網(wǎng)上商城之外,人臉數(shù)據(jù)也可以從售賣面部數(shù)據(jù)的商業(yè)公司處獲得,比如一家名為Vigilant Solutions的公司就提供1500萬(wàn)張面孔,可以用來(lái)“解決”人臉識(shí)別軟件訓(xùn)練的難題。

至于這些人臉又源自哪里,恐怕和上述幾個(gè)渠道脫不了干系,也有可能是直接下載的公開數(shù)據(jù)集進(jìn)行轉(zhuǎn)賣。

 

你的人臉數(shù)據(jù)都去了哪兒?

人臉數(shù)據(jù)被賣了也好,流向人臉數(shù)據(jù)集也罷,歸根結(jié)底,后續(xù)的應(yīng)用是完全失控的。

“裸奔”的人臉數(shù)據(jù),防不勝防的風(fēng)險(xiǎn)

如果早期我們收集人臉數(shù)據(jù)還是在志愿者的知情同意下獲取,后期就完全摒棄個(gè)人隱私,直接通過(guò)爬蟲程序,美其名曰要遵守共享知識(shí)協(xié)議,但很多人在上傳自己的照片到社交平臺(tái)、互聯(lián)網(wǎng)相冊(cè)的時(shí)候,壓根不知道這些圖片已經(jīng)被納入了這個(gè)協(xié)議下。

就像前陣子掀起軒然大波的ZAO,在密密麻麻的用戶協(xié)議中,一排不起眼的條款提到“同意授予ZAO及其關(guān)聯(lián)公司以及ZAO用戶全球范圍內(nèi)完全免費(fèi)、不可撤銷、永久、可轉(zhuǎn)授權(quán)和可再許可的權(quán)利”,如果沒有后續(xù)的風(fēng)波,你的人臉數(shù)據(jù)悄然無(wú)息間就被“賣”了。

當(dāng)前,收集人臉的途徑非常多,除了政府部門的安保需要,很多商業(yè)場(chǎng)景也都要求使用面部識(shí)別。比如參加某個(gè)大型會(huì)議,主辦方需要提供個(gè)人照片提前錄入到人臉識(shí)別系統(tǒng);比如住酒店,需要面部識(shí)別確認(rèn);再比如一些社交APP,自動(dòng)識(shí)別標(biāo)記上傳圖片中的人臉;還有一些披著相冊(cè)應(yīng)用外衣,實(shí)際是收集人臉信息的軟件程序……

之前Facebook因“未經(jīng)用戶同意,非法收集并存儲(chǔ)數(shù)百萬(wàn)用戶的生物識(shí)別數(shù)據(jù)”被集體起訴,在今年9月,壓力之下的Facebook選擇停止在用戶的照片和標(biāo)簽建議中默認(rèn)使用面部識(shí)別功能。

 

你的人臉數(shù)據(jù)都去了哪兒?

當(dāng)你把包含自己人臉的照片上傳到云端,沒有人確保最終這些人臉數(shù)據(jù)可以被妥善保管。上傳到平臺(tái),必然涉及到會(huì)不會(huì)保存到云端,如果在云端,數(shù)據(jù)最終流向何處呢?帶來(lái)的風(fēng)險(xiǎn)是什么?

其實(shí)從人臉數(shù)據(jù)集的來(lái)源渠道也能了解到上傳面部照片到網(wǎng)上的風(fēng)險(xiǎn)是非常高的。

此前有媒體曝光,國(guó)內(nèi)一家人臉識(shí)別公司發(fā)生大規(guī)模數(shù)據(jù)泄露事件,超過(guò)250萬(wàn)人的數(shù)據(jù)可被獲取,其中包括姓名、身份證號(hào)碼以及照片。

今年年初,美國(guó)海關(guān)和邊境保護(hù)局收集的旅客照片和車牌照片讓一個(gè)外包公司泄露,而流出的數(shù)據(jù)已經(jīng)被人掛在暗網(wǎng)上,可以免費(fèi)下載。

類似新聞層出不窮,所以人臉數(shù)據(jù)引發(fā)的風(fēng)險(xiǎn)也非常高,當(dāng)隱私信息被出售或者可被公開獲取后,人臉可以用于金融領(lǐng)域的詐騙、亦或是在換臉軟件下,被用在一些不當(dāng)?shù)膱?chǎng)合下,比如將你的臉成小視頻的女主角。除此之外,圍繞人臉識(shí)別系統(tǒng)的種族歧視和偏見爭(zhēng)議,也引發(fā)了巨大爭(zhēng)議。

人臉保衛(wèi)戰(zhàn),收集容易監(jiān)管難

有的時(shí)候,技術(shù)和應(yīng)用會(huì)處在相悖的一個(gè)狀態(tài),一方面,算法需要大量的人臉數(shù)據(jù)去優(yōu)化,從而帶來(lái)更準(zhǔn)確、安全、高效的識(shí)別,避免可能會(huì)發(fā)生的欺騙性行為,另一方面,在優(yōu)化算法的過(guò)程中又難以保證人臉數(shù)據(jù)的安全和不濫用,算法應(yīng)用到場(chǎng)景中又會(huì)再次無(wú)限制收集更多的人臉數(shù)據(jù),最終陷入兩難的局面。

研究人臉識(shí)別的技術(shù)公司非常多,從CV四小龍到谷歌、微軟、亞馬遜、阿里巴巴這樣的科技巨頭,它們借助技術(shù)提高社會(huì)效率的同時(shí),也會(huì)掉入輿論的旋渦中。

就在最近,繼支付寶要在三年投入30億推動(dòng)刷臉支付后,有消息稱微信也將拿出100億補(bǔ)貼刷臉硬件設(shè)備的推廣,當(dāng)人臉作為常態(tài)的身份認(rèn)證方式,保衛(wèi)人臉安全也愈加重要。

 

但人臉數(shù)據(jù)收集容易,監(jiān)管卻是難上加難,無(wú)論是國(guó)外還是國(guó)內(nèi),在人臉數(shù)據(jù)安全上都顯得憂心忡忡,美國(guó)的舊金山和薩默維爾已經(jīng)通過(guò)立法的方式禁止在公共場(chǎng)所使用面部識(shí)別技術(shù),其中舊金山是禁止警察和其他政府機(jī)構(gòu)使用面部識(shí)別技術(shù)。這種一刀切的管理方式,雖然一定程度上規(guī)避了風(fēng)險(xiǎn),但治標(biāo)不治本。

國(guó)內(nèi)的話,因?yàn)槿四樧R(shí)別走進(jìn)教室以及換臉軟件ZAO的病毒式傳播,不少人開始注意到人臉數(shù)據(jù)安全的問題。近日有消息,有關(guān)部門將發(fā)布人臉識(shí)別領(lǐng)域相關(guān)金融標(biāo)準(zhǔn),以明確人臉信息采集、傳輸、存儲(chǔ)、利用等環(huán)節(jié)的安全管理要求。

其實(shí),談到如何保護(hù)我們的人臉數(shù)據(jù),無(wú)外乎三個(gè)方面。除了個(gè)人提高安全意識(shí)之外,采集人臉數(shù)據(jù)的商業(yè)公司也需要通過(guò)技術(shù)手段保護(hù)數(shù)據(jù)的安全,監(jiān)管部門則從制度層面加快相關(guān)法規(guī)標(biāo)準(zhǔn)的落地。

悲觀的想,技術(shù)是雙刃劍,雖然我們通過(guò)規(guī)則約束可以減少一定的風(fēng)險(xiǎn),但有買賣,就有傷害,只要技術(shù)需要,你的人臉數(shù)據(jù)去哪兒了,被用作什么,可能誰(shuí)也不知道。

責(zé)任編輯:未麗燕 來(lái)源: 鎂碦 網(wǎng)
相關(guān)推薦

2018-02-26 17:42:58

大數(shù)據(jù)一線城市北上廣深

2013-05-03 14:11:43

程序員

2012-12-28 09:32:16

健康數(shù)據(jù)App

2019-04-30 08:49:23

通信人才研發(fā)

2014-06-09 16:32:55

大數(shù)據(jù)大數(shù)據(jù)人才

2015-11-13 09:34:25

流量wifi運(yùn)營(yíng)商

2021-08-11 09:47:57

MySQL 數(shù)據(jù)InnoDB

2020-12-23 08:29:08

人臉識(shí)別AI人工智能

2017-05-15 15:54:50

MySQL數(shù)據(jù)庫(kù)

2019-09-29 08:50:01

Python IT旅游

2024-01-25 17:58:14

OpenAIAI科技公司

2015-04-03 17:26:34

Adobe

2015-02-10 10:08:59

JavaScript

2018-09-12 14:58:54

程序員年紀(jì)大辭退

2015-11-10 10:57:18

流量不清零運(yùn)營(yíng)商

2020-06-11 18:06:03

電腦電路板元件

2011-06-14 09:12:12

管理員文件

2021-09-07 09:01:07

人臉識(shí)別人工智能數(shù)據(jù)

2018-03-15 10:24:56

2024-06-12 12:57:12

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)