人工智能也被用來反制假視頻,靠眨眼是否正常來判斷!
人工智能的 PS 視頻已經(jīng)達(dá)到以假亂真的地步,自從去年 Reddit 上出現(xiàn)臉部被移花接木成米歇爾·奧巴馬的色情視頻,利用虛假名人頭像的“深度仿冒(deepfake)”視頻源源不斷出現(xiàn)在互聯(lián)網(wǎng)上。
也有大量免費(fèi)的假視頻軟件出現(xiàn),圖像模型的訓(xùn)練過程依托 Google 開源項(xiàng)目 Tensor Flow,造假成本不高。來自匿名開發(fā)者的 FakeApp 被放上 Reddit 供人免費(fèi)下載,兩個(gè)月就有 12 萬下載量。
軟件工具起初并無惡意,一名開發(fā)者在接受《紐約時(shí)報(bào)》采訪時(shí)說 FakeApp 的初衷是作為一種創(chuàng)意實(shí)驗(yàn),但這不阻礙假視頻被廣泛濫用,繼而引發(fā)假新聞、騷亂和犯罪上方面的爭議,《大西洋月刊》的文章說,假視頻正在摧毀我們對現(xiàn)實(shí)的認(rèn)知。
有些造假視頻看起來毫無破綻,不過依然有漏網(wǎng)之魚,紐約奧爾巴尼大學(xué)的一支團(tuán)隊(duì)發(fā)現(xiàn)了漏洞,并將其用作判別視頻的方法——假視頻中的角色往往無法完美展現(xiàn)真實(shí)人類生理動(dòng)作,比如呼吸、脈搏或眼部動(dòng)作。
研究團(tuán)隊(duì)發(fā)布了篇論文,提到的最新進(jìn)展是眨眼識別。成年人每分鐘平均有 17 次眨眼,或者說每一秒眨眼 0.283 次。講話的時(shí)候,人類眨眼頻率增加到每分鐘 26 次,閱讀時(shí)是每分鐘 4.5 次。
假視頻通過圖像訓(xùn)練算法,而用于訓(xùn)練模型的圖像大多是來自網(wǎng)上的公開圖片,比如造假一份奧巴馬的視頻,首先要找到奧巴馬的臉部圖片。但你很難找到他閉眼但圖片,這會(huì)造成視頻里的假臉缺乏眨眼動(dòng)作,起碼是不自然的眨眼。
“說到在網(wǎng)上 PO 照片,人們僅僅會(huì)放上‘好看的’那些,通常意味著是睜開眼睛的照片,所以 AI 算法往往很少看到閉眼的圖像。”項(xiàng)目的負(fù)責(zé)人 Siwei Lyu 說。
具體來說,Lyu 的團(tuán)隊(duì)訓(xùn)練算法自動(dòng)識別和標(biāo)記眨眼動(dòng)作。這個(gè)過程包括,分析和判斷之前算法首先檢測出視頻中的面部,然后將此后視頻中所有的圖像連續(xù)對齊,分析每個(gè)圖像中眼睛的區(qū)域,判斷這里是否有眨眼動(dòng)作,把這些圖像標(biāo)記出來。
也就是說這套算法會(huì)自動(dòng)識別出視頻中的眨眼部分,判斷視頻中的主體是否眨眼了,眨眼的模式是什么,以此辨別視頻的真假。根據(jù)論文的說法,他們的模型能有效地判斷眼睛狀態(tài),識別假視頻的準(zhǔn)確率達(dá)到 99%。
不過 Lyu 的方法也有局限,制作精良的假視頻中確實(shí)包含有眨眼動(dòng)作,做到完全模擬出人的眨眼方式并非不可實(shí)現(xiàn),多花點(diǎn)功夫一幀幀調(diào)整就可以了。
Lyu 說他們的技術(shù)形成了“第一道防線”,起碼可以拖慢造假者的進(jìn)度。他們也在解決更復(fù)雜的問題,包括眨眼的頻率和持續(xù)時(shí)間。
也有其他人在研究反制假視頻的方式,美國加州一家名為 Truepic 的初創(chuàng)公司也在投資離線圖像和視頻分析技術(shù),同樣通過一些細(xì)節(jié)來檢測深度仿冒,比如頭發(fā)、耳朵、眼睛的反射率等。
Adobe 也通過他們對 PS 圖片的經(jīng)驗(yàn),訓(xùn)練模型識別圖像中經(jīng)過處理的痕跡,一篇論文中展示了他們怎么利用機(jī)器學(xué)習(xí)識別虛假照片。