AI技術(shù)使偽造視頻更容易?
天啊,我真希望有當時的錄像帶??!6月8日,詹姆斯·科米(James Comey)在面對參議院情報委員會的時候惱怒地說道。當被指控涉嫌撒謊時,科米有這樣的想法并不奇怪。這位前FBI總指揮之所以希望有錄像帶,正是因為在這個社會,我們認為錄音和錄像是真相的化身。證人們的一面之辭遠不如錄像帶來的可信。
今天,當人們看到一段沒有明顯編輯痕跡的視頻--無論是政客在受賄,士兵在犯下戰(zhàn)爭罪行,還是明星的不雅視頻--觀眾們大可推斷這些事的的確確發(fā)生過。但這個信奉'眼見為實'的世界即將被AI顛覆。
我們已經(jīng)習(xí)慣了這樣的假想:在未來,數(shù)據(jù)分析和機器學(xué)習(xí)能夠幫助我們辨別真?zhèn)?。沒有多少人意識到這些技術(shù)實際上可以幫助我們?nèi)鲋e。語音和視頻造假在AI的幫助下有了突破性的進展。在不久的將來,逼真的造假視頻和音頻將會不時地出現(xiàn)在我們生活中。真相被淹沒海量真真假假的圖片、錄音、檔案和視屏之中,使得人們很難確定到底該相信什么。
Lyrebird是蒙特利爾的一家深度學(xué)習(xí)科技創(chuàng)業(yè)公司。這家公司致力于打造逼真的人聲模擬,甚至包含說話的抑揚頓挫和不同的語音語調(diào)。比如,它可以用川普、奧巴馬或希拉里的聲音說話。現(xiàn)在,Lyrebird雖然模仿得有模有樣,但就算吃瓜群眾也能聽出來合成語音的失真和機械化。但不管怎么說,這項技術(shù)發(fā)展迅猛。創(chuàng)意軟件巨頭Adobe正在研發(fā)相似的產(chǎn)品,意圖創(chuàng)造出音頻界的Photoshop。
另一方面,斯坦福的研究人員已在視頻造假技術(shù)上有了驚人的突破。只需一個隨處可見的網(wǎng)絡(luò)攝像頭,這款A(yù)I軟件就可以使YouTube視頻里的人逼真地變換表情和口型。
其他的AI研究組演示了如何將圖片識別技術(shù)的倒著玩,使圖片能夠僅需文字描述就自動合成。此項技術(shù)的一位科研人員,杰夫·克羅恩告訴記者,'現(xiàn)在大家給我發(fā)真圖的時候我會懷疑它是不是造假的。而他們發(fā)假照片的時候我覺得像是真的,因為現(xiàn)在假照片的質(zhì)量和水準太高了'。
這些廉價而高質(zhì)量的偽造技術(shù)令人堪憂。以目前的發(fā)展進程,不消兩三年,吃瓜群眾就將很難識別出造假音頻,而五到十年后,這樣的造假技術(shù)可以愚弄至少一部分的法醫(yī)分析。當可以媲美甚至超越CGI的高質(zhì)量視頻造假工具落戶尋常百姓家,那么偽造將會占據(jù)信息生態(tài)系統(tǒng)的很大一部分。這項技術(shù)的發(fā)展將會對新聞、司法、政府溝通乃至國家安全造成深遠影響,改變我們對證據(jù)和真相的認知。
俄羅斯的情報部門目前聘用了數(shù)千全職員工偽造新聞、社交媒體的內(nèi)容以及主流網(wǎng)站的評論。這些水軍掌管了數(shù)以百萬計的社交媒體賬戶。他們利用這些機器人賬戶發(fā)政治推文以塑形國家的政治討論。牛津互聯(lián)網(wǎng)研究院的宣傳研究項目發(fā)現(xiàn),在俄羅斯按時推送政治探討的推特賬戶里有一半都是機器人。這種情況不僅僅出現(xiàn)在俄羅斯境內(nèi):在美國,俄羅斯的社交媒體機器人已經(jīng)證明了它們有能力驅(qū)使主流媒體報道假新聞,其影響甚至波及美國的股票價格。
試想一下,如果這些機器人水軍不僅有能力偽造假新聞,還能如魚得水地自動生成以假亂真的高清視頻,后果將不堪設(shè)想。技術(shù)行業(yè)和政府部門不應(yīng)該坐以待斃。技術(shù)發(fā)展帶來的威脅是多方面的。因此,我們必須對此采取措施。
有一些將會是技術(shù)上的解決方式。正如有些技術(shù)手段試圖防止不法分子利用PS來制造假幣一樣,也可能會有方式方法來減輕AI偽造技術(shù)帶來的惡劣影響。用于保護比特幣的區(qū)塊鏈(Blockchain)技術(shù)提供了一種可能性:有了密碼學(xué)原理的保駕護航,每一筆交易都有加密的安全記錄,確保了同一枚貨幣不會被重復(fù)支出。根據(jù)區(qū)塊鏈的原理,我們可以設(shè)計出能夠無可爭議地記錄視頻創(chuàng)建時刻的相機和話筒。雖然我們無法阻止視頻編輯和篡改的發(fā)生,這項技術(shù)至少能夠安全加密地保留視頻初次創(chuàng)建的時刻,從而讓專家們意識到在這一日期之后的版本很可能是被改動過的。
其他的解決方式牽扯到法律法規(guī)的制定和實施。警官和公訴人可能要重新考慮他們對視頻或音頻證據(jù)的收集標準了。一封匿名郵件里的視頻文件很可能最終會被認定為不相關(guān)信息,就好像今天的一份含有目擊證詞的匿名郵件一樣缺乏可靠性。不久之后,或許各行各業(yè)又會重振面對面的交流方式,因為電話和視頻通話不僅僅可能被數(shù)字化地攔截,更有可能會被數(shù)字化地假冒。
自十九世紀晚期,隨著相機和留聲機的發(fā)明,社會開始接觸并利用這些技術(shù)來探尋真相。尼克斯總統(tǒng)稱宣稱他對水門事件一無所知,然而錄音揭露了他的謊言??墒乾F(xiàn)在,如果政府和行業(yè)都無所作為的話,我們將生活在一個失去真相仲裁標準的社會。也許十年以后,詹姆斯·科米的愿望實現(xiàn),他和川普的對話錄音帶浮出水面。然而到那時,群眾和史學(xué)家都會不約而同地考慮一個問題:這些錄音究竟是真相的見證還是又一件AI偽造品?