防不勝防:正經(jīng)AI研究何以變成了計算機(jī)生成色情作品?
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)。
十年前,一些最基本的人工智能算法(比如圖像識別)需要數(shù)據(jù)中心通常具備的那種計算能力才能使用。而如今,這些工具在智能手機(jī)上就可以使用,并且功能更強(qiáng)大、更精密。
像核能或火箭推進(jìn)一樣,人工智能也被視為一種“兩用”技術(shù),也就是說,它既能帶來好處,又能造成危害。
不久前,Vice報道了人工智能最新造成的一個危害案例:編碼人員正用性虐待圖像訓(xùn)練算法制作色情作品。這篇報道詳細(xì)披露了這名匿名博士生是如何將未經(jīng)雙方同意的圖像編譯為數(shù)據(jù)集,并結(jié)合現(xiàn)有算法生成自定義視頻的。
用人工智能生成色情作品的創(chuàng)作者將這些作品發(fā)布在Pornhub、OnlyFans等平臺上。他向Vice透露自己使用了StyleGAN2,一種由Nvidia構(gòu)建的開源算法。如果你曾經(jīng)在網(wǎng)上看到過極其逼真的假人臉(比如ThisPersonDoesNotExist.com網(wǎng)站),那么它們很有可能是由StyleGAN2生成的。
這項技術(shù)并不是一夜之間就出現(xiàn)的。從某些最早的現(xiàn)代圖像生成算法出現(xiàn),到這種人工智能生成色情作品現(xiàn)象的發(fā)生,都是有跡可循的。
圖源:Getty Images
向生成對抗網(wǎng)絡(luò)(GAN)的飛躍
2014年,圖像生成算法的能力突飛猛進(jìn),生成對抗網(wǎng)絡(luò)(GAN)應(yīng)運(yùn)而生。這是一個名叫伊恩·古德費(fèi)洛(Ian Goodfellow)的人工智能研究員在酒吧和別人爭論時所想到的,即讓算法之間相互競爭,從而產(chǎn)生最佳結(jié)果。
生成圖像需要“生成器”和“鑒別器”。生成器生成圖像,而鑒別器將根據(jù)其訓(xùn)練時接觸到的真實(shí)圖像來判斷該圖像是真是假。鑒別器只會接受最真實(shí)的圖像,從而確保最終結(jié)果是人工智能生成圖像中的精品。
讓技術(shù)變得有用
古德費(fèi)洛對生成對抗網(wǎng)絡(luò)的最初研究在行業(yè)基準(zhǔn)測試中表現(xiàn)良好,但他創(chuàng)建的許多圖像看起來仍然像是讓人難以接受的一團(tuán)亂麻(以抽象和非人性的方式來表達(dá)創(chuàng)建者的想法)。
2016年,其他研究人員已經(jīng)開始試驗(yàn)這項技術(shù),并找到了制作逼真圖像的方法,盡管分辨率很低。當(dāng)時,有一篇出色的論文描述了研究人員是如何生成逼真的臥室圖像的,以及初次嘗試生成人臉的過程。
這項研究再次表明,生成對抗網(wǎng)絡(luò)能夠以訓(xùn)練時接觸到的數(shù)據(jù)為基礎(chǔ)進(jìn)行調(diào)適。這種技術(shù)能夠生成逼真的臥室圖像,同樣也能生成逼真的人臉圖像,這意味著生成對抗網(wǎng)絡(luò)實(shí)際上能夠識別各種不同類型圖像中的圖案。
深度偽造變得越來越普及
以生成對抗網(wǎng)絡(luò)架構(gòu)為基礎(chǔ),目前有多種免費(fèi)的開源方法來合成人臉。隨著亞馬遜云服務(wù)(AWS)和谷歌云(Google Cloud)這樣的云服務(wù)變得越來越容易訪問,訓(xùn)練這些算法的能力也變得越來越容易獲得。
在人工智能研究領(lǐng)域中,最有名的是Nvidia團(tuán)隊開發(fā)的StyleGAN。它于2018年12月發(fā)布,雖然它能夠生成不可思議的高質(zhì)量假臉圖像,但這些圖像上仍然會出現(xiàn)奇怪的模糊畫面和數(shù)字偽像。之后不到一年的時間內(nèi),Nvidia團(tuán)隊發(fā)布了StyleGAN2。
為防止形成這些模糊畫面和偽像,并提高圖像的保真度,該版本修復(fù)了算法的體系結(jié)構(gòu),這些算法能夠適應(yīng)不同的領(lǐng)域。通過使用色情圖像(不僅僅在面部圖像上)訓(xùn)練算法,該系統(tǒng)能夠生成一些它可能從未打算生成的東西。
通過DeepFaceLab和Wav2Lip等開源項目,生成對抗網(wǎng)絡(luò)也已經(jīng)被用來專門從事深度偽造。想要使用這些服務(wù)確實(shí)很容易:從Wav2Lip項目的網(wǎng)站上可以了解到,如何用一行代碼實(shí)現(xiàn)視頻人物與任何音頻文件自動對上口型。
這些技術(shù)仍處在起步階段,但它們將變得更加精密、更有說服力。某些應(yīng)用確實(shí)很有趣,但目前看來,這些算法更容易被某些別有用心之人利用去做一些壞事。如果不采取措施,深度偽造的危害可能超過其微不足道的娛樂價值。