千年一瞬,兵馬俑竟眨眼了!外國小哥用AI復(fù)原了他
?千年一瞬,他們眨眼的瞬間,仿佛歷史重演。
前不久,外國博主Panagiotis Constantinou用AI修復(fù)了秦代兵馬俑。
更令人驚艷的是,他還讓古人做出了細(xì)微的動(dòng)態(tài)表情。
快看,兵馬俑在向你眨眼、微笑。
去過兵馬俑后,大家都會(huì)對(duì)這些泥塑真人古跡的感到震撼。再看用AI復(fù)原后的兵馬俑,竟變成了有血有肉的大叔。
每個(gè)兵馬俑的表情都是千奇百態(tài),幾千年過去了,我們很難想象出他們當(dāng)時(shí)的樣子。
這位外國小哥讓這些兵俑重新煥發(fā)了生機(jī),穿越千年來和你對(duì)話。
此前,B站UP主大谷也對(duì)兵馬俑進(jìn)行了修復(fù),讓其嘴巴也動(dòng)了起來。
其實(shí),除了兵馬俑,Panagiotis Constantinou還對(duì)埃及帝王敵后、古希臘哲學(xué)家、英國女王等做了一系列動(dòng)態(tài)修復(fù)。
接下來一起欣賞下。
穿越時(shí)空相逢
古羅馬末期聲名顯赫的首富Marcus Crassus
?
亞歷山大大帝
古埃及艷后
英國女王
......
憑借這一系列修復(fù),外國博主也爆火出圈,也引來許多人的關(guān)注。
修復(fù)技術(shù)
那么AI修復(fù)工作一般都是如何實(shí)現(xiàn)的呢?
大多都會(huì)用到這三個(gè)技術(shù):第一個(gè)是負(fù)責(zé)做補(bǔ)幀的DAIN,第二個(gè)是做分辨率擴(kuò)增的ESRGAN,第三個(gè)是上色的DeOldify。
DAIN:深度感知視頻幀插值(DAIN)模型,通過探索深度信息來顯式地檢測(cè)遮擋。該項(xiàng)目開發(fā)了一個(gè)深度感知流動(dòng)投影層,優(yōu)選取樣更近的物體,以合成中間流插補(bǔ)視頻幀。
ESRGAN:ESRGAN改進(jìn)自SRGAN ,主要用來做視頻超分辨率。
與SRGAN的深層模型越來越難以訓(xùn)練相反,更深層次的 ESRGAN 模型通過簡單的訓(xùn)練就能達(dá)到卓越的性能,核心點(diǎn)在于平衡視覺質(zhì)量和峰值信噪比的網(wǎng)絡(luò)插值策略。
DeOldify:DeOldify 使用了NoGAN 進(jìn)行訓(xùn)練,NoGAN對(duì)于獲得穩(wěn)定和豐富多彩的圖像是至關(guān)重要的。
NoGAN 訓(xùn)練結(jié)合了 GAN (美妙的著色)的好處,同時(shí)消除了副作用(如視頻中的閃爍對(duì)象)。
不論是圖像還是視頻,AI能夠?qū)⑵湫迯?fù)得栩栩如生,最主要的是歸功于它強(qiáng)大的學(xué)習(xí)能力。
這里我們?cè)俸唵瘟私庖幌翧I修復(fù)離不開的「靈魂GAN」。
還記得馬和斑馬相互轉(zhuǎn)換的圖像嗎?這便是GAN的應(yīng)用之一。
和其他經(jīng)典的機(jī)器學(xué)習(xí)算法相比,GAN算法最大的創(chuàng)新點(diǎn)便是它結(jié)合了生成器(Generator)和判別器(Discriminator),以二者的相互對(duì)抗進(jìn)而實(shí)現(xiàn)相互優(yōu)化,最后達(dá)到一個(gè)「勢(shì)均力敵」的狀態(tài)。
以圖像為例,判別器D經(jīng)過反復(fù)訓(xùn)練,最后希望可以準(zhǔn)確分辨出哪一個(gè)是真實(shí)的數(shù)據(jù)分布,哪一個(gè)是生成器的數(shù)據(jù)分布;同時(shí),生成器G也不斷地訓(xùn)練,最后希望能夠以假亂真,讓判別器判斷不出到底哪個(gè)是真的圖像,哪個(gè)是假的圖像。
現(xiàn)在越來越多的技術(shù)像是AI修復(fù)、AI換臉等都離不開GAN網(wǎng)絡(luò),曾經(jīng)困擾GAN的難題,比如難以收斂等也都漸漸得到了改善,而且基于GAN也衍生出了越來越多的更優(yōu)秀的網(wǎng)絡(luò),比如CycleGAN、StackGAN等,愈加逼真、生動(dòng)的圖像逐一呈現(xiàn)在大眾眼前。
現(xiàn)在大抵是「萬物皆可AI」的時(shí)代了!AI還會(huì)繼續(xù)給我們帶來何種視覺驚喜,我們拭目以待~~~?