草圖變真人臉?AI:可以,多草都行
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
畫(huà)畫(huà)手殘,也想搞出一個(gè)逼真人像?
這個(gè)可以有。
油管(Youtube)上的一位小哥,就用一個(gè)簡(jiǎn)單的小程序辦到了!
效果還不錯(cuò)!分辨率和逼真度應(yīng)有盡有。
你要知道,草圖可是這樣的……
見(jiàn)鬼了。
畫(huà)畫(huà)手殘黨的AI人臉生成作品
第一組的首戰(zhàn)告捷,小哥決定換個(gè)性別看看。
OK,性別識(shí)別成功✅,就是看起來(lái)有點(diǎn)“瘆人”。
要怪就怪小哥的“靈魂”畫(huà)技吧……
下一組——
作者逐步畫(huà)臉、頭發(fā)、眼睛……讓大家看看AI是怎么一步步生成人像的。
看起來(lái),隨著細(xì)節(jié)的完善,人臉也被訓(xùn)練得隨之豐富起來(lái)。
接下來(lái),腦洞大開(kāi)的作者居然畫(huà)起三角形/芒果形/方形/梨形人臉……
要玩壞了嗎?
NO!
管他什么臉型還是歪耳朵斜眼睛,都成功了。結(jié)果還算滿(mǎn)意,有一張顏值居然還可以。
那,畫(huà)個(gè)鳴人看看?
現(xiàn)實(shí)世界里的鳴人會(huì)長(zhǎng)什么樣子呢?
救命!🆘?。?!
……
后面小哥又整了兩組:
△Minecraft中Steve的AI人像:還原了方方的頭發(fā)
△動(dòng)畫(huà)片角色Rick Sanchez的AI人像: 神似邁克爾·杰克遜?
有沒(méi)有發(fā)現(xiàn)AI居然能夠基本呈現(xiàn)相應(yīng)原人物的皺紋和膚色,再加上上面鳴人AI的頭像也“歪打正著”的黃頭發(fā)。
這么神奇?
但作者調(diào)侃:是魔法……
靈感來(lái)自一篇論文
這個(gè)想法的提出和程序的實(shí)現(xiàn)者是一位網(wǎng)名叫做“Stochastic Machine”(隨機(jī)機(jī)?)的小哥。
靈感來(lái)自一篇論文——
《Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation》
這篇論文講技術(shù)人員如何在styleGAN頂層訓(xùn)練了一個(gè)深度神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)將源圖像映射到styleGAN模型的輸入,最終輸出高質(zhì)量的目標(biāo)圖像。
其中有三個(gè)有趣的實(shí)例。
1、將側(cè)著的人臉輸出為相應(yīng)的正臉(Face Frontalization)
2、將一個(gè)糊了的人臉生成為一張高分辨率的人臉(Super Resolution)
但是還原的最接近長(zhǎng)相不止一種。
3、和pix2pix非常相似的條件圖像合成(Conditional Image Synthesis)
編碼器輸入一張手繪或face mask,就能生成一系列高清真人頭像!
pix2pix是在GAN的基礎(chǔ)上設(shè)計(jì)出的一個(gè)算法,完成成對(duì)的圖像轉(zhuǎn)換,可以得到比較清晰的結(jié)果。
GAN(Generative Adversarial Networks),生成式對(duì)抗網(wǎng)絡(luò),是一種深度學(xué)習(xí)模型,是近年來(lái)復(fù)雜分布上無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一。
小哥對(duì)最后一個(gè)效果表示非常贊許和感興趣。并轉(zhuǎn)念一想:
也許我可以做個(gè)簡(jiǎn)單的程序來(lái)實(shí)現(xiàn)信手涂鴉一鍵生成高逼真AI人臉。
說(shuō)干就干,小哥先前就搞了一個(gè)基于pix2pix技術(shù)的草圖生成人臉程序。
無(wú)奈效果相去甚遠(yuǎn)——根本不是人!
現(xiàn)在他將原代碼結(jié)合這篇論文的技術(shù),做成了這樣一個(gè)簡(jiǎn)單的應(yīng)用程序。不管你的畫(huà)功有多爛,都能生成一張像模像樣的高逼真AI人臉。
AI人臉生成技術(shù):從模糊到難辨真假
一開(kāi)始,很多AI人臉生成作品(技術(shù)基于GAN)只能勉強(qiáng)模仿出一個(gè)人類(lèi)的臉的大概樣子,但是多少都有點(diǎn)“糊”(lack quanlity)。
且不說(shuō)有的生成的還只是黑白的人像。
2019年,StyleGAN的出現(xiàn)讓AI圖像生成技術(shù)邁出了超一大步!
該技術(shù)生成的人像終于能夠逼真到“如果我不說(shuō),你就根本猜不出來(lái)我是AI”了!
StyleGAN是基于GAN開(kāi)發(fā)的模型。
StyleGAN中的“Style”是指人臉的各種屬性,包括臉型、發(fā)型等,還有人臉膚色、是否有皺紋等細(xì)節(jié)。不同的“畫(huà)法”,可以精確控制人臉不同的“style”。
上面“隨機(jī)機(jī)”小哥用到的StyleGAN2是對(duì)StyleGAN的改進(jìn)。
基于這項(xiàng)技術(shù)的人臉生成應(yīng)用數(shù)不勝數(shù),這位小哥的最大不同就是不需要你按著底圖臨摹加工,也不需要你有多好的畫(huà)畫(huà)技術(shù),多“靈魂”都能給你生成相應(yīng)的高逼真人像!
不過(guò)有人表示小哥這個(gè)程序生成的肖像大多具有印度(次大陸)常見(jiàn)的人臉特征。
當(dāng)然,小哥說(shuō)這都是在相應(yīng)的數(shù)據(jù)集(CelebA-HQ)上訓(xùn)練的結(jié)果。