AI免費(fèi)設(shè)計LOGO效果驚艷,雷軍200萬花早了
很快啊,Stable Diffusion又被發(fā)掘新用途了——
設(shè)計LOGO最關(guān)鍵的“形意結(jié)合”,被它拿捏得明明白白??匆奀at秒畫貓貓頭:
瑜伽店YOGA幾個字母用人體形態(tài)一轉(zhuǎn)換,風(fēng)格完全不出錯:
只設(shè)計其中一個字也沒問題,例如將Dog的D畫成一個狗子:
屬實(shí)簡潔又傳神了有木有!
哪怕是面對中文字體,AI也能很好地理解其中的意思,快速畫出甲方想要傳達(dá)的LOGO形象:
要是開店用上這個,哪里還需要花幾十上百塊專門設(shè)計一個LOGO出來?(doge)
雖然之前也有不少設(shè)計LOGO的AI了,不過從這次生成的效果來看,還真有點(diǎn)不太一樣。
保留一部分原有字體的味道
事實(shí)上,在這次研究之前,已經(jīng)有不少研究在考慮如何用AI設(shè)計LOGO。
從效果來看,主要可以分成三類:
一是以字體為形狀限制,將圖片風(fēng)格遷移上去(如圖AB);二是以圖片風(fēng)格為基底,將字體遷移到圖片中去(圖D);三是將不同圖片的形狀和字體關(guān)聯(lián)起來,生成或彩色或黑白的“圖像拼接”風(fēng)格LOGO設(shè)計(圖CE)。
然而,與下面人類手工設(shè)計的LOGO比起來,上面AI設(shè)計的效果不能說不好看,但似乎還差那么點(diǎn)意思:
作者們經(jīng)過一通探查,發(fā)現(xiàn)人類手工設(shè)計的LOGO并不“喧賓奪主”。
人類設(shè)計師會在保留原本字體特色、讓人們能一眼認(rèn)出單詞的基礎(chǔ)上,再加入一點(diǎn)創(chuàng)新之處,例如將Jazz中的J改成樂器,但其他人一眼仍然能認(rèn)出“JAZZ”字體的形狀。
整體來說,就是在保留一部分字體“味道”的同時,加入一定的設(shè)計感。
例如這是Stable Diffusion生成的“FROG”設(shè)計,F(xiàn)RO仍然是原本字體的形狀,只有G變成一只跳出去的小青蛙:
如果用Stable Diffusion 2進(jìn)一步進(jìn)行后期處理的話,還能進(jìn)一步實(shí)現(xiàn)上色功能,顯得更加生動:
生成LOGO的風(fēng)格也能隨著原本設(shè)計字體的變化,而產(chǎn)生不一樣的變化。
例如這是8種字體下生成的不同瑜伽LOGO,每種風(fēng)格都不一樣:
相比之下,其他AI模型在生成字體的時候,倒是更喜歡保留自己的風(fēng)格(手動狗頭):
那么,這種神奇的字體設(shè)計AI是怎么做出來的?
用貝塞爾曲線調(diào)整字母形狀
為了一定程度上保留原本字體的風(fēng)格、以及只改變單詞中的某幾個字母,作者們想出一種“微調(diào)”字母形狀的方法——
那就是讓AI學(xué)會用貝塞爾曲線,對不同字體的字母進(jìn)行小幅度變形。
(用過PS中“鋼筆”的小伙伴們應(yīng)該對貝塞爾曲線不陌生,用它能控制鼠標(biāo)畫出一些神奇的曲線)
具體控制點(diǎn)數(shù)量,則根據(jù)字母復(fù)雜度和字體風(fēng)格進(jìn)行迭代變換,直到設(shè)計出來的字母符合要求,其中橙色是初始點(diǎn),藍(lán)色是后續(xù)增加的控制點(diǎn):
控制點(diǎn)數(shù)量對生成效果影響有多大?
例如這是不同數(shù)量的控制點(diǎn)生成字母的效果,如果數(shù)量太少,會看不清設(shè)計的圖像形狀;但數(shù)量過多又容易扭曲字體原本的形狀:
基于這種核心設(shè)計思路,作者們結(jié)合Stable Diffusion和CLIP,設(shè)計出了一整個字體設(shè)計AI模型:
其中,ACAP(as conformal as possible)損失函數(shù)基于德勞內(nèi)三角形剖分算法,對字母形狀進(jìn)一步進(jìn)行了約束。
例如這是PANTS(褲子)在變形前和變形之后的形態(tài),可以看見ACAP在保留褲子形態(tài)的同時,也保留了字體的效果:
與此同時,為了進(jìn)一步保留字體形態(tài),作者們采用了一個低通濾波器,保證調(diào)整后的字母不與原始字母偏離太多。例如這是Bear(熊)中的B調(diào)整后的形態(tài):
應(yīng)用這套模型,生成每個字母的速度也還不錯。
在一塊RTX 2080 GPU上,生成單個字母的LOGO設(shè)計大約需要5分鐘。
作者介紹
雖然作者們放到項(xiàng)目主頁上的論文是匿名的:
不過在arXiv上,作者們的名字倒是已經(jīng)公開了,他們分別來自以色列特拉維夫大學(xué)、Reichman University(萊希曼大學(xué)),以及倫敦大學(xué)金史密斯學(xué)院:
共同一作Shir Iluz,特拉維夫大學(xué)電子與電氣工程理學(xué)碩士,目前的研究方向是生成AI,感興趣的方向是深度學(xué)習(xí)與計算機(jī)視覺。
共同一作Yael Vinker,特拉維夫大學(xué)計算機(jī)視覺博士生,曾經(jīng)在以色列希伯來大學(xué)獲得計算機(jī)科學(xué)本科與碩士學(xué)位,目前研究方向同樣是深度學(xué)習(xí)與計算機(jī)視覺。
這么看來,雷軍當(dāng)年設(shè)計小米LOGO的200萬元花早了啊
論文地址:https://arxiv.org/abs/2303.01818
項(xiàng)目地址:https://wordasimage.github.io/Word-As-Image-Page/