自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI免費(fèi)設(shè)計LOGO效果驚艷,雷軍200萬花早了

人工智能
咋說呢,看來“不想逐字逐句讀PDF”,真是人類の共同呼聲了。還有網(wǎng)友說自己手搓了類似的工具,真的不要太爽~

很快啊,Stable Diffusion又被發(fā)掘新用途了——

設(shè)計LOGO最關(guān)鍵的“形意結(jié)合”,被它拿捏得明明白白??匆奀at秒畫貓貓頭:

圖片

瑜伽店YOGA幾個字母用人體形態(tài)一轉(zhuǎn)換,風(fēng)格完全不出錯:

圖片

只設(shè)計其中一個字也沒問題,例如將Dog的D畫成一個狗子:

屬實(shí)簡潔又傳神了有木有!

哪怕是面對中文字體,AI也能很好地理解其中的意思,快速畫出甲方想要傳達(dá)的LOGO形象:

圖片

要是開店用上這個,哪里還需要花幾十上百塊專門設(shè)計一個LOGO出來?(doge)

雖然之前也有不少設(shè)計LOGO的AI了,不過從這次生成的效果來看,還真有點(diǎn)不太一樣。

保留一部分原有字體的味道

事實(shí)上,在這次研究之前,已經(jīng)有不少研究在考慮如何用AI設(shè)計LOGO。

從效果來看,主要可以分成三類:

一是以字體為形狀限制,將圖片風(fēng)格遷移上去(如圖AB);二是以圖片風(fēng)格為基底,將字體遷移到圖片中去(圖D);三是將不同圖片的形狀和字體關(guān)聯(lián)起來,生成或彩色或黑白的“圖像拼接”風(fēng)格LOGO設(shè)計(圖CE)。

圖片

然而,與下面人類手工設(shè)計的LOGO比起來,上面AI設(shè)計的效果不能說不好看,但似乎還差那么點(diǎn)意思:

圖片

作者們經(jīng)過一通探查,發(fā)現(xiàn)人類手工設(shè)計的LOGO并不“喧賓奪主”。

人類設(shè)計師會在保留原本字體特色、讓人們能一眼認(rèn)出單詞的基礎(chǔ)上,再加入一點(diǎn)創(chuàng)新之處,例如將Jazz中的J改成樂器,但其他人一眼仍然能認(rèn)出“JAZZ”字體的形狀。

整體來說,就是在保留一部分字體“味道”的同時,加入一定的設(shè)計感。

圖片

例如這是Stable Diffusion生成的“FROG”設(shè)計,F(xiàn)RO仍然是原本字體的形狀,只有G變成一只跳出去的小青蛙:

圖片

如果用Stable Diffusion 2進(jìn)一步進(jìn)行后期處理的話,還能進(jìn)一步實(shí)現(xiàn)上色功能,顯得更加生動:

圖片

生成LOGO的風(fēng)格也能隨著原本設(shè)計字體的變化,而產(chǎn)生不一樣的變化。

例如這是8種字體下生成的不同瑜伽LOGO,每種風(fēng)格都不一樣:

圖片

相比之下,其他AI模型在生成字體的時候,倒是更喜歡保留自己的風(fēng)格(手動狗頭):

圖片

那么,這種神奇的字體設(shè)計AI是怎么做出來的?

用貝塞爾曲線調(diào)整字母形狀

為了一定程度上保留原本字體的風(fēng)格、以及只改變單詞中的某幾個字母,作者們想出一種“微調(diào)”字母形狀的方法——

那就是讓AI學(xué)會用貝塞爾曲線,對不同字體的字母進(jìn)行小幅度變形。

(用過PS中“鋼筆”的小伙伴們應(yīng)該對貝塞爾曲線不陌生,用它能控制鼠標(biāo)畫出一些神奇的曲線)

具體控制點(diǎn)數(shù)量,則根據(jù)字母復(fù)雜度和字體風(fēng)格進(jìn)行迭代變換,直到設(shè)計出來的字母符合要求,其中橙色是初始點(diǎn),藍(lán)色是后續(xù)增加的控制點(diǎn):

圖片

控制點(diǎn)數(shù)量對生成效果影響有多大?

例如這是不同數(shù)量的控制點(diǎn)生成字母的效果,如果數(shù)量太少,會看不清設(shè)計的圖像形狀;但數(shù)量過多又容易扭曲字體原本的形狀:

圖片

基于這種核心設(shè)計思路,作者們結(jié)合Stable Diffusion和CLIP,設(shè)計出了一整個字體設(shè)計AI模型:

圖片

其中,ACAP(as conformal as possible)損失函數(shù)基于德勞內(nèi)三角形剖分算法,對字母形狀進(jìn)一步進(jìn)行了約束。

例如這是PANTS(褲子)在變形前和變形之后的形態(tài),可以看見ACAP在保留褲子形態(tài)的同時,也保留了字體的效果:

圖片

與此同時,為了進(jìn)一步保留字體形態(tài),作者們采用了一個低通濾波器,保證調(diào)整后的字母不與原始字母偏離太多。例如這是Bear(熊)中的B調(diào)整后的形態(tài):

圖片

應(yīng)用這套模型,生成每個字母的速度也還不錯。

在一塊RTX 2080 GPU上,生成單個字母的LOGO設(shè)計大約需要5分鐘。

作者介紹

雖然作者們放到項(xiàng)目主頁上的論文是匿名的:

圖片

不過在arXiv上,作者們的名字倒是已經(jīng)公開了,他們分別來自以色列特拉維夫大學(xué)、Reichman University(萊希曼大學(xué)),以及倫敦大學(xué)金史密斯學(xué)院:

圖片

共同一作Shir Iluz,特拉維夫大學(xué)電子與電氣工程理學(xué)碩士,目前的研究方向是生成AI,感興趣的方向是深度學(xué)習(xí)與計算機(jī)視覺。

圖片

共同一作Yael Vinker,特拉維夫大學(xué)計算機(jī)視覺博士生,曾經(jīng)在以色列希伯來大學(xué)獲得計算機(jī)科學(xué)本科與碩士學(xué)位,目前研究方向同樣是深度學(xué)習(xí)與計算機(jī)視覺。

圖片

這么看來,雷軍當(dāng)年設(shè)計小米LOGO的200萬元花早了啊

論文地址:https://arxiv.org/abs/2303.01818

項(xiàng)目地址:https://wordasimage.github.io/Word-As-Image-Page/

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2011-12-31 21:10:53

2012-06-28 11:52:22

雷軍小米

2015-03-25 11:05:36

雷軍小米魅族

2011-08-22 10:16:07

雷軍喬布斯小米

2014-11-07 15:34:34

雷軍小米未來

2011-12-27 20:44:31

小米

2012-05-11 14:38:23

米聊微信雷軍

2015-05-12 14:08:30

雷軍小米NOTE

2014-11-05 09:27:56

陳彤雷軍

2023-05-31 15:15:53

2014-11-13 12:56:57

手機(jī)導(dǎo)航高德地圖

2024-10-11 12:37:12

2012-04-10 08:58:26

小米

2010-07-16 10:22:19

金山雷軍

2012-04-05 11:56:19

小米

2012-12-04 09:30:24

小米金山雷軍

2014-08-18 15:10:16

2015-04-02 09:55:25

小米

2015-06-16 10:55:29

雷軍小米

2020-06-12 14:48:58

芯片半導(dǎo)體技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號