“請給我一個五彩斑斕的黑”,只需一行命令就能讓AI畫畫
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
OpenAI今年1月公布的Dall-E可謂艷驚四座,只需輸入一段話,就能根據(jù)內(nèi)容輸出一幅畫。連吳恩達老師都不禁點贊。
比如讓它設計一個“像牛油果一樣的座椅”。
但是,OpenAI只在官網(wǎng)設置了幾種固定模板,代碼也沒有開源,用戶無法用AI設計出更多的圖片。
不過現(xiàn)在有個好消息,一位華人小哥Philip Wang已經(jīng)復現(xiàn)了一個PyTorch版Dall-E,叫做Deep Daze。
他使用了OpenAI的CLIP以及斯坦福大學的Siren,可以在個人電腦上運行。
只需輸入在命令行中輸入一段描述,這個AI就能畫出各式圖片。
比如在綠色山丘上的薄霧(mist over green hills):
或者是“草地上的碎盤子”(shattered plates on the grass):
你覺得實際效果如何?
開發(fā)該項目的Philip Wang,就是在今年年初公布要復現(xiàn)Dall-E的那位大神,沒想到不到3個月的時間,這個項目已經(jīng)如此強大,在GitHub上已收獲1.1k星。
安裝與使用
Deep Daze可直接通過pip安裝:
- pip install deep-daze
安裝完成后,輸入以下命令運行。
- imagine TEXT <flags>
其中imagine是命令,TEXT必須是一段不超過77個字符的英文描述,<flags>為可選參數(shù),可加可不加。
如果我們想生成文章開始那張山中薄霧的圖片,就輸入以下命令:
- imagine mist over green hills
<flags>中可加入的參數(shù)有:—deeper,獲取更高的圖像質(zhì)量;—num-layers,指定網(wǎng)絡的層數(shù)……更多用法可以去GitHub項目主頁查詢。
如果擔心AI的想象力過于天馬行空,可以指定一張圖片,讓AI在此圖像基礎上想象。這樣就能保證圖像不至于太過離譜。
具體的命令如下:
- imagine ‘description’ —start-image-path /path/to/picture.jpg
假設我們給AI一張披薩的圖片,讓它想象“上面鋪滿青椒的樣子”。
那么我們將上述命令中的描述改成“A pizza with green pepper”。
你以為這就是Deep Daze的全部?其實,它還有一個更強大的完全體——故事模式。
只需設置—create_story=True,就可以解鎖該模式,取消77個字符的限制,項目作者將美國詩人羅伯特·弗羅斯特的詩《雪夜林邊歇馬》輸入其中,得到了一段mp4視頻。
到這里我有點想讓AI畫一下“五彩斑斕的黑”,但貧窮限制了我的操作。
因為使用Deep Daze必須要安裝CUDA,而且最好在不小于8GB顯存的GPU上,才能獲得不錯的效果。而我現(xiàn)在根本買不起英偉達顯卡。
項目地址:
https://github.com/lucidrains/deep-daze