51CTO讀者成長(zhǎng)計(jì)劃社群招募,咨詢小助手(微信號(hào):CTOjishuzhan)
文 | Calvin Wankhede
編譯 | 王瑞平
其實(shí),技術(shù)革命離我們一點(diǎn)也不遙遠(yuǎn)...
在過(guò)去的幾個(gè)月里,我們目睹了AIGC工具的突然爆發(fā)。在免費(fèi)和付費(fèi),開源和專有之間,用戶有很多選擇。但如果你關(guān)注過(guò)有關(guān)AI生成圖像的討論,你肯定聽說(shuō)過(guò)Midjourney與Stable Diffusion之間的競(jìng)爭(zhēng)。
雖然這兩款A(yù)I圖像生成器都非常出色,但它們?cè)谧远x功能、美術(shù)風(fēng)格、易用性、定價(jià)等方面存在明顯差異。因此,在本文中,我們介紹了如何將二者區(qū)分開,以及您應(yīng)該使用哪一款。
1、快速了解差別
同樣是用文字生成圖片,Midjourney和Stable Diffusion究竟有什么差別?這里,根據(jù)官網(wǎng)信息,也根據(jù)自己的經(jīng)驗(yàn),我們簡(jiǎn)單做出總結(jié),希望能夠幫助到廣大用戶朋友。這只是一個(gè)大概的總結(jié),更詳細(xì)的介紹還需要您通讀全文。
從技術(shù)層面來(lái)看,Midjourney使用專有的機(jī)器學(xué)習(xí)模型,而Stable Diffusion的源代碼是免費(fèi)的。只要符合要求,您可以在自己的計(jì)算機(jī)上下載并運(yùn)行Stable Diffusion,而Midjourney只能在有網(wǎng)絡(luò)連接的情況下使用。
此外,訪問(wèn)Midjourney的唯一方法是通過(guò)Discord聊天應(yīng)用程序。而您可以通過(guò)各種在線和離線應(yīng)用程序使用Stable Diffusion。
在付費(fèi)模式方面,Midjourney每月至少需要花費(fèi)10美元才能生成有限張圖像。您可以在自己的硬件上免費(fèi)運(yùn)行Stable Diffusion,也可以為在線服務(wù)支付少量費(fèi)用。
您可以使用Stable Diffusion填充或修改圖像的某些部分,中途不支持內(nèi)涂或外涂。此外,Stable Diffusion還支持?jǐn)?shù)千個(gè)可下載的自定義模型,而在Midjourney中,只有少數(shù)模型可供選擇。
總的來(lái)講,Midjourney似乎更便于用戶使用,因?yàn)樗脑O(shè)置比Stable Diffusion少。然而,后者提供了許多更高級(jí)的功能和定制選項(xiàng)。
繼續(xù)閱讀可以幫助你了解更多Midjourney和Stable Diffusion之間的詳細(xì)差別。我們還使用了相同的文本提示生成圖像并進(jìn)行了比較。
2、Midjourney更便于使用
Midjourney和Stable Diffusion作為當(dāng)今最流行的AI圖像生成器,都于2022年年中面向用戶推出。但在當(dāng)時(shí),二者被推出的目標(biāo)是截然不同的,Midjourney是作為一項(xiàng)盈利性服務(wù)被推出的,而Stable Diffusion則是開發(fā)者發(fā)布的開源應(yīng)用。
Stable Diffusion所具有的開放性質(zhì)使其成為可定制和被廣泛使用的圖像生成器之一。你可以在線使用它的基本版本或進(jìn)行免費(fèi)與付費(fèi)訂閱。
并且,像Stable Diffusion Web UI這樣的前端軟件通常包含許多高級(jí)功能并允許你使用自定義美術(shù)模型。但是,如果你希望獲取效果最佳的圖像,并希望在自己的計(jì)算機(jī)上生成圖像。Stable Diffusion的缺點(diǎn)是需要設(shè)置一些時(shí)間和技術(shù)技能。
從這一點(diǎn)看來(lái),雖然Midjourney更便于使用,但是Stable Diffusion也為初學(xué)者和有經(jīng)驗(yàn)的用戶提供了大量選擇。
另一方面,用戶更容易學(xué)會(huì)如何使用Midjourney。官方在Discord聊天應(yīng)用程序上也公布了使用指南。此外,你還可以在提示中添加一些參數(shù),這些都是可以自定義的。
也就是說(shuō),Midjourney的最新V5版本可以生成與文本提示非常匹配的高質(zhì)量圖像。所以,在易用性方面,它具備一些優(yōu)勢(shì)。但如果你愿意不斷調(diào)整輸入和設(shè)置,Stable Diffusion也可以達(dá)到甚至超過(guò)Midjourney的圖片生成效果。
3、各有利弊
乍一看,Midjourney和Stable Diffusion似乎提供了相同的功能集。然而,仔細(xì)比對(duì),你會(huì)發(fā)現(xiàn)這兩種圖像生成器各有一些獨(dú)特的優(yōu)點(diǎn)和缺點(diǎn)。
以升級(jí)為例,從前,你可以使用Midjourney中的U1、U2、U3和U4按鈕完成升級(jí)。而Midjourney的最新版本不支持任何升級(jí)型號(hào)。相比之下,Stable Diffusion的開放性允許你下載幾個(gè)不同的升級(jí)模型進(jìn)行實(shí)驗(yàn)。如果你的電腦有足夠的內(nèi)存,你還可以在Midjourney中生成比目前限制的100萬(wàn)像素更高分辨率的圖像。
4、功能的差異
Midjourney與Stable Diffusion在功能上具有一系列差異,使生成的圖像更符合用戶需求:
(1)圖像修復(fù)與圖像擴(kuò)展:Stable Diffusion具有圖像修復(fù)(Inpainting)和圖像擴(kuò)展(outpainting)功能。你可以使用圖像修復(fù)功能調(diào)整現(xiàn)有圖像的某些部分,而應(yīng)用圖像擴(kuò)展功能,你可以在現(xiàn)有的圖像邊界之外生成新的細(xì)節(jié)。而Midjourney還不支持這兩種功能。
(2)圖片提示:你可以上傳一張(或兩張)圖片用來(lái)提示Midjourney生成圖片的風(fēng)格。機(jī)器人程序會(huì)將圖像與文本結(jié)合起來(lái),生成視覺上與輸入相似的輸出。
(3)自定義美術(shù)風(fēng)格:Midjourney提供了一個(gè)動(dòng)畫優(yōu)化模型,你可以使用niji參數(shù)調(diào)用。Stable Diffusion可以讓你下載用自定義模型訓(xùn)練出的各種藝術(shù)風(fēng)格。
(4)審查:雖然官方的基礎(chǔ)Stable Diffusion模型不允許生成明確的圖像,但你可以使用自定義模型解決這些限制,這在Midjourney中是不可能實(shí)現(xiàn)的。如果你的提示信息中包含明確或暗示性的語(yǔ)言,你的帳戶可能會(huì)被禁止。
請(qǐng)記住,你必須在自己的硬件設(shè)備上使用Stable Diffusion才能充分發(fā)揮出它的優(yōu)勢(shì)。在線工具不能提供相同程度的靈活性,這使得Midjourney和Stable Diffusion的功能變得一樣強(qiáng)大。
5、付費(fèi)VS開源
作為一家以營(yíng)利為目的的公司,Midjourney對(duì)用戶的使用頻率設(shè)置了一些限制。即使是付費(fèi)訂閱的用戶,你每個(gè)月也只能獲得有限的免費(fèi)圖像生成時(shí)間和次數(shù)。
而在30美元/月及以上的付費(fèi)模式中,Midjourney確實(shí)為用戶提供了無(wú)限的放松模式,但這意味著你必須為每個(gè)任務(wù)等待幾分鐘。
在付費(fèi)方面,Stable Diffusion則采取了完全相反的模式。它的源代碼可以被下載,這意味著可以免費(fèi)使用。然而,你需要一臺(tái)配備專用顯卡的功能強(qiáng)大的電腦,需要具有至少4GB的VRAM(影像隨機(jī)接達(dá)記憶器)。
但這種硬件設(shè)備至少會(huì)花費(fèi)你一千多美元。幸運(yùn)的是,如果你喜歡冒險(xiǎn),你還可以嘗試在線使用Stable Diffusion,甚至可以在基于云的虛擬機(jī)(如,Google Colab)中使用。
值得注意的是,Stable Diffusion的創(chuàng)建者還提供了一個(gè)基于網(wǎng)絡(luò)的圖像生成應(yīng)用程序Dream Studio。這就像Midjourney一樣很容易上手,但是也需要付出一定的代價(jià)。
即便如此,這個(gè)價(jià)格對(duì)于使用者來(lái)講還是相當(dāng)便宜的,10美元可以獲得1000個(gè)積分。你也可以免費(fèi)試用,所有新賬戶在注冊(cè)時(shí)都可以免費(fèi)獲得25個(gè)積分。
如果你正在尋找一個(gè)免費(fèi)且易于使用的工具,我建議你考慮選擇其它的應(yīng)用,比如,Bing Image Creator。
6、生成圖像大比拼
為了比較這兩種工具的使用效果,我在Midjourney和Stable Diffusion輸入了相同的提示詞生成了圖像,讓我們一起比較一下。
第一組圖片是用一個(gè)相當(dāng)簡(jiǎn)單的提示詞生成的:“《星球大戰(zhàn)》中的達(dá)斯·維德,但要做成賽博朋克”。我認(rèn)為,即使應(yīng)用了截然不同的方法,這兩個(gè)圖像生成工具在提供信息方面表現(xiàn)得都很好。
下一個(gè)提示詞清楚地展示出Midjourney生成圖像的最大優(yōu)點(diǎn):現(xiàn)實(shí)主義。如果你想讓生成的圖像看起來(lái)更真實(shí),Midjourney無(wú)疑是首選。雖然Stable Diffusion匹配的提示符中也包含了所有內(nèi)容,但它并沒有達(dá)到“逼真”的程度。
最后一個(gè)示例中的文本提示要求“一個(gè)巨大的白色蛇形龍棲息在巖石上,看著地平線”。Midjourney再一次創(chuàng)造出了更復(fù)雜的細(xì)節(jié)。然而,如果你仔細(xì)觀察圖像的底部,你會(huì)注意到Midjourney試圖復(fù)制它從訓(xùn)練數(shù)據(jù)中學(xué)到的一系列亂碼。
高級(jí)用戶則可以從Stable Diffusion中獲取效果更好的圖像。然而,Midjourney通常在輸入相同的提示下獲得更好的結(jié)果。
那么,你更喜歡哪個(gè)AI圖像工具呢?歡迎留言告訴我們!
參考資料:https://www.androidauthority.com/midjourney-vs-stable-diffusion-3327349/