Midjourney能生成文字了!V6版5大升級(jí)驚艷網(wǎng)友
Midjourney重磅更新,V6版本問(wèn)世!
更新后最大看點(diǎn)是圖像更真實(shí)、細(xì)節(jié)處理更細(xì)膩:
和上一代對(duì)比來(lái)看更直觀。
就說(shuō)一道番茄燉牛腩,右邊的圖不僅菜看起來(lái)更自然、更有食欲,就連木勺的細(xì)節(jié)也沒(méi)放過(guò)(左V5.2,右V6):
再來(lái)看對(duì)人物的刻畫(huà),V6光影等細(xì)節(jié)拉滿。相比之下,V5.2根本不是一個(gè)level(上V6,下V5.2):
風(fēng)景圖的處理也是一眼就能區(qū)分哪個(gè)更真實(shí)自然(左V5.2,右V6):
另外,新版本還有一大看頭是可以對(duì)簡(jiǎn)單的文字進(jìn)行處理了,只需給要繪制的文字加上"引號(hào)",比如"Hello World!":
終于不是亂碼了!
創(chuàng)始人David Holz在Discord發(fā)帖公布了V6的問(wèn)世,并且表示V6是團(tuán)隊(duì)從頭開(kāi)始訓(xùn)練的第三個(gè)模型,開(kāi)發(fā)過(guò)程已持續(xù)了9個(gè)月。
總結(jié)來(lái)說(shuō),V6共有5大升級(jí):
- 更精確且更長(zhǎng)的提示響應(yīng)
- 改進(jìn)了連貫性和模型知識(shí)
- 圖像生成和混合(remix)得到了優(yōu)化
- 新增了基礎(chǔ)文字繪制功能
- upscale(放大器)功能得到增強(qiáng),具有’subtle’和’creative’兩種模式,分辨率提升兩倍
此外,David Holz表示目前V6處于“alpha test”階段,會(huì)隨時(shí)變化,之后會(huì)升級(jí)到完整版。
這也就意味著,接下來(lái)幾周內(nèi),V6的速度、圖像質(zhì)量、連貫性、提示響應(yīng)和文本準(zhǔn)確性會(huì)再次提高。
而目前V6相比于V5來(lái)說(shuō)速度更慢、成本更高(大約每次imagine消耗1gpu/min,每次upscale消耗2gpu/min),但昨天已對(duì)V6做了一次更新,速度已提高2.7倍:
V6的問(wèn)世,讓網(wǎng)友們又有新東西玩了,各種測(cè)試對(duì)比都非?;鸨?/p>
不過(guò),要想玩好V6,再用之前的提示策略恐怕是不行了。
David Holz明確表示“V6的提示與V5有很大不同,你需要重新學(xué)習(xí)如何提示”。
效果:寫(xiě)真真真
先來(lái)看一波網(wǎng)友們的測(cè)試效果。
讓Midjourney V5.2(左)、V6(右)畫(huà)一個(gè)酒吧,需要用燈牌標(biāo)注”open late”(營(yíng)業(yè)到很晚),V6畫(huà)起來(lái)毫無(wú)難度:
再來(lái)體驗(yàn)一下更新后的Upscale,正常圖片是這樣?jì)饍旱模?/p>
Subtle(上)、Creative(下)兩種不同模式,家人們更中意哪張?
Creative連鏡子里的細(xì)節(jié)都給處理了。
這里還有和其它AI繪圖工具的比較,比如說(shuō)DALL·E 3、Adobe Firefly。
Midjourney V6在不同風(fēng)格的圖片生成上,都表現(xiàn)出眾:
是能夠以假亂真的那種了:
甚至,V6還通過(guò)的香煙測(cè)試。不僅煙真實(shí),手的歲月感也刻畫(huà)得淋漓盡致:
但正如上面提到的,Midjourney V6更新不只是改變了效果,還有提示詞。
好在David Holz給到了一些提示小妙招,其中就包括:
- 避免使用無(wú)關(guān)緊要的詞,如award winning、photorealistic、4k、8k;
- 明確表達(dá)你想要的內(nèi)容,表達(dá)明確,模型理解得更好;
- 如果你想要更具攝影感、更中立、更直接的效果,可以默認(rèn)使用—style raw;
- 較低的—stylize值(默認(rèn)100)可能會(huì)有更好的提示理解,而較高的值(最高1000)可能會(huì)有更好的美學(xué)效果。
我們也來(lái)簡(jiǎn)單上手體驗(yàn)一把。
開(kāi)盒Midjourney V6
召喚V6的方法有三種,可以選擇在Midjourney Discord服務(wù)器中鍵入斜杠命令“/settings”,或者在給Midjourney bot的直接消息(DM)中鍵入,然后使用頂部的下拉菜單選擇V6,又或是在提示詞后手動(dòng)輸入“—v 6.0”。
我們讓Midjourney描繪一幅跨年夜的場(chǎng)景,要求要有漫天飛舞的大雪,還要有一個(gè)牌子上面寫(xiě)著“新年快樂(lè)”:
Please depict a New Year’s Eve scene with heavy snow falling all around, and include a sign with the words "Happy New Year" on it.
該說(shuō)不說(shuō),雖然很有feel,但“字”的發(fā)揮還是不穩(wěn)定。
完全相同的提示詞下,V5.2版本整體偏暖色調(diào),但這么一看V6畫(huà)字還是很有水平的??:
緊接著,點(diǎn)擊任意一張圖Upscale:
就可以看到兩個(gè)新的模式Subtle、Creative:
下面是Creative的效果,家人們?nèi)绾卧u(píng)價(jià)?