OpenAI 的新 GPT-4o 圖像生成技術(shù)絕對(duì)會(huì)改變游戲規(guī)則
GPT-4o 的圖像生成功能剛剛發(fā)布就直接開始摧毀傳統(tǒng)行業(yè),甚至讓 OpenAI 的 CEO 山姆·奧特曼(Sam Altman)都直呼:“我也看不懂眼前發(fā)生的一切!”
圖片
傳統(tǒng)的設(shè)計(jì)軟件,比如 Photoshop,現(xiàn)在可真是如臨大敵了。
一、圖像融合的能力徹底超越傳統(tǒng)工具
來看一個(gè)讓人震驚的圖像融合實(shí)例:
圖片
傳統(tǒng)的 Photoshop 頂多就是簡單地將人物圖層疊加到背景圖上,對(duì)光影和角度的細(xì)節(jié)通常還要手動(dòng)調(diào)整。但 GPT-4o 呢?
它對(duì)圖像的理解已經(jīng)達(dá)到前所未有的深度——看看下面的對(duì)比圖:
- 前(before):房間單獨(dú)的背景圖 + 女孩單獨(dú)的人物圖。
- 后(after):合成的圖片中,房間和人物的光線、角度自然匹配,完全不像簡單拼貼,而是像本來就在一起。
你注意到細(xì)節(jié)了嗎?人物和房間的3D角度與光線完全融合,GPT-4o 不再只是簡單地拼接或調(diào)用 DALL-E 后臺(tái)了,而是真正意義上的“理解”圖片本身!
二、創(chuàng)造力爆表,理解 prompt 的能力前所未見
再看看這張圖:
圖片
你覺得訓(xùn)練數(shù)據(jù)里可能有這種獨(dú)特而精確的圖像嗎?顯然不可能!
過去有些人認(rèn)為 AI 圖片生成不過是“復(fù)制”或“隨機(jī)拼貼”——而 GPT-4o 徹底打破了這種誤解。它對(duì)用戶 prompt 的理解精準(zhǔn)得讓人難以置信。
圖片
舉個(gè)簡單例子:它現(xiàn)在甚至能完美繪制一杯真實(shí)感爆棚的紅酒。
圖片
三、文字的理解和生成能力質(zhì)的飛躍
下面這個(gè)例子簡直讓人目瞪口呆:
圖片
- 圖像理解的驚艷:GPT-4o 能準(zhǔn)確地在完全不同的繪畫風(fēng)格之間轉(zhuǎn)換圖像,并保留面部表情。
- 上下文理解的突破:注意原漫畫中第四個(gè)女孩舉手指向服務(wù)員的動(dòng)作,GPT-4o 在新風(fēng)格里完美還原了這個(gè)動(dòng)作,甚至比原圖更準(zhǔn)確地表達(dá)了“點(diǎn)單”的情境! 你甚至可以要求它精確還原原來的手勢,它也完全能夠做到。
- 文字生成的巨大進(jìn)步:傳統(tǒng) AI 圖片生成工具對(duì)文字生成一直都非常吃力,而 GPT-4o 輕松復(fù)刻了對(duì)話氣泡中的文本,甚至自動(dòng)給最后一個(gè)女孩加了個(gè)感嘆號(hào),更貼合她驚訝的表情與情景氛圍。
四、圖文一體生成,設(shè)計(jì)師的福音 ??
圖片
另外,現(xiàn)在 GPT-4o 也能輕松地將文字直接融合進(jìn)圖像中,對(duì)于海報(bào)、社交媒體圖文設(shè)計(jì)等場景簡直完美:
如果你不認(rèn)為這已經(jīng)徹底顛覆了傳統(tǒng)的圖像編輯與平面設(shè)計(jì)工具(比如 Photoshop 和 Illustrator),那你可真得給我解釋一下,到底什么才叫“顛覆”。
圖片
五、網(wǎng)絡(luò)瘋傳,人人搶著玩
難怪這些天你在社交媒體上總能刷到大量類似“吉卜力動(dòng)畫風(fēng)格”的精美圖片,這已經(jīng)迅速成為一種新潮流:
圖片
目前 OpenAI 僅為付費(fèi)用戶開放了 GPT-4o 圖像功能,免費(fèi)用戶還需稍等一段時(shí)間,因?yàn)樾枰獢U(kuò)展技術(shù)規(guī)模,確保所有人都能獲得最佳體驗(yàn)。
?? 總結(jié):一個(gè)新時(shí)代的開啟
毫無疑問,GPT-4o 的圖像生成功能標(biāo)志著人工智能生成圖像領(lǐng)域的巨大飛躍,極大地威脅了傳統(tǒng)設(shè)計(jì)工具的市場地位。
更讓人興奮的是,這只是個(gè)開始——AI 的下一波創(chuàng)新浪潮已經(jīng)蓄勢待發(fā),你準(zhǔn)備好了嗎?