吉卜力只是開胃小菜,GPT-4o一鍵摳圖「換裝換背景」!推理也初步顯現(xiàn)
這幾天,你要說 AI 圈最火的是哪個模型?OpenAI 的 GPT-4o 當(dāng)仁不讓。
吉卜力風(fēng)格的圖像和視頻在社交圈瘋傳,被玩出了花。之心用 GPT-4o 和可靈做出了吉卜力版《甄嬛傳》全網(wǎng)播放超 20w。
除了一些口型和神情還有出入,人物形象可謂是超絕還原。
X 平臺上的網(wǎng)友利用 GPT-4o 和 Luma Ray 2,把《瘋狂的麥克斯》動畫版也做出來了。
在網(wǎng)友探索 AI 動畫生成的同時,還有一個功能被刨了個底朝天。在 OpenAI 的發(fā)布介紹中壓根沒提,但非常有用的功能 —— 畫筆編輯。
沒錯,就是這么一涂,你就能變身造物主,想怎么改圖就怎么改圖。
我們趕緊上手試了一下,發(fā)現(xiàn)效果真的很強!
把同事的照片轉(zhuǎn)換成吉卜力風(fēng)格后,點擊生成的圖片,右上方有一個畫筆按鈕,輕點之后就能進入到畫板界面。
涂抹需要修改的部分,然后輸入相關(guān)的 prompt,例如這張圖里,我們輸入了「移除外套只保留里面那件短袖」。
于是,一張保留了大量原圖細(xì)節(jié)的脫去外套版圖片就生成了。
不過,原圖與新圖之間還有一定差別。后面背景中石頭和植被的布置以及人物的表情都發(fā)生了變化。不過整體細(xì)節(jié)相對保留完整,GPT-4o 也能夠理解我們的指令。
還能換背景哦,下面這張圖就把背景換成了小溪。
換個同事的童年照片,給她加頂海盜帽也是非常好用。
不過,復(fù)雜一些的轉(zhuǎn)換看起來效果還不算完美。例如這個彌補了《大話西游》中至尊寶和紫霞仙子遺憾結(jié)局的換位。猴子腦袋快被金箍勒爆了,身體也沒有被云霧覆蓋。但是人物的細(xì)節(jié)和風(fēng)格都保持住了。
推理與非推理集于一身,GPT-5 要來了?
在刷爆圖像生成的同時,GPT-4o 還有了另一個重大發(fā)現(xiàn):現(xiàn)在可以顯示推理時間與思維鏈過程了。
這不禁令人聯(lián)想,難道 OpenAI 開始合并推理與非推理模型了?正如奧特曼上個月提到的那樣,OpenAI 計劃統(tǒng)一 o 系列與 GPT 系列模型,構(gòu)建可以自主判斷任務(wù)需求的智能系統(tǒng),不用再每次選擇模型。
還有用戶曬出了自己 2024 年底的截圖,這可能意味著 OpenAI 并不是最近才開始測試,GPT-4o 的推理能力也持續(xù)很長時間了(6 個月以上)。
截圖如下:
對此,以上兩位用戶展開了討論,前一位表示現(xiàn)在的推理看起來比去年更長更好了。后一位稱,這只是反映了 OpenAI 如何輸出「推理」過程,可以看到過去是兩種方式,與 o1 相同。而最近 o1、o3 與 4o 的推理看起來不一樣了,非推理模型中開始出現(xiàn)推理了。
這并不是個例,越來越多人發(fā)現(xiàn)了 GPT-4o 的推理現(xiàn)象。
不過有人懷疑是不是 bug。即使是 bug,也許是非常有趣的 bug。
正如下面這位網(wǎng)友所說,看起來我們正在實時觀察 GPT-5 的啟動,模型版本之間的界限正在迅速模糊并合并。