AI PS卷起來了!谷歌Gemini動(dòng)嘴P圖火出圈,馬斯克Grok連夜上線圖像編輯
Grok連夜上線圖片編輯功能。
昨晚,Grok上線圖片編輯功能,可以通過文字描述直接修改圖片。
比如你可以上傳一張個(gè)人證件照,「動(dòng)動(dòng)嘴」讓Grok給你PS一套全新的西服。
看起來效果非常不錯(cuò),Grok還「體貼地」給你設(shè)計(jì)了四種不同風(fēng)格,比如領(lǐng)帶「帶花紋」和「不帶花紋」。
不過該功能目前應(yīng)該還是在灰度測(cè)試中(作為Premium氪金用戶的Grok主頁(yè)暫時(shí)還沒有編輯按鈕)。
Grok手機(jī)APP同步上線
Grok也同步上線了X的手機(jī)APP,你也可以在手機(jī)上體驗(yàn)圖片編輯功能。
比如上傳一張照片,讓圖片中人物的「黑發(fā)」變成「金發(fā)」。
不過作為手機(jī)內(nèi)部的Grok功能,目前同樣是在灰度測(cè)試中。
由于Grok灰色測(cè)試,目前全網(wǎng)還沒有太多討論。
不過從一些博主的測(cè)試作品來看,Grok應(yīng)該是對(duì)自己的效果很有信心。
比如這位有6萬粉絲的Borriss博主,他的頭像是一件「黑色高領(lǐng)毛衣」。
但是經(jīng)過Grok的P圖后,換成了一套「西服」。
「黑毛衣秒變西服」,AI編輯的能力目前看起來效果并不賴。
其他陸續(xù)有用戶放出了自己使用Grok編輯圖片的效果,不過這次Grok犯了一個(gè)錯(cuò)誤,把用戶的臉也給換了。
比如,可以將圖片風(fēng)格變成Egon Shiele的畫作風(fēng)格。
或者是給馬斯克加一頂帽子。
大模型「內(nèi)卷」,PS受傷
Grok這次「連夜」上傳圖片編輯功能,大概率是被Google的Gemini2.0火出圈的「動(dòng)動(dòng)嘴」PS功能給刺激到了。
Google發(fā)布Gemini-2.0-flash的Experimantal版本靠著簡(jiǎn)單的文本描述就能「P圖」的能力著實(shí)火了一把。
比如將兩張照片P在一起還不違和,并且可以添加人物動(dòng)作。
或者,將白色風(fēng)格的裙子換成紅色,還能給人物打個(gè)領(lǐng)帶。
從Gemin2.0到Grok的圖片編輯,能看出目前SOTA模型的「內(nèi)卷」依然還在進(jìn)行。
大模型也在「搶占」用戶心智。
以后人們談起P圖,第一個(gè)想到也許不是Photoshop這種傳統(tǒng)的圖片編輯軟件,而是AI賦能各種大模型功能。
從P圖這件事情可以窺見一些苗頭,AI的發(fā)展很可能會(huì)帶來一個(gè)很大的「范式轉(zhuǎn)移」。
未來的很多工作會(huì)從「復(fù)雜操作」變成「簡(jiǎn)單交互」。
比如在圖片編輯領(lǐng)域,Gemini和Grok等大模型將持續(xù)降低圖片編輯的技術(shù)門檻。
從原來需要專業(yè)軟件、復(fù)雜步驟,到只需一句自然語言指令即可實(shí)現(xiàn)高質(zhì)量圖片編輯。
當(dāng)然在目前的大模型P圖效果依然停留在「可玩」的層面,專業(yè)的圖片編輯還需要專業(yè)的UI工程師使用特定的軟件才能完成。
不過SOTA模型的內(nèi)卷依然沒有結(jié)束。
正如Alvaro Cintas所說,為什么OpenAI還沒有發(fā)布原生圖像生成和編輯功能。
也許快了,說不定哪天ChatGPT就放出編輯原生圖片。