神秘模型“小熊貓”一夜刷屏:排名超F(xiàn)lux、Midjourney,網(wǎng)友:一看就中國(guó)的
一夜之間,名為“red_panda” (小熊貓)的神秘文生圖模型狠狠火了??!
登頂文生圖競(jìng)技場(chǎng),直接將Flux、Midjourney等一眾頂尖模型踩在腳下——
其ELO得分比Flux 1.1 Pro高出100多,勝率高達(dá)79%,每7秒就能生成一張圖像。生成效果be like:
啥概念呢?按網(wǎng)友的話說(shuō),這家伙擱這跳級(jí)呢!
這與從Flux 1 schnell到Flux 1.1 Pro的跳躍相同
除了強(qiáng)得可怕,red_panda由于無(wú)人認(rèn)領(lǐng),更是引發(fā)大家伙好奇心,各種猜測(cè)都有:
- 鑒于生成質(zhì)量過(guò)好,很可能是傳說(shuō)中的Midjourney V7或中杯Stable Diffusion 3.5;
- 可能是OpenAI的DALL-E 4,因?yàn)锳nthropic前員工在圖片后綴里發(fā)現(xiàn)了OpenAI;
- 也可能是Mistral AI的新模型,理由是在未公布的測(cè)試版中發(fā)現(xiàn)了相似名稱“Pandragon”;
- 或者來(lái)自Recraft文生圖模型,因?yàn)樗鼈冊(cè)褂眯⌒茇垜?zhàn)士作為默認(rèn)矢量提示;
- ……
值得一提的是,有一些人猜測(cè)它可能出自中國(guó)廠商之手。
不過(guò)你還真別說(shuō),一看這既red又panda的名稱logo,中國(guó)味兒實(shí)在過(guò)于濃了。
眾說(shuō)紛紜里,一位工程師小哥更是莫名被cue,網(wǎng)友:
@felix_red_panda,是你嗎?
笑死,誰(shuí)讓你頭像名稱都很像~
競(jìng)技場(chǎng)實(shí)測(cè)效果
red_panda真的有這么強(qiáng)嗎?量子位這就實(shí)測(cè)一下。
需要提醒的是,由于red_panda現(xiàn)身不久,因此目前只能在競(jìng)技場(chǎng)進(jìn)行體驗(yàn)。
規(guī)則也很簡(jiǎn)單,隨機(jī)兩個(gè)匿名模型pk,用戶只需選出最喜歡、覺(jué)得更符合提示詞的圖片就行。
下面我們直接展示捉到的red_panda,與其他模型的同題對(duì)比,直觀看看效果。
第1關(guān):SD 3 Medium(√) VS red_panda
A 3D render of an ancient artfact,intricately detailed and realistically textured,as if just unearthed.(一個(gè)古代文物的3D渲染圖,細(xì)節(jié)錯(cuò)綜復(fù)雜,紋理逼真,仿佛剛剛出土。)
第2關(guān):red_panda VS SD 3.5 Large(√)
An elaborate Gothic cathedral with flying buttresses, stained glass windows, and a bell tower.(一幅精致的哥特式大教堂的圖像,擁有飛扶壁、彩色玻璃窗和鐘樓。)
第3關(guān):red_panda VS Flux.1 [dev](√)
An image of a financial advisor discussing investment strategies with a young couple in a modern office, emphasizing financial planning and long-term wealth management.(一張圖片,展示了一位金融顧問(wèn)在現(xiàn)代辦公室里與一對(duì)年輕夫婦討論投資策略,強(qiáng)調(diào)財(cái)務(wù)規(guī)劃和長(zhǎng)期財(cái)富管理。)
第4關(guān):red_panda(√) VS neptune_next
Antarctic cruise ship poster.(南極游輪海報(bào))
第5關(guān):red_panda(√) VS Flux.1 [schnell]
A vintage, art nouveau-inspired perfume bottle with an elegant, curved design and an ornate, floral label reading “Essence of Elegance”, created as a 3D product render.(一個(gè)復(fù)古風(fēng)格的、受新藝術(shù)運(yùn)動(dòng)啟發(fā)的香水瓶,擁有優(yōu)雅的曲線設(shè)計(jì)和裝飾華麗的花卉標(biāo)簽,上面寫(xiě)著“優(yōu)雅精華”,作為一個(gè)3D產(chǎn)品渲染圖被創(chuàng)造出來(lái)。)
試玩結(jié)束,單從5局結(jié)果來(lái)看,神秘模型red_panda倒是沒(méi)有想象中的壓倒性勝利。
不過(guò)也可能是個(gè)人審美原因:
感興趣的朋友也可以去試試,看誰(shuí)運(yùn)氣好能隨機(jī)匹配上red_panda。(擴(kuò)大樣本招數(shù)有doge)
網(wǎng)友:中國(guó)造?
好的,現(xiàn)在問(wèn)題同樣來(lái)了:red_panda哪來(lái)的??
大部分人第一反應(yīng)都是中國(guó),理由也很直白:一是看起來(lái)就很china,二是國(guó)內(nèi)目前在視頻生成方面大有趕超之勢(shì),順手做一個(gè)文生圖模型也很正常。
幾乎沒(méi)有什么比這個(gè)名字更中國(guó)的了……
點(diǎn)名快手、字節(jié)、Minimax等,當(dāng)你看到他們?nèi)绾谓y(tǒng)治AI視頻時(shí),就知道它更有可能是一家在生成人工智能方面已經(jīng)擁有豐富經(jīng)驗(yàn)的公司的中國(guó)模型代號(hào)。
除了國(guó)內(nèi)大廠,另一呼聲來(lái)自Midjourney V7。
Midjourney于8月1日發(fā)布了v 6.1版本,且官方一直透露正在測(cè)試V7,所以很多人猜測(cè)Midjourney有偷偷提前測(cè)試的可能。(匿名競(jìng)技場(chǎng)測(cè)試,很熟悉的配方了)
還有人猜測(cè)是中杯Stable Diffusion 3.5,這是Stability AI上周發(fā)布的模型型號(hào)之一,擁有25億參數(shù),采用改進(jìn)的MMDiT-X架構(gòu)和訓(xùn)練方法,能夠生成分辨率在0.25~2百萬(wàn)像素之間的圖像。
難道是換個(gè)馬甲來(lái)競(jìng)技場(chǎng)試試水?
除此之外,相對(duì)靠譜的猜測(cè)來(lái)自Anthropic前員工,“Dalle 4 = Red Panda”。
他提供的證據(jù)如下,一張由DALL-E生成的圖片命名中帶有相關(guān)字符串。
不過(guò)也有網(wǎng)友出來(lái)反駁了,也許panda只是出于索引原因隨機(jī)插入的?
更有人表示,OpenAI沒(méi)必要再搞DALL-E,GPT-4o已經(jīng)夠用了,而且命名風(fēng)格也和OpenAI不符~
除了OpenAI,法國(guó)開(kāi)源模型公司Mistral AI也榜上有名,不過(guò)這個(gè)比較牽強(qiáng),只是因?yàn)槊Q相似。
本月早些時(shí)候,有消息稱該公司正在測(cè)試新模型“Pandragon”,可能具有圖像生成和網(wǎng)絡(luò)搜索功能。
所以,沒(méi)準(zhǔn)是這個(gè)還未現(xiàn)身的測(cè)試模型~
不過(guò)當(dāng)時(shí)也透露,Pandragon的圖像生成功能可能會(huì)由黑森林實(shí)驗(yàn)室的Flux提供支持。
由此也引出“red_panda”很可能來(lái)自Flux的傳聞:
好家伙,如果屬實(shí),這算是自己打敗自己?jiǎn)幔?doge)
BTW,截至發(fā)稿前,雖然red_panda仍占據(jù)榜首,但它和后位選手的差距貌似正逐漸縮小。
且讓我等繼續(xù)觀望,順便等個(gè)認(rèn)領(lǐng)。
競(jìng)技場(chǎng)地址:https://artificialanalysis.ai/text-to-image/arena?tab=Leaderboard