Gemini 1.5實測:我看Sora一眼假;還有更多驚艷功能
谷歌の“反擊”來了!
Gemini被Sora搶走的風頭,現在有搶回來的勢頭了。
在最新實測中,Gemini 1.5能分析Sora視頻是否AI生成。
是直接給出當中關鍵因素的那種。
比如這個經典的貓貓視頻,Gemini 1.5直言:
它的眼睛和毛都看起來都不像是真的。
還有像這段生成視頻,Gemini 1.5都能說出個一二三造假細節(jié)來~
都說魔法打敗魔法,結果Sora發(fā)布這才沒幾天,就火速被Gemini 1.5“抓出現行”。
對于Gemini 1.5第一波實測結果,網友直呼:that’s scary good,并稱其為“游戲規(guī)則的改變者”。
Gemini 1.5第一波實測來了
Gemini 1.5版本突然發(fā)布,結果被對面Sora的光芒所掩蓋。
但即便如此,其模型性能的重大升級,尤其是支持100萬token上下文窗口,仍讓網友們印象深刻。
現在一些博主陸陸續(xù)續(xù)地拿到了訪問資格,開始了第一波實測。
除了能鑒別生成視頻真假之外,還有這些令人印象深刻的功能。
1、分解并理解長視頻。
比如一場14分鐘的NBA扣籃視頻,Gemini 1.5能判斷出哪個扣籃得分最高, 并給出其中扣籃細節(jié)。
整個響應過程大致只需要55秒左右。
2、理解長文本內容,進行比較分析。
博主投喂了《星際穿越》和《星際探索》兩個完整的電影腳本,合起來接近10萬tokens,要求Gemini 1.5分析比較,以幫助決定觀看哪部電影為好。
結果只需三十幾秒,就給出了完整詳盡的分析報告。
這樣一看,分析其中的劇情臺詞也就顯得小兒科了。
(分析電影中最鼓舞人心的三句話)
3、翻譯小語種。
即便是那種只有2000人左右使用的語言也能搞定,比如將英語翻譯成薩特蘭語。
除此之外,還有像分析理解論文中表格的細節(jié)。
對于這波實測,網友們都表示驚嘆:這是個巨大進步,想說可能得等GPT-5來對抗。
尤其是能處理100萬Tokens上下文,這對GenAI初創(chuàng)公司很有用。
還有網友好奇谷歌是怎么解決上下文窗口大小問題的?
一定是發(fā)現或實現了什么新東西。
網友:不太可能是巧合
不過對于谷歌這波“反擊”,暫且還未有OpenAI的人出來回應。而此前Sora的發(fā)布,也少見有谷歌的人出來評價。
但兩家同一天發(fā)布,早就有網友浮想聯(lián)翩:
確實不太可能是巧合。
奧特曼不想失去谷歌這樣一個絕妙的炒作時機。
有網友認為,Sora宣布顯然是一種營銷舉措,它還沒有準備好。相比而言,Gemini 1.5 才是真正的突破。
但也有人認為,Sora才真正意想不到。
Gemini 1.5 非常棒,但并不令人驚訝。
我非常有信心 OpenAI 內部也有超過 100 萬個模型。(Sora是一個副項目)。
并且認為GPT-5出來之后,會擊敗所有的競爭對手。
對于兩家這樣的操作,你怎么看呢?
One More Thing
兩家激戰(zhàn),受傷的是Adobe這類聚光燈之外的玩家。
這兩天股價簡直是一跌再跌……
而此前備受關注的視頻生成公司Runway,其聯(lián)合創(chuàng)始人回應:游戲開始了。
值得一提的是,此次國內反應跟ChatGPT那時候有點不一樣。
Sora出來之后,少見喊對標的人,比當時要安靜多了…