基本就是AGI?GPT-4o“它”來了
OpenAI昨晚發(fā)布的GPT-4o給許多智能助理丟下一顆震撼彈。它不僅是一款強大的多模態(tài)AI助理,同時,為了應(yīng)對Google Gemini的免費策略,OpenAI也讓它免費了。
GPT-4o其中的“o”代表“Omni”,也就是“全能”的意思,可見OpenAI對它的表現(xiàn)充滿了自信。不僅如此,OpenAI還為macOS用戶推出ChatGPT的桌面應(yīng)用,不僅可以向ChatGPT提問,還能讀取用戶的屏幕截圖。
GPT-4o的最大特點在于,它支持文本、音頻、圖像任意組合的輸入,同時也能以這樣的任意組合輸出,而且能夠接受最短232毫秒、平均320毫秒的音頻輸入,簡單來說,GPT-4o的反應(yīng)速度就像真實的人類一樣。
在英文和代碼處理能力上,GPT-4o與GPT-4 Turbo性能不相上下,但是GPT-4o已經(jīng)可以直接在ChatGPT的網(wǎng)站使用。在非英文的能力上,GPT-4o有著明顯的提升,而且API速度也更快,成本也更低。
GPT-4o提供了GPT-4級別的智能,同時改進了文本、視覺和音頻方面的能力。OpenAI CTO Muri Murati表示,這些模型將越來越復(fù)雜,但交互體驗需要變得更簡單和自然,讓用戶忘記交互界面,只關(guān)注與GPT的協(xié)作上。
在演示過程中,工程師在iPhone上和GPT-4o進行了一次“視頻通話”,它對即時的信息反應(yīng)相當迅速,還能很好地理解人類情感,同時也能表現(xiàn)出豐富的情感。在視覺能力上,它也能通過手機的攝像頭實時幫助工程師完成數(shù)學題甚至幾何題的運算。
這么強大的能力,也讓GPT-4o發(fā)布幾個小時,就迅速在社交媒體上引發(fā)爭論。
Nvidia高級科學家Jim Fan在X上表示:“OpenAI正在競爭中遠超Character AI”,他也指出,以往OpenAI刻意壓制的更具情感和個性化的AI特性,如今已經(jīng)成為它迭代的方向。
AI開發(fā)者Benjamin De Kraker更感嘆GPT-4o基本上就是AGI(通用人工智能):“這基本上就是AGI,這會被視為一個奇跡。當一個虛擬人能聽、說、看,并且具備和人類幾乎無異的推理能力時,人們還能怎么稱呼它呢?”
基本就是AGI?GPT-4o“它”來了
與此同時,網(wǎng)絡(luò)上也有一些質(zhì)疑的聲音。記者和作家James Vincent表示,將GPT-4o作為語音助手的推廣方法很精明,但這最終只是“智能的偽裝”,因為“聲音的表現(xiàn)并不一定預(yù)示著能力的飛躍”。
基本就是AGI?GPT-4o“它”來了
對AI技術(shù)持反對意見的Artisanal Holdout表示:“OpenAI對GPT-5沒有信心,在GPT-4發(fā)布一年多后才推出了GPT-4o。這對OpenAI和AI愛好者來說都是一種尷尬。”
基本就是AGI?GPT-4o“它”來了
不過,Google預(yù)計也會在北京時間5月15日凌晨的I/O大會上公布自己的大模型進展,而且Gemini早已取代Google Assistant,成為Android系統(tǒng)內(nèi)置的虛擬助理。
不論是大模型還是虛擬助理方面,OpenAI已經(jīng)搶盡風頭,Google一定做好了準備迎接這場挑戰(zhàn)。在I/O大會之后,OpenAI還會不會有什么別的動作也很難說呢。