編輯 | 伊風
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
春季終于如約而至!GPT系列的模型終于等到了久違的更新——GPT-4o浮出水面。
而且此前頗具神秘氣息的“im-also-a-good-gpt2-chatbot”,正是其測試版本。
本場更新并未見到奧特曼的身影,而是由OpenAI CTO 穆里-穆拉提(Muri Murati)主持。此前她曾因為在采訪中對OpenAI的訓練數(shù)據(jù)語焉不詳而受到過一些爭議。
OpenAI在春季發(fā)布上都說了啥呢?一句話概括,GPT-4o更快、更多模態(tài)、而且更加便宜了!
圖片
1.最新模型GPT-4o
讓奧特曼直呼“amazing work”的模型更新來了!
圖片
可以看到GPT-4o的性能一騎絕塵。(題外話,通義千問大模型在這張圖的右側(cè)默默上榜了)。
新的大型語言模型是在互聯(lián)網(wǎng)的海量數(shù)據(jù)基礎(chǔ)上訓練出來的,將更擅長處理文本和音頻,并可處理 50 種語言。
OpenAI 更新的 GPT-4o 生成式人工智能模型,將在未來幾周內(nèi)正式面向開發(fā)者和消費者推出。新模型將面向所有用戶,穆拉提補充說,付費用戶將繼續(xù) "擁有五倍于免費用戶的容量限制"。
OpenAI 首席技術(shù)官穆里-穆拉提(Muri Murati)說,GPT-4o 提供了 "GPT-4 級 "的智能,但改進了 GPT-4 在文本、視覺和音頻方面的能力。
"穆拉提在 OpenAI 辦公室舉行的主題演講中說:"GPT-4o 的優(yōu)勢在于它能跨越語音、文本和視覺。"這一點非常重要,因為我們正在展望人類與機器互動的未來。
GPT-4是OpenAI之前的領(lǐng)先模型,它是由圖像和文本組合訓練而成的,可以分析圖像和文本,完成從圖像中提取文本甚至描述圖像內(nèi)容等任務。但 GPT-4o 在此基礎(chǔ)上增加了語音功能。
這吻合了此前大家猜測的方向:“ChatGPT+Voice Agent”!
英偉達的科學家Jim Fan在更新直播前的預測
2.GPT-4o強大的“視聽”能力
OpenAI 首席執(zhí)行官山姆-阿爾特曼(Sam Altman)發(fā)布消息稱,該模型是 "原生多模態(tài) "的,這意味著該模型可以生成內(nèi)容或理解語音、文本或圖像命令。
GPT-4o在語音方面具體可以實現(xiàn)什么呢?
GPT-4o 極大地改善了 ChatGPT 的體驗--ChatGPT 是 OpenAI 的病毒式人工智能聊天機器人。ChatGPT 長期以來一直提供語音模式,使用文本到語音模型轉(zhuǎn)錄 ChatGPT 中的文本。但 GPT-4o 對此進行了改進,讓用戶可以更像使用助手一樣與 ChatGPT 互動。
例如,用戶可以向由 GPT-4o 支持的 ChatGPT 提問,并在 ChatGPT 回答時打斷它。OpenAI 表示,該模型可以提供 "實時 "響應,甚至可以捕捉用戶聲音中的情感,并生成 "一系列不同情感風格 "的語音。
GPT-4o 還提高了 ChatGPT 的視覺能力。如果給定一張照片或一個桌面屏幕,ChatGPT 現(xiàn)在可以快速回答相關(guān)問題,從 "這個軟件代碼是怎么回事 "到 "這個人穿的是什么牌子的襯衫?"
"穆拉提說:"我們知道這些模型越來越復雜,但我們希望交互體驗實際上變得更加自然、輕松,讓你完全不用關(guān)注用戶界面,而只關(guān)注與 [GPT] 的協(xié)作。
OpenAI 聲稱,GPT-4o 的多語言性也更強,在 50 種不同語言中的性能都有所提高。Altman 在 X 上補充說,想要使用 GPT-4o 的開發(fā)者可以訪問 API,其價格是 GPT-4-turbo 的一半,速度是 GPT-4-turbo 的兩倍。
3.寫在最后
OpenAI具有強大音頻能力的模型GPT-4o的推出,讓我們進一步看到了虛擬助手的未來。
有知情的科技博主表示,此時的發(fā)布也是OpenAI和蘋果已經(jīng)達成交易的信號。這意味著Siri的未來可能是由ChatGPT進行支持的!
圖片
如果OpenAI與微軟、蘋果都牽起了手,那么谷歌這個"AI屆汪峰"真的要陷入孤軍奮戰(zhàn)的尷尬中了。
明天,谷歌的開發(fā)者大會將如約而至。OpenAI 趕在此時發(fā)布產(chǎn)品更新頗有些搶奪谷歌風頭的意思!
那么,你認為谷歌發(fā)布什么產(chǎn)品才可以為自己扳回一局呢?
參考鏈接:
1.https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/
想了解更多AIGC的內(nèi)容,請訪問:
51CTO AI.x社區(qū)