自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI模型終于更新!強大視聽能力的GPT-4o將面向所有用戶,其前身正是神秘的gpt2!

原創(chuàng) 精選
人工智能
如果OpenAI與微軟、蘋果都牽起了手,那么谷歌這個"AI屆汪峰"真的要陷入孤軍奮戰(zhàn)的尷尬中了。

編輯 | 伊風

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

春季終于如約而至!GPT系列的模型終于等到了久違的更新——GPT-4o浮出水面。

而且此前頗具神秘氣息的“im-also-a-good-gpt2-chatbot”,正是其測試版本。

本場更新并未見到奧特曼的身影,而是由OpenAI CTO 穆里-穆拉提(Muri Murati)主持。此前她曾因為在采訪中對OpenAI的訓練數(shù)據(jù)語焉不詳而受到過一些爭議。

OpenAI在春季發(fā)布上都說了啥呢?一句話概括,GPT-4o更快、更多模態(tài)、而且更加便宜了!

圖片圖片

1.最新模型GPT-4o

讓奧特曼直呼“amazing work”的模型更新來了!

圖片圖片

可以看到GPT-4o的性能一騎絕塵。(題外話,通義千問大模型在這張圖的右側(cè)默默上榜了)。

新的大型語言模型是在互聯(lián)網(wǎng)的海量數(shù)據(jù)基礎(chǔ)上訓練出來的,將更擅長處理文本和音頻,并可處理 50 種語言。

OpenAI 更新的 GPT-4o 生成式人工智能模型,將在未來幾周內(nèi)正式面向開發(fā)者和消費者推出。新模型將面向所有用戶,穆拉提補充說,付費用戶將繼續(xù) "擁有五倍于免費用戶的容量限制"。

OpenAI 首席技術(shù)官穆里-穆拉提(Muri Murati)說,GPT-4o 提供了 "GPT-4 級 "的智能,但改進了 GPT-4 在文本、視覺和音頻方面的能力。

"穆拉提在 OpenAI 辦公室舉行的主題演講中說:"GPT-4o 的優(yōu)勢在于它能跨越語音、文本和視覺。"這一點非常重要,因為我們正在展望人類與機器互動的未來。

GPT-4是OpenAI之前的領(lǐng)先模型,它是由圖像和文本組合訓練而成的,可以分析圖像和文本,完成從圖像中提取文本甚至描述圖像內(nèi)容等任務。但 GPT-4o 在此基礎(chǔ)上增加了語音功能。

這吻合了此前大家猜測的方向:“ChatGPT+Voice Agent”!

英偉達的科學家Jim Fan在更新直播前的預測英偉達的科學家Jim Fan在更新直播前的預測


2.GPT-4o強大的“視聽”能力

OpenAI 首席執(zhí)行官山姆-阿爾特曼(Sam Altman)發(fā)布消息稱,該模型是 "原生多模態(tài) "的,這意味著該模型可以生成內(nèi)容或理解語音、文本或圖像命令。

GPT-4o在語音方面具體可以實現(xiàn)什么呢?

GPT-4o 極大地改善了 ChatGPT 的體驗--ChatGPT 是 OpenAI 的病毒式人工智能聊天機器人。ChatGPT 長期以來一直提供語音模式,使用文本到語音模型轉(zhuǎn)錄 ChatGPT 中的文本。但 GPT-4o 對此進行了改進,讓用戶可以更像使用助手一樣與 ChatGPT 互動。

例如,用戶可以向由 GPT-4o 支持的 ChatGPT 提問,并在 ChatGPT 回答時打斷它。OpenAI 表示,該模型可以提供 "實時 "響應,甚至可以捕捉用戶聲音中的情感,并生成 "一系列不同情感風格 "的語音。

GPT-4o 還提高了 ChatGPT 的視覺能力。如果給定一張照片或一個桌面屏幕,ChatGPT 現(xiàn)在可以快速回答相關(guān)問題,從 "這個軟件代碼是怎么回事 "到 "這個人穿的是什么牌子的襯衫?"

"穆拉提說:"我們知道這些模型越來越復雜,但我們希望交互體驗實際上變得更加自然、輕松,讓你完全不用關(guān)注用戶界面,而只關(guān)注與 [GPT] 的協(xié)作。

OpenAI 聲稱,GPT-4o 的多語言性也更強,在 50 種不同語言中的性能都有所提高。Altman 在 X 上補充說,想要使用 GPT-4o 的開發(fā)者可以訪問 API,其價格是 GPT-4-turbo 的一半,速度是 GPT-4-turbo 的兩倍。

3.寫在最后

OpenAI具有強大音頻能力的模型GPT-4o的推出,讓我們進一步看到了虛擬助手的未來。

有知情的科技博主表示,此時的發(fā)布也是OpenAI和蘋果已經(jīng)達成交易的信號。這意味著Siri的未來可能是由ChatGPT進行支持的!

圖片圖片

如果OpenAI與微軟、蘋果都牽起了手,那么谷歌這個"AI屆汪峰"真的要陷入孤軍奮戰(zhàn)的尷尬中了。

明天,谷歌的開發(fā)者大會將如約而至。OpenAI 趕在此時發(fā)布產(chǎn)品更新頗有些搶奪谷歌風頭的意思!

那么,你認為谷歌發(fā)布什么產(chǎn)品才可以為自己扳回一局呢?

參考鏈接:

1.https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/

2.https://www.theverge.com/2024/5/13/24155493/openai-gpt-4o-launching-free-for-all-chatgpt-users?showComments=1

想了解更多AIGC的內(nèi)容,請訪問:

51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2024-05-15 17:34:15

2024-05-06 08:25:00

2024-06-05 13:09:26

2024-08-08 14:27:29

2024-05-14 11:29:15

2024-06-05 08:29:35

2025-03-31 08:50:00

AI生成模型

2024-08-22 13:40:08

開發(fā)者GPT-4oepoch

2024-05-21 12:23:17

2024-08-02 14:58:00

2024-11-28 15:51:19

GPT-4o微軟

2024-08-14 14:30:00

AI訓練

2023-07-07 09:32:57

GPT-4OpenAI

2024-07-22 15:13:24

2024-05-08 13:41:31

OpenAIA/B測試

2025-04-07 00:00:00

OpenAIGPT-4o圖像

2024-05-30 13:13:43

2025-04-08 02:26:00

2024-05-17 09:35:55

GPT-4o模型OpenAI

2024-05-16 12:38:05

GPT-4o圖像方式
點贊
收藏

51CTO技術(shù)棧公眾號