大洋彼岸馬上就要“過(guò)年”了,OpenAI和谷歌都在搶著在年前秀一秀自己壓箱底的AI大作。在通向AGI的道路上,谷歌似乎已經(jīng)反超了OpenAI,奪回了領(lǐng)先地位。前幾天,兩家?guī)缀跬瑫r(shí)發(fā)布的Sora但效果上的顯著差異,再次讓外界看到了谷歌的實(shí)力回歸。
不止視頻賽道,Google 再次甩出了一個(gè)大招。今天凌晨,Google 推出 Gemini 2.0 Flash Thinking,可以說(shuō)來(lái)了一波反打 OpenAI o1。
1.谷歌版o1發(fā)布,榜上第一 皮查伊:迄今為止最深思熟慮的模型
谷歌 Gemini 2.0 產(chǎn)品負(fù)責(zé)人 Logan Kilpatrick 表示,這個(gè)新模型“解鎖了更強(qiáng)大的推理能力并展示了自己的思維”。
他介紹,該模型可以“以 Flash 速度解決復(fù)雜問(wèn)題”,同時(shí)顯示其內(nèi)部規(guī)劃流程(思維鏈),從而提高 AI 問(wèn)題解決的透明度。
圖片
另外,除了擅長(zhǎng)數(shù)學(xué)、編程等復(fù)雜場(chǎng)景,這次谷歌版本的o1是具備多模態(tài)推理能力。
該實(shí)驗(yàn)?zāi)P腿蕴幱谠缙陔A段,但 Kilpatrick 提供了一個(gè)例子來(lái)說(shuō)明其潛力,展示了它如何解決涉及視覺(jué)和文本線索的具有挑戰(zhàn)性的難題。
大家可以看這個(gè)例子:
開(kāi)發(fā)人員現(xiàn)在可以在 Google AI Studio 和 Gemini API 中試用該模型?!斑@只是我們推理之旅的第一步,很高興看到你們的想法!”
圖片
“Google 向 AIStudio 中的用戶免費(fèi)提供推理模型只是為了展示他們的力量。他們回來(lái)了,“X 上的一位用戶評(píng)論道。
“我們迄今為止最深思熟慮的模型,”谷歌首席執(zhí)行官桑達(dá)爾·皮查伊 (Sundar Pichai) 在 X 上發(fā)帖說(shuō)。
來(lái)自 Chatbot Arena??? 的突發(fā)新聞@GoogleDeepMind Gemini-2.0-Flash-Thinking 在所有類別中首次亮相,躍升成為 No.1!
圖片
大家都知道,三天前 Google 最近推出了 Gemini 2.0 Flash,它支持多模態(tài)輸入,包括圖像、視頻和音頻,以及多模態(tài)輸出,例如本地生成的圖像與文本相結(jié)合,以及可操縱的文本轉(zhuǎn)語(yǔ)音 (TTS) 多語(yǔ)言音頻。它還可以原生調(diào)用 Google 搜索等工具、執(zhí)行代碼以及集成第三方用戶定義函數(shù)。
Gemini 2.0 Flash Thinking 建立在谷歌的 Gemini 系列之上,將與 OpenAI 的 o1 模型競(jìng)爭(zhēng),后者以其令人印象深刻的推理能力而聞名,其水平類似于物理、化學(xué)和生物學(xué)的博士生。
這一發(fā)展是在 OpenAI 發(fā)布完整版 o1 模型作為其 12 天直播的一部分的背景下發(fā)生的。除此之外,它還在 API 中發(fā)布了 o1 模型,升級(jí)了函數(shù)調(diào)用、結(jié)構(gòu)化輸出、推理努力控制、開(kāi)發(fā)者消息和視覺(jué)輸入。一些基準(zhǔn)測(cè)試表明,o1 是迄今為止最強(qiáng)大的 AI 模型,在編碼任務(wù)中甚至優(yōu)于 Claude 3.5 Sonnet。
o1 讓其他人都大吃一驚——它是推理方面的野獸,也是編碼方面最好的!!
12 月 17 日的新 o1 模型在 Livebench AI 上是 #1,推理得分為 91.58??!
最后,OpenAI 在編碼方面也擊敗了 Sonnet。??
2.OpenAI 的第11天發(fā)布:應(yīng)用創(chuàng)新
谷歌現(xiàn)在似乎在 AGI 競(jìng)賽中領(lǐng)先,而 OpenAI 現(xiàn)在正在迎頭趕上。在“OpenAI 12 天直播”的第 11 天,這家獨(dú)角獸宣布對(duì) Mac 的 ChatGPT 桌面應(yīng)用程序進(jìn)行更新。
這次直播發(fā)布來(lái)自 OpenAI ChatGPT 桌面團(tuán)隊(duì)的 John Nastos 和 Justin Rushing。
Nastos 將原生應(yīng)用程序描述為“輕量級(jí)”且易于使用,而不會(huì)中斷正在進(jìn)行的任務(wù)。該應(yīng)用程序的一個(gè)突出特點(diǎn)是它與用戶計(jì)算機(jī)上的各種應(yīng)用程序無(wú)縫集成,可以更輕松地直接從 ChatGPT 與多個(gè)工具進(jìn)行交互。
圖片
“我們的桌面應(yīng)用程序現(xiàn)在可以與 Xcode、Warp、Notion、Apple 等 ~30 多個(gè)應(yīng)用程序一起使用。ChatGPT 可以查看、理解和自動(dòng)化您在其他應(yīng)用程序中的工作——這是朝著更具代理性的 ChatGPT 邁出的一步,“OpenAI 首席產(chǎn)品官 Kevin Weil 說(shuō)。
“我們都一直在將東西復(fù)制和粘貼到 ChatGPT 中,”Rushing 說(shuō)。“此功能可以自動(dòng)從您正在使用的應(yīng)用程序中提取上下文,從而使這種方式更加順暢,因此您可以專注于提出問(wèn)題,剩下的交給我們?!?/span>
該應(yīng)用程序的實(shí)用程序擴(kuò)展到編碼任務(wù)。Nastos 展示了它與 Xcode 等 IDE 集成的能力,展示了 ChatGPT 如何協(xié)助應(yīng)對(duì)實(shí)時(shí)編碼挑戰(zhàn)。
該應(yīng)用程序的突出功能之一是語(yǔ)音交互,使用戶能夠通過(guò)高級(jí)語(yǔ)音模式直接與 ChatGPT 交流,以實(shí)現(xiàn)更快、更自然的對(duì)話。
3.谷歌和OpenAI 12月大戰(zhàn)階段性總結(jié)
OpenAI Shipmas 只剩下一天了,每個(gè)人都熱切期待 OpenAI 接下來(lái)將推出什么,以結(jié)束 12 天的不間斷輸出。然而,到目前為止,谷歌見(jiàn)招拆招,對(duì) OpenAI 的一舉一動(dòng)都進(jìn)行了無(wú)差別打擊。
雖然 OpenAI 在其“OpenAI 12 天”期間一直在發(fā)布公告,但谷歌但尖貨更為讓人振奮,已經(jīng)推出了自己的一系列創(chuàng)新,包括量子芯片 Willow、Gemini 2、3D 世界模型 Genie 2、Veo 2 視頻生成模型、作為通用代理的 Project Astra、Project Mariner、Google Deep Research 和用于 AR/VR 開(kāi)發(fā)的 Android XR,當(dāng)然還有今天的推理模型thinking。
另一方面,OpenAI 公布了幾項(xiàng)重大更新,包括改進(jìn)的 OpenAI o1 推理模型、每月 200 美元的新 ChatGPT Pro 訂閱以及他們的文本到視頻 AI 生成器 Sora。
其他值得注意的版本包括適用于所有用戶的 ChatGPT Search、用于組織聊天的新項(xiàng)目功能、用于協(xié)作編寫和編碼的 Canvas 以及 ChatGPT 的實(shí)時(shí)視頻功能。
此外,OpenAI 還推出了一系列新功能,例如帶有圣誕老人語(yǔ)音選項(xiàng)的高級(jí)語(yǔ)音模式、從固定電話撥打 ChatGPT 的 1-800 號(hào)碼,以及 ChatGPT 與 Apple Intelligence 的集成。