甲骨文寵兒力壓GPT-4斬獲競(jìng)技場(chǎng)首勝,不綁定廠商,不做聊天機(jī)器人,Transformer最年輕作者帶飛大模型創(chuàng)業(yè)新 原創(chuàng)
編輯 |諾亞、伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
近日在開源模型界,Command R+風(fēng)頭正勁。
在Arena榜單上,Command R+憑借逾13000名支持者的票,一度躍升至第6位,其表現(xiàn)與GPT-4-0314旗鼓相當(dāng)!在一眾對(duì)壘GPT-4的開放權(quán)重模型中,斬獲該榜單有史以來的首勝。
圖源:https://twitter.com/lmsysorg/status/17776301337
而Arena榜單,是近日用純C語(yǔ)言手搓GPT-2的AI大神Andrej Karpathy提過的唯二信任的測(cè)試基準(zhǔn)之一。
Command R+隸屬總部位于多倫多的大模型創(chuàng)業(yè)公司Cohere。這家AI新銳的聯(lián)合創(chuàng)始人兼CEO,正是Transformer最年輕作者Aidan Gomez。我們且來看一看開源模型界當(dāng)紅炸子雞的幕后故事。
1.Command R+ 橫空出世,何以擊敗GPT-4
Command R+與前代Command R一樣,擁有128k令牌上下文窗口,而且又在此基礎(chǔ)上全面提高了性能。
首先,提供先進(jìn)的檢索增強(qiáng)生成(RAG)能力。RAG技術(shù)結(jié)合了基于檢索的模型和生成性模型的優(yōu)勢(shì)。前者涉及從數(shù)據(jù)庫(kù)、文章或網(wǎng)站等大量來源中訪問和提取信息,而后者擅長(zhǎng)生成連貫且具有上下文意識(shí)的文本。通過結(jié)合這兩個(gè)組件,RAG在生成更具信息性和上下文相關(guān)性的響應(yīng)方面脫穎而出。
更值得一提的是,新模型針對(duì)高級(jí)RAG進(jìn)行了優(yōu)化,提高了響應(yīng)的準(zhǔn)確性,并提供了內(nèi)嵌的源引用,以減少幻覺現(xiàn)象,從而更好地應(yīng)對(duì)業(yè)務(wù)需求,使企業(yè)能夠借助AI擴(kuò)展支持各種業(yè)務(wù)功能,如財(cái)務(wù)、人力資源、銷售、市場(chǎng)營(yíng)銷和客戶支持等。
再者,覆蓋10多種語(yǔ)言,支持全球業(yè)務(wù)運(yùn)營(yíng)。其中包括:英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)、德語(yǔ)、葡萄牙語(yǔ)、日語(yǔ)、韓語(yǔ)、阿拉伯語(yǔ)和中文。
另外,Command R+還配置了多種工具使用功能,用于自動(dòng)化復(fù)雜的業(yè)務(wù)流程
API接口:附帶可以通過Cohere和LangChain API訪問的工具使用能力。這有助于自動(dòng)化復(fù)雜的業(yè)務(wù)工作流程,如更新CRM任務(wù)、活動(dòng)和記錄。
多步驟工具使用:Command R+中的一個(gè)新特性,使模型能夠結(jié)合多個(gè)工具進(jìn)行多個(gè)步驟以完成復(fù)雜任務(wù)。Command R+還具有自我糾正的能力,當(dāng)它嘗試使用工具失敗時(shí)(例如遇到工具的錯(cuò)誤或故障),這增強(qiáng)了模型完成任務(wù)的可能性,并提高了成功的可能性。
在對(duì)話工具使用和單輪次函數(shù)調(diào)用能力方面,Command R+在關(guān)鍵企業(yè)AI基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,超過了OpenAI的GPT-4 Turbo,以及Anthropic的Claude 3 Sonnet和Mistral Large。
圖源:https://txt.cohere.com/command-r-plus-microsoft
2.Cohere與Oracle,并不是OpenAI和微軟的關(guān)系
作為一家為企業(yè)用戶進(jìn)行服務(wù)的公司,Cohere并不想成為巨頭的跟班。
盡管Oracle是Cohere的主要投資者,兩者的關(guān)系十分密切,但他們并不喜歡OpenAI與Microsoft的“相處模式”。Cohere的CEO Gomez表示,Cohere獨(dú)立于任何云服務(wù)提供商,可以在任何云平臺(tái)上部署其模型,這與僅在Microsoft Azure可以使用的OpenAI不同。
“我們認(rèn)為獨(dú)立性非常重要,因此我們的服務(wù)可以在你所知道的每一家云平臺(tái)上使用——Azure、GCP、OCI、AWS,以及本地部署。你不會(huì)被鎖定在單一的技術(shù)?;蛟破脚_(tái)上,”Gomez在2024年達(dá)沃斯世界經(jīng)濟(jì)論壇的間隙說道。這種獨(dú)立性給了Cohere開辟更多收入來源的可能。
“我們不會(huì)從單一的云服務(wù)提供商那里接受巨額的支票,這可能會(huì)將我們鎖定在一個(gè)生態(tài)系統(tǒng)或環(huán)境中。我們真的在努力保持獨(dú)立,并為世界建立一些新的東西,”他補(bǔ)充道,間接地對(duì)OpenAI進(jìn)行批評(píng)。
該企業(yè)的COO Martin Kon也表達(dá)了類似的想法,他說模型需要與云無關(guān),這樣你就可以在你覺得對(duì)你的數(shù)據(jù)最舒適的地方部署它們,而不會(huì)被綁定到特定的云或甚至是本地部署。
不過,Oracle的確是Cohere資金雄厚的金主之一,與該公司在技術(shù)方面也有著密切的關(guān)系。Cohere在Oracle云基礎(chǔ)設(shè)施(OCI)上訓(xùn)練和構(gòu)建其生成性AI模型,該基礎(chǔ)設(shè)施提供了高性能和低成本的GPU集群技術(shù)。這使得Cohere能夠加速大型語(yǔ)言模型(LLM)的訓(xùn)練,同時(shí)降低成本。同樣的,微軟Azure云計(jì)算平臺(tái)也在為OpenAI所提供的算力支持。
“與Oracle的關(guān)系在計(jì)算方面產(chǎn)生了巨大的影響,為我們提供了地球上最好的超級(jí)計(jì)算機(jī),同時(shí)在共同進(jìn)入市場(chǎng)、共同創(chuàng)造新產(chǎn)品、改造現(xiàn)有產(chǎn)品以及將這項(xiàng)技術(shù)帶給企業(yè)方面也非常重要,”Gomez說道。
Gomez補(bǔ)充說,“OCI生成性AI服務(wù)真正體現(xiàn)了我們的使命,即為企業(yè)構(gòu)建大型語(yǔ)言模型,以一種極度保護(hù)他們的數(shù)據(jù)、完全安全的方式”。
Cohere的生成性AI模型已經(jīng)集成到Oracle的商業(yè)應(yīng)用中,包括Oracle Fusion Cloud、Oracle NetSuite和Oracle特定行業(yè)的應(yīng)用程序。
當(dāng)前,Cohere 一直在努力提升自身的盈利水平。去年年底,該公司的年化收入約為 1300 萬美元,月收入僅略高于 100 萬美元。這一數(shù)字被他強(qiáng)大的競(jìng)爭(zhēng)對(duì)手——OpenAI遠(yuǎn)遠(yuǎn)地甩在了身后,去年年 12 月OpenAI的營(yíng)收已突破 20 億美元大關(guān)。
不過,這家初創(chuàng)公司已告知投資者,其銷售漏斗上(包括預(yù)計(jì)在 2024 年底之前完成的潛在合同)的價(jià)值超過 3 億美元,目前尚不清楚甲骨文在其中所占的份額??梢源_定的是,隨著Cohere的模型在多家云平臺(tái)上完成部署,他的收入曲線勢(shì)必會(huì)繼續(xù)攀升。
微軟Azure宣布接入Cohere
3.OpenAI之下,大模型謀求盈利之路
大模型的元年已過,AI的落地應(yīng)用浪潮洶涌。傅盛預(yù)言,今年千億大模型過半將會(huì)凋零。
在OpenAI的高光之下,或是照貓畫虎,或是另辟蹊徑,大模型廠商都必須探索出自己的生財(cái)之道。
專注于企業(yè)服務(wù)的Cohere,早早便堅(jiān)定了To B的決心。Cohere的首席執(zhí)行官M(fèi)artin Kon 說:"我們現(xiàn)在沒有,將來也不會(huì)有一個(gè)燒錢的消費(fèi)者聊天機(jī)器人?!?/p>
4月11日晚,李彥宏在內(nèi)部講話中表達(dá)了文心一言為何選擇了閉源之路,他提到,“閉源,是有真正的商業(yè)模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才,閉源在成本上反而是有優(yōu)勢(shì)的,只要是同等能力,閉源模型的推理成本一定是更低的,響應(yīng)速度一定是更快的。”
但以Llama、Mistral AI 和Command R+為代表的其他各種替代方案正在蓬勃發(fā)展,并越來越多地被云提供商和企業(yè)采用。開源勢(shì)力亦不可小覷。以Command R+ 為例,其在可擴(kuò)展市場(chǎng)類別中優(yōu)于類似模型,定價(jià)上也更具競(jìng)爭(zhēng)力。
Cohere為Command R+設(shè)定的100萬輸入和輸出令牌成本分別為3美元和15美元,這一價(jià)格頗具競(jìng)爭(zhēng)力。相較于其他產(chǎn)品,其定價(jià)與Claude 3 Sonnet相當(dāng);而最新的OpenAI GPT-4 Turbo模型對(duì)100萬輸入令牌收費(fèi)10美元,對(duì)100萬輸出令牌收費(fèi)30美元。
隨著AI創(chuàng)新領(lǐng)域新競(jìng)爭(zhēng)者的不斷涌入,在當(dāng)前穩(wěn)健發(fā)展的態(tài)勢(shì)下,相信關(guān)于“開源VS閉源”的辯論,也會(huì)伴隨創(chuàng)新浪潮下探索的每一步,但這不會(huì)是“東風(fēng)壓倒西風(fēng)”的二選一終局,這兩種模式必然將在相當(dāng)長(zhǎng)的時(shí)期內(nèi)共生共存,共同為AI產(chǎn)業(yè)落地創(chuàng)造價(jià)值。
參考鏈接:
1.https://analyticsindiamag.com/who-needs-openais-gpt-4/
2.https://analyticsindiamag.com/the-secret-superstar-of-llms/
3.??https://k.sina.com.cn/article_1654203637_629924f5020011twi.html??
?本文轉(zhuǎn)載自 ???51CTO技術(shù)棧??,作者:諾亞
