全球3.5億下載量破紀(jì)錄! Llama家族暴漲10倍,開源帝國(guó)掀AI革命
Llama一舉成為世界開源的領(lǐng)頭羊。
截至目前,Llama模型在開源平臺(tái)HuggingFace下載量近3.5億。
Groq的創(chuàng)始人表示,這也太瘋狂了,想想Linux花了多長(zhǎng)時(shí)間才達(dá)到這個(gè)數(shù)字?
官博介紹,這一數(shù)字,是去年同期的10倍。而且,僅在上個(gè)月,模型的下載量超2000萬次。
2023年2月,Llama 1首次亮相,經(jīng)過多次迭代,到現(xiàn)在已經(jīng)過去了整整18個(gè)月。
而在這僅有的一年半里,Llama已經(jīng)從一個(gè)最先進(jìn)的單體基礎(chǔ)模型,發(fā)展成為,一個(gè)面向開發(fā)者的強(qiáng)大生態(tài)系統(tǒng)。
LeCun還不忘給自家模型宣傳一波,越來越多的大公司、小公司、初創(chuàng)公司、政府和非營(yíng)利組織,正基于此開發(fā)新的產(chǎn)品和服務(wù)。
還有高校機(jī)構(gòu)、研究人員和工程師每天都在改進(jìn)Llama,并提出新的用例。
另外,值得關(guān)注的一點(diǎn)是,自今年5月Llama 3.1發(fā)布之后,云服務(wù)商對(duì)模型API token調(diào)用需求,翻了一番還要多。
一些Meta最大的云服務(wù)提供商,從2024年1月到7月,Llama的每月token量增長(zhǎng)了10倍。
從微軟云、英偉達(dá)、谷歌云等科技巨頭,到Groq、Databricks等初創(chuàng)公司,全都支持Llama模型的使用。
老黃稱,「Llama深深地影響著最先進(jìn)AI的進(jìn)步」。
可見,Llama正引領(lǐng)著開源之光。
Llama開源,拉低token價(jià)格戰(zhàn)
GPT-4級(jí)別模型開源,最先帶來的好處是,token的價(jià)格不斷下降。
AI大牛吳恩達(dá)在DeepLearning的博客中,算了一筆賬:
近期,OpenAI官宣降價(jià)后,GPT-4o的token成本,現(xiàn)在是每百萬token4美元。(假設(shè)是80%輸入和20%輸入token混合率)
還記得,2023年3月首發(fā)GPT-4時(shí),每百萬token的成本是36美元。
博客地址:https://www.deeplearning.ai/the-batch/issue-264/
17個(gè)月的時(shí)間,價(jià)格相當(dāng)于每年下降了79%(4/36 = (1 - p)^{17/12})。
如你所見,token價(jià)格正迅速下降!
而推動(dòng)token價(jià)格不斷下降的一個(gè)因素,便是開源模型(如Llama 3.1)的發(fā)布。
這是因?yàn)椋珹PI提供商(如Anyscale、Fireworks、Together AI初創(chuàng)公司,以及一些大型云服務(wù)商)并不需要擔(dān)心賺回開發(fā)模型所需的成本,因此他們可以直接在價(jià)格、速度等其他因素上,開啟競(jìng)爭(zhēng)。
此外,一些芯片公司Groq(快速生成token領(lǐng)先者)、Samba Nova(能以114 token/s速度運(yùn)行Llama 3.1 405B)、Cerebras(以1800 token/s速率運(yùn)行Llama 3.1 8B),以及英偉達(dá)、AMD、英特爾、高通等半導(dǎo)體巨頭,在硬件上的創(chuàng)新,近一步拉低了模型價(jià)格。
Groq發(fā)文介紹了,如今支持Llama模型的生態(tài)。
「到目前為止,Groq已經(jīng)使用Llama模型套件和自家LPU Inference,每天向40多萬開發(fā)人員提供50億個(gè)免費(fèi)token」。
在構(gòu)建用程序時(shí),吳恩達(dá)發(fā)現(xiàn),根據(jù)未來技術(shù)發(fā)展方向,進(jìn)行設(shè)計(jì)是非常有用的,而非局限于當(dāng)前水平。
基于多家軟硬件公司的技術(shù)路線(改進(jìn)半導(dǎo)體、更小的模型、推理架構(gòu)中的算法創(chuàng)新),可以預(yù)見的是,token價(jià)格還將持續(xù)下降。
這意味著,即便你構(gòu)建的智能體工作流看起來成本太高,而隨著token價(jià)格不斷下降,或許在某個(gè)時(shí)間,這套方案在未來也變得經(jīng)濟(jì)可行。
假設(shè)你創(chuàng)建了一個(gè)APP幫助人類,可每秒連續(xù)輸出100個(gè)token。那如果百萬token 4美元,每小時(shí)只花費(fèi)1.44美元。
這遠(yuǎn)遠(yuǎn)低于美國(guó),以及許多其他國(guó)家最低工資標(biāo)準(zhǔn)。
Meta挑戰(zhàn)ChatGPT贏得數(shù)百萬用戶
小扎希望,到今年年底,讓Meta AI成為全球使用量最多的AI助手,超越OpenAI的ChatGPT。
目前,這一切正朝著他的目標(biāo),取得了進(jìn)展。
據(jù)內(nèi)部2位員工透露,8月初,Meta AI(2023年9月發(fā)布)在發(fā)布不到一年時(shí)間里,收攬了至少4億月活躍用戶和4000萬日活躍用戶。
這些數(shù)字從側(cè)面反映了,超30億用戶的Meta,每天至少使用Meta旗下的一款應(yīng)用中的AI助手。
此外還包括,通過Meta AI專屬網(wǎng)站,以及Ray-Ban智能眼鏡,也收獲了不少用戶。
龐大的用戶群,成為大型科技公司優(yōu)勢(shì),希望從ChatGPT中奪取一部分市場(chǎng)份額和關(guān)注度。
其實(shí),谷歌也向數(shù)十億用戶推廣了對(duì)話式AI——Gemini,但力度卻不如Meta。
但一些使用Meta應(yīng)用程序的人,在Facebook、Reddit、X上,抱怨Meta過于激進(jìn)地推廣AI助手,比如在其APP的鍵盤上添加搜索按鈕。
有的人還出了一個(gè)關(guān)閉Meta AI對(duì)話的教程。
出于對(duì)用戶參與度的擔(dān)憂,Meta員工可能會(huì)不定期討論的一個(gè)問題是,是否有些用戶無意間使用了Meta AI。
8月初使用數(shù)據(jù)顯示,大約10%的月活躍用戶,每天使用助手來回答問題、生成圖像和執(zhí)行其他任務(wù)。
而這一比例遠(yuǎn)低于Meta的其他應(yīng)用程序。
Meta此前2月報(bào)告稱,80%的月活躍用戶每天至少使用一款自家的應(yīng)用。
這些數(shù)字表明,Meta AI已經(jīng)是ChatGPT強(qiáng)有力的競(jìng)爭(zhēng)者之一。
2022年11月,ChatGPT首次推出。截至目前,每周有超2億人使用。鑒于最近的使用數(shù)據(jù),Meta AI可能相距不遠(yuǎn)。
與Meta AI不同,ChatGPT也是一項(xiàng)盈利的業(yè)務(wù)模型。
數(shù)百萬用戶每月需要支付20美元,成為ChatGPT Plus用戶,才能用上最先進(jìn)模型撰寫、編程、答問的能力。
數(shù)據(jù)顯示,ChatGPT訂閱收入,每年大約高達(dá)20億美元。
Meta已在今年投入高達(dá)400億美金數(shù)據(jù)中心和其他基礎(chǔ)設(shè)施。
而Meta AI被視為,未來公司獲得這些巨額投資回報(bào)的關(guān)鍵部分,主要用于開發(fā)這一產(chǎn)品的背后大模型Llama。
雖有報(bào)道曝出,Meta正推出一個(gè)付費(fèi)版的高級(jí)人工智能助手。
去年9月,Meta剛剛推出AI助手時(shí),人們最初只能通過Instagram、WhatsApp或Messenger上的直接消息與Meta AI聊天。
今年,Meta開始在各種應(yīng)用中, 讓其變得更加顯眼、容易訪問。
4月,他們將Meta AI添加到其應(yīng)用程序的搜索欄和信息流中,并為其推出了獨(dú)立網(wǎng)站meta.ai。
同月,Meta還推出了一個(gè)新版本的AI助手,該版本能夠識(shí)別和解析圖像,并在其Ray-Ban智能眼鏡中廣泛應(yīng)用。
目前,該助手在Meta的應(yīng)用程序中可用的語(yǔ)言有8種,并在22個(gè)國(guó)家提供,同時(shí)在美國(guó)和加拿大的智能眼鏡中提供英語(yǔ)版本。
開源AI如火如荼
開源AI技術(shù)正在迅速發(fā)展,推動(dòng)著生成式AI的重大創(chuàng)新。通過GitHub和Hugging Face等可訪問的研究和平臺(tái),社區(qū)已經(jīng)啟動(dòng)了取得突破性成果的項(xiàng)目。
生態(tài)系統(tǒng):穩(wěn)步增長(zhǎng),走出泡沫化的底谷期(Trough of Disillusionment)
自2023年第一季度的溫和增長(zhǎng)以來,開發(fā)者的興趣已經(jīng)增長(zhǎng)并穩(wěn)定下來,進(jìn)入了「穩(wěn)步爬升的光明期」(Slope of Enlightenment)——價(jià)值驅(qū)動(dòng)的創(chuàng)新在此增長(zhǎng)。
2024年,開源AI中嚴(yán)肅的開發(fā)者參與(即GitHub貢獻(xiàn)者)仍在繼續(xù)增加。
市場(chǎng)分析:開發(fā)工具仍是熱門,訓(xùn)練和監(jiān)督勢(shì)頭正旺
- 開源AI產(chǎn)品初創(chuàng)企業(yè)數(shù)量顯著增加
2024年,參與開源AI的參與者數(shù)量激增,新的參與者如Neum AI和Patronus AI進(jìn)入了這一領(lǐng)域,而像Vian AI這樣的老牌參與者也為其用戶提供了開源工具包。
- 開發(fā)工具仍然熱門;培訓(xùn)和監(jiān)控工具競(jìng)爭(zhēng)加劇
大多數(shù)初創(chuàng)企業(yè)仍專注于生成式AI的開發(fā)工具,這對(duì)于構(gòu)建、部署和管理應(yīng)用程序至關(guān)重要。
然而,圍繞模型訓(xùn)練和監(jiān)督用例的初創(chuàng)企業(yè)活動(dòng)有所增加,這表明可能會(huì)向在小眾數(shù)據(jù)上微調(diào)模型和增強(qiáng)AI治理的方向轉(zhuǎn)變。
在開源模型領(lǐng)域,領(lǐng)先者開始顯現(xiàn),開發(fā)的新模型較少,更多的重點(diǎn)放在來自Mistral和Meta等公司的改進(jìn)和更高效的版本上。
- 開源開發(fā)正在縮小與閉源解決方案的差距
開源使得研究更具成本效益和可訪問性,促進(jìn)了來自多元?jiǎng)?chuàng)作者的創(chuàng)新,并且法律限制較少。據(jù)統(tǒng)計(jì),有41%的企業(yè)用戶傾向于選擇開源來滿足生成式AI的需求。
融資環(huán)境:融資步伐加快,規(guī)模更大、后期交易增多
過去兩年,開源AI領(lǐng)域已完成60多筆交易,總?cè)谫Y額超過130億美元。這些交易中有超過45%屬于A輪及以上的融資,表明對(duì)增長(zhǎng)階段投資的強(qiáng)烈關(guān)注。
- Deci AI被英偉達(dá)以3億美元收購(gòu)
- Scale AI完成了10億美元的F輪融資
- Mistral AI完成了6.4億美元的B輪融資
- Together AI完成了1.06億美元的A輪融資
在開源AI領(lǐng)域中,模型訓(xùn)練和開發(fā)工具是獲得資金最多的細(xì)分領(lǐng)域(不包括Mistral和Databricks),占總?cè)谫Y的60%。
其中,英偉達(dá)參與了8筆交易(包括Scale AI、Mistral AI、Together AI)。
基礎(chǔ)模型:性能差距已縮小
如今,開源和閉源模型之間的基準(zhǔn)差距現(xiàn)在比以往任何時(shí)候都要小——Meta Llama和Mistral在MMLU上的表現(xiàn)幾乎與GPT-4o相同。
其他開源模型,如Qwen和Yi,也在性能上快速趕上。
為了解決現(xiàn)有評(píng)估(如Elo和MMLU)的局限性,Hugging Face于2024年6月正式推出了專注于復(fù)雜任務(wù)的開源LLM排行榜——Open-LLM-Leaderboard。
在過去的6個(gè)月中,隨著新競(jìng)爭(zhēng)者的出現(xiàn),開源AI的格局發(fā)生了顯著變化。
經(jīng)過大量數(shù)據(jù)預(yù)訓(xùn)練的Qwen,于2024年6月在Huggingface Traction上獲得了最高的下載量。
Github:Huggingface、MindsDB和Roboflow非?;鸨?/span>
GitHub的stars是項(xiàng)目在GitHub上受歡迎程度的直接指標(biāo)。
AutoGPT和ModularML的Mojo在2023年引領(lǐng)了GitHub熱度——自那時(shí)以來,多個(gè)倉(cāng)庫(kù)已經(jīng)獲得了顯著的進(jìn)展。
LeRobot提供基于PyTorch的真實(shí)世界機(jī)器人模型、數(shù)據(jù)集和工具,旨在使機(jī)器人技術(shù)更易于訪問。它具有最先進(jìn)的模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)方法,提供預(yù)訓(xùn)練模型、人類收集的數(shù)據(jù)集和模擬環(huán)境。
由英偉達(dá)支持的MindsDB是一個(gè)使用企業(yè)數(shù)據(jù)構(gòu)建AI模型的平臺(tái)。MindsDB簡(jiǎn)化了數(shù)據(jù)源和AI/ML工具之間的連接,自動(dòng)化工作流程以創(chuàng)建定制的AI系統(tǒng)。