清華團(tuán)隊(duì)推出新平臺(tái):用去中心化AI打破算力荒
最近,一則數(shù)據(jù)點(diǎn)出了AI領(lǐng)域算力需求的驚人增長(zhǎng)——
根據(jù)業(yè)內(nèi)專家的預(yù)估,OpenAI推出的Sora在訓(xùn)練環(huán)節(jié)大約需要在4200-10500張NVIDIA H100上訓(xùn)練1個(gè)月,并且當(dāng)模型生成到推理環(huán)節(jié)以后,計(jì)算成本還將迅速超過(guò)訓(xùn)練環(huán)節(jié)。
照這個(gè)趨勢(shì)發(fā)展下去,GPU的供給或許很難滿足大模型持續(xù)的需求。
不過(guò),最近海外有一個(gè)新動(dòng)向,可能會(huì)給即將到來(lái)的“算力荒”提供新的解決思路——去中心化AI。
三周前,3月23日,Stability AI突然發(fā)布一項(xiàng)公告,宣布公司CEO Emad Mostaque辭職。Emad Mostaque自己透露了接下來(lái)動(dòng)向,要去追求“去中心化AI的夢(mèng)想”。
但由于去中心化網(wǎng)絡(luò)的不確定性、不穩(wěn)定性等技術(shù)上的痛難點(diǎn)沒法解決,上一波去中心化AI很難在大模型時(shí)代真正落地。
直到最近,量子位發(fā)現(xiàn),一個(gè)在海外創(chuàng)業(yè)的清華團(tuán)隊(duì)聚焦去中心化AI,創(chuàng)立了NetMind.AI。2023年,NetMind發(fā)布了一份白皮書,詳細(xì)介紹了去中心化算力共享平臺(tái)NetMind Power。這個(gè)平臺(tái)要解決的,正是去中心化AI在大模型時(shí)代落地的痛點(diǎn)。
一、讓每一位開發(fā)者都用得起GPU
2021年9月,NetMind.AI啟動(dòng)了一項(xiàng)名為NetMind Power的去中心化計(jì)算平臺(tái)項(xiàng)目。
全球有大量的閑置算力:傳統(tǒng)數(shù)據(jù)中心的閑置算力,中小型企業(yè)擁有的沒有充分使用的算力以及個(gè)人擁有的零散GPU。這些算力要么被閑置,要么被用來(lái)做游戲、視頻渲染。同時(shí),AI算力又越發(fā)緊缺,AI研究人員、中小型企業(yè)尤其是AI創(chuàng)業(yè)公司、參與AI項(xiàng)目的傳統(tǒng)公司都受困于AI算力的高成本和高門檻。
于是,NetMind Power創(chuàng)建了一個(gè)去中心化的計(jì)算網(wǎng)絡(luò),利用NetMInd研發(fā)的核心技術(shù),撬動(dòng)全球算力資源,為AI產(chǎn)業(yè)提供好用又用得起的AI算力服務(wù)。
△NetMind Power是獲取算力的經(jīng)濟(jì)之選,為用戶提供高效且實(shí)惠的計(jì)算資源解決方案。
目前,NetMind Power已經(jīng)收集了數(shù)千張顯卡,包括H100,A100,4090,3090。
該平臺(tái)的四大亮點(diǎn):
1. 去中心化動(dòng)態(tài)集群——在極度不確定的算力上打造可靠高效的AI應(yīng)用
Power平臺(tái)利用基于P2P的動(dòng)態(tài)分布式集群技術(shù),結(jié)合其獨(dú)特的路由、聚類算法及神經(jīng)網(wǎng)絡(luò),將成千上萬(wàn)個(gè)計(jì)算節(jié)點(diǎn)編織成強(qiáng)大的網(wǎng)絡(luò)集群架構(gòu),專門服務(wù)于AI應(yīng)用等高層需求。
當(dāng)用戶在Power平臺(tái)上進(jìn)行AI相關(guān)操作,如模型訓(xùn)練、微調(diào)或推理時(shí),Power的去中心化網(wǎng)絡(luò)能夠在極短時(shí)間內(nèi),在全球各地的計(jì)算節(jié)點(diǎn)中,通過(guò)最優(yōu)化算法快速調(diào)配最合適的計(jì)算資源,為用戶提供服務(wù)。
同時(shí),Power為B端用戶提供動(dòng)態(tài)集群策略,可以在幾秒內(nèi)智能進(jìn)行節(jié)點(diǎn)重組和配置,提供可定制,高擴(kuò)展和高冗余的專屬集群。
2.完整的AI生態(tài):降低算力使用門檻,擴(kuò)大去中心化網(wǎng)絡(luò)應(yīng)用場(chǎng)景
借助NetMind多年在AI領(lǐng)域的積累,Power網(wǎng)絡(luò)在基礎(chǔ)算力服務(wù)之外,還將囊括開源模型庫(kù)、AI數(shù)據(jù)集、數(shù)據(jù)與模型加密等AI生態(tài)基座,以及模型訓(xùn)練、推理、部署等全方位服務(wù),打造MaaS (Model as a Service) 平臺(tái),為算力供給方與AI應(yīng)用端的雙方賦能。
針對(duì)科研人員、AI領(lǐng)域的中小企業(yè)和傳統(tǒng)企業(yè)的AI+項(xiàng)目,Power的MaaS平臺(tái)將大幅度降低算力的使用門檻,特別是對(duì)于沒有專業(yè)AI開發(fā)能力的中小企業(yè)和傳統(tǒng)企業(yè)來(lái)說(shuō),這一點(diǎn)尤為重要。
對(duì)于傳統(tǒng)算力供給者,借助Power網(wǎng)絡(luò)可以觸達(dá)更多用戶。更進(jìn)一步,他們借助Power的MaaS平臺(tái),可以擴(kuò)大應(yīng)用場(chǎng)景,獲得更高收益。這樣一來(lái),Power網(wǎng)絡(luò)可以將傳統(tǒng)的中小型中心化算力也納入去中心化算力網(wǎng)絡(luò),進(jìn)而大幅度擴(kuò)大網(wǎng)絡(luò)規(guī)模。
3.異步訓(xùn)練算法——解決網(wǎng)絡(luò)瓶頸,挖掘閑置算力潛力
在當(dāng)下的機(jī)器學(xué)習(xí)領(lǐng)域,特別是在大型語(yǔ)言模型訓(xùn)練中,通常需要通過(guò)GPU專用連接線或高帶寬的內(nèi)部網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)GPU間的同步分布式訓(xùn)練,這不可避免地增加了訓(xùn)練的門檻和成本。
NetMind Power通過(guò)自研的模型切分和數(shù)據(jù)異步的技術(shù),打破了分布式訓(xùn)練中網(wǎng)速和帶寬的壁壘,即使是分布在地球不同角落的訓(xùn)練節(jié)點(diǎn),也能夠同步參與到龐大的模型訓(xùn)練工作中。
4. 模型加密與數(shù)據(jù)隔離——解決去中心化網(wǎng)絡(luò)中的安全困擾
Power提供獨(dú)特的模型加密技術(shù),保障了在去中心化的志愿計(jì)算場(chǎng)景中,用戶的AI模型和數(shù)據(jù)安全。所有網(wǎng)絡(luò)通信都經(jīng)過(guò)加密處理,保障了數(shù)據(jù)傳輸?shù)陌踩煌ㄟ^(guò)數(shù)據(jù)隔離與模型拆分確保去中心化網(wǎng)絡(luò)中任何單一節(jié)點(diǎn)無(wú)法獲得完整數(shù)據(jù)和模型,大幅度提高安全性。
二、又一個(gè)清華背景團(tuán)隊(duì),已在海外創(chuàng)業(yè)多年
NetMind.AI的核心團(tuán)隊(duì)來(lái)自清華,已在AI領(lǐng)域打磨超過(guò)10年的時(shí)間。
公司創(chuàng)始人兼CEO, Kai Zou 于2010年畢業(yè)于清華大學(xué)數(shù)學(xué)物理基礎(chǔ)科學(xué)班,并于2013年獲得喬治城大學(xué)數(shù)學(xué)和統(tǒng)計(jì)學(xué)碩士學(xué)位。
他是一名連續(xù)創(chuàng)業(yè)者,曾同時(shí)領(lǐng)導(dǎo)ProtagoLabs和非營(yíng)利組織AGI Odyssey。同時(shí),他還是一位天使投資人,曾投資包括Haiper.ai、Auto Edge、Qdot和Orbit在內(nèi)的多家AI初創(chuàng)企業(yè)。
值得關(guān)注的是,目前,Kai Zou 和OpenAI研究員Jason Wei發(fā)表的論文《EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks》累計(jì)引用次數(shù)已經(jīng)超過(guò)2000次。CEO和他的團(tuán)隊(duì)堅(jiān)信他們搭建的平臺(tái)應(yīng)該為真正做學(xué)術(shù)研究的學(xué)者以及推動(dòng)AI發(fā)展的企業(yè)工程師們提供資源。
公司CTO則于2016年在喬治華盛頓大學(xué)獲得計(jì)算機(jī)科學(xué)碩士學(xué)位;在加入NetMind.AI之前,曾在微軟擔(dān)任高級(jí)團(tuán)隊(duì)負(fù)責(zé)人;其在Web3、區(qū)塊鏈技術(shù)、分布式系統(tǒng)、Kubernetes、云計(jì)算以及Azure和AWS等方面積累頗深;并具備邊緣計(jì)算、全棧開發(fā)和機(jī)器學(xué)習(xí)等專業(yè)技能。
三、終極理想:把AI送進(jìn)千家萬(wàn)戶
NetMind去中心化AI的愿景背后,實(shí)則深埋著技術(shù)普惠的理想。
回看IT技術(shù)發(fā)展史,去中心化的思潮往往在計(jì)算資源集中化陡增的時(shí)刻涌現(xiàn),作為一股自下而上的力量,對(duì)抗試圖將一切資源壟斷的巨頭,從而拉開新一輪的技術(shù)普惠浪潮,讓新技術(shù)真正普及到世界各個(gè)角落。
如今的大模型市場(chǎng),或許正處在這樣的時(shí)刻。
放眼大模型市場(chǎng),轟轟烈烈發(fā)展了一整年后,真正能站穩(wěn)腳跟的創(chuàng)業(yè)公司并不多。除了極少數(shù)幾家明星獨(dú)角獸外,大模型的未來(lái)似乎正在收斂到微軟、谷歌、英偉達(dá)等科技巨頭手中。長(zhǎng)此以往,少數(shù)企業(yè)可能會(huì)對(duì)計(jì)算資源的定價(jià)、可用性和訪問(wèn)權(quán)限形成壟斷控制。
這時(shí)候,正需要類似NetMind Power這樣的民主化敘事,為AGI的故事撰寫新的藍(lán)圖。
目前,NetMind已經(jīng)在學(xué)術(shù)和商業(yè)領(lǐng)域展開合作——
學(xué)術(shù)方面,NetMind Power目前已經(jīng)與諸多國(guó)內(nèi)外頂級(jí)名校開展合作,包括計(jì)算機(jī)科學(xué)領(lǐng)域頂尖的劍橋大學(xué)、牛津大學(xué)、卡耐基梅隆大學(xué),美國(guó)西北大學(xué)、清華大學(xué)、華中科技大學(xué)、萊斯大學(xué)、復(fù)旦大學(xué)、上海交通大學(xué)等。
?商業(yè)方面,NetMind Power作為企業(yè)提供基于去中心化網(wǎng)絡(luò)的AI算力解決方案,讓企業(yè)可以專注于模型研發(fā)與產(chǎn)品創(chuàng)新。越來(lái)越多的企業(yè)在Netmind Power的幫助下,加速推出AI創(chuàng)新產(chǎn)品。例如最近在北美勢(shì)頭正盛的文生視頻團(tuán)隊(duì)Haiper.ai已經(jīng)將其模型的訓(xùn)練和推理與NetMind Power平臺(tái)深度結(jié)合。
未來(lái),NetMind Power將逐漸生長(zhǎng)為一個(gè)去中心化的AI社區(qū),加速全球AI創(chuàng)新。
機(jī)器學(xué)習(xí)從業(yè)者,學(xué)術(shù)研究人員及AI應(yīng)用側(cè)的企業(yè)都可以在NetMind Power平臺(tái)找到自己所需的算力和模型,也可以把自己訓(xùn)練的模型托管在平臺(tái)上,甚至提供給平臺(tái)上的其他用戶,并從中收取一定費(fèi)用。
用戶不僅能夠在平臺(tái)上調(diào)用相應(yīng)算力解決自己的訓(xùn)練需求,還能將自己訓(xùn)練的模型通過(guò)平臺(tái)提供給更多有需要的人或企業(yè),層層傳遞。
將時(shí)間軸拉長(zhǎng),要真正實(shí)現(xiàn)AGI,AI的普惠化和民主化是必然前提。如今,率先出發(fā)的NetMind.AI,正在做出自己的貢獻(xiàn),尋找更多的伙伴,通向民主的AGI時(shí)代,邁出堅(jiān)實(shí)的一小步。
本文轉(zhuǎn)自 量子位 ,作者:量子位
