自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

電腦平板組AI集群,在家就能跑400B大模型,GitHub狂攬2.5K星?

人工智能 新聞
開(kāi)發(fā)者使用exo框架連接了兩臺(tái)MacBook Pro和一臺(tái)Mac Studio,運(yùn)算速度達(dá)到了110TFLOPS。

不用H100,三臺(tái)蘋(píng)果電腦就能帶動(dòng)400B大模型。

背后的功臣,是GitHub上的一個(gè)開(kāi)源分布式AI推理框架,已經(jīng)斬獲了2.5k星標(biāo)。

圖片

利用這個(gè)框架,幾分鐘就能用iPhone、iPad等日常設(shè)備構(gòu)建出自己的AI算力集群。

圖片

這個(gè)框架名叫exo,不同于其他的分布式推理框架,它采用了p2p的連接方式,將設(shè)備接入網(wǎng)絡(luò)即可自動(dòng)加入集群。

開(kāi)發(fā)者使用exo框架連接了兩臺(tái)MacBook Pro和一臺(tái)Mac Studio,運(yùn)算速度達(dá)到了110TFLOPS。

同時(shí)這位開(kāi)發(fā)者表示,已經(jīng)準(zhǔn)備好迎接即將到來(lái)的Llama3-405B了。

圖片

exo官方也放話(huà)稱(chēng),將在第一時(shí)間(day 0)提供對(duì)Llama3-405B的支持。

圖片

而且不只是電腦,exo可以讓iPhone、iPad等設(shè)備也加入本地算力網(wǎng)絡(luò),甚至Apple Watch也同樣能夠吸納。

圖片

隨著版本的迭代,exo框架也不再是蘋(píng)果限定(起初只支持MLX),有人把安卓手機(jī)和4090顯卡也拉進(jìn)了集群。

圖片

最快60秒完成配置

與其他分布式推理框架不同,exo不使用master-worker架構(gòu),而是點(diǎn)對(duì)點(diǎn)(p2p)地將設(shè)備進(jìn)行連接。

只要設(shè)備連接到相同的局域網(wǎng),就可以自動(dòng)加入exo的算力網(wǎng)絡(luò),從而運(yùn)行模型。

在對(duì)模型進(jìn)行跨設(shè)備分割時(shí),exo支持不同的分區(qū)策略,默認(rèn)是環(huán)內(nèi)存加權(quán)分區(qū)。

這會(huì)在環(huán)中運(yùn)行推理,每個(gè)設(shè)備分別運(yùn)行多個(gè)模型層,具體數(shù)量與設(shè)備內(nèi)存成比例。

圖片

而且整個(gè)過(guò)程幾乎無(wú)需任何手動(dòng)配置,安裝并啟動(dòng)之后系統(tǒng)就會(huì)自動(dòng)連接局域網(wǎng)內(nèi)運(yùn)行的設(shè)備,未來(lái)還會(huì)支持藍(lán)牙連接。

在作者的一段視頻當(dāng)中,只用了60秒左右就在兩臺(tái)新的MacBook上完成了配置。

,時(shí)長(zhǎng)01:48

可以看到,在60秒左右時(shí),程序已然開(kāi)始在后臺(tái)運(yùn)行。

圖片

另外從上面這張圖中還能看出,exo還支持tiny chat圖形化界面,同時(shí)還有兼容OpenAI的API。

不過(guò),這樣的操作只能在集群中的尾節(jié)點(diǎn)(tail node)上實(shí)現(xiàn)。

圖片

目前,exo支持蘋(píng)果MLX框架和開(kāi)源機(jī)器學(xué)習(xí)框架tinygrad,對(duì)llama.cpp的適配工作也正在進(jìn)行。

美中不足的是,由于iOS實(shí)現(xiàn)更新跟不上Python,導(dǎo)致程序出現(xiàn)很多問(wèn)題,作者把exo的手機(jī)和iPad端進(jìn)行了暫時(shí)下線,如果確實(shí)想嘗試,可以給作者發(fā)郵件索取。

圖片

網(wǎng)友:真有那么好用?

這種利用本地設(shè)備運(yùn)行大模型的方式,在HakerNews上也引發(fā)了廣泛的討論。

本地化運(yùn)行的優(yōu)點(diǎn),一方面是隱私更有保障,另一方面是模型可以離線訪問(wèn),同時(shí)還支持個(gè)性化定制。

圖片

也有人指出,利用現(xiàn)有設(shè)備搭建集群進(jìn)行大模型運(yùn)算,長(zhǎng)期的使用成本要低于云端服務(wù)。

圖片

但針對(duì)exo這個(gè)具體的項(xiàng)目,也有不少人表達(dá)了心中的疑問(wèn)。

首先有網(wǎng)友指出,現(xiàn)有的舊設(shè)備算力水平無(wú)法與專(zhuān)業(yè)的服務(wù)商之間差了數(shù)量級(jí),如果是出于好奇玩一玩還可以,但想達(dá)到尖端性能,成本與大型平臺(tái)根本無(wú)法比較。

圖片

而且還有人表示,作者演示用的設(shè)備都是高端硬件,一個(gè)32GB內(nèi)存的Mac設(shè)備可能要價(jià)超過(guò)2000美元,這個(gè)價(jià)格還不如買(mǎi)兩塊3090。

他甚至認(rèn)為,既然涉及到了蘋(píng)果,那可以說(shuō)是和“便宜”基本上不怎么沾邊了。

圖片

這就引出了另一個(gè)問(wèn)題——exo框架都兼容哪些設(shè)備?難道只支持蘋(píng)果嗎?

網(wǎng)友的提問(wèn)則更加直接,開(kāi)門(mén)見(jiàn)山地問(wèn)支不支持樹(shù)莓派。

作者回復(fù)說(shuō),理論上可以,不過(guò)還沒(méi)測(cè)試,下一步會(huì)進(jìn)行嘗試。

圖片

除了設(shè)備自身的算力,有人還補(bǔ)充說(shuō),網(wǎng)絡(luò)傳輸?shù)乃俣绕款i,也會(huì)限制集群的性能。

對(duì)此,框架作者親自下場(chǎng)進(jìn)行了解釋?zhuān)?/p>

exo當(dāng)中需要傳輸?shù)氖切⌒图せ钕蛄?,而非整個(gè)模型權(quán)重。
對(duì)于Llama-3-8B模型,激活向量約為10KB;Llama-3-70B約為32KB。
本地網(wǎng)絡(luò)延遲通常很低(<5ms),不會(huì)顯著影響性能。

圖片

作者表示,目前該框架已經(jīng)支持tinygrad,因此雖然測(cè)試主要在Mac設(shè)備上展開(kāi),(理論上)支持能運(yùn)行tinygrad的所有設(shè)備。

目前該框架仍處于實(shí)驗(yàn)階段,未來(lái)的目標(biāo)是把這個(gè)框架變得像Dropbox(一款網(wǎng)盤(pán))一樣簡(jiǎn)單。

圖片

BTW,exo官方也列出了一些目前計(jì)劃解決的缺點(diǎn),并進(jìn)行了公開(kāi)懸賞,解決這些問(wèn)題的人將獲得100-500美元不等的獎(jiǎng)金。

圖片

GitHub:https://github.com/exo-explore/exo

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-10-04 19:52:33

模型論文

2023-10-05 12:22:43

AI模型

2023-08-07 13:30:08

平臺(tái)MetaGPTAI

2011-10-31 16:24:06

筆記本評(píng)測(cè)

2011-08-06 22:28:10

2024-11-18 10:25:00

AI模型

2020-12-10 10:24:25

AI 數(shù)據(jù)人工智能

2020-12-07 16:14:40

GitHub 技術(shù)開(kāi)源

2023-12-13 12:55:39

模型數(shù)據(jù)

2023-10-29 22:41:29

模型開(kāi)源

2024-02-04 13:43:49

模型訓(xùn)練

2023-06-20 16:05:58

AI代碼

2020-12-30 10:35:49

程序員技能開(kāi)發(fā)者

2024-11-29 07:00:00

Kimi大模型Mooncake

2024-03-18 10:17:00

開(kāi)源AI

2020-11-19 15:23:08

GitHub代碼工具

2020-04-14 15:00:04

PyTorchGitHub檢測(cè)

2023-08-17 16:18:00

AI相機(jī)

2024-09-18 13:01:10

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)