去太空訓(xùn)練AI大模型,24小時太陽能供電的GPU明年上天
大模型的未來,其實是在天上?
為了跟上人工智能快速發(fā)展的步伐,最近全球都在爭搶 AI 算力,想得更遠的人(如 OpenAI CEO Sam Altman)甚至已經(jīng)把問題想到了供電這一層。據(jù)說在 OpenAI 訓(xùn)練新一代大模型時,計算集群甚至?xí)Ξ?dāng)?shù)氐碾娋W(wǎng)造成沖擊。如果基礎(chǔ)設(shè)施能力提升的步伐不及 AI 技術(shù)發(fā)展,或許 AGI 的瓶頸會變成能源。
在這個時候,一家 Y-Combinator 投資的創(chuàng)業(yè)公司 Lumen Orbit 引發(fā)了人們的關(guān)注,他們發(fā)現(xiàn)在太空中組建 AI 計算集群是個好主意:可以直接利用太陽能、隨時隨地的被動冷卻,還有自由擴展的空間。
Lumen Orbit 建造太空數(shù)據(jù)中心的計劃已經(jīng)提上了日程,該公司計劃明年發(fā)射第一顆衛(wèi)星,還將每年發(fā)射一次更大的迭代,直到服務(wù)器總功率達到千兆瓦規(guī)模。
Lumen Orbit 已經(jīng)在華盛頓州雷德蒙德建立了有效載荷制造工廠,設(shè)計并開始建造和測試第一艘航天器,其搭載的 GPU 會是有史以來發(fā)射到太空最快的 GPU,速度將要比當(dāng)前發(fā)射到太空中的最強 GPU 快約 100 倍。第一顆衛(wèi)星將是一顆 60 公斤的演示衛(wèi)星,預(yù)計將于 2025 年 5 月作為 SpaceX 獵鷹 9 號火箭的共乘有效載荷發(fā)射,可用的微型數(shù)據(jù)中心則將在 2026 年進行發(fā)射。
該公司的 CEO Philip Johnston 表示,Lumen 正在與 Ansys 和 Solidworks 合作進行衛(wèi)星設(shè)計和開發(fā),并正在向聯(lián)邦通信委員會和國際電信聯(lián)盟提交申請。
雖然發(fā)射數(shù)據(jù)中心對于航天器運載能力的挑戰(zhàn)巨大,但從第一性原理出發(fā),Lumen Orbit 已經(jīng)開發(fā)了一系列概念設(shè)計,并且沒有發(fā)現(xiàn)任何難以克服的障礙。隨著 Starship 和 New Glenn 等新型、可復(fù)用、經(jīng)濟高效的重型運載火箭即將投入使用,再加上在軌網(wǎng)絡(luò)的普及,軌道算力的設(shè)想或許將變得非?,F(xiàn)實。
太空訓(xùn)練大模型,有效率優(yōu)勢
為什么要在太空建造 AI 算力集群呢?理論上來說,太空數(shù)據(jù)中心可全天候利用高強度太陽能,不受晝夜循環(huán)、天氣和大氣損耗(衰減)的影響。這使得邊際能源成本大大降低,與地面相比,運營成本大幅節(jié)省。
Lumen Orbit 為我們算了一筆賬,美國地面太陽能發(fā)電場的平均容量系數(shù)僅為 24%,相比之下,該公司提出的太空太陽能電池陣列的容量系數(shù)大于 95%,沒有晝夜循環(huán),最佳面板方向垂直于太陽光線,不受季節(jié)或天氣的影響。因此,太空中的太陽能電池陣列產(chǎn)生的能量將是地球上相同陣列的 5 倍以上。
假設(shè)每發(fā)射一次 500 萬美元的火箭任務(wù)可轉(zhuǎn)換為 40 兆瓦的數(shù)據(jù)中心,太陽能電池的材料成本為每瓦 0.03 美元,均在 10 年內(nèi)攤銷,我們將能夠獲得約 0.002 美元 / 千瓦時的等效能源成本。相比之下,美國、英國和日本的平均批發(fā)電力成本分別為 0.045 美元 / 千瓦時、0.06 美元 / 千瓦時和 0.17 美元 / 千瓦時。因此,軌道數(shù)據(jù)中心可以提供比當(dāng)今能源價格更低能源。
下一個是散熱問題。外太空的「有效」環(huán)境溫度約為 - 270°C,相當(dāng)于宇宙微波背景輻射的溫度。要利用深空作為散熱器來散發(fā)廢熱,需要避免太陽直射,設(shè)計一個可展開的散熱器。一塊保持在 20°C 的 1×1m 黑板可以向深空輻射約 850 瓦,這大約是太陽能電池板每平方米發(fā)電量的三倍。因此,這些散熱器的尺寸需要約為太陽能電池陣列的三分之一,具體取決于散熱器的配置。
在太空中,我們可以使用比常規(guī)高性能算力冷卻器更簡單、更高效的冷卻架構(gòu)。據(jù)估計,我們可以實現(xiàn)與最先進的超大規(guī)模地面數(shù)據(jù)中心相當(dāng)?shù)?PUE。此外,某些軌道上的軌道數(shù)據(jù)中心幾乎沒有「環(huán)境溫度」波動(太陽輻射變化不超過約 0.2%),并且處于高度穩(wěn)定的熱和機械環(huán)境中,這有助于熱控制和穩(wěn)定性。
然后是可擴展性。軌道數(shù)據(jù)中心將解鎖地球上前所未見的下一代集群規(guī)模,發(fā)電量將遠超 GW 范圍。它們可以幾乎無限地線性擴展,不受地面項目的物理和規(guī)劃限制,可以在 3D 空間的各個方向上擴展。
如果按照大模型領(lǐng)域目前的趨勢繼續(xù)下去,從 2027 年開始,我們將需要數(shù) GW 功率的集群來訓(xùn)練最大的 LLM。假設(shè)一個 5 GW 集群將用于訓(xùn)練 Llama 5 或 GPT-6 等模型,耗電量就直接超過了美國最大的發(fā)電廠供能。因此在當(dāng)今的能源基礎(chǔ)設(shè)施條件下,這種集群根本是不可能運轉(zhuǎn)的,尋找新的方向?qū)τ谟?xùn)練下一代人工智能模型至關(guān)重要。
在太空 AI 算力運行的過程中,其他衛(wèi)星會將他們收集的數(shù)據(jù)發(fā)送給 Lumen Orbit 的星座,使用機載 GPU 進行推理,隨后輸出推理結(jié)果。
Lumen Orbit 并不是唯一一家致力于將數(shù)據(jù)中心送入軌道的公司:歐盟資助的項目 ASCEND 一直在研究太空數(shù)據(jù)中心的可行性,總部位于德克薩斯州的 Axiom Space 表示,它正在與 Kepler Space 和 Skyloom 合作,在 Axiom 的第一個太空艙上建立一個軌道數(shù)據(jù)中心,預(yù)計將于 2026-2027 年發(fā)射。
團隊成員
Lumen Orbit 于 2023 年底剛剛成立,公司創(chuàng)始人、CEO Philip Johnston 曾在 McKinsey & Co. 工作,負責(zé)國家航天局的衛(wèi)星項目。Philip 擁有哈佛大學(xué)公共管理碩士學(xué)位、沃頓商學(xué)院工商管理碩士學(xué)位、哥倫比亞大學(xué)應(yīng)用數(shù)學(xué)與理論物理碩士學(xué)位,他也是一名特許金融分析師(CFA)。
該公司的 CTO Ezra Feilden 擁有十年衛(wèi)星設(shè)計經(jīng)驗,專攻可展開太陽能電池陣列和大型可展開結(jié)構(gòu)。Ezra 曾就職于空中客車防務(wù)與航天公司(SSTL)和牛津太空系統(tǒng)公司,參與過包括 NASA 的月球探路者號在內(nèi)的任務(wù)。Ezra 擁有倫敦帝國理工學(xué)院材料工程博士學(xué)位。
首席工程師 Adi Oltean 曾任 SpaceX 首席軟件工程師,是 Starlink 網(wǎng)絡(luò)團隊的一員,曾為包括 Starship 在內(nèi)的移動用戶提供 Starlink 服務(wù)。在此之前,他在微軟的大型 GPU 生產(chǎn)集群上部署了第一個大語言模型,在微軟工作的二十多年中,他曾獲得了 25 項專利。Adi 擁有布加勒斯特兩所頂尖大學(xué)的計算機科學(xué)和化學(xué)學(xué)位。