AI成為「耗電大戶」,除了新能源,還需要芯片創(chuàng)新
人工智能(AI)的爆炸式增長促使科技巨頭(包括 Google、Meta、亞馬遜和微軟等)開始構(gòu)建超大規(guī)模數(shù)據(jù)中心,這些數(shù)據(jù)中心需要的電力非常多 —— 是以千兆瓦計算而不是兆瓦。有分析師表示,這些巨型數(shù)據(jù)中心使用現(xiàn)有的半導(dǎo)體技術(shù)來挑戰(zhàn)美國老化的電網(wǎng)基礎(chǔ)設(shè)施,以滿足其能源消耗需求。
例如,高盛估計僅對 ChatGPT 的一次查詢所消耗的數(shù)據(jù)中心電能就比語音識別等傳統(tǒng)人工智能功能多 10 倍,因此我們需要更強大的數(shù)據(jù)中心來支持這種需求。
如今,生成式 AI(GenAI)處于爆發(fā)階段,其參數(shù)量基本以億計算。但是,在運行時,例如基于 Transformer 的這類模型無法像單詞識別那樣被壓縮成小巧、快速的推理引擎。原因是它們不會返回簡單的單詞來響應(yīng)用戶輸入,而是將用戶查詢與其龐大的神經(jīng)網(wǎng)絡(luò)中的數(shù)萬億個示例進(jìn)行比較。這些響應(yīng)需要從完整的段落到整篇白皮書、甚至是關(guān)于查詢主題的整本書來查找。
市場調(diào)研公司 Tirias Research 創(chuàng)始人兼首席分析師 Jim McGregor 表示,「十年之后, 我們將需要更多的算力。一旦我們進(jìn)入生成式 AI 大規(guī)模應(yīng)用的階段,視覺內(nèi)容創(chuàng)作的需求將非常龐大 —— 我們需要指數(shù)級提升數(shù)據(jù)中心的性能和功耗?!?nbsp;
為了支持當(dāng)前聊天級別的生成式 AI,Tirias 最新報告預(yù)測,美國數(shù)據(jù)中心的能源消耗將從現(xiàn)在的 1.4 太瓦時(TWh)增加到 2028 年的 67 太瓦時。高盛估計,如果將傳統(tǒng) AI 加入生成式 AI 的能耗計算,預(yù)計在同一時間段內(nèi)數(shù)據(jù)中心能耗的增長會翻倍,結(jié)果是 AI 消耗大約占據(jù)數(shù)據(jù)中心總能耗的 19%,約占全美電網(wǎng)總發(fā)電量的 4%。
高盛評估報告顯示,滿足電網(wǎng)能源消耗強勁增長的方法是將電網(wǎng)的發(fā)電方式從燃煤發(fā)電轉(zhuǎn)變?yōu)?60% 天然氣 和 40% 可再生能源 (主要是太陽能和風(fēng)能)發(fā)電。
報告地址:https://www.goldmansachs.com/pdfs/insights/pages/generational-growth-ai-data-centers-and-the-coming-us-power-surge/report.pdf
為了防止電網(wǎng)過載,市面上已經(jīng)出現(xiàn)了使用核電發(fā)電機(jī)為超大規(guī)模數(shù)據(jù)中心提供專用電力的趨勢,這些發(fā)電機(jī)被稱為小型模塊化反應(yīng)堆(SMR)。
實際上,亞馬遜已經(jīng)從電力生產(chǎn)商 Talen Energy 購買了一個接近 1 吉瓦容量的核電數(shù)據(jù)中心園區(qū)。
與此同時,微軟正試圖通過投資無核廢料聚變反應(yīng)堆(與 Helion 合作)來超越 SMR 等裂變反應(yīng)堆。
McGregor 表示:盡管當(dāng)今的超大規(guī)模數(shù)據(jù)中心仍在使用現(xiàn)有的半導(dǎo)體技術(shù)和架構(gòu),但創(chuàng)新將長期受到能耗無限增長的限制?,F(xiàn)階段節(jié)能減排方面的創(chuàng)新令人驚嘆,這種創(chuàng)新可與半導(dǎo)體行業(yè)的起步相媲美,而且在許多方面甚至增長速度更快。如果技術(shù)停滯不前,那么到本世紀(jì)末,我們將耗盡可用能源。
根據(jù) Tirias 對 GenAI 的預(yù)測,數(shù)據(jù)中心使用低功耗混合 CPU/GPU 的 AI 加速器的數(shù)量將從目前的 362000 臺增長到 2028 年的 1760 萬臺。
用創(chuàng)新來解決危機(jī)
生成式 AI 對能源的需求越來越大,各類廠家開始研制更低功耗的芯片。
英偉達(dá)研發(fā)了 CPU/GPU 混合芯片;AMD 贏得了 2022 年 Green500 超級計算機(jī)排名的冠軍。
Cerebras 公司在自家芯片的頂部安裝了一個水冷金屬冷板,可以實現(xiàn)更有效地散熱。
其他芯片制造商也在用節(jié)能的混合多芯片堆棧加速下一代數(shù)據(jù)中心處理器。此外,英特爾、三星和臺積電 (TSMC) 正在研發(fā)用于下一代處理器的 3D 堆疊晶體管,這種晶體管在大幅提高性能的同時還節(jié)省了功耗。
半導(dǎo)體架構(gòu)師也開始將整個數(shù)據(jù)中心重新視為一個單一系統(tǒng)(如混合片上系統(tǒng)),投資可持續(xù)、更節(jié)能的架構(gòu),例如將整個數(shù)據(jù)中心的機(jī)架改用水冷(而不是風(fēng)冷)。
McGregor 表示,未來的數(shù)據(jù)中心還將利用多種能源之間的快速切換策略,包括太陽能、風(fēng)能、天然氣、地?zé)帷㈦娋W(wǎng)和核反應(yīng)堆。
「人工智能的普及造成了一場能源危機(jī),但并不是無法解決的危機(jī)。在我看來,所有這些危機(jī)論調(diào)中,最有趣的一點是,每當(dāng)一項新技術(shù)開始普及時,危機(jī)論調(diào)就會一再出現(xiàn) —— 危機(jī)預(yù)測者只是從現(xiàn)有技術(shù)進(jìn)行推斷,而沒有考慮到創(chuàng)新解決方案,例如,在 20 世紀(jì) 90 年代,互聯(lián)網(wǎng)開始快速發(fā)展,我們曾預(yù)測全球一半的電力將被互聯(lián)網(wǎng)消耗。發(fā)生了什么?創(chuàng)新能夠跟上需求。當(dāng)比特幣起飛時,同樣大規(guī)模的危機(jī)論調(diào)再次出現(xiàn),但它也失敗了,現(xiàn)在我們聽到的是關(guān)于人工智能發(fā)展的同樣危機(jī)論調(diào)?!拱雽?dǎo)體市場研究公司 Objective Analysis 的經(jīng)理 Jim Handy 表示道。