自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

創(chuàng)新無界,亞馬遜云科技重塑云基礎設施新未來

原創(chuàng)
云計算
在全球科技創(chuàng)新日新月異的今天,亞馬遜云科技再次站在了技術變革的前沿。在 re:Invent 2024 大會上,亞馬遜云科技進一步拓寬了其基礎設施創(chuàng)新的邊界,從自研芯片到高性能服務器,從革命性的網(wǎng)絡架構到綠色數(shù)據(jù)中心的設計,亞馬遜云科技正在以其創(chuàng)新的技術實力,開啟了全棧云和 AI 服務的無限可能。

在全球科技創(chuàng)新日新月異的今天,亞馬遜云科技再次站在了技術變革的前沿。在 re:Invent 2024 大會上,亞馬遜云科技進一步拓寬了其基礎設施創(chuàng)新的邊界,從自研芯片到高性能服務器,從革命性的網(wǎng)絡架構到綠色數(shù)據(jù)中心的設計,亞馬遜云科技正在以其創(chuàng)新的技術實力,開啟了全棧云和 AI 服務的無限可能。

縱向擴展創(chuàng)新:提升計算性能,助力 AI 訓練突破極限

在云計算和 AI 領域,計算能力始終是推動技術進步的核心因素。隨著生成式 AI 和大模型的復雜度不斷增加,芯片性能的提升變得尤為關鍵。早在十年前,亞馬遜云科技便開始布局自研芯片,并在這一領域持續(xù)深耕。通過自研芯片的戰(zhàn)略,亞馬遜云科技不僅提升了計算能力,還在降低成本和提高效率方面取得了顯著進展。

在 re:Invent 2024 上,亞馬遜云科技發(fā)布了全新的 Amazon Trainium2 AI 訓練芯片。作為亞馬遜云科技自研的最新一代 AI 專用芯片,Trainium2 采用了最新的技術架構,專門為大規(guī)模訓練和實時推理需求進行了優(yōu)化。

Amazon Trainium2芯片

Trainium2 采用脈動陣列(Systolic Arrays)硬件架構,使得計算步驟之間能夠避免頻繁內(nèi)存訪問,直接將結果從一個計算單元傳遞到下一個,從而減輕內(nèi)存帶寬壓力,優(yōu)化計算資源。這一架構特別適合 AI 中常見的矩陣和張量操作。除此之外,Trainium2 還提供了 Neuron 內(nèi)核接口(NKI),允許開發(fā)者直接訪問硬件,編寫計算內(nèi)核,最大化計算密集型任務的性能。

Amazon Trainium2芯片

除了芯片創(chuàng)新,亞馬遜云科技在縱向擴展方面也取得了重要突破。傳統(tǒng)的云計算擴展通常依賴于水平擴展,但隨著 AI 模型和數(shù)據(jù)量的激增,單純擴展集群已無法有效解決訓練和推理的瓶頸。

因此,亞馬遜云科技突破單服務器性能,推出 Amazon EC2 Trn2 實例和Amazon EC2 Trn2 UltraServers 服務器。Amazon EC2 Trn2 實例配備 16 個 Trainium2 芯片,提供高達 20.8 Petaflops 的浮點算力,特別適用于大規(guī)模生成式 AI 訓練、超大語言模型(LLM)及其他計算密集型 AI 任務,從而大幅提升了訓練和推理的效率。

亞馬遜云科技全新推出 Amazon EC2 Trn2 UltraServers 服務器,配備 64 顆 Trainium2 芯片,采用 NeuronLink 超速互連技術,提供高達 83.2 Petaflops 的浮點算力,計算、內(nèi)存和網(wǎng)絡能力是單一實例的四倍,能夠支持超大規(guī)模模型的訓練和部署。正如亞馬遜云科技高級副總裁Peter Desantis 所言,“如果你要構建一個萬億參數(shù)的 AI 模型,這就是你需要的服務器?!?/span>

Amazon EC2 Trn2 UltraServers 服務器Amazon EC2 Trn2 UltraServers 服務器

此外,亞馬遜云科技還發(fā)布了新一代 Amazon Trainium3 訓練芯片。Trainium3 是亞馬遜云科技首款采用 3 納米工藝制造的芯片,標志著在性能、能效和芯片密度方面的新突破。搭載 Trainium3 的 UltraServers 預計將比 Trn2 UltraServers 提供 4 倍的性能,幫助客戶加快模型的迭代速度,并在部署時提供卓越的實時性能。首批基于 Trainium3 的實例預計將在 2025 年末上線,將進一步推動 AI 訓練技術的進步。

橫向擴展創(chuàng)新:突破性網(wǎng)絡架構與路由協(xié)議,提升 AI 訓練效率

隨著 AI 集群規(guī)模的不斷擴大,數(shù)據(jù)傳輸和網(wǎng)絡效率變得愈發(fā)重要。正如 Peter Desantis 所言,“在 AI 集群的世界里,時間就是金錢。”為了應對大規(guī)模 AI 訓練的挑戰(zhàn),亞馬遜云科技在橫向擴展方面進行了重要創(chuàng)新,推出了帶寬高達 10Pb/s、延遲低于 10ms 的 10p10u 網(wǎng)絡架構。

這一架構通過將 16 根光線電纜整合成單一連接器,在工廠完成復雜組裝,從而減少了 54% 的安裝時間。定制的光纖插頭和光纖電纜確保了網(wǎng)絡連接在機架到達數(shù)據(jù)中心前就已進行全面測試和驗證,避免了調試布線的時間浪費,同時保護接口免受灰塵侵入。這些創(chuàng)新不僅提高了集群間的數(shù)據(jù)傳輸速度,也顯著縮短了模型訓練所需的時間。過去 12 個月,亞馬遜云科技已安裝超過 300 萬條鏈路,使其成為擴展速度最快的網(wǎng)絡之一。

此外,亞馬遜云科技還推出了全新的 SIDR(Scalable,Intent Driven Routing)路由協(xié)議。傳統(tǒng)網(wǎng)絡協(xié)議在光鏈路發(fā)生故障時,恢復速度較慢,影響 AI 集群的高效運轉。SIDR 協(xié)議結合了集中控制和去中心化響應,能夠在故障發(fā)生時更迅速地恢復網(wǎng)絡。通過預先生成“網(wǎng)絡意圖”,中央控制器可以將其推送到各交換機,確保交換機在故障發(fā)生時能自主決策并快速恢復網(wǎng)絡。與傳統(tǒng)的 BGP 和 OSPF 協(xié)議相比,SIDR 能夠在不到 1 秒內(nèi)恢復網(wǎng)絡,速度是傳統(tǒng)方法的 10 倍,大大提高了 AI 訓練的可靠性和實時性。

通過這一系列的創(chuàng)新,亞馬遜云科技有效解決了 AI 集群中網(wǎng)絡故障恢復慢和數(shù)據(jù)傳輸瓶頸的問題,顯著提升了 AI 訓練的效率與可靠性。無論在故障發(fā)生時的快速恢復,還是在確保高效運行方面,這些技術都為大規(guī)模 AI 計算提供了堅實的支持。

綠色創(chuàng)新:高效冷卻系統(tǒng)與低碳設計,推動云基礎設施可持續(xù)發(fā)展

在推動云計算和 AI 技術發(fā)展的同時,綠色可持續(xù)性已成為亞馬遜云科技基礎設施創(chuàng)新的重要考量。隨著數(shù)據(jù)處理能力和服務器功率密度的不斷提升,如何在滿足日益增長的計算需求的同時降低能源消耗和環(huán)境影響,已成為亞馬遜云科技面臨的關鍵挑戰(zhàn)。

為應對這一挑戰(zhàn),亞馬遜云科技持續(xù)優(yōu)化數(shù)據(jù)中心設施,推出了簡化的電氣分配和機械系統(tǒng)設計,提升了基礎設施的可用性,達到了 99.9999% 的高可靠性。這些改進不僅減少了電氣故障對機架的影響,還通過優(yōu)化電力分配降低了故障發(fā)生的頻率。簡化的系統(tǒng)不僅降低了復雜度,還增強了系統(tǒng)的穩(wěn)定性,從而確保了數(shù)據(jù)中心在運營過程中的高效可靠性。

此外,亞馬遜云科技還在冷卻系統(tǒng)、機架設計和控制系統(tǒng)方面進行了一系列創(chuàng)新。為滿足 AI 芯片對高密度計算的需求,亞馬遜云科技引入了液體冷卻系統(tǒng),并在現(xiàn)有和新建數(shù)據(jù)中心中實施了“液體到芯片”的冷卻方案,將空氣冷卻和液體冷卻無縫集成,可以高效支持 AI 工作負載,同時降低運營成本。新型冷卻系統(tǒng)不僅適用于如 Amazon Trainium2 AI 芯片,還能支持傳統(tǒng)工作負載,確保不同應用場景下的最佳性能和效率。

為了進一步提升高密度 AI 工作負載的支持能力,亞馬遜云科技優(yōu)化了數(shù)據(jù)中心的機架布局和電力傳輸系統(tǒng),預計未來兩年內(nèi)機架功率密度將提高 6 倍,顯著提升計算能力。同時,亞馬遜云科技還通過數(shù)據(jù)和生成式 AI 驅動的軟件,精確預測服務器的最佳部署方式,從而最大化電力使用效率。

在建筑設計方面,亞馬遜云科技采用了低碳鋼和低碳混凝土,將數(shù)據(jù)中心的碳排放降低了 35%。此外,亞馬遜云科技還在備用發(fā)電機中使用可再生柴油,這種生物降解且無毒的燃料能將溫室氣體排放量減少 90%,進一步推動了綠色計算和可持續(xù)發(fā)展的目標。

結語

Peter 表示,“持續(xù)的領先,來自于對硬件細節(jié)極致的追求。”通過在芯片、網(wǎng)絡架構、數(shù)據(jù)中心設計等多個維度的持續(xù)創(chuàng)新,亞馬遜云科技不僅提升了自身云計算基礎設施的技術水平,也推動了整個行業(yè)的發(fā)展。

這些創(chuàng)新不僅讓亞馬遜云科技在市場競爭中占據(jù)了技術領先地位,也為客戶提供了更強大、更靈活、更高效的服務支持,幫助各行各業(yè)加速數(shù)字化轉型。亞馬遜云科技的基礎設施創(chuàng)新,正不斷推動著云計算和 AI 領域的技術進步,改變著全球科技的格局。

責任編輯:鳶瑋 來源: 51CTO
相關推薦

2016-11-04 14:38:51

云計算云市場

2022-08-17 17:23:19

亞馬遜云科技游戲人工智能

2022-12-20 16:45:33

亞馬遜云科技

2017-03-28 18:56:01

華為

2022-12-27 11:27:54

云原生數(shù)據(jù)庫基礎設施

2023-12-08 18:40:36

字節(jié)跳動云原生火山引擎

2017-12-27 14:41:57

融合云計算服務器

2018-11-02 17:27:16

華為云

2014-07-29 17:12:14

惠普

2019-04-01 17:39:05

混合云基礎設施

2023-05-16 13:46:00

數(shù)據(jù)中心

2023-12-20 11:45:08

物聯(lián)網(wǎng)Wi-Fi智能家居

2017-03-08 07:50:28

IT基礎設施

2018-12-17 13:00:19

2022-06-28 09:10:32

K8S容器鏡像滾動升級

2023-12-29 17:43:04

亞馬遜云科技re:InventAmazonQ

2013-03-06 16:36:32

華為云基礎設施

2024-04-24 10:03:16

智能建筑人工智能

2025-01-03 08:52:29

2017-01-19 10:41:51

云存儲公共云私有云
點贊
收藏

51CTO技術棧公眾號