亞馬遜云科技的技術(shù)架構(gòu)演進(jìn)創(chuàng)新實(shí)踐?
原創(chuàng)在過(guò)去的十年里,云計(jì)算極大地推動(dòng)了創(chuàng)新和創(chuàng)業(yè)的步伐,為各行各業(yè)帶來(lái)了前所未有的便利。展望未來(lái)十年,生成式 AI 將引領(lǐng)我們共同重塑各行各業(yè)的格局。在這個(gè)特殊的時(shí)間點(diǎn),What Will You Build?
在生成式 AI 時(shí)代,技術(shù)架構(gòu)的演進(jìn)趨勢(shì)有哪些新的特點(diǎn)?在近日舉辦的 2024 亞馬遜云科技中國(guó)峰會(huì)現(xiàn)場(chǎng),亞馬遜云科技大中華區(qū)解決方案架構(gòu)總經(jīng)理代聞以橋梁為比喻,深入探討了亞馬遜云科技在技術(shù)架構(gòu)演進(jìn)過(guò)程中的創(chuàng)新實(shí)踐。
亞馬遜云科技大中華區(qū)解決方案架構(gòu)總經(jīng)理代聞
代聞表示,橋梁的建造與發(fā)展離不開(kāi)基礎(chǔ)材料、建筑架構(gòu)和多元化需求的協(xié)同作用,而技術(shù)的發(fā)展往往也是如此。他強(qiáng)調(diào),技術(shù)架構(gòu)演進(jìn)過(guò)程中,有三個(gè)不變的主題需求,包括基礎(chǔ)組件能力,架構(gòu)體系創(chuàng)新和多元技術(shù)融合。我們應(yīng)該看清變化的技術(shù)和不變的需求,積極推進(jìn)架構(gòu)演進(jìn),連接未來(lái)的想象。
基礎(chǔ)組件能力決定架構(gòu)設(shè)計(jì)
在架構(gòu)設(shè)計(jì)的世界里,基礎(chǔ)組件的能力往往決定了整個(gè)架構(gòu)的穩(wěn)固性和擴(kuò)展性。特別是在云計(jì)算領(lǐng)域,這種影響尤為顯著。云計(jì)算最基礎(chǔ)的組件是由計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)構(gòu)成,而在這三者中,計(jì)算無(wú)疑是最為核心的組件,承載著數(shù)據(jù)處理、運(yùn)行應(yīng)用等關(guān)鍵任務(wù)。
當(dāng)我們談及云計(jì)算的計(jì)算組件時(shí),不得不提的是亞馬遜云科技Amazon Nitro 系統(tǒng)。自 2006 年亞馬遜云科技推出第一臺(tái) EC2 以來(lái),經(jīng)過(guò) 11 年的努力,其 EC2 種類(lèi)從單一的 1 種拓展至 70 種。而在隨后的 6 年里,即從 2017 年至 2023 年,EC2 的種類(lèi)更是迅猛增長(zhǎng)到 750種,這一成就的背后離不開(kāi) Nitro 系統(tǒng)的強(qiáng)大支持。
2017 年,亞馬遜云科技推出了 Nitro 虛擬化平臺(tái),將安全、管理和監(jiān)控功能卸載至硬件層面,實(shí)現(xiàn)了主機(jī)算力近乎 100% 的客戶供給,并極大地增強(qiáng)了虛擬化安全性。更為重要的是,Nitro 系統(tǒng)實(shí)現(xiàn)了虛擬化平臺(tái)與服務(wù)器選擇的解耦,使得底層的虛擬化技術(shù)創(chuàng)新與上層的服務(wù)器種類(lèi)發(fā)展能夠并行不悖。如今,亞馬遜云科技已經(jīng)發(fā)布了五代 Nitro 芯片,持續(xù)在網(wǎng)絡(luò)性能、存儲(chǔ)性能和安全加固等方面取得突破,為用戶帶來(lái)了更低的延遲、更高的吞吐量和每秒處理更多數(shù)據(jù)包的能力。
Nitro 系統(tǒng)不僅帶來(lái)計(jì)算能力的增強(qiáng),還顯著提升了網(wǎng)絡(luò)性能。最新的 Nitro 系統(tǒng)支持高達(dá)30Mpps 的包轉(zhuǎn)發(fā)率,即每秒處理三千萬(wàn)個(gè)數(shù)據(jù)包。同時(shí),亞馬遜云科技還開(kāi)發(fā)了 SRD(Scalable Reliable Datagram)網(wǎng)絡(luò)傳輸協(xié)議和 SIDR(Scalable Intent Driven Routing)數(shù)據(jù)中心路由協(xié)議,以最大化利用網(wǎng)絡(luò)帶寬并實(shí)現(xiàn)亞秒級(jí)的路由收斂,從而進(jìn)一步擴(kuò)大了數(shù)據(jù)中心網(wǎng)絡(luò)的規(guī)模?;?Nitro 創(chuàng)新帶來(lái)的網(wǎng)絡(luò)性能提升,結(jié)合新的數(shù)據(jù)傳輸協(xié)議和路由協(xié)議,亞馬遜云科技成功建成了 UltraCluster 超大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò),支持 GPU 實(shí)例數(shù)量高達(dá)兩萬(wàn)臺(tái),如果使用亞馬遜自研的機(jī)器學(xué)習(xí)訓(xùn)練 Trn1 實(shí)例,甚至可以擴(kuò)展到三萬(wàn)個(gè) Trainium 加速器。
在存儲(chǔ)方面,Nitro 平臺(tái)同樣表現(xiàn)出色。它支持單個(gè)虛擬機(jī)的最大 IOPS 達(dá)到 400K,存儲(chǔ)帶寬高達(dá) 100Gbps。此外,亞馬遜云科技還重寫(xiě)了主機(jī)和閃存之間的閃存轉(zhuǎn)換層算法,并將其運(yùn)行在 Nitro 系統(tǒng)的一塊芯片上,從而將 SSD 訪問(wèn)延遲降低了 60%,抖動(dòng)減少了 75%。
當(dāng)然,在云計(jì)算環(huán)境中,安全性始終是重中之重。亞馬遜云科技的 Nitro Enclaves 提供了一個(gè)隔離的敏感數(shù)據(jù)處理環(huán)境,允許客戶為自己的實(shí)例帶來(lái)額外的隔離,并只能通過(guò)安全的本地渠道進(jìn)行訪問(wèn),從而確保了客戶數(shù)據(jù)和應(yīng)用的安全性。
架構(gòu)體系創(chuàng)新拓展核心能力
在數(shù)字化浪潮的推動(dòng)下,架構(gòu)體系的創(chuàng)新已成為企業(yè)提升核心競(jìng)爭(zhēng)力的關(guān)鍵。這種創(chuàng)新主要聚焦于韌性和彈性與效率兩方面,它們是企業(yè)在復(fù)雜環(huán)境中持續(xù)發(fā)展的堅(jiān)實(shí)基石。
首先,韌性是架構(gòu)體系創(chuàng)新不可或缺的一環(huán)。與橋梁需應(yīng)對(duì)天災(zāi)人禍相似,技術(shù)架構(gòu)也需應(yīng)對(duì)不可控的外部風(fēng)險(xiǎn)和管理不善導(dǎo)致的內(nèi)部風(fēng)險(xiǎn)。以 Amazon IAM 為例,它通過(guò)控制平面與數(shù)據(jù)平面的分離設(shè)計(jì),確保了服務(wù)的穩(wěn)定運(yùn)行,即使在極端情況下也能保持服務(wù)不中斷。此外,Amazon IAM 在每個(gè)區(qū)域的數(shù)據(jù)平面都采用了單元架構(gòu),實(shí)現(xiàn)了高可用性和故障隔離,這種設(shè)計(jì)理念在亞馬遜云科技的多個(gè)核心服務(wù),如 Amazon EC2、Amazon EBS、Amazon Aurora 等中均有所體現(xiàn)。
其次,彈性與效率是架構(gòu)體系創(chuàng)新的另一重要方向。彈性意味著系統(tǒng)能夠迅速響應(yīng)需求變化,通過(guò)快速擴(kuò)展或縮減資源來(lái)應(yīng)對(duì)不同負(fù)載場(chǎng)景。而效率則側(cè)重于最大化資源利用率,減少浪費(fèi),提升整體性能。在這方面,亞馬遜云科技推出了多項(xiàng)創(chuàng)新技術(shù),如 Firecracker 輕量級(jí)虛擬化技術(shù)、Amazon Lambda SnapStart 快速啟動(dòng)功能以及 Caspian 智能資源調(diào)度系統(tǒng)。
Firecracker 基于 KVM 構(gòu)建微虛擬機(jī),能在極短時(shí)間內(nèi)啟動(dòng)完全隔離的虛擬機(jī),并通過(guò)多層隔離和保護(hù)機(jī)制支持多租戶環(huán)境。其簡(jiǎn)約設(shè)計(jì)減少了攻擊面,確保了系統(tǒng)的安全性。
Amazon Lambda SnapStart 則利用 Firecracker 的快照功能,對(duì)已初始化環(huán)境的內(nèi)存和磁盤(pán)狀態(tài)進(jìn)行緩存,并在函數(shù)調(diào)用時(shí)從緩存中恢復(fù),從而顯著提高了啟動(dòng)速度。在使用 Lambda SnapStart 后,函數(shù)的冷啟動(dòng)速度能提升 10 倍,且無(wú)需修改任何代碼。
在 Serverless 數(shù)據(jù)庫(kù)領(lǐng)域,亞馬遜云科技的 Caspian 技術(shù)實(shí)現(xiàn)了內(nèi)存的高效共享和彈性管理。通過(guò)融合虛擬化管理、熱管理計(jì)劃和數(shù)據(jù)庫(kù)引擎特性改寫(xiě),Caspian 允許多個(gè)數(shù)據(jù)庫(kù)共享同一物理機(jī)的全部?jī)?nèi)存,但每個(gè)數(shù)據(jù)庫(kù)實(shí)際使用的內(nèi)存僅限于其申請(qǐng)的大小。當(dāng)物理機(jī)內(nèi)存不足時(shí),Caspian 能智能地將數(shù)據(jù)庫(kù)實(shí)例遷移至其他物理機(jī)并擴(kuò)容內(nèi)存,確保 Serverless數(shù)據(jù)庫(kù)的流暢運(yùn)行和高效彈性。
多元技術(shù)融合驅(qū)動(dòng)架構(gòu)創(chuàng)新
隨著現(xiàn)代應(yīng)用對(duì)智能體驗(yàn)、可持續(xù)發(fā)展和合規(guī)等多元化需求的日益增長(zhǎng),應(yīng)用架構(gòu)的創(chuàng)新變得至關(guān)重要。多元技術(shù)融合,作為推動(dòng)架構(gòu)創(chuàng)新的關(guān)鍵動(dòng)力,通過(guò)整合不同技術(shù)領(lǐng)域的優(yōu)勢(shì),為構(gòu)建更高效、更智能的解決方案提供了可能。
為滿足企業(yè)多元化的需求,亞馬遜云科技精心打造了一系列數(shù)據(jù)服務(wù),涵蓋關(guān)系型數(shù)據(jù)庫(kù)、非關(guān)系型數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù),以及批式和流式的數(shù)據(jù)采集與分析服務(wù)。這些服務(wù)不僅滿足了企業(yè)多樣化的數(shù)據(jù)處理需求,還為企業(yè)提供了強(qiáng)大的數(shù)據(jù)支持。
值得一提的是,Zero-ETL 技術(shù)的出現(xiàn)進(jìn)一步簡(jiǎn)化了數(shù)據(jù)處理流程,顯著提高了數(shù)據(jù)處理的效率和準(zhǔn)確性。亞馬遜云科技已經(jīng)推出了 6 項(xiàng) Zero-ETL 能力,助力客戶輕松實(shí)現(xiàn)數(shù)據(jù)同步和分析,從而提高業(yè)務(wù)效率和洞察力。
此外,優(yōu)良架構(gòu)體系(Well-Architected Framework)作為一套經(jīng)過(guò)實(shí)踐驗(yàn)證的架構(gòu)設(shè)計(jì)方法,為企業(yè)提供了全面的架構(gòu)評(píng)估和優(yōu)化工具。該框架覆蓋了安全性、可靠性、性能效率、成本效益和可持續(xù)性等多個(gè)方面,指導(dǎo)企業(yè)構(gòu)建出健壯、靈活且高效的架構(gòu)體系,以應(yīng)對(duì)不斷變化的業(yè)務(wù)需求和市場(chǎng)環(huán)境。
結(jié)語(yǔ)
作為云計(jì)算領(lǐng)域的領(lǐng)軍者,亞馬遜云科技始終秉持著創(chuàng)新的精神,不斷推動(dòng)著技術(shù)架構(gòu)的演進(jìn)和行業(yè)的變革。在亞馬遜云科技發(fā)展的 18 年來(lái),亞馬遜云科技不僅展示了其強(qiáng)大的技術(shù)實(shí)力,更體現(xiàn)了對(duì)未來(lái)發(fā)展的深刻洞察和堅(jiān)定追求。
正如代聞所言,亞馬遜云科技正是通過(guò)不斷優(yōu)化基礎(chǔ)組件、創(chuàng)新架構(gòu)體系以及融合多元技術(shù),實(shí)現(xiàn)了對(duì)云計(jì)算性能、安全性和可靠性的全面提升,為用戶帶來(lái)了前所未有的體驗(yàn)和價(jià)值。
相信,在生成式 AI 時(shí)代下,亞馬遜云科技將繼續(xù)秉承創(chuàng)新精神,不斷推動(dòng)技術(shù)架構(gòu)的演進(jìn),以更加智能、高效、安全的服務(wù),助力各行各業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和升級(jí)。