云計算一哥的生成式AI之道:Choice Matters
引言:AI大模型,并不是一個贏家通吃的市場。
自O(shè)penAI在2022年發(fā)布ChatGPT以來,無論是科技巨頭還是初創(chuàng)公司,各個玩家可以說是紛紛加大投入,試圖在模型性能上超越彼此。
似乎追求單一、性能卓越的AI大模型已然成為一種趨勢,各類Benchmark上的奪冠也好似一張得到市場認(rèn)可的入場券。
然而在如此打法成為主流的同時,一個在AI大模型時代以來一直看似低調(diào),也鮮有大聲量地高喊“大模型性能第一”的科技巨頭,卻在時隔兩年多之久,以截然不同的方式在大模型市場里驚艷亮相。
它就是云計算一哥——亞馬遜云科技。
對于亞馬遜云科技在AI大模型時代的定位,目前有一種非常貼切的比喻,叫做“沉睡的雄獅”。
之所以如此,是因為亞馬遜云科技此前幾乎是以“工廠模式”來推動大模型的發(fā)展,在業(yè)界聲響最大的便是集成各路大模型的Amazon Bedrock。
即便在早期有發(fā)布過自研大模型Titan,但有一說一,似乎也是在大模型飛速迭代的浪潮中被淹沒。
然而,正當(dāng)大眾以為亞馬遜云科技在AI大模型時代會持續(xù)扮演一個“工廠”角色之際,就在前不久自家的年度盛宴re:Invent 2024中,它卻高調(diào)發(fā)布了全新的基礎(chǔ)模型——Amazon Nova系列。
而且是一口氣六款模型,涵蓋文本對話、圖片生成和視頻生成,并且也罕見地把與各類模態(tài)主流玩家的PK測評成績直接亮了出來。
以視頻生成模型Amazon Nova Reel為例,效果是這樣的:
于是乎,為何在沉寂兩年后才會有此動作?亞馬遜云科技的打法又是否能符合市場發(fā)展?……
種種問題,亟待回答。
亞馬遜的“AI步法”:Choice Matters
其實在今年亞馬遜云科技的re:Invent中,若是一定要提煉一個關(guān)鍵詞,那么Choice(選擇),無疑就是最搶眼的那一個。
展開這個關(guān)鍵詞,則正是“云計算一哥”在AI大模型時代下的打法:
會做選擇,比擁有單一強大的大模型更為重要。
這是因為在亞馬遜云科技看來,大模型市場并不是一個贏家通吃的市場;這就與其它公司形成了鮮明對比。
然而,亞馬遜選擇了一條不同的道路,通過其Bedrock等工具支持來自多個提供商的不同模型,而不是僅僅專注于構(gòu)建自己的強大模型。
而這種背后蘊含“沒有一個模型可以一統(tǒng)天下”的模式似乎也正在被市場所接納。
根據(jù)Menlo Ventures的報告,公司通常在其AI服務(wù)中使用3個或更多的基礎(chǔ)模型,根據(jù)不同的用例或結(jié)果路由到不同的模型。
這種趨勢表明,即使是市場份額佼佼者的OpenAI,也面臨著來自其他采用多模型策略的公司的挑戰(zhàn)。
同樣是根據(jù)Menlo Ventures的報告,一個較有說服力的數(shù)據(jù)是這樣的:
采用亞馬遜云科技模式的Anthropic在AI模型市場的份額翻倍至24%,而OpenAI的份額從50%下降到34%。
不過與此同時,自身擁有先進的AI大模型同樣也有助于亞馬遜云科技吸引更多的AI開發(fā)者。
雖然早期亞馬遜云科技所推出Titan并沒有在大模型圈里泛起太大的浪花,但這一次的Nova系列,確實是以其效果和實力博取了不小的關(guān)注。
而這一切的背后,依舊是貫徹亞馬遜云科技的根本問題,即客戶有所需要。
因此,亞馬遜云科技在大模型時代下的“AI步法”就非常清晰了——
為客戶提供“多快好省”的選擇權(quán),而不是“一統(tǒng)天下”的市場主導(dǎo)權(quán)。
那么接下來的一個問題是:
提供了怎樣的AI選擇權(quán)?
就在今天剛結(jié)束的re:Invent 2024中國行全國巡展北京站活動中,亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理陳曉建對這一問題做了再次的回顧。
△亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理,陳曉建
在短短90分鐘的主題演講中,露出的“AI可選項”多達30多個,平均下來就是每三分鐘一個!
縱觀整場活動,最直觀的感受,就是這些回顧的“全新發(fā)布”涵蓋了整個生成式AI的全周期——
從最底層的基礎(chǔ)設(shè)施,到中間的模型服務(wù),再到頂層的AI應(yīng)用,是屬于全棧的那種。
而之所以如此,陳曉建在現(xiàn)場做出了如下解釋:
我們不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個技術(shù)堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進化。
我相信,只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新才能真正滿足當(dāng)今客戶的發(fā)展需求,加速前沿技術(shù)的價值釋放,助力各行各業(yè)重塑未來。
“全新發(fā)布”數(shù)量雖然驚人,但按照生成式AI各層級來看脈絡(luò)也是較為清晰,可以分為五個大亮點:
- 計算
- 存儲
- 數(shù)據(jù)庫
- 分析
- AI推理
那么接下來,我們就來再次深入回顧下今年re:Invent中的那些高光時刻。
新款自研基礎(chǔ)模型
首先,我們先來看下“AI推理”部分的產(chǎn)品,或許也是大家最感興趣、最有感知的一個內(nèi)容——大模型。
亞馬遜云科技所發(fā)布的新款自研基礎(chǔ)模型,名曰Amazon Nova,是有一點點震撼在身上的。
整體來看Amazon Nova共有四個“杯型”,它們分別是:
- Amazon Nova Micro:僅限文本對話,主打一個低價格和低延遲;
- Amazon Nova Lite:低成本的多模態(tài)大模型,處理圖像、視頻和文本輸入的速度極快。
- Amazon Nova Pro:高性能的多模態(tài)大模型,精度、速度和成本最佳“配方”,可處理廣泛的任務(wù)。
- Amazon Nova Premier:亞馬遜最強多模態(tài)大模型,可處理復(fù)雜的推理任務(wù),也可用于蒸餾客戶定制化的模型。
其中一大亮點便是成本大幅降低。
據(jù)了解,在各自智能類別中,Amazon Nova Micro、Lite和Pro應(yīng)用成本比“模型工廠”Amazon Bedrock中表現(xiàn)最佳的模型至少降低75%,同時也是Amazon Bedrock中對應(yīng)類別速度最快的模型。
前三者已經(jīng)上架亞馬遜云科技的Amazon Bedrock,而Premier版本則將于2025年第一季度推出。
除此之外,還有Amazon Nova Canvas,主打的是圖像生成,用官方的話來說,是達到了“State-of-the-art”(最先進)的水平。
在現(xiàn)場,陳曉建也展示了與DALL·E 3和Stable Diffusion Large 3.5的評估測試上的比較,圖像質(zhì)量等維度上均勝出。
在圖像生成之后,亞馬遜云科技還發(fā)布了視頻生成模型——Amazon Nova Reel。
據(jù)了解,目前6秒鐘時長的視頻生成已經(jīng)正式可用,2分鐘版本的也在路上了。
同樣的,Amazon Nova Reel與Runway家的Gen-3 Alpha之間的評測比試結(jié)果:視頻質(zhì)量勝率61.4%、視頻連貫性勝率71.6%。
但這還不算完,Amazon Nova的下一步也已披露——
不僅要Speech-to-Speech,更要Any-to-Any!
一切皆可生成,是值得期待一波了。
而作為承載它們的“模型工廠”Amazon Bedrock,這一次也有不少的升級動作。
首先就是在模型的選擇上,新增了多個choices,例如首家提供Luma AI和poolside模型,以及更新的Stability AI最新模型等。
其次,全新發(fā)布的Amazon Bedrock Marketplace,可以為客戶提供100多個熱門、新興及專業(yè)模型。
還有Amazon Bedrock Knowledge Bases,現(xiàn)在支持可以支持GraphRAG等知識庫功能增強數(shù)據(jù)利用能力。
在性能方面,Bedrock還推出了低延遲優(yōu)化推理,由此,用戶可以在使用最先進的大模型基礎(chǔ)上,還享受卓越的推理性能。
值得一提的是,Llama 405B和Llama 70B低延遲優(yōu)化版本,在亞馬遜云科技上展現(xiàn)出超越其他云提供商的出色表現(xiàn)。
最后,通過自動推理檢查功能和多智能體協(xié)作等創(chuàng)新,進一步增強AI安全性并推動智能體發(fā)展。
Amazon Q Developer則是引入了三款先進的智能體。
它們能夠自動執(zhí)行單元測試、生成文檔和進行代碼審查,同時通過與GitLab的深度整合,拓寬了應(yīng)用范圍。
此外,它還推出了新的轉(zhuǎn)型特性,旨在加快Windows.NET、VMware和大型機工作負(fù)載的遷移與現(xiàn)代化進程,有效減少轉(zhuǎn)型周期和成本。
同時,Amazon Q Business和Amazon Q in QuickSight的洞察力得到了加強,簡化了復(fù)雜工作流程自動化的實現(xiàn)方法。
云計算,也全面升級
說完大模型,我們再來看下亞馬遜云科技的“老本行業(yè)務(wù)”——云計算。
這次升級主要圍繞三大核心領(lǐng)域展開:計算(Compute)、存儲(Storage) 和數(shù)據(jù)庫(Database)。
每一項都可以說是展現(xiàn)出了前所未有的性能提升與成本優(yōu)化。
在計算(Compute)層面,亞馬遜云科技推出了性能全面升級的Amazon EC2 Trn2實例。
Trn2實例搭載第二代Trainium芯片(Trainium2),相比上一代Trn1,性能提升如下:
- 訓(xùn)練速度提升4倍,顯著縮短模型訓(xùn)練時間,助力企業(yè)更快落地AI應(yīng)用;
- 內(nèi)存帶寬提升4倍,滿足復(fù)雜模型對于數(shù)據(jù)高并發(fā)處理的需求;
- 內(nèi)存容量提升3倍,為大規(guī)模參數(shù)模型提供強大支持。
更重要的是,Trn2實例的性價比提升顯著,相比傳統(tǒng)GPU實例(P5e和P5en)高出30-40%,大幅降低了算力成本。
對于超大規(guī)模計算需求,亞馬遜云科技還推出了Trn2 UltraServer。
每臺UltraServer集成了64顆Trainium2芯片,并通過NeuronLink高速互聯(lián)實現(xiàn)2TB/s帶寬和1微秒級延遲。
這款產(chǎn)品為超大規(guī)模AI模型訓(xùn)練提供了理想的算力平臺。
除此之外,在芯片層面上,亞馬遜云科技宣布將在2025年推出Trainium3芯片。
據(jù)悉,Trainium3將采用3納米工藝制造,提供兩倍于Trainium2的計算能力,并提升40%的能效。
在存儲(Storage)層面,亞馬遜云科技發(fā)布了專為表格數(shù)據(jù)設(shè)計的Amazon S3 Tables,性能和效率再次升級。
Amazon S3 Tables引入了一種創(chuàng)新的存儲解決方案,專門針對表格數(shù)據(jù)優(yōu)化,并兼容Amazon Athena、Amazon EMR以及Apache Spark等主流查詢工具,以便用戶能夠便捷地執(zhí)行數(shù)據(jù)查詢操作。
作為S3的第三種存儲類別,表存儲桶與通用存儲桶和目錄存儲桶相輔相成,它被設(shè)計為一個分析型數(shù)據(jù)倉庫,適合存放多種模式的Iceberg格式表格。
S3 Tables在性能上相較于傳統(tǒng)的自管理表格存儲有顯著提升,查詢速度可提高至3倍,事務(wù)處理速率可達10倍,且享有全面托管的服務(wù)帶來的操作便利。
在數(shù)據(jù)管理中,元數(shù)據(jù)的作用日益凸顯,例如,手機中存儲的大量照片能夠通過元數(shù)據(jù)快速定位,使用自然語言即可迅速檢索到特定照片。
為滿足此類需求,亞馬遜云科技推出了Amazon S3 Metadata的測試版,旨在提供更加智能和高效的元數(shù)據(jù)管理功能。
Amazon S3 Metadata 提供了一種智能化、便捷的元數(shù)據(jù)管理方案,實現(xiàn)了近乎實時的元數(shù)據(jù)更新,幫助用戶高效地組織、識別和利用S3數(shù)據(jù),支持業(yè)務(wù)分析和實時推理等應(yīng)用場景。
該功能支持對象元數(shù)據(jù)管理,既涵蓋系統(tǒng)生成的詳細(xì)信息(如文件大小和來源),也允許用戶自定義元數(shù)據(jù)。用戶可以通過標(biāo)簽為對象附加額外信息,如產(chǎn)品SKU、交易ID或內(nèi)容評級,進一步提升數(shù)據(jù)的分類與檢索效率。
此外,這些元數(shù)據(jù)信息被無縫整合到 S3 Tables 中,進一步強化了數(shù)據(jù)的管理與分析能力。
最后一層,便是數(shù)據(jù)庫(Database)了。
亞馬遜云科技發(fā)布了新型無服務(wù)器分布式數(shù)據(jù)庫Amazon Aurora DSQL,旨在解決傳統(tǒng)數(shù)據(jù)庫在擴展性和性能方面的挑戰(zhàn),目前可以實現(xiàn):
- 跨區(qū)域強一致性和低延遲;
- 無限擴展,可輕松處理TB至PB級數(shù)據(jù);
- 超高可用性,達到99.999%的可靠性。
與此同時,Amazon DynamoDB global tables也增加了多區(qū)域強一致性支持,進一步增強了其分布式數(shù)據(jù)庫服務(wù)能力。
數(shù)據(jù)分析能力也是Up Up Up
此次發(fā)布的最后一部分,便是分析板塊。
亞馬遜云科技所發(fā)力的點,便是其一站式數(shù)據(jù)、分析與AI解決方案中心——新一代Amazon SageMaker。
新一代SageMaker的核心是SageMaker Unified Studio。
這是一個單一的數(shù)據(jù)和AI開發(fā)環(huán)境,它整合了Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA)以及現(xiàn)有的SageMaker Studio中的工具和功能。
其次是Amazon SageMaker Lakehouse,可以統(tǒng)一Amazon S3數(shù)據(jù)湖、Amazon Redshift數(shù)據(jù)倉庫和第三方及聯(lián)合數(shù)據(jù)源。
除此之外,還包括Amazon SageMaker HyperPod的新訓(xùn)練配方功能、靈活訓(xùn)練計劃和任務(wù)治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應(yīng)用。
這些功能將幫助客戶更快開始訓(xùn)練流行模型,通過靈活訓(xùn)練計劃節(jié)省數(shù)周時間,并將成本降低高達40%。
以上就是今年亞馬遜云科技給予大模型時代客戶們的種種新的選擇了。
而這種“以客戶為中心,逆向工作(work backward)”為基因的云計算巨頭,還將以“提供選擇權(quán)”的方式在這個時代給我們帶來怎樣的驚喜,是值得期待一波。