作者 | Anirban Ghoshal
策劃 | 云昭
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
“Generative AI”可謂是re:Invent 2023的口號,不管是AWS推出了新的芯片、基礎(chǔ)模型、基于生成AI的應(yīng)用程序構(gòu)建服務(wù)Amazon Bedrock的更新,還是一款名為Amazon Q的新生成AI助手,支持向量數(shù)據(jù)庫和零ETL集成。
在上周的AWS re:Invent會議上,一切的焦點(diǎn)都集中在人工智能上,新的生成AI助手Amazon Q首次成為會議上的“明星”。但還有很多其他發(fā)布,激發(fā)了數(shù)據(jù)庫經(jīng)理、數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和開發(fā)人員的興趣,包括新的提取、轉(zhuǎn)換、加載(ETL)服務(wù)、新的成本優(yōu)化中心,以及AWS基于云的開發(fā)工具(稱為Amazon CodeCatalyst)的企業(yè)定價層改進(jìn)。以下是大會的七個看點(diǎn)。
1、為生成型AI提供豐富的基礎(chǔ)設(shè)施
AWS作為云服務(wù)供應(yīng)商,自去年以來一直在增加基礎(chǔ)設(shè)施功能和芯片的投入,以支持具有增強(qiáng)能效的高性能計(jì)算,并宣布了其Graviton和Trainium芯片的最新迭代。
根據(jù)AWS的數(shù)據(jù),Graviton4處理器比當(dāng)前一代Graviton3處理器提供了高達(dá)30%的計(jì)算性能、50%的內(nèi)核和75%的內(nèi)存帶寬。
另一方面,Trainium 2的訓(xùn)練速度是第一代Trainium芯片的四倍。在J今年的re:Invent,AWS還擴(kuò)展了與英偉達(dá)的合作伙伴關(guān)系,包括對DGX Cloud的支持,一個名為Ceiba的新GPU項(xiàng)目,以及支持生成AI工作負(fù)載的新實(shí)例。
英偉達(dá)還分享了將其NeMo Retriever微服務(wù)集成到AWS的計(jì)劃,以幫助用戶開發(fā)聊天機(jī)器人等生成性人工智能工具。NeMo Retriever是一種生成型人工智能微服務(wù),使企業(yè)能夠?qū)⒆远x的大型語言模型(LLM)連接到企業(yè)數(shù)據(jù),因此公司可以根據(jù)自己的數(shù)據(jù)生成適當(dāng)?shù)娜斯ぶ悄茼憫?yīng)。
此外,AWS表示,它將成為第一家將英偉達(dá)GH200 Grace Hopper超級芯片帶到云端的云提供商。
2、Amazon Bedrock的新基礎(chǔ)模型
Bedrock中添加的更新型號包括Anthropic的Claude 2.1和Meta Llama 2 70B,這兩款產(chǎn)品都已上市。亞馬遜還將其專有的Titan Text Lite和Titan Text Express基礎(chǔ)模型添加到Bedrock中。此外,這家云服務(wù)提供商在人工智能應(yīng)用程序構(gòu)建服務(wù)中添加了一個預(yù)覽模型,即亞馬遜泰坦圖像生成器。
AWS還在Bedrock中發(fā)布了一項(xiàng)新功能,允許企業(yè)評估、比較和選擇適合其用例和業(yè)務(wù)需求的最佳基礎(chǔ)模型。
該公司表示,該功能在Amazon Bedrock上被稱為模型評估,目前正在預(yù)覽中,旨在簡化多項(xiàng)任務(wù),如確定基準(zhǔn)、設(shè)置評估工具和運(yùn)行評估,并補(bǔ)充說,這節(jié)省了時間和成本。
3、Amazon SageMaker更新:支持生成式AI
為了幫助企業(yè)高效地訓(xùn)練和部署大型語言模型,AWS在其亞馬遜SageMaker人工智能和機(jī)器學(xué)習(xí)服務(wù)中推出了兩種新產(chǎn)品——SageMaker HyperPod和SageMaker推理。
該公司表示,與手動模型訓(xùn)練過程相比,HyperPod消除了為訓(xùn)練模型構(gòu)建和優(yōu)化機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施所涉及的繁重任務(wù),將訓(xùn)練時間減少了40%,而手動模型訓(xùn)練容易出現(xiàn)延遲、不必要的支出和其他復(fù)雜情況。
另一方面,SageMaker推理旨在幫助企業(yè)降低模型部署成本,減少模型響應(yīng)的延遲。為了做到這一點(diǎn),推理允許企業(yè)將多個模型部署到同一個云實(shí)例,以更好地利用底層加速器。
AWS還更新了針對商業(yè)分析師的低代碼機(jī)器學(xué)習(xí)平臺SageMaker Canvas。
AWS數(shù)據(jù)庫、分析和機(jī)器學(xué)習(xí)服務(wù)主管Swami Sivasubramanian表示,分析師可以使用自然語言在Canvas中準(zhǔn)備數(shù)據(jù),以生成機(jī)器學(xué)習(xí)模型。無代碼平臺支持來自Anthropic、Cohere和AI21實(shí)驗(yàn)室的LLM。
SageMaker現(xiàn)在還具有模型評估功能,現(xiàn)在稱為SageMaker Clarify,可以從SageMaker Studio中訪問。
4、Amazon Q:萬物生成的AI助手
上周二,AWS首席執(zhí)行官Adam Selipsky首次展示了這家云巨頭的re:Invent 2023會議的明星:Amazon Q,這是該公司對微軟GPT驅(qū)動的Copilot生成人工智能助手的回應(yīng)。Amazon Q可供企業(yè)用于各種功能,包括開發(fā)應(yīng)用程序、轉(zhuǎn)換代碼、生成商業(yè)智能、充當(dāng)商業(yè)應(yīng)用程序的生成AI助理,以及通過Amazon Connect服務(wù)幫助客戶服務(wù)代理。
5、Amazon Braket 計(jì)劃:保留量子計(jì)算
這家云服務(wù)提供商宣布了一項(xiàng)名為“Amazon Braket Direct”的新計(jì)劃,為研究人員提供量子計(jì)算機(jī)的直接私人訪問。該項(xiàng)目是AWS托管量子計(jì)算服務(wù)的一部分,名為Amazon Braket,Amazon Bracket Direct于2020年推出。
亞馬遜表示,它允許企業(yè)的研究人員在沒有任何等待時間的情況下私人訪問各種量子處理單元(QPU)的全部容量,還提供了從亞馬遜量子計(jì)算專家團(tuán)隊(duì)獲得其工作負(fù)載專家指導(dǎo)的選項(xiàng)。
目前,Direct計(jì)劃支持保留IonQ Aria、QuEra Aquila和Rigetti Aspen-M-3量子計(jì)算機(jī)。IonQ的價格為每小時7000美元,QuEra Aquila的價格為2500美元。Aspen-M-3的價格略高,為每小時3000美元。
6、成本優(yōu)化中心,幫助企業(yè)減少支出
re:Invent上宣布的更新包括一個新的AWS計(jì)費(fèi)和成本管理功能,稱為AWS成本優(yōu)化中心,使企業(yè)能夠輕松識別、過濾、匯總和量化AWS成本優(yōu)化建議的節(jié)約。
據(jù)云服務(wù)提供商稱,新的Hub將AWS云財(cái)務(wù)管理(CFM)服務(wù)中的所有成本優(yōu)化建議行動收集在一個地方,包括AWS成本資源管理器和AWS計(jì)算優(yōu)化器。AWS補(bǔ)充道,它將特定于客戶的定價和折扣納入了這些建議中,并消除了重復(fù)的發(fā)現(xiàn)和節(jié)省,從而對企業(yè)的成本優(yōu)化機(jī)會提供了一個綜合的視圖。
該功能可能有助于FinOps或基礎(chǔ)設(shè)施管理團(tuán)隊(duì)獲得更多成本優(yōu)化的可能性。
7、Zero-ETL, 向量數(shù)據(jù)庫和其他更新
AWS繼續(xù)努力實(shí)現(xiàn)數(shù)據(jù)倉庫服務(wù)的零ETL,宣布了與Amazon Aurora PostgreSQL、Amazon DynamoDB和Amazon RDS for MySQL的新的Amazon RedShift集成。
企業(yè)通常使用提取、轉(zhuǎn)換、加載(ETL)將來自多個源的數(shù)據(jù)集成到單個一致的數(shù)據(jù)存儲中,以便加載到數(shù)據(jù)倉庫中進(jìn)行分析。
然而,大多數(shù)數(shù)據(jù)工程師聲稱,從不同來源轉(zhuǎn)換數(shù)據(jù)可能是一項(xiàng)困難而耗時的任務(wù),因?yàn)樵撨^程涉及到清理、過濾、重塑和匯總原始數(shù)據(jù)等步驟。AWS表示,另一個問題是為運(yùn)行分析準(zhǔn)備數(shù)據(jù)管道的團(tuán)隊(duì)的維護(hù)成本增加。
相比之下,根據(jù)該公司的說法,新的零ETL集成消除了在Aurora PostgreSQL、DynamoDB、RDS for MySQL和RedShift之間執(zhí)行ETL的需要,因?yàn)檫@些數(shù)據(jù)庫中的事務(wù)數(shù)據(jù)幾乎可以立即復(fù)制到RedShift中,并可以運(yùn)行分析。
re:Invent的其他生成AI相關(guān)更新包括對Amazon Bedrock向量數(shù)據(jù)庫的更新支持。這些數(shù)據(jù)庫包括AmazonAurora和MongoDB。其他受支持的數(shù)據(jù)庫包括Pinecone、Redis Enterprise Cloud和Vector Engine for Amazon OpenSearch Serverless。該公司還在其基于云的開發(fā)工具中添加了一個新的企業(yè)定價層,Amazon CodeCatalyst。
參考鏈接:https://www.infoworld.com/article/3711385/aws-reinvent-2023-7-takeaways-from-the-big-annual-event.html