自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大到大模型,小到產(chǎn)品更名,一窺云計算一哥的創(chuàng)新哲學(xué)

企業(yè)動態(tài)
從新推出的Nova系列大模型和新一代Amazon Sagemaker角度出發(fā),去窺探亞馬遜云科技獨有風(fēng)格的GenAI創(chuàng)新敘事。

亞馬遜云科技2024 re-Invent大會在拉斯維加斯落下帷幕,發(fā)布了相當(dāng)多讓人印象深刻的新產(chǎn)品。那么,我們該如何理解種種發(fā)布背后的創(chuàng)新呢?

如果說,創(chuàng)新是亞馬遜的DNA,那么作為全球云計算的No.1,亞馬遜云科技會在“生成式AI創(chuàng)新”進行怎樣的基因表達呢?

很多人也許會從基礎(chǔ)設(shè)施層、模型層、應(yīng)用層去解構(gòu)2024年亞馬遜云科技re-Invent大會上推出的一系列面面俱到的產(chǎn)品功能或服務(wù)創(chuàng)新。

但這里更想從新推出的Nova系列大模型和新一代Amazon Sagemaker角度出發(fā),去窺探亞馬遜云科技獨有風(fēng)格的GenAI創(chuàng)新敘事。

從Titan到Nova:不拘一格的6款模型打法

從2022年年底開始,很多國內(nèi)外的科技巨頭紛紛在大模型訓(xùn)練上展開了與OpenAI的追趕角逐。而作為云計算的No.1,亞馬遜云科技卻很少在明面的battle中去狂秀肌肉。

直到這個月初,亞馬遜云科技一口氣發(fā)布了六款Nova基礎(chǔ)模型,同時Amazon Bedrock 也集成了100多款三方的模型。相信很多人跟我們一樣好奇:亞馬遜云科技這波“不發(fā)則已,一發(fā)驚人”的操作,背后是出于怎樣的目的?

在采訪中,亞馬遜云科技大中華區(qū)產(chǎn)品總經(jīng)理陳曉建告訴了我們答案:

亞馬遜云科技去年提供了嵌入式模型Titan,今年推出了包括六個不同定位模型的Nova系列,未來還會推出speech to speech和any to any等模型。推出這些模型的重點是為用戶提供更好的選擇,使其能與產(chǎn)品更好地結(jié)合,實現(xiàn)更好的集成。模型的推出基于逆向工作法,通過了解客戶需求來確定,比如根據(jù)用戶在Micro、Lite、Pro、Premier 等不同層面的訴求來構(gòu)建模型,未來也會推出更多不同能力和定位的模型。

對于Amazon Bedrock集成100多款三方模型的打法,亞馬遜云科技大中華區(qū)數(shù)據(jù)分析與生成式AI的產(chǎn)品總監(jiān)崔瑋補充道,整體策略是以客戶需求為主的逆向工作法,致力于給客戶更多選擇,通過Amazon Bedrock 平臺部署一方和三方模型,滿足客戶多樣化需求。

為什么不是通用大模型,而是6款專用模型

回到這次Nova系列模型的推出,大家會發(fā)現(xiàn)這些模型各有各的強項和優(yōu)勢:

Amazon Nova Micro專門用于處理文本、Amazon Nova Lite 和Amazon Nova Pro,即將推出的Amazon Nova Premier專攻多模態(tài)的理解(文本、圖像、視頻),此外,還有圖像生成模型Amazon NovaCanvas 和視頻生成模型Amazon Nova Reel。

綜合在一起看,你就會發(fā)現(xiàn),這些Nova模型基本都是在強調(diào)低成本、快速響應(yīng),同時又都是基于實際工作生活的使用(推理)場景所亟需的。

進一步看,在未來推理將無處不在,所有業(yè)務(wù)都可能會應(yīng)用到大模型提供的推理能力。對亞馬遜云科技而言,需要向客戶提供一個能夠支持規(guī)模化推理的平臺,以充分應(yīng)用亞馬遜云科技的推理能力,并幫助客戶用好自己的私有化數(shù)據(jù),實現(xiàn)性能、安全和成本方面的平衡,這也是亞馬遜云科技在re:Invent大會期間推出Amazon Nova系列模型的初衷。

為什么不是推出一個全能的通用模型?亞馬遜云科技大中華區(qū)數(shù)據(jù)分析與生成式AI的產(chǎn)品總監(jiān)崔瑋解釋了這樣做的原因——

“我們這樣做是因為看到客戶從可行性研究進入生產(chǎn)階段時,必然會權(quán)衡模型的延時(latency)、成本和性能。”

比如,有時客戶為確保準(zhǔn)確性(accuracy),可能接受較慢的響應(yīng)速度和較高成本,此時會選擇大模型;而對于一些日活躍用戶(DAU)達十萬或百萬級的互聯(lián)網(wǎng)企業(yè),可能無法承受大模型的高成本,就會選擇在性能尚可的情況下成本較低的模型。在性能(performance)尚可的情況下,客戶會傾向于選擇成本較低的模型來服務(wù)業(yè)務(wù)。

實際上,客戶會基于自身的用例以及對業(yè)務(wù)投資回報率(ROI)的考量,去判斷如何匹配和組合模型。在大型場景下的多個任務(wù)中,客戶通常會使用不同模型來解決不同業(yè)務(wù)問題,進而組建一個整體解決方案,這是極為常見的做法。

關(guān)于快速響應(yīng)原理,我們在提及 Nova 模型時會涉及到“優(yōu)化的低延遲推理”,這是Amazon Bedrock提供的一項新功能。實現(xiàn)快速響應(yīng)的原理是從模型本身的部署和架構(gòu),到Amazon Bedrock提供的能力,再到底層基礎(chǔ)設(shè)施,實現(xiàn)了端到端的保障,從而確保整個過程的快速響應(yīng)。

新老一代的Amazon SageKaker背后

細心的朋友會發(fā)現(xiàn)除了Nova大模型,自研芯片Trainium3等硬貨亞馬遜云科技此次眾多發(fā)布產(chǎn)品中還有一個不得忽視的變化,,大家比較熟悉的以前的Amazon SageMaker,現(xiàn)在更名為Amazon SageMaker AI,同時亞馬遜又重新定義了新一代Amazon SageMaker。新一代的Amazon SageMaker涵蓋了分析、數(shù)據(jù)處理、搜索、數(shù)據(jù)準(zhǔn)備、AI模型開發(fā)和訓(xùn)練、?成式AI等所有必需功能,同時全部功能都可以通過統(tǒng)?的企業(yè)數(shù)據(jù)視圖實現(xiàn)。

崔瑋同樣解釋了這種變化背后的歸因。因為在大的方向上,“客戶在構(gòu)建整個生成式AI的旅程時,需要的不只是模型,甚至不只是生成AI這個詞,更多的是數(shù)據(jù)加AI的統(tǒng)一。新一代Amazon SageMaker就是數(shù)據(jù)加AI,首先是統(tǒng)一,統(tǒng)一的平臺;第二它要開放,第三還是要安全。我們會通過這三層,給客戶提供從數(shù)據(jù)到AI的一體化的感受?!?/span>

而對于大家比較熟悉的以前的Amazon SageMaker,定位還是AI開發(fā)方面,所以現(xiàn)在叫Amazon SageMaker AI,它也有很多新的這個功能發(fā)布。Amazon SageMaker AI推出四項創(chuàng)新,助力企業(yè)更快使用熱門的公開模型,最大化訓(xùn)練效率、降低成本,并使用其首選工具加速生成式AI模型的開發(fā)。

一窺亞馬遜持續(xù)創(chuàng)新哲學(xué)

這時你就會發(fā)現(xiàn),大到模型的發(fā)布,小到一個工具的更名,亞馬遜云科技都做了如此“工匠”級的精心設(shè)計和需求驗證。這背后其實都是亞馬遜前文提到的“逆向工作法”的創(chuàng)新哲學(xué)。

那么,如何理解逆向工作法?陳曉建在亞馬遜云科技2024re-Invent中國站的主題演講中做出了解釋:

“我們始終在傾聽客戶的心聲,著眼于長遠的發(fā)展。感謝成為我們客戶的企業(yè),正是因為他們愿意抽出寶貴的時間,幫助我們?nèi)チ私馐裁词强蛻粽嬲枰脑朴嬎愎δ?,以及如何為客戶提供更好的服?wù),從而在過去十多年我們才能夠基于客戶需求不斷創(chuàng)新,來最終滿足這些需求。這個就是我們常說的customer obsession walking backwards,以客戶為中心、逆向工作法。這個已經(jīng)深深地融入到亞馬遜云科技的基因之中,從最開始創(chuàng)立的時候就已經(jīng)確立?!?/span>

這也讓人想到了今年re-Invent大會上,亞馬遜云科技高級副總裁Peter DeSantis那句比喻:

“亞馬遜雨林的扶壁根系,支撐著世界上最大的樹木生長在并不穩(wěn)定的土壤系統(tǒng)中。扶根可以從一棵樹的底部延伸數(shù)百英尺,并與附近的樹木互鎖構(gòu)成一個堅實的基礎(chǔ),來支撐這些巨大的雨林。而亞馬遜云科技最獨特的事情之一,是我們的領(lǐng)導(dǎo)者能夠在細節(jié)上花費大量時間精力,去了解客戶和服務(wù)真正發(fā)生了什么事情,從而能夠快速做出決定,甚至有可能在問題發(fā)生之前就解決或預(yù)防它們?!?/span>

理解了這一點,也就理解了這次亞馬遜云科技2024re-Invent大會上推出的發(fā)布為什么會多到讓人眼花繚亂,但每一項發(fā)布都能讓你找到似曾相識的場景和痛點。理解了這一點,也就窺見了亞馬遜云科技獨有的re-Invent創(chuàng)新文化。


責(zé)任編輯:張燕妮
相關(guān)推薦

2012-06-07 09:48:10

云計算趨勢

2024-11-20 13:24:10

2024-04-10 12:42:51

AI模型

2023-04-17 09:00:00

WakeData惟客數(shù)據(jù)大模型

2010-10-14 10:04:59

云計算創(chuàng)新企業(yè)

2015-08-19 11:45:42

2009-06-10 09:01:46

SOASmartSOAIBM

2010-12-15 09:31:08

2016-01-07 13:47:06

云計算私有云公共云

2023-11-15 15:37:21

大模型人工智能

2023-08-11 16:17:55

2016-11-04 23:29:40

云計算IT基礎(chǔ)設(shè)施

2013-12-30 09:48:59

云計算CDN開源

2024-12-11 12:58:57

2023-06-06 16:33:11

云計算人工智能

2024-11-01 10:16:09

API開源項目

2024-12-19 07:00:00

2019-08-16 10:43:45

2024-09-24 09:12:59

點贊
收藏

51CTO技術(shù)棧公眾號