自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

云上高級(jí)應(yīng)用篇:亞馬遜云科技 云上人工智能創(chuàng)新實(shí)戰(zhàn)

云計(jì)算
云計(jì)算是新的服務(wù)形式,它有萬億級(jí)別的市場空間。人工智能迎來了高速發(fā)展階段,正在引爆智能時(shí)代。云計(jì)算與人工智能看似是兩個(gè)獨(dú)立的技術(shù)生態(tài),其實(shí)有千絲萬縷的關(guān)系,兩者的結(jié)合將會(huì)相得益彰,釋放出更多價(jià)值。

云計(jì)算是新的服務(wù)形式,它有萬億級(jí)別的市場空間。人工智能迎來了高速發(fā)展階段,正在引爆智能時(shí)代。云計(jì)算與人工智能看似是兩個(gè)獨(dú)立的技術(shù)生態(tài),其實(shí)有千絲萬縷的關(guān)系,兩者的結(jié)合將會(huì)相得益彰,釋放出更多價(jià)值。那么云上人工智能有什么樣的價(jià)值呢?我們將在本文進(jìn)行一些介紹。

一、 云計(jì)算與人工智能

現(xiàn)如今,無論是城市還是農(nóng)村,自來水取水是絕對(duì)的主流,只需輕輕擰開水龍頭,源源不斷的水立刻就流出來了,這些水是經(jīng)過處理和檢測才送到了老百姓的家里的,無須擔(dān)心水質(zhì)問題,無需自己打井,更無需管理汲水設(shè)備。

云計(jì)算與此類似,只需連上云,計(jì)算應(yīng)用就“自然來“了。這種集約式的轉(zhuǎn)變正在IT世界如火如荼地進(jìn)行當(dāng)中,企業(yè)從自建機(jī)房/數(shù)據(jù)中心轉(zhuǎn)而采用專業(yè)的云計(jì)算服務(wù)商的云服務(wù),無需自己運(yùn)維管理軟硬件基礎(chǔ)設(shè)施,只要按需求采購按用量付費(fèi),再也不用人人都要懂點(diǎn)運(yùn)維知識(shí),企業(yè)可以減少投入,將更多精力放在業(yè)務(wù)本身。

云計(jì)算雖然已經(jīng)發(fā)展了十幾年,但云計(jì)算本身并沒有為IT技術(shù)發(fā)展帶來質(zhì)變,它本身更多是技術(shù)交付模式的變化,是一種按需多快好省地交付所需服務(wù),以更集約的方式滿足原有需求的方法。隨著云計(jì)算發(fā)展變化的深入,這種集約的云服務(wù)模式逐漸從量變發(fā)展出了質(zhì)變,特別是當(dāng)云計(jì)算遇上人工智能和機(jī)器學(xué)習(xí)的時(shí)候。

從1956年達(dá)特茅斯的一場會(huì)議開始,人類開啟了對(duì)于人工智能的探索,但受限于算力,人工智能經(jīng)過了幾次熱潮,始終停留在實(shí)驗(yàn)室和影視作品的幻想里,與大多數(shù)人的生活相距甚遠(yuǎn)。但在摩爾定律的作用下,算力不斷增強(qiáng),而且算力的單位能源消耗成本越來越低,人工智能(具體而言是機(jī)器學(xué)習(xí))終于迎來了屬于它的時(shí)代。

這個(gè)時(shí)代里,云計(jì)算正在快速發(fā)展,云計(jì)算彈性的資源,靈活可用的部署方式,讓人工智能更好更快地進(jìn)行部署和落地。反過來說,人工智能的創(chuàng)新與發(fā)展的成果通過龐大的云計(jì)算平臺(tái)來放大。兩者相互促進(jìn)、相互成就。云計(jì)算與人工智能的結(jié)合是必然的,會(huì)有越來越多的機(jī)器學(xué)習(xí)在云上進(jìn)行。

亞馬遜云科技是全球領(lǐng)先的云計(jì)算供應(yīng)商,在云計(jì)算方面有非常豐富的云產(chǎn)品布局。在人工智能及機(jī)器學(xué)習(xí)方面也有完善的產(chǎn)品和服務(wù)集合,使得用戶一方面有許多可直接調(diào)用API的服務(wù),另一方面,還能在云上完成機(jī)器學(xué)習(xí)構(gòu)建、訓(xùn)練、部署的全流程,例如,通過亞馬遜云科技著名的機(jī)器學(xué)習(xí)開發(fā)服務(wù)Amazon SageMaker,即可達(dá)成這項(xiàng)目標(biāo)。

Amazon SageMaker可以說是幫助企業(yè)踏入機(jī)器學(xué)習(xí)旅程的一張通票。Amazon SageMaker作為云上機(jī)器學(xué)習(xí)平臺(tái)的典型代表,利用云的優(yōu)勢降低機(jī)器學(xué)習(xí)成本,成為了亞馬遜云科技目前非常具有特色、非常實(shí)用的云上機(jī)器學(xué)習(xí)服務(wù)。

二、 為什么需要用云上機(jī)器學(xué)習(xí)平臺(tái)

技術(shù)的發(fā)展史就是技術(shù)方案成本降低史,舊時(shí)王謝堂前燕,飛入尋常百姓家,說的是技術(shù)迭代造就的市場成就。

智能時(shí)代下,各種算法方面已有數(shù)十年的充足積累,數(shù)據(jù)存儲(chǔ)成本也足夠低,算力也是易于獲得的資源,特別是在云計(jì)算基礎(chǔ)設(shè)施的幫助下,將人工智能(機(jī)器學(xué)習(xí))所需的三大要素進(jìn)行了緊密集成,綜合使用成本大大降低。當(dāng)年,Wintel聯(lián)盟打造的PC生態(tài)讓電腦變成個(gè)人消費(fèi)品;而今,云計(jì)算的發(fā)展對(duì)于人工智能的普及落地也將有同等重要的作用。

機(jī)器學(xué)習(xí)從數(shù)據(jù)準(zhǔn)備、到模型訓(xùn)練,再到模型調(diào)優(yōu)…… 整個(gè)流程對(duì)于基礎(chǔ)設(shè)施的需求相對(duì)明確。數(shù)據(jù)準(zhǔn)備階段和模型部署階段在滿足需求的前提下盡可能要控制成本;而在訓(xùn)練階段,則要求算力能在規(guī)定時(shí)間里完成訓(xùn)練任務(wù)??紤]到對(duì)算力的需求存在峰值和低谷,云計(jì)算彈性能力讓資源召之即來,揮之即去,按需付費(fèi)的特點(diǎn)對(duì)于降低成本非常合適。

企業(yè)在現(xiàn)有架構(gòu)上部署一套機(jī)器學(xué)習(xí)的方案不是不行,只是除了要克服上述資源成本方面的問題,還要考慮到管理一整套方案的隱性成本,設(shè)立一套關(guān)于機(jī)器學(xué)習(xí)業(yè)務(wù)的流程,還要規(guī)避自行處理數(shù)據(jù)合規(guī)方面的問題,應(yīng)對(duì)可能出現(xiàn)的數(shù)據(jù)泄露問題,等等。與其自行解決這些問題,不如選用一套成熟、經(jīng)過眾多企業(yè)驗(yàn)證的云上解決方案。

Amazon SageMaker是一個(gè)構(gòu)建、訓(xùn)練與部署機(jī)器學(xué)習(xí)模型的全托管服務(wù),作為典型的云上機(jī)器學(xué)習(xí)平臺(tái),能完美解決上述問題,同時(shí)避免了企業(yè)采購和部署軟硬件平臺(tái)的前期投入。機(jī)器學(xué)習(xí)環(huán)境配置需要安裝配置許多軟件, Amazon SageMaker可以節(jié)省后期運(yùn)維升級(jí)維護(hù)上的投入,節(jié)省大量成本,利用云按需付費(fèi)的特點(diǎn)讓投入物盡其用。

Amazon SageMaker能將繁瑣的訓(xùn)練過程變得簡單高效,減少訓(xùn)練過程耗費(fèi)的時(shí)間和精力,讓企業(yè)以很少的投入就能使用機(jī)器學(xué)習(xí)帶來的諸多便利和優(yōu)勢。接下來,我們通過具體的操作來介紹Amazon SageMaker云上機(jī)器學(xué)習(xí)開發(fā)平臺(tái)的優(yōu)勢。

三、云上機(jī)器學(xué)習(xí)開發(fā)平臺(tái)實(shí)戰(zhàn)

2020年4月底,亞馬遜云科技在中國區(qū)的光環(huán)新網(wǎng)和西云數(shù)據(jù)都上線了Amazon SageMaker。為便于通俗講解,這里選用亞馬遜云科技全球區(qū)域的個(gè)人賬戶來進(jìn)行實(shí)操。中國區(qū)域的Amazon SageMaker服務(wù)和全球區(qū)域的絕大部分服務(wù)是一樣的,除了暫不提供數(shù)據(jù)標(biāo)注(Labelling)以外,大部分與全球版的一致。

亞馬遜云科技于2017年首次發(fā)布了Amazon SageMaker,自此就不斷“迭代”更新。它提供從數(shù)據(jù)準(zhǔn)備、模型構(gòu)建、模型訓(xùn)練/調(diào)優(yōu)、到模型部署推理等全流程支持。 

 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

其中,數(shù)據(jù)準(zhǔn)備能提供的服務(wù)就是數(shù)據(jù)標(biāo)注,畢竟現(xiàn)在的機(jī)器學(xué)習(xí)還是以監(jiān)督式學(xué)習(xí)為主,這一服務(wù)與Amazon Mechanical Turk的數(shù)據(jù)標(biāo)注外包服務(wù)有關(guān)聯(lián),同時(shí)還提供了自動(dòng)數(shù)據(jù)標(biāo)注的能力。

模型構(gòu)建和訓(xùn)練到部署,大部分都是在托管的Jupyter Notebook里完成的,以致于有人誤以為Amazon SageMaker就只是亞馬遜云科技托管的Jupyter Notebook。

1,Amazon SageMaker初步利用了云的優(yōu)勢

接下來,我們創(chuàng)建Notebook instances實(shí)例來實(shí)戰(zhàn)體驗(yàn)一下,看看Amazon SageMaker是怎么利用云的優(yōu)勢打造AI方案的。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 開啟Amazon SageMaker ,創(chuàng)建一個(gè)實(shí)例。系統(tǒng)默認(rèn)的實(shí)例類型是ml.t2.medium,Inference推理的實(shí)例可以暫不設(shè)置,權(quán)限和網(wǎng)絡(luò)設(shè)置部分也可以不作修改。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 Amazon SageMaker的控制臺(tái)可以控制實(shí)例,停止或者啟動(dòng),也可以控制各種相關(guān)資源。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 啟動(dòng)完成后打開Jupyter,可以看到上圖。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

點(diǎn)擊打開JupyterLab,如上圖所示。

 Amazon SageMaker托管的Jupyter和JupyterLab與本地版本在外觀上沒太多區(qū)別,最大的不同在于,Amazon SageMaker托管的版本多了許多示例代碼。

出于演示的目的,我們找一個(gè)操作簡單,步驟清晰的示例代碼,用K-means聚類算法和經(jīng)典的MNIST數(shù)據(jù)集訓(xùn)練一個(gè)分類模型,識(shí)別手寫體圖片里的數(shù)字。

以下是訓(xùn)練過程: 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 第一步,設(shè)置運(yùn)行環(huán)境,賦予必要的權(quán)限。值得注意的是,這里引入Amazon SageMaker自己的SDK,簡單理解為賦予了notebook使用亞馬遜云科技資源的能力,包括各種硬件資源,還有亞馬遜云科技內(nèi)置的一些算法,需要了解這一套SDK才能用的更方便。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 第二步驟是導(dǎo)入各種工具包,對(duì)用來訓(xùn)練的數(shù)據(jù)進(jìn)行初步的探索,這部分與亞馬遜云科技資源無關(guān)。 

 圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 第三步可以查看數(shù)據(jù)的樣子,如上圖的MNIST數(shù)據(jù)集的一張圖片,MINIST數(shù)據(jù)集本身包含70萬張28 x 28 像素的手寫體圖片。 

  圖片來源于亞馬遜云科技全球網(wǎng)站截圖

 第四步,主要是設(shè)置訓(xùn)練的參數(shù),包括設(shè)置輸入數(shù)據(jù)和輸出模型的位置,設(shè)置訓(xùn)練所需實(shí)例的數(shù)量和實(shí)例的類型“ml.c4.xlarge”,已知0-9是十個(gè)數(shù)字,k值就是10,至此,模型構(gòu)建完畢。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

 

 

第五步,調(diào)用.fit函數(shù)完成訓(xùn)練,耗時(shí)大約4分鐘。 

 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

第六步,將訓(xùn)練好的模型部署在實(shí)例上供后續(xù)調(diào)用模型推理。 

 

 

第七部分,從驗(yàn)證集數(shù)據(jù)里選出100個(gè)數(shù)據(jù),用模型將其分到0-9,一共10個(gè)類別里去,分類效果如下圖所示。 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)

 圖片來源于亞馬遜云科技全球網(wǎng)站截圖

 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

可以看到,彼此相似的圖片被分到一個(gè)類別里。肉眼可見其中是有一定規(guī)律的,但許多數(shù)字不一樣,誤差還挺大的。

實(shí)際機(jī)器學(xué)習(xí)的訓(xùn)練過程中,需要機(jī)器學(xué)習(xí)專家來不斷減小誤差,而且,K-means算法在這里其實(shí)不是特別合適,作為數(shù)據(jù)科學(xué)家你需要找到合適算法,然后,還需要不斷調(diào)整超參數(shù),以獲取表現(xiàn)最佳的模型。

這個(gè)過程其實(shí)非常繁瑣且復(fù)雜,耗時(shí)耗力,對(duì)于這部分需求,亞馬遜云科技的Amazon SageMaker在超參數(shù)優(yōu)化階段提供了自動(dòng)化操作,可以以貝葉斯和隨機(jī)搜索的方式自己調(diào)優(yōu)超參數(shù),這部分內(nèi)容我們會(huì)在下面內(nèi)容中提到。

其實(shí)Amazon SageMaker托管的Jupyter Notebook在本地機(jī)器上也完全可以部署,兩者的區(qū)別在于,亞馬遜云科技包裝了操作云資源的類庫,可以直接調(diào)用亞馬遜云科技的各種資源。本次實(shí)驗(yàn)中,我們直接調(diào)用了2個(gè)ml.c4.xlarge實(shí)例來做訓(xùn)練,訓(xùn)練耗時(shí)僅需四分鐘,模型部署階段使用的是ml.m4.xlarge,也完全可以指定規(guī)格的實(shí)例。

如果是只在本地訓(xùn)練的話,就只能調(diào)用本地的資源,無論是多大規(guī)模的訓(xùn)練量,都只有有限的資源可以使用,為了應(yīng)對(duì)偶爾的計(jì)算量峰值,不得不購買更多資源,于是,在大多數(shù)時(shí)候忍受較低的資源使用率。浪費(fèi)就意味著產(chǎn)生了額外成本。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 

訓(xùn)練完成后的最后一步,記得清理掉部署模型的Endpoint。

這里Amazon SageMaker主要發(fā)揮出了云計(jì)算本身的優(yōu)勢,計(jì)算資源召之即來揮之即去,按照使用量來付費(fèi)。但這只是簡單初步利用了云的特點(diǎn),云上服務(wù)并沒有帶來太多額外的功能,因?yàn)樵趯?shí)際使用中,還有許多麻煩的問題沒有解決,比如訓(xùn)練過程反復(fù)優(yōu)化超參數(shù)的過程非常費(fèi)時(shí)費(fèi)力,非常的不人性化,Amazon SageMaker Studio的出現(xiàn)真正就是為了解決此類問題。

2,Amazon SageMaker Studio才真正發(fā)揮了云的優(yōu)勢

Amazon SageMaker Studio是一個(gè)Web端的IDE工具,跟所有開發(fā)工具一樣,集成了開發(fā)環(huán)境,能寫代碼,能做Debug,能看運(yùn)行效果。

(1) 便捷的開發(fā)環(huán)境 

 圖片來源于亞馬遜云科技全球網(wǎng)站截圖

創(chuàng)建并運(yùn)行Amazon SageMaker Studio,上圖是Amazon SageMaker Studio的起始界面,與JupyterLab界面相似度很高,不過,亞馬遜云科技在這里做了許多改動(dòng),加入了亞馬遜云科技自有的許多高級(jí)操作。  

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

比如,在Launcher窗口提供了各種容器鏡像可選,有TensorFlow、PyTorch以及MXNet各種常見的機(jī)器學(xué)習(xí)框架可用,這些環(huán)境都是配置好的,省去了自己配置的麻煩,除了默認(rèn)的CPU版本,還有GPU的版本可選。

要知道,在本地自己配置的時(shí)候,無論是Windows上還是Linux上,如果想支持GPU的話,都需要一番繁瑣的操作,有過親身經(jīng)歷的人都會(huì)有比較深入的印象的,現(xiàn)在TensorFlow GPU版本可以以容器方式部署了,但也只支持在Linux上操作。  

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

本地Jupyter Notebook切換Kernel的操作 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

這里鏡像的概念在Jupyter Notebook的上下文里,其實(shí)是一個(gè)個(gè)單獨(dú)的Jupyter Kernel,可以隨時(shí)進(jìn)行切換,這里的鏡像也都是隨時(shí)可以切換的。跟標(biāo)準(zhǔn)版本Jupyter Notebook里切換Kernel是一個(gè)概念。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖  

Amazon SageMaker Studio不僅可以隨時(shí)切換Kernel,還可以隨時(shí)修改主機(jī)配置,如上圖所示,列出的四個(gè)是支持快速切換的主機(jī),另外還有25個(gè)主機(jī)配置的啟動(dòng)速度稍慢。本地原生的Jupyter不支持這一操作,這是Amazon SageMaker Studio獨(dú)有的優(yōu)勢。 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖 

 

每次新打開一個(gè)Notebook的時(shí)候,都需要單獨(dú)配置Kernel和主機(jī),當(dāng)不需要的時(shí)候,可以隨時(shí)shut down,也就不再計(jì)費(fèi)了,也就是我們所說的召之即來揮之即去。

至此,我們的開發(fā)環(huán)境就準(zhǔn)備好了。

(2)訓(xùn)練過程的記錄和回溯——Experiments

Amazon SageMaker Studio最突出的能力是能解決機(jī)器學(xué)習(xí)過程中許多繁瑣的問題,我們接下來通過一系列操作介紹這些新的功能。

我們通過創(chuàng)建一個(gè)AutoML實(shí)驗(yàn)來看:  

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

將準(zhǔn)備好的訓(xùn)練數(shù)據(jù)傳到s3上,選擇Bucket的名字,還有文件train.csv。這里使用的訓(xùn)練數(shù)據(jù)從Kaggle上下載來的,是泰坦尼克乘客救援情況數(shù)據(jù)。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

然后,選擇要預(yù)測的參數(shù)是哪一列,這里選擇的是Survived,就是看一個(gè)人是否獲救了。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn) 

 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

然后選擇我們要處理的是什么問題,而不用選擇具體的算法,可以指出是分類還是回歸,是二分類還是多分類任務(wù),是否需要一個(gè)完整的實(shí)驗(yàn),默認(rèn)選項(xiàng)即可,最后點(diǎn)擊創(chuàng)建,自動(dòng)化的機(jī)器學(xué)習(xí)就開始了。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

從分析數(shù)據(jù)開始,然后進(jìn)入特征提取工程階段,模型調(diào)優(yōu)階段,最后就完成了,過程耗時(shí)較長,需要亞馬遜云科技自己的機(jī)器學(xué)習(xí)平臺(tái)來完成的所有操作,比如,訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集、還有測試數(shù)據(jù)及的劃分,算法的選擇,超參數(shù)的優(yōu)化等等,所有操作交給亞馬遜云科技來完成。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

經(jīng)過一個(gè)小時(shí),經(jīng)過數(shù)不清多少次的嘗試后,系統(tǒng)能找到表現(xiàn)最好的那次嘗試(如上圖星標(biāo)所示),上圖只展示了二十來個(gè)Tuning job(可譯作調(diào)優(yōu)負(fù)載),每個(gè)Tuning job對(duì)應(yīng)一個(gè)訓(xùn)練出來的模型。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

整個(gè)訓(xùn)練過程都有記錄,如上圖所示,可以查看某次實(shí)驗(yàn)嘗試使用的一些參數(shù),看到更多關(guān)于訓(xùn)練過程,訓(xùn)練模型相關(guān)的更多細(xì)節(jié)。

這些嘗試都是自動(dòng)進(jìn)行的,而在實(shí)際訓(xùn)練當(dāng)中,可能會(huì)有數(shù)不清次數(shù)的嘗試,手動(dòng)記錄不太現(xiàn)實(shí),而且容易錯(cuò)亂,SageMaker Experiments可以隨時(shí)記錄和查看這些過程。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

找到最滿意的那次嘗試后,可以通過一些簡單的設(shè)置完成最后的部署。

(3)自動(dòng)化的超參數(shù)調(diào)優(yōu)Hyperparameter Tuning與自動(dòng)化的機(jī)器學(xué)習(xí) Autopilot 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

上文提到了超參數(shù)優(yōu)化(hyperparameter tuning job)的操作,其實(shí)在Amazon SageMaker的控制臺(tái)窗口也可以自己創(chuàng)建自動(dòng)化的超參數(shù)優(yōu)化負(fù)載,如上圖,我們剛才自動(dòng)化的機(jī)器學(xué)習(xí)過程中也會(huì)創(chuàng)建這樣的任務(wù)。

可見,自動(dòng)化機(jī)器學(xué)習(xí)的部分工作任務(wù)也是靠自動(dòng)化的超參數(shù)優(yōu)化。不過,自動(dòng)化機(jī)器學(xué)習(xí)更高級(jí)一些,還會(huì)自動(dòng)挑選算法,會(huì)自行設(shè)定超參數(shù)優(yōu)化的一些參數(shù)。當(dāng)手動(dòng)創(chuàng)建超參數(shù)優(yōu)化負(fù)載的時(shí)候,這些都需要機(jī)器學(xué)習(xí)專家自己手動(dòng)設(shè)置。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

創(chuàng)建超參數(shù)優(yōu)化負(fù)載的關(guān)鍵是選擇算法,可以用Amazon SageMaker自帶的算法,也可以用自己創(chuàng)建的算法。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

配置算法對(duì)應(yīng)的超參數(shù),設(shè)定待優(yōu)化的目標(biāo)值,這里設(shè)置的是準(zhǔn)確度。

Amazon SageMaker的超參數(shù)優(yōu)化功能自動(dòng)調(diào)參,省去人力手工操作的麻煩,而且能同時(shí)啟用多個(gè)訓(xùn)練任務(wù)來節(jié)省時(shí)間,還能設(shè)置使用Spot實(shí)例來節(jié)省費(fèi)用。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn) 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

 任務(wù)完成后,可以得到配置好的一組超參數(shù)組合,用于后續(xù)的訓(xùn)練。

(4)訓(xùn)練階段的Debugger

自動(dòng)化的機(jī)器學(xué)習(xí)雖然很方便,但由于支持場景相對(duì)有限,而且,訓(xùn)練過程相對(duì)不那么透明,因此雖然SageMaker Experiments能記錄訓(xùn)練的過程固然有幫助,但大多數(shù)時(shí)候還是需要手寫代碼來完成訓(xùn)練過程的。

Amazon SageMaker Studio可以Debug模型訓(xùn)練過程,一直以來,機(jī)器學(xué)習(xí)的訓(xùn)練過程可見度都很低,基本處于黑盒狀態(tài),常見的只能看見loss和accuracy值,其他部分的能見度比較低。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

在訓(xùn)練階段,使用Amazon SageMaker SDK還可以監(jiān)控模型的訓(xùn)練過程,比如上圖中顯示的是在訓(xùn)練過程中卷積層的梯度分布,開始是高斯分布,但后來梯度的范圍越來越小,這時(shí)候就需要修改超參數(shù)了,如果能在訓(xùn)練的時(shí)候就發(fā)現(xiàn)這一問題,就不用等到訓(xùn)練完成后再修改了。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn)  

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

SageMaker Debugger工具使用起來其實(shí)也比較簡單,如上圖所示,在實(shí)際代碼中,設(shè)置estimator的時(shí)候,需要多添加幾個(gè)配置參數(shù)即可獲取到訓(xùn)練時(shí)候的一些Tensor數(shù)據(jù),獲取數(shù)據(jù)后就可以進(jìn)行一些展示。

(5)監(jiān)控模型運(yùn)行效果 

 云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn) 

 圖片來源于亞馬遜云科技全球網(wǎng)站截圖

在實(shí)際生產(chǎn)過程中,部署并不是最后一個(gè)環(huán)節(jié),而只是許多工作的開始,Amazon SageMaker可以提供線上模型監(jiān)控能力,監(jiān)控模型運(yùn)行的狀況,如果數(shù)據(jù)發(fā)生變化,導(dǎo)致模型適用性有偏差,則需要重新訓(xùn)練,這在亞馬遜云科技上可以通過構(gòu)建Pipeline來實(shí)現(xiàn)。

(6)分享協(xié)作 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn) 

 圖片來源于亞馬遜云科技全球網(wǎng)站截圖

機(jī)器學(xué)習(xí)的過程難免會(huì)有些問題,把賬號(hào)分享給別人也不太現(xiàn)實(shí),為了便于分享協(xié)作,Amazon SageMaker Studio在每個(gè)Notebook的右上角都添加了分享按鈕。

 云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn) 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

在創(chuàng)建Amazon SageMaker Studio的時(shí)候需要設(shè)置domain,在同一個(gè)domain下的用戶可以共享協(xié)作,比如在公司內(nèi)部跟同事做分享,接受分享的用戶看到的所有內(nèi)容與分享者看到的是完全一樣的,便于協(xié)作共享,無需額外配置,這點(diǎn)是本地機(jī)器學(xué)習(xí)環(huán)境中絕對(duì)做不到的。

(7)資源控制

Amazon SageMaker所有的資源都可以在控制臺(tái)看到并進(jìn)行管理,如果只是實(shí)驗(yàn)階段的話,建議在嘗試之后關(guān)掉相關(guān)資源來管理成本,在生產(chǎn)環(huán)境中,可以清楚看到各種資源的用量并進(jìn)行管理,使得整體成本更容易控制。

四、總結(jié)評(píng)估

Amazon SageMaker上可以完成全流程的訓(xùn)練,我們也可以將原有的模型部署到Amazon SageMaker的endpoint服務(wù)器上,如果也不想自己訓(xùn)練模型,可以直接用亞馬遜云科技以SaaS方式提供的AI能力,還可以在Marketplace上拿別人模型來用。

Amazon SageMaker側(cè)重的是訓(xùn)練、調(diào)優(yōu)和部署階段的能力,可以降本增效。一方面,Amazon SageMaker可以使用Spot Instance來降低成本;另一方面,如果只想在云上部署模型,也可以直接使用Elastic Inference降低模型部署后的推理成本。而在效率提升方面,Amazon SageMaker Experiments、自動(dòng)化的機(jī)器學(xué)習(xí)能力、還有各種規(guī)格的云上資源等,都能提升效率。

最后需要說明的是,亞馬遜云科技的云上人工智能/機(jī)器學(xué)習(xí)棧是一個(gè)完整的系列,上中下一共由三個(gè)層次構(gòu)成。本次評(píng)估中談到的Amazon SageMaker只是中間一層的“機(jī)器學(xué)習(xí)服務(wù)層”。在其之下的底層,提供的是對(duì)各類框架的支持、對(duì)CPU/GPU的彈性支持等基礎(chǔ)算力方面的服務(wù)。 

 

云上高級(jí)應(yīng)用篇:AWS云上人工智能創(chuàng)新實(shí)戰(zhàn) 

 

圖片來源于亞馬遜云科技全球網(wǎng)站截圖

比如用戶單純想將本地的訓(xùn)練搬到云上,也可以不使用完全托管的Amazon SageMaker而可以用EC2以及一個(gè)支持TensorFlow、PyTorch,MXNET的Linux鏡像(雖然這可能給后續(xù)機(jī)器學(xué)習(xí)的開發(fā)帶來更多額外工作)。

在中間層SageMaker之上的,是“AI服務(wù)層”,提供了許多易用的AI服務(wù),比如用于圖像及視頻分析的Amazon Rekognition, 用于文檔內(nèi)容識(shí)別的OCR工具Amazon Traxtract, 用于翻譯的Amazon Translate, 用于文字轉(zhuǎn)語音的Amazon Polly, 用于金融反欺詐的Amazon Fraud Detection, 用于碼農(nóng)優(yōu)化代碼的Amazon CodeGuru……, 等等。

這些應(yīng)用導(dǎo)向的AI服務(wù)的提供,極大方便了AI在各類企業(yè)應(yīng)用中的推廣。(具體可參考https://amazonaws-china.com/cn/machine-learning/ai-services/ )

 

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2020-10-29 15:06:43

AWS人工智能云計(jì)算

2021-10-13 10:50:50

亞馬遜云科技啟元世界AI

2024-07-31 17:57:42

2022-10-19 07:04:12

?人工智能云服務(wù)Alaas

2020-09-21 17:29:42

云計(jì)算

2025-01-08 15:28:23

2024-06-07 17:42:29

2024-03-29 12:44:11

2023-10-18 14:15:43

人工智能云計(jì)算

2018-03-23 09:14:46

人工智能云計(jì)算機(jī)器學(xué)習(xí)

2017-02-08 15:59:11

人工智能機(jī)器

2018-07-24 16:39:47

華為云AIAI上有信仰的云

2018-07-27 11:07:08

華為云

2020-12-18 11:03:44

云計(jì)算人工智能

2022-09-29 20:47:10

亞馬遜云科技

2022-12-16 11:25:25

亞馬遜云科技芯片虛擬化

2024-06-14 12:54:34

2018-07-24 16:12:09

華為云

2022-08-17 17:23:19

亞馬遜云科技游戲人工智能

2022-09-01 17:57:01

亞馬遜云科技
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)