AWS云上輸出機(jī)器學(xué)習(xí)的黃金工具:Amazon SageMaker正式落地中國(guó)
本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請(qǐng)至雷鋒網(wǎng)官網(wǎng)申請(qǐng)授權(quán)。
我們正在開(kāi)啟機(jī)器學(xué)習(xí)的黃金時(shí)代。”
AWS首席云計(jì)算企業(yè)戰(zhàn)略顧問(wèn)張俠博士表示,以前阻礙機(jī)器學(xué)習(xí)在現(xiàn)實(shí)世界應(yīng)用的許多限制開(kāi)始消失。全球各地的公司,從初創(chuàng)公司到大型企業(yè),部署機(jī)器學(xué)習(xí)應(yīng)用程序幾乎是普遍的重中之重。
幾乎每一個(gè)行業(yè)和細(xì)分市場(chǎng),都開(kāi)始將機(jī)器學(xué)習(xí)應(yīng)用于其工作負(fù)載,從數(shù)據(jù)中獲得更多價(jià)值,獲得洞察,提升業(yè)務(wù)。機(jī)器學(xué)習(xí)的黃金時(shí)代也是AWS的黃金時(shí)代。
機(jī)器學(xué)習(xí)黃金時(shí)代的AWS
“目前有數(shù)萬(wàn)家全球各種各樣的企業(yè)選擇AWS來(lái)運(yùn)行機(jī)器學(xué)習(xí)的負(fù)載,據(jù)我們所知,采用AWS機(jī)器學(xué)習(xí)的客戶數(shù)量高于任何其他廠商至少兩倍。”AWS首席云計(jì)算企業(yè)戰(zhàn)略顧問(wèn)張俠表示。
人工智能大概率成為確定性事件,越來(lái)越多的企業(yè)內(nèi)部開(kāi)始運(yùn)行深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等負(fù)載,亞馬遜是最早的一批企業(yè),自電商時(shí)代起始,亞馬遜的商品推薦、搜索、物流配送等業(yè)務(wù)都融入了機(jī)器學(xué)習(xí),誕生出送貨機(jī)器人、Amazon Echo、Amazon GO等產(chǎn)品和業(yè)務(wù)。
相對(duì)來(lái)說(shuō),機(jī)器學(xué)習(xí)對(duì)企業(yè)仍然是一項(xiàng)非常復(fù)雜的工作,大多數(shù)企業(yè)并不具備獨(dú)立開(kāi)發(fā)機(jī)器學(xué)習(xí)模型的能力,AWS等廠商則扮演“云梯”的角色。
比如開(kāi)發(fā)者和數(shù)據(jù)科學(xué)家首先必須對(duì)數(shù)據(jù)進(jìn)行可視化、轉(zhuǎn)換和預(yù)處理,這些數(shù)據(jù)才能變成算法可以使用的格式,用以訓(xùn)練模型;從選擇和優(yōu)化算法,到調(diào)節(jié)影響模型準(zhǔn)確性的數(shù)百萬(wàn)個(gè)參數(shù),訓(xùn)練模型的所有階段都需要大量的人力和猜測(cè);在應(yīng)用程序中部署訓(xùn)練好的模型時(shí),客戶又需要另一套應(yīng)用設(shè)計(jì)和分布式系統(tǒng)方面的專業(yè)技能。
此外,隨著數(shù)據(jù)集和變量數(shù)的增加,模型會(huì)過(guò)時(shí),客戶又必須一次又一次地重新訓(xùn)練模型,讓模型從新的信息中學(xué)習(xí)和進(jìn)化。所有這些工作都需要大量的專業(yè)知識(shí),并耗費(fèi)龐大的算力、數(shù)據(jù)存儲(chǔ)和時(shí)間成本。而且,由于沒(méi)有集成化的工具用于整個(gè)機(jī)器學(xué)習(xí)的工作流,機(jī)器學(xué)習(xí)模型的傳統(tǒng)開(kāi)發(fā)方式是復(fù)雜、繁復(fù)和昂貴的。
AWS提供的機(jī)器學(xué)習(xí)解決方案是一個(gè)包括三層的服務(wù)堆棧。
底層是機(jī)器學(xué)習(xí)框架和基礎(chǔ)架構(gòu),AWS支持TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras等機(jī)器學(xué)習(xí)框架。在基礎(chǔ)架構(gòu)方面,AWS虛機(jī)提供各種各樣的實(shí)例,同時(shí)提供現(xiàn)成的亞馬遜機(jī)器鏡像AMI(Amazon Machine Image)。
張俠表示,“我們的策略是全方位的支持各種各樣的開(kāi)源框架,因?yàn)椴煌目蚣苡胁煌奶攸c(diǎn)、不同的使用場(chǎng)景,所以我們并不局限于某一個(gè)框架,而是全方位支持。”
AWS機(jī)器學(xué)習(xí)解決方案上層是訓(xùn)練好的人工智能服務(wù),這些服務(wù)主要解決與人類認(rèn)知相關(guān)的典型問(wèn)題。例如,計(jì)算機(jī)視覺(jué)方面的服務(wù),可以識(shí)別圖像或視頻中的對(duì)象、人員、文本、場(chǎng)景、活動(dòng)和不安全或不適宜的內(nèi)容。個(gè)性化推薦服務(wù)可以從庫(kù)存中向消費(fèi)者推薦多種產(chǎn)品和服務(wù)??蛻艨梢灾苯釉谄鋺?yīng)用中調(diào)用AWS提供的這些人工智能服務(wù),而無(wú)需關(guān)注服務(wù)背后的機(jī)器學(xué)習(xí)模型。
中間層是機(jī)器學(xué)習(xí)服務(wù),主要目標(biāo)是消除機(jī)器學(xué)習(xí)過(guò)程中的繁重工作,讓開(kāi)發(fā)高質(zhì)量模型變得更加輕松。依靠的是Amazon SageMaker托管服務(wù),也是本次AWS強(qiáng)調(diào)的重點(diǎn)。
Amazon SageMaker落地中國(guó)
張俠介紹,制約人工智能廣泛應(yīng)用的因素有三個(gè)方面,導(dǎo)致缺乏低成本、易使用、可擴(kuò)展的人工智能產(chǎn)品和服務(wù),分別是:
-
掌握人工智能專業(yè)知識(shí)的人才不足;
-
構(gòu)建和擴(kuò)展人工智能的技術(shù)產(chǎn)品有難度;
-
在生產(chǎn)經(jīng)營(yíng)中部署人工智能應(yīng)用費(fèi)時(shí)且成本高。
Amazon SageMaker就是為了消除機(jī)器學(xué)習(xí)各步驟的繁重工作而來(lái)。5月12日,AWS宣布Amazon SageMaker在由西云數(shù)據(jù)運(yùn)營(yíng)的AWS中國(guó) (寧夏) 區(qū)域和光環(huán)新網(wǎng)運(yùn)營(yíng)的AWS中國(guó)(北京)區(qū)域正式上線。
通過(guò)預(yù)置的Notebook、針對(duì)PB級(jí)數(shù)據(jù)集優(yōu)化的常用算法,以及自動(dòng)模型調(diào)優(yōu),Amazon SageMaker降低了模型構(gòu)建和訓(xùn)練的難度。并且,Amazon SageMaker簡(jiǎn)化和加快了模型訓(xùn)練過(guò)程,可以通過(guò)自動(dòng)提供和管理基礎(chǔ)設(shè)施來(lái)訓(xùn)練模型和運(yùn)行推理。
同時(shí),AWS 最近宣布了多項(xiàng)重要功能和高級(jí)特性,讓客戶能夠更輕松地構(gòu)建、訓(xùn)練、調(diào)優(yōu)和部署機(jī)器學(xué)習(xí)模型。這些功能包括:
-
面向機(jī)器學(xué)習(xí)的集成開(kāi)發(fā)環(huán)境(IDE):Amazon SageMaker Studio將所有用于機(jī)器學(xué)習(xí)的組件集中,開(kāi)發(fā)者可以在Amazon SageMaker Studio中查看和組織源代碼、依賴項(xiàng)、文檔和其它應(yīng)用程序資產(chǎn),Amazon SageMaker Studio使構(gòu)建、訓(xùn)練、解釋、檢查、監(jiān)視、調(diào)試和運(yùn)行機(jī)器學(xué)習(xí)模型變得更簡(jiǎn)單、更快。
-
彈性筆記本:Amazon SageMaker Notebooks提供了一鍵啟用的Jupyter Notebook,具有秒級(jí)的彈性計(jì)算提升能力,讓開(kāi)發(fā)者可以輕松地調(diào)高或降低Notebook需要的算力(包括GPU加速),這些調(diào)整在后臺(tái)自動(dòng)發(fā)生,不會(huì)打斷開(kāi)發(fā)者的工作。Amazon SageMaker Notebook還可以自動(dòng)復(fù)制特定環(huán)境和庫(kù)依賴項(xiàng),實(shí)現(xiàn)Notebook一鍵共享。
-
實(shí)驗(yàn)管理:Amazon SageMaker Experiments可以幫助開(kāi)發(fā)者組織和跟蹤機(jī)器學(xué)習(xí)模型的迭代。Amazon SageMaker Experiments自動(dòng)捕獲輸入?yún)?shù)、配置和結(jié)果,并將它們存儲(chǔ)為“實(shí)驗(yàn)”,幫助開(kāi)發(fā)者管理這些迭代。Amazon SageMaker Experiments使開(kāi)發(fā)者更容易快速迭代和開(kāi)發(fā)高質(zhì)量的模型。
-
調(diào)試與分析:Amazon SageMaker Debugger用于調(diào)試和分析模型訓(xùn)練,提高準(zhǔn)確性,減少訓(xùn)練時(shí)間,讓開(kāi)發(fā)者更好地理解模型。使用Amazon SageMaker Debugger,在Amazon SageMaker中訓(xùn)練的模型將自動(dòng)發(fā)出收集到的關(guān)鍵指標(biāo),Amazon SageMaker Debugger也可幫助開(kāi)發(fā)者解讀模型是如何工作的,向神經(jīng)網(wǎng)絡(luò)的可解釋性邁出了第一步。
-
自動(dòng)構(gòu)建模型:Amazon SageMaker Autopilot是業(yè)內(nèi)首個(gè)可以讓開(kāi)發(fā)者對(duì)其模型保持控制和可見(jiàn)性的自動(dòng)化機(jī)器學(xué)習(xí)功能。Amazon SageMaker Autopilot會(huì)自動(dòng)檢查原始數(shù)據(jù),應(yīng)用特征處理器,挑選最佳算法集,訓(xùn)練多個(gè)模型,對(duì)它們進(jìn)行調(diào)優(yōu),跟蹤其性能,然后根據(jù)性能對(duì)模型進(jìn)行排名,開(kāi)發(fā)者能夠針對(duì)應(yīng)用場(chǎng)景選擇最佳模型,并且可以結(jié)合不同的優(yōu)化因子考慮多個(gè)候選模型。
-
概念漂移檢測(cè):Amazon SageMaker Model Monitor允許開(kāi)發(fā)者檢測(cè)和糾正概念漂移(concept drift)。開(kāi)發(fā)者可以使用Amazon SageMaker Model Monitor的開(kāi)箱即用功能檢測(cè)漂移,也可以為Amazon SageMaker Model Monitor編寫(xiě)自己的規(guī)則用于監(jiān)測(cè)。Amazon SageMaker Model Monitor讓開(kāi)發(fā)者更容易調(diào)整訓(xùn)練數(shù)據(jù)或算法以解決概念漂移問(wèn)題。
IDC報(bào)告指出,中國(guó)人工智能市場(chǎng)已成為全球第二大人工智能單一市場(chǎng),并且市場(chǎng)規(guī)模還在保持高速增長(zhǎng)。當(dāng)前40%的企業(yè)數(shù)字化轉(zhuǎn)型項(xiàng)目都會(huì)運(yùn)用人工智能,人工智能將成為各業(yè)務(wù)部門(mén)不可或缺的一部分,推動(dòng)大規(guī)模創(chuàng)新并實(shí)現(xiàn)巨大的商業(yè)價(jià)值。