自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)新范式:MLOps究竟是什么?

大數(shù)據(jù)
數(shù)字化將DataOps這一概念引入人們生活的同時(shí),大數(shù)據(jù)正引入一種新的范式——MLOps。

本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)。

數(shù)字化將DataOps這一概念引入人們生活的同時(shí),大數(shù)據(jù)正引入一種新的范式——MLOps。鑒于DevOps和DataOps在實(shí)踐中越來越多的運(yùn)用,該項(xiàng)業(yè)務(wù)需要機(jī)器學(xué)習(xí)模型使用過程中的所有參與者一直保持合作與互動(dòng),包括業(yè)務(wù)人員、工程師、大數(shù)據(jù)開發(fā)人員(數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)專家)。

[[358454]]

MLOps還是一個(gè)比較新的概念,但人們對它的需求卻在與日俱增。2018年左右,在谷歌舉辦的一場演講之后,業(yè)內(nèi)專業(yè)人士首次公開談及工業(yè)運(yùn)行(生產(chǎn))中機(jī)器學(xué)習(xí)生命周期集成化管理的必要性。

將機(jī)器學(xué)習(xí)模型引入實(shí)際業(yè)務(wù)這一實(shí)踐,并不局限于數(shù)據(jù)準(zhǔn)備、開發(fā)、神經(jīng)網(wǎng)絡(luò)或其他機(jī)器學(xué)習(xí)算法的訓(xùn)練方面。從驗(yàn)證數(shù)據(jù)集,再到可靠的大數(shù)據(jù)生產(chǎn)環(huán)境下測試和部署數(shù)據(jù)集,產(chǎn)品解決方案的質(zhì)量受到諸多因素的影響。

大數(shù)據(jù)新范式:MLOps究竟是什么?

這意味著,預(yù)測或分類的實(shí)際結(jié)果不僅取決于數(shù)據(jù)科學(xué)家提出的神經(jīng)網(wǎng)絡(luò)架構(gòu)和機(jī)器學(xué)習(xí)方法,還取決于開發(fā)團(tuán)隊(duì)如何實(shí)現(xiàn)這一模型,以及管理員如何在集群環(huán)境中部署這一模型。輸入數(shù)據(jù)的質(zhì)量,接收數(shù)據(jù)的來源、渠道和頻率也很重要,這都屬于數(shù)據(jù)工程師的職責(zé)范圍。

在機(jī)器學(xué)習(xí)解決方案的開發(fā)、測試、部署和支持過程中,多學(xué)科專家在互動(dòng)中會遇到許多組織難題和技術(shù)障礙,這不僅延長了產(chǎn)品創(chuàng)建的時(shí)間,還降低了產(chǎn)品帶給該項(xiàng)業(yè)務(wù)的實(shí)際價(jià)值。

為了消除這些障礙,MLOps這一概念應(yīng)運(yùn)而生。與DevOps和DataOps類似,MLOps旨在提高自動(dòng)化程度和工業(yè)機(jī)器學(xué)習(xí)解決方案的質(zhì)量,同時(shí)兼顧監(jiān)管需求和業(yè)務(wù)利益。

因此,MLOps是結(jié)合系統(tǒng)開發(fā)和運(yùn)營支持(包括集成、測試、發(fā)布、部署、基礎(chǔ)設(shè)施管理等操作),以實(shí)現(xiàn)機(jī)器學(xué)習(xí)系統(tǒng)生命周期復(fù)合化和自動(dòng)化管理的文化理念和應(yīng)用實(shí)例。

可以說,MLOps借助敏捷的方法和技術(shù)工具擴(kuò)展了CRISP-DM方法論(CRISP-DM跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程),從而可以自動(dòng)執(zhí)行包括數(shù)據(jù)、機(jī)器學(xué)習(xí)模型、代碼和環(huán)境在內(nèi)的操作。

這些工具中包括了Cloudera公司的數(shù)據(jù)科學(xué)工作臺——ClouderaData Science Workbench,將MLOps付諸實(shí)踐有助于數(shù)據(jù)科學(xué)家在CRISP-DM經(jīng)典階段規(guī)避常見陷阱和問題。

MLOps帶給業(yè)務(wù)和數(shù)據(jù)科學(xué)的十大好處

實(shí)施MLOps帶來的所有好處中,最為突出的是機(jī)器學(xué)習(xí)工業(yè)部署細(xì)節(jié)中的敏捷方法:

  • 通過可靠且有效的機(jī)器學(xué)習(xí)生命周期管理,減少時(shí)間,從而得到高質(zhì)量結(jié)果。
  • 持續(xù)開發(fā)(CD)、持續(xù)集成(CI)、持續(xù)訓(xùn)練(CT)方法和工具保障了工作流程和模型的可重復(fù)性。
  • 隨時(shí)隨地輕松部署高精度機(jī)器學(xué)習(xí)模型。
  • 集成管理系統(tǒng)可連續(xù)監(jiān)測機(jī)器學(xué)習(xí)資源。
  • 消除組織障礙,匯聚多學(xué)科機(jī)器學(xué)習(xí)專家的經(jīng)驗(yàn)。

因此,使用MLOps可以優(yōu)化以下機(jī)器學(xué)習(xí)操作:

  • 統(tǒng)一機(jī)器學(xué)習(xí)模型和關(guān)聯(lián)軟件產(chǎn)品的發(fā)布周期。
  • 自動(dòng)測試機(jī)器學(xué)習(xí)組件,如數(shù)據(jù)驗(yàn)證、測試機(jī)器學(xué)習(xí)模型本身、及其集成到產(chǎn)品解決方案的過程。
  • 在機(jī)器學(xué)習(xí)項(xiàng)目中踐行敏捷原則。
  • 在CI、CD、CT系統(tǒng)中支持機(jī)器學(xué)習(xí)模型和數(shù)據(jù)集。
  • 使用機(jī)器學(xué)習(xí)模型減輕技術(shù)債。

大數(shù)據(jù)新范式:MLOps究竟是什么?

圖源:Google

值得注意的是,MLOps的實(shí)踐應(yīng)該與語言、框架、平臺和基礎(chǔ)設(shè)施無關(guān)。從技術(shù)角度來看,MLOps系統(tǒng)的總體架構(gòu)應(yīng)包括收集和聚合大數(shù)據(jù)平臺,為機(jī)器學(xué)習(xí)建模分析和準(zhǔn)備數(shù)據(jù)的應(yīng)用程序,執(zhí)行計(jì)算和分析的工具,以及自動(dòng)移動(dòng)機(jī)器學(xué)習(xí)模型及其生命周期中關(guān)聯(lián)數(shù)據(jù)、軟件產(chǎn)品的工具。

如此以來,數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、機(jī)器學(xué)習(xí)專家、大數(shù)據(jù)解決方案的架構(gòu)師和開發(fā)人員、以及使用統(tǒng)一高效管道的DevOps工程師的工作任務(wù)有望實(shí)現(xiàn)部分或完全自動(dòng)化。

 

責(zé)任編輯:趙寧寧 來源: 今日頭條
相關(guān)推薦

2011-02-16 16:13:40

Debian

2015-06-04 10:26:50

2018-09-10 13:47:21

數(shù)據(jù)科學(xué)統(tǒng)計(jì)學(xué)決策

2015-06-09 14:49:38

2015-09-29 09:47:14

2019-05-27 15:30:44

Node.jsJavaScript前端

2014-07-28 08:28:38

Windows

2014-08-07 10:32:02

Windows微軟

2022-06-13 09:51:35

UWB超寬帶無線載波通信技術(shù)

2012-05-28 22:49:50

PureView

2009-07-30 14:43:30

認(rèn)識BSM

2011-08-04 13:24:28

IT運(yùn)維

2015-08-26 09:54:19

物聯(lián)網(wǎng)

2025-03-14 11:18:19

2021-03-08 21:44:33

以太坊區(qū)塊鏈比特幣

2022-02-07 15:20:53

去中心化加密經(jīng)濟(jì)學(xué)加密貨幣

2021-08-09 05:19:08

Provider 前端前端代碼

2014-06-27 09:35:16

機(jī)器學(xué)習(xí)

2020-07-08 08:09:08

邊緣計(jì)算邊緣云云平臺

2022-10-19 12:23:50

緩存CDN外部緩存
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號