自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AutoML 2.0:數(shù)據(jù)科學(xué)家過時了嗎?

人工智能 大數(shù)據(jù)
業(yè)界現(xiàn)在推出的各種新平臺(https://dotdata.com)都具有更多的自動化功能。人工智能現(xiàn)在可以驅(qū)動所謂的要素工程(Feature Engineering),允許用戶自動發(fā)現(xiàn)和創(chuàng)建數(shù)據(jù)科學(xué)處理功能。這種做法開啟了一種全新的數(shù)據(jù)科學(xué)方法,似乎會威脅到數(shù)據(jù)科學(xué)家的作用。

在過去幾年里,AutoML快速增長。而且目前看來,經(jīng)濟(jì)衰退無可避免,人工智能(AI)和機(jī)器學(xué)習(xí)自動化開發(fā)的觀念也必將越來越有吸引力。業(yè)界現(xiàn)在推出的各種新平臺(https://dotdata.com)都具有更多的自動化功能。人工智能現(xiàn)在可以驅(qū)動所謂的要素工程(Feature Engineering),允許用戶自動發(fā)現(xiàn)和創(chuàng)建數(shù)據(jù)科學(xué)處理功能。這種做法開啟了一種全新的數(shù)據(jù)科學(xué)方法,似乎會威脅到數(shù)據(jù)科學(xué)家的作用。

那么,數(shù)據(jù)科學(xué)家需要關(guān)注這些發(fā)展嗎?數(shù)據(jù)科學(xué)家在自動化過程中的作用是什么呢?鑒于這種新發(fā)現(xiàn)的自動化技術(shù),企業(yè)又將如何發(fā)展呢?

 


傳統(tǒng)的數(shù)據(jù)科學(xué)過程(圖;dotData公司)

AutoML 2.0必將令數(shù)據(jù)科學(xué)更加自動化

第一代AutoML平臺的重點(diǎn)主要放在自動化數(shù)據(jù)科學(xué)過程中的機(jī)器學(xué)習(xí)部分。但在傳統(tǒng)的數(shù)據(jù)科學(xué)工作流程里,最冗長和最具挑戰(zhàn)性的部分則是被稱之為是要素工程的部分,要素工程是高度手動的一步,主要涉及到連接數(shù)據(jù)源及構(gòu)建寬大的“要素表”,需包含豐富多樣的“要素”。與此同時,這些要素還需要針對多種機(jī)器學(xué)習(xí)算法進(jìn)行評估。

目前,要素工程面臨的挑戰(zhàn)是,只有用更高水平領(lǐng)域的專業(yè)知識才能“醞釀”新的要素,而且這一過程需要在評估、拒絕或選擇要素時反復(fù)地做。但最近業(yè)界出現(xiàn)了新平臺,這些新平臺可以提供旨在解決這一挑戰(zhàn)的附加功能及自動化功能?,F(xiàn)在一些具有“自動要素工程”功能的平臺可以從關(guān)系數(shù)據(jù)源以及無結(jié)構(gòu)文件里自動創(chuàng)建要素表。這種能夠在數(shù)據(jù)科學(xué)過程中“自動生成”要素的方法,可以說是個改變游戲規(guī)則的功能。

于是,突然之間,“公民”數(shù)據(jù)科學(xué)家開始成為組織開發(fā)ML和AI模型的有價值貢獻(xiàn)者。一般來說,「公民數(shù)據(jù)科學(xué)家」指的是商業(yè)智能(BI)分析師、數(shù)據(jù)工程師和組織中其他具有深厚領(lǐng)域知識的、精通技術(shù)的成員。借助于機(jī)器學(xué)習(xí),BI團(tuán)隊利用自動化要素工程可以在幾天之內(nèi)開發(fā)出復(fù)雜的預(yù)測分析算法,無需數(shù)據(jù)科學(xué)家?guī)兔涂梢詷O大地提高生產(chǎn)力。

自動化數(shù)據(jù)科學(xué):平民化

AutoML 2.0平臺的主要好處之一是可以用于真正的數(shù)據(jù)科學(xué)平民化。

數(shù)據(jù)科學(xué)自動化可以加速發(fā)現(xiàn)要素和創(chuàng)建功能的過程,而且是自動的,如此一來,更多的用戶群體就可以為數(shù)據(jù)科學(xué)過程做貢獻(xiàn)。要素創(chuàng)建的自動化使得“公民”數(shù)據(jù)科學(xué)家能夠創(chuàng)建極有用的、高度優(yōu)化的用例。而且公民數(shù)據(jù)科學(xué)家通常具有高度的“專業(yè)領(lǐng)域知識”,因此他們基本無需數(shù)據(jù)科學(xué)團(tuán)隊的幫助就可以將重點(diǎn)放在對組織具有高價值的用例上。

開啟公民數(shù)據(jù)科學(xué)家的另一個好處在于,企業(yè)無需擔(dān)心招不到數(shù)據(jù)科學(xué)家而一樣可以開拓數(shù)據(jù)科學(xué)的使用。2018年 LinkedIn的一項研究表明,美國的組織在雇用數(shù)據(jù)科學(xué)家方面遇到困難。鑒于此,能夠發(fā)掘新的數(shù)據(jù)科學(xué)貢獻(xiàn)者就顯得尤為重要。

眼下,全球經(jīng)濟(jì)面臨著諸多不確定性,在這種情況下能以最少的投資發(fā)掘出幾類新的AI/ML開發(fā)人員,必將成為改變游戲規(guī)則的價值主張,在維持或增加競爭優(yōu)勢上意義重大。

自動化數(shù)據(jù)科學(xué):生產(chǎn)力而非替代

但任何AutoML 2.0平臺如果將定位的重點(diǎn)放在替換或更替數(shù)據(jù)科學(xué)家上就大錯特錯了。大多數(shù)數(shù)據(jù)科學(xué)家都將要素工程視為工作中的最大障礙之一。自動化可以幫助加快要素工程的流程,靠的就是自動化可以提供令人難以置信的生產(chǎn)率提升,這種提升若無自動化是不可能實(shí)現(xiàn)的。

對于數(shù)據(jù)科學(xué)家來說,利用AutoML 2.0通??梢詷O大地加快自己的工作,縮短的工作時間從幾天到幾個月不等。而且,數(shù)據(jù)科學(xué)家在AutoML 2.0平臺上使用基于AI的要素工程還可以發(fā)現(xiàn)他們從未考慮過的要素?;贏I的要素工程可以自動構(gòu)建、評估和開通要素,而且可以結(jié)合來自基于多列的數(shù)據(jù)(通常是跨越不同的表和源)。

此外,AutoML 2.0還具有自我發(fā)現(xiàn)要素的功能,數(shù)據(jù)科學(xué)家借此功能可以探索所謂的“未知的未知數(shù)”,這種“未知的未知數(shù)”屬于那些數(shù)據(jù)科學(xué)家由于缺乏時間或缺乏領(lǐng)域?qū)I(yè)知識而從未考慮過的要素。

AutoML 2.0:創(chuàng)建更高效、更具包容性的AI / ML程序

所以,AutoML 2.0平臺并沒有威脅到數(shù)據(jù)科學(xué)家的生計,反而有助于加速數(shù)據(jù)科學(xué)過程及令數(shù)據(jù)科學(xué)平民化。與此同時, AutoML 2.0也為數(shù)據(jù)科學(xué)家提高生產(chǎn)力提供了必要的加速和自動化手段,令數(shù)據(jù)科學(xué)家能夠擴(kuò)展工作規(guī)模并為業(yè)務(wù)帶來更大的效益。AutoML 2.0平臺具有推動數(shù)據(jù)科學(xué)平民化和加速數(shù)據(jù)科學(xué)流程的雙重優(yōu)勢,也是其最重要的賣點(diǎn),這種雙重優(yōu)勢是現(xiàn)代組織擴(kuò)展數(shù)據(jù)科學(xué)流程規(guī)模的關(guān)鍵。

責(zé)任編輯:未麗燕 來源: Forbes
相關(guān)推薦

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2012-12-06 15:36:55

CIO

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2012-06-12 09:33:59

2012-12-27 09:52:23

數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2014-07-03 09:38:19

2019-08-26 09:47:56

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析

2016-08-02 17:00:12

Hadoop大數(shù)據(jù)系統(tǒng)

2016-04-11 14:15:06

數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘工具

2020-03-20 14:40:48

數(shù)據(jù)科學(xué)Python學(xué)習(xí)

2022-04-25 09:48:31

數(shù)據(jù)科學(xué)崗位離職

2015-08-25 13:20:29

數(shù)據(jù)科學(xué)

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2018-08-20 19:24:40

數(shù)據(jù)科學(xué)數(shù)據(jù)清理數(shù)據(jù)分析

2022-11-03 14:13:24

騰訊科學(xué)家

2013-11-12 09:27:01

大數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2016-05-11 10:36:16

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號