自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

真的缺數(shù)據(jù)科學(xué)家嗎? 如今到底有多少數(shù)據(jù)科學(xué)家?

大數(shù)據(jù)
LinkedIn公司在2018年8月發(fā)布的美國(guó)勞動(dòng)力報(bào)告中提到:“對(duì)數(shù)據(jù)科學(xué)家的需求空前高漲……具有數(shù)據(jù)科學(xué)技能的人才短缺問(wèn)題幾乎存在于美國(guó)的所有大城市。在全美國(guó)范圍內(nèi),共缺少151717名具有數(shù)據(jù)科學(xué)技能的人,其中紐約市(34032人)、舊金山灣區(qū)(31798人)和洛杉磯(12251人)的人才短缺尤為嚴(yán)重。”

[[246290]]

2011年,麥肯錫發(fā)布的《大數(shù)據(jù)》報(bào)告稱(chēng),“僅美國(guó)就面臨著14萬(wàn)至19萬(wàn)名具有分析專(zhuān)長(zhǎng)的人才短缺,以及150萬(wàn)名具備理解并基于大數(shù)據(jù)分析做出決策能力的管理人員和分析師的短缺”。

2014年,我們調(diào)查了數(shù)據(jù)科學(xué)家的數(shù)量,當(dāng)時(shí)的估計(jì)為50名至10萬(wàn)名,且當(dāng)時(shí)并沒(méi)有看到數(shù)據(jù)科學(xué)家大量短缺的證據(jù)。2014年,我們?cè)趇ndeed.com網(wǎng)站上僅發(fā)現(xiàn)了約1000個(gè)“數(shù)據(jù)科學(xué)家”的招聘廣告。

2016年,我們研究了德勤的一項(xiàng)研究。德勤在研究中預(yù)測(cè):到2018年,企業(yè)將需要100萬(wàn)名數(shù)據(jù)科學(xué)家。

現(xiàn)在已經(jīng)是2018年了,所以我們可以檢驗(yàn)上述預(yù)測(cè)的準(zhǔn)確程度,并且嘗試回答以下三個(gè)問(wèn)題:

  1. 現(xiàn)在是否存在數(shù)據(jù)科學(xué)家的短缺?
  2. 現(xiàn)階段有多少“數(shù)據(jù)科學(xué)家”?無(wú)論是名義上的還是實(shí)際職能上的。
  3. 數(shù)據(jù)科學(xué)家的未來(lái)前景如何?

1 數(shù)據(jù)科學(xué)家短缺嗎?

第一個(gè)問(wèn)題的答案似乎是肯定的。

LinkedIn公司在2018年8月發(fā)布的美國(guó)勞動(dòng)力報(bào)告中提到:“對(duì)數(shù)據(jù)科學(xué)家的需求空前高漲……具有數(shù)據(jù)科學(xué)技能的人才短缺問(wèn)題幾乎存在于美國(guó)的所有大城市。在全美國(guó)范圍內(nèi),共缺少151717名具有數(shù)據(jù)科學(xué)技能的人,其中紐約市(34032人)、舊金山灣區(qū)(31798人)和洛杉磯(12251人)的人才短缺尤為嚴(yán)重。”

值得注意的是,LinkedIn報(bào)告中的人才短缺是指具有“數(shù)據(jù)科學(xué)技能”的人,而不一定是擁有“數(shù)據(jù)科學(xué)家”頭銜的人。

我們可以通過(guò)兩個(gè)熱門(mén)的求職網(wǎng)站——indeed和Glassdoor——來(lái)估計(jì)對(duì)“數(shù)據(jù)科學(xué)家”的需求。

在indeed.com網(wǎng)站上搜索美國(guó)的“data scientist”(加引號(hào)),只能找到約4800個(gè)工作崗位。

(注意:在indeed網(wǎng)站上進(jìn)行搜索時(shí)使用引號(hào)十分重要。搜索沒(méi)有加引號(hào)的data scientist可以找到約3萬(wàn)個(gè)工作崗位,但我們不確定這些工作崗位中有多少是針對(duì)其他領(lǐng)域的科學(xué)家的。)

美國(guó)是數(shù)據(jù)科學(xué)家最大的市場(chǎng),卻非唯一的市場(chǎng)。通過(guò)在indeed的區(qū)域性站點(diǎn)(indeed.co.uk、indeed.fr、indeed.de、indeed.co.in等)上進(jìn)行搜索,我們可以發(fā)現(xiàn)其他國(guó)家對(duì)數(shù)據(jù)科學(xué)家也有強(qiáng)烈的需求:

在Glassdoor網(wǎng)站上輸入“Data Scientist”進(jìn)行搜索,可發(fā)現(xiàn)美國(guó)大約有2.6萬(wàn)個(gè)工作崗位(刪除引號(hào)也會(huì)得到同樣的結(jié)果)。

2 現(xiàn)階段有多少“數(shù)據(jù)科學(xué)家”?

谷歌搜索將數(shù)據(jù)科學(xué)家定義為:“受雇用于分析和解釋復(fù)雜的數(shù)字?jǐn)?shù)據(jù)(如網(wǎng)站的使用統(tǒng)計(jì)數(shù)據(jù))的人,從而協(xié)助企業(yè)做出決策。”

由于數(shù)據(jù)科學(xué)是集統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)和商業(yè)于一體的交叉學(xué)科,因此在業(yè)界和學(xué)術(shù)界有許多人雖從事這項(xiàng)工作卻沒(méi)有正式的數(shù)據(jù)科學(xué)家頭銜。因而我們可以通過(guò)調(diào)查流行的數(shù)據(jù)科學(xué)平臺(tái)來(lái)估計(jì)當(dāng)前數(shù)據(jù)科學(xué)家的數(shù)量。

Kaggle(現(xiàn)在是Google的一部分)是一個(gè)數(shù)據(jù)科學(xué)和數(shù)據(jù)分析的競(jìng)賽平臺(tái),它聲稱(chēng)是世界上最大的活躍數(shù)據(jù)科學(xué)家社區(qū)。雖然并非所有數(shù)據(jù)科學(xué)家都參加過(guò)Kaggle比賽或擁有Kaggle賬戶(hù),且并非Kaggle上的所有人員都從事數(shù)據(jù)科學(xué)工作,但我們可以合理地假設(shè)數(shù)據(jù)科學(xué)家群體與Kaggle人員群體存在大量重疊。 2017年6月,Kaggle的社區(qū)成員數(shù)量突破了100萬(wàn)。2018年9月19日的Kaggle電子郵件稱(chēng),他們的社區(qū)成員數(shù)量在2018年8月超過(guò)了200萬(wàn)。由于并非所有Kaggle成員都是活躍的,所以Kaggle的社區(qū)成員總數(shù)可能是全球從事數(shù)據(jù)科學(xué)的人的數(shù)量最大值。

KDnuggets網(wǎng)站現(xiàn)在每個(gè)月有超過(guò)50萬(wàn)名獨(dú)立訪(fǎng)客,由于網(wǎng)站專(zhuān)注于幫助數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師更好地完成他們的工作,因而我們可以合理地認(rèn)為網(wǎng)站的大多數(shù)訪(fǎng)客都在數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)領(lǐng)域工作,無(wú)論他們的實(shí)際頭銜是什么。但由于部分訪(fǎng)客可能是無(wú)意中隨機(jī)訪(fǎng)問(wèn)了KDnuggets,因而我們可以了解網(wǎng)站的訂閱者或粉絲——這個(gè)更活躍的子集。

KDnuggets目前在Twitter、LinkedIn、Facebook、RSS和電子郵件上擁有約24萬(wàn)名訂閱者或粉絲。雖然不同平臺(tái)的人會(huì)有一些重疊,但對(duì)于全球眾多的數(shù)據(jù)科學(xué)家來(lái)說(shuō),大約20萬(wàn)的人數(shù)預(yù)估似乎是合理的最小值。

在LinkedIn上,有許多致力于數(shù)據(jù)科學(xué)的組織。盡管這些組織的參與度一直在下降,但我們可以粗略地估計(jì)他們的成員數(shù)量。以下是三個(gè)最大的數(shù)據(jù)科學(xué)組織的預(yù)估成員數(shù)量:

這些組織成員的頭銜有著巨大的多樣性,這些頭銜包括數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師、統(tǒng)計(jì)學(xué)家、生物信息學(xué)家、神經(jīng)科學(xué)家、市場(chǎng)營(yíng)銷(xiāo)主管、計(jì)算機(jī)科學(xué)家等等……可以肯定地說(shuō),任何從事著傳統(tǒng)數(shù)據(jù)科學(xué)家所從事的工作的人都可被認(rèn)為屬于這一類(lèi)別。隨著越來(lái)越多的人需要通過(guò)分析數(shù)據(jù)來(lái)獲得見(jiàn)解或做出關(guān)鍵決策,傳統(tǒng)上職位和職責(zé)不同的人們都熱衷于學(xué)習(xí)數(shù)據(jù)分析這一新技術(shù),以適應(yīng)自己的領(lǐng)域。這雖然并不能使他們從根本上成為數(shù)據(jù)科學(xué)家,但他們確實(shí)擁有該領(lǐng)域的知識(shí)和才能。

我們還可以從數(shù)據(jù)科學(xué)家的LinkedIn個(gè)人資料中獲取一些有用信息,這些資料顯示有超過(guò)10萬(wàn)人擁有數(shù)據(jù)科學(xué)家頭銜。 


圖1:LinkedIn數(shù)據(jù)科學(xué)家簡(jiǎn)介(按行業(yè)和地點(diǎn)分類(lèi))

在LinkedIn上搜索“數(shù)據(jù)科學(xué)家”(加引號(hào)很重要),我們發(fā)現(xiàn)超過(guò)10萬(wàn)人擁有該頭銜。 因此,如果全球有20萬(wàn)到100萬(wàn)人在做一些與數(shù)據(jù)科學(xué)相關(guān)的工作,那么他們中的大多數(shù)人都沒(méi)有數(shù)據(jù)科學(xué)家的頭銜。

我們還可以通過(guò)查看與數(shù)據(jù)科學(xué)最相關(guān)的語(yǔ)言和平臺(tái)(R、Python、機(jī)器學(xué)習(xí)庫(kù)、Spark和Jupyter)相關(guān)的活動(dòng)來(lái)估算大型數(shù)據(jù)分析/可視化/統(tǒng)計(jì)社區(qū)的規(guī)模。

Apache Spark Meetups上現(xiàn)有22.5萬(wàn)名成員,而且每個(gè)月都在增長(zhǎng)。 Intel Capital估計(jì)全球有100萬(wàn)R程序員。 根據(jù)python.org網(wǎng)站上的公開(kāi)數(shù)據(jù),現(xiàn)在已有約275萬(wàn)次的下載量。 Jupyter項(xiàng)目目前擁有約300萬(wàn)用戶(hù)。 這些數(shù)字可以為我們提供全球數(shù)據(jù)分析師或數(shù)據(jù)科學(xué)家數(shù)量的粗略上限。

3 數(shù)據(jù)科學(xué)家的未來(lái)前景

數(shù)據(jù)科學(xué)家近期的前景看起來(lái)很光明。

2017年的LinkedIn新興就業(yè)報(bào)告稱(chēng),2017年的機(jī)器學(xué)習(xí)工程師比5年前增加了9.8倍。 在LinkedIn報(bào)告上,機(jī)器學(xué)習(xí)工程師、數(shù)據(jù)科學(xué)家和大數(shù)據(jù)工程師躋身新興崗位之列。 自2012年以來(lái),數(shù)據(jù)科學(xué)家增加了650%以上。 


圖2:LinkedIn十大新興職位及其增長(zhǎng)情況(2012年至2017年)。

根據(jù)美國(guó)勞工統(tǒng)計(jì)局的數(shù)據(jù),未來(lái)十年的就業(yè)增長(zhǎng)預(yù)計(jì)將超過(guò)前十年的增長(zhǎng),到2026年數(shù)據(jù)科學(xué)或數(shù)據(jù)分析領(lǐng)域?qū)?chuàng)造1150萬(wàn)個(gè)就業(yè)崗位。 

IBM最近宣稱(chēng),到2020年,數(shù)據(jù)科學(xué)和分析職位的數(shù)量預(yù)計(jì)將增加近36.4萬(wàn)個(gè),達(dá)到約272萬(wàn)個(gè)。 因而無(wú)論目前數(shù)據(jù)專(zhuān)業(yè)人員的真實(shí)數(shù)量是多少,他們的數(shù)量在不久的將來(lái)很可能會(huì)繼續(xù)增長(zhǎng)。

然而,從長(zhǎng)遠(yuǎn)來(lái)看,自動(dòng)化將取代業(yè)內(nèi)的許多工作,數(shù)據(jù)科學(xué)家的工作也不例外。 如今,DataRobot和H2O等公司已經(jīng)為數(shù)據(jù)科學(xué)問(wèn)題提供了自動(dòng)化的解決方案。

2015年KDnuggets民意調(diào)查中的受訪(fǎng)者認(rèn)為,大多數(shù)專(zhuān)家級(jí)的預(yù)測(cè)分析或數(shù)據(jù)科學(xué)任務(wù)將在2025年實(shí)現(xiàn)自動(dòng)化。為了保住工作崗位,數(shù)據(jù)科學(xué)家應(yīng)該專(zhuān)注于培養(yǎng)更難自動(dòng)化的技能,如業(yè)務(wù)理解、解釋和講故事的能力。

責(zé)任編輯:未麗燕 來(lái)源: 數(shù)據(jù)科學(xué)DataScience
相關(guān)推薦

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2013-11-12 09:27:01

大數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2012-12-06 15:36:55

CIO

2012-12-27 09:52:23

數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2020-06-15 15:43:23

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析師數(shù)據(jù)科學(xué)

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2012-06-12 09:33:59

2014-07-03 09:38:19

2019-08-26 09:47:56

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析

2016-08-02 17:00:12

Hadoop大數(shù)據(jù)系統(tǒng)

2016-04-11 14:15:06

數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘工具

2020-03-20 14:40:48

數(shù)據(jù)科學(xué)Python學(xué)習(xí)

2020-04-09 15:32:20

數(shù)據(jù)科學(xué)AutoML代智能

2022-04-25 09:48:31

數(shù)據(jù)科學(xué)崗位離職

2015-08-25 13:20:29

數(shù)據(jù)科學(xué)

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2018-08-20 19:24:40

數(shù)據(jù)科學(xué)數(shù)據(jù)清理數(shù)據(jù)分析

2022-11-03 14:13:24

騰訊科學(xué)家
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)