KDnuggets:未來4至10年內(nèi)對數(shù)據(jù)科學(xué)家的需求將開始減少
根據(jù)近1200份投票的統(tǒng)計(jì)結(jié)果顯示,KDnuggets的讀者認(rèn)為對數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)專家的需求將在未來4至10年內(nèi)開始減少。最常見的一種回答是4-6年,中值是8-9年。
KDnuggets問卷:對數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)專家的需求何時(shí)會(huì)開始衰減?
這是一張很重要也很有意思的圖表,看完之后我的想法如下……
注意:需求下降的起始點(diǎn)緊隨著需求高峰,所以我們需要交換著使用這兩個(gè)術(shù)語。
在2012年被譽(yù)為“21世紀(jì)最性感的工作”之后,市場對于數(shù)據(jù)科學(xué)家的需求開始迅速增長。這一需求的填補(bǔ)體現(xiàn)在兩個(gè)方面:
教育:很多大學(xué)及其他教育平臺(tái)(例如Coursera,、edX和Udemy)開始增加提供數(shù)據(jù)科學(xué)與機(jī)器語言的教育。
自動(dòng)化:如同DataRobot這樣的公司提供“自動(dòng)化數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)”的平臺(tái)一樣,這些平臺(tái)可以讓商業(yè)用戶自己去建模,或者在某一商業(yè)流程中嵌入模型來完全自動(dòng)化數(shù)據(jù)科學(xué)(比如自動(dòng)化的廣告競價(jià))。
但目前的需求下面卻潛藏著一個(gè)巨大的泡沫,這個(gè)泡沫很可能在未來的某一個(gè)時(shí)間點(diǎn)破裂,隨后需求開始迅速下降。而且如同其它的泡沫一樣,這個(gè)泡沫同樣難以預(yù)測。所以需求高峰期(需求開始下降的點(diǎn))出現(xiàn)在未來4-9年,是一個(gè)很合理的假設(shè)。但是,這并不意味著數(shù)據(jù)科學(xué)家會(huì)失業(yè),這只是讓這種工作變得常規(guī)化,使薪資水平變得平穩(wěn)下來,如同互聯(lián)網(wǎng)發(fā)展初期,網(wǎng)頁開發(fā)者是一個(gè)炙手可熱的工作,現(xiàn)在卻成了一個(gè)稀疏平常的工作了。
問卷也調(diào)查了受訪者在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方面的相關(guān)經(jīng)驗(yàn),以及他們所屬的社會(huì)群體(產(chǎn)業(yè)界/學(xué)生/科研/政府/其他)。
從圖中我們可以看到:60%的受訪者有2年以內(nèi)的相關(guān)經(jīng)歷,62%的被調(diào)查者來自產(chǎn)業(yè)界,19.5%是學(xué)生,9.2%是科研人員,4.5%來自政府及公益組織。
在檢驗(yàn)高峰需求的預(yù)測與受訪者經(jīng)驗(yàn)、所屬社會(huì)群體的關(guān)系時(shí),我得到了驚人的相似曲線。一個(gè)高峰期是在未來4-6年和7-10年,另一個(gè)小一些的高峰出現(xiàn)在25年及以后。為了簡單理解這個(gè)圖表,我將曲線分組為“小于1年經(jīng)驗(yàn)”,“1-2年的經(jīng)驗(yàn)”和“2-4年的經(jīng)驗(yàn)”,無論哪種情況,這些曲線看起來都非常相似。
對數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)的高峰需求vs.受訪者在數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)領(lǐng)域的相關(guān)經(jīng)驗(yàn)
讓我們把那些“預(yù)測對數(shù)據(jù)科學(xué)家的需求在25年后開始衰減”的人稱為樂觀主義者,而將另一部分人歸類為悲觀主義者吧!
我們發(fā)現(xiàn),經(jīng)驗(yàn)最多的(16年以上)這一群體占據(jù)了樂觀主義者的絕大多數(shù),而且這一群體有超過35%的人認(rèn)為需求在25年之后才會(huì)逐漸減緩。
接下來,讓我們看看預(yù)測高峰需求曲線與受訪者所屬社會(huì)群體的關(guān)系。

數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)專家的高峰需求預(yù)測vs社會(huì)群體
再一次,我們出乎意料地發(fā)現(xiàn):這些曲線都很相似。
其中,學(xué)生是所有群體里最樂觀的,政府工作人員是最悲觀的,產(chǎn)業(yè)界人士居于其中。
最后,我們看一下不同區(qū)域的分布。各地區(qū)參與者包括:
- US/Canada, 40%
- Europe, 33%
- Asia, 16%
- other, 11%
- 美國/加拿大 40%
- 歐洲 33%
- 亞洲 16%
- 其他 11%

對數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)專家的高峰需求vs地域
這一次,我們又雙叒叕發(fā)現(xiàn)曲線依然十分相似。而一個(gè)顯著的差異是:美國/加拿大的受訪者相比其他區(qū)域的受訪者更樂觀,他們最多的選擇是認(rèn)為需求將在未來7-10年內(nèi)飽和,而其他區(qū)域則認(rèn)為是4-6年。在所有區(qū)域里面,認(rèn)為25年甚至更久的受訪者百分比為(18.3%-19.8%),這也是讓人難以置信的相似。
如何解釋這樣及其相似的分布?
有一種假設(shè)是,樂觀主義或者悲觀主義是天生的,這會(huì)影響到他們做預(yù)測的結(jié)果。所以當(dāng)我們想對“社會(huì)趨勢”做預(yù)測的時(shí)候,由于這種主題的問題不能通過物理事實(shí)測量,更多的只是取決于人們的想法和直覺。所以問卷設(shè)計(jì)應(yīng)該以某種方法來檢測樂觀主義或者悲觀主義特質(zhì)。
如果這個(gè)結(jié)論是真的,那么我們可以認(rèn)為:樂觀主義的百分比在各個(gè)不同的區(qū)域、社會(huì)群體的群組里面是相似的,而且這個(gè)相似不會(huì)隨著經(jīng)驗(yàn)發(fā)生變化。