數(shù)據(jù)科學(xué)崗位將在未來(lái)5年內(nèi)重新洗牌,你準(zhǔn)備好轉(zhuǎn)型了嗎?
計(jì)算器的工作曾經(jīng)由人來(lái)做;網(wǎng)站管理員曾經(jīng)是熱門職業(yè);中層管理人員也曾配備過(guò)秘書。技術(shù)的迭代變革了一批又一批職業(yè),數(shù)據(jù)科學(xué)家也不會(huì)例外……
在每種情況下,硬件和軟件的進(jìn)步都需要專業(yè)技能,再將它們交到通用人才的手中。在專業(yè)的人員失業(yè)的同時(shí),這些技術(shù)的民主化引發(fā)了創(chuàng)新、商業(yè)和創(chuàng)造就業(yè)的浪潮。
同樣,我堅(jiān)信 數(shù)據(jù)科學(xué)家 的工作在五到十年內(nèi)就會(huì)過(guò)氣。相反,經(jīng)濟(jì)領(lǐng)域各行各業(yè)的終端用戶都將會(huì)使用數(shù)據(jù)科學(xué)軟件,就像現(xiàn)在的非技術(shù)人員使用 Excel 一樣。事實(shí)上,那些數(shù)據(jù)科學(xué)的工具可能只是 Excel 2029 中的一個(gè)選項(xiàng)卡而已。
當(dāng)今的金融分析師不再需要聘請(qǐng)數(shù)據(jù)科學(xué)家來(lái)幫助他們,因?yàn)樗麄兯褂玫钠脚_(tái)已經(jīng)提供了他們所需的數(shù)據(jù)科學(xué)工具。這在其他領(lǐng)域也會(huì)變得普遍,因?yàn)閷?duì)數(shù)據(jù)科學(xué)的基本了解已經(jīng)成為許多工作的必需技能。與此同時(shí),很多數(shù)據(jù)科學(xué)的工作也正在實(shí)現(xiàn)自動(dòng)化,一些觀察人士提出警告,稱數(shù)據(jù)科學(xué)家可能正在讓自己失去現(xiàn)有的工作。
數(shù)據(jù)科學(xué)不斷飆升的人氣
數(shù)據(jù)科學(xué)這一職業(yè)正在經(jīng)歷「淘金熱」時(shí)期。2018 年彭博社(Bloomberg)的一篇文章將數(shù)據(jù)科學(xué)稱為「全美最熱門職業(yè)」,因?yàn)閺?2015 年 1 月到 2018 年 1 月,招聘網(wǎng)站 Indeed.com 上的數(shù)據(jù)科學(xué)家需求增加了 75%。文章還提到,在一些咨詢公司,數(shù)據(jù)科學(xué)博士的薪水為 30 萬(wàn)美元。
同時(shí),美國(guó)數(shù)十所大學(xué)都推出了數(shù)據(jù)分析項(xiàng)目。加州大學(xué)伯克利分校(UC Berkeley)在 2018 年新開(kāi)設(shè)了數(shù)據(jù)科學(xué)專業(yè),該專業(yè)很快成為了學(xué)校十分受歡迎的專業(yè)之一。去年十一月,該校開(kāi)設(shè)了新的數(shù)據(jù)科學(xué)與信息系。
但這些年輕人即將進(jìn)入的行業(yè)將在未來(lái)10年內(nèi)發(fā)生翻天覆地的變化。盡管他們的數(shù)據(jù)科學(xué)技能可以成為一項(xiàng)穩(wěn)定的職業(yè)財(cái)富,但他們中會(huì)直接成為數(shù)據(jù)科學(xué)家的人可能少得驚人。
從機(jī)器編碼到大規(guī)模編碼再到數(shù)據(jù)自動(dòng)化
當(dāng)我在學(xué)習(xí)計(jì)算機(jī)科學(xué)時(shí),編譯器設(shè)計(jì)是必修課。我們需要了解如何將像 C 語(yǔ)言這樣的編程語(yǔ)言直接轉(zhuǎn)換成機(jī)器語(yǔ)言,也就是計(jì)算機(jī)可以直接解釋的十六進(jìn)制代碼。用機(jī)器語(yǔ)言來(lái)編寫商業(yè)應(yīng)用程序以獲得更高的性能是很常見(jiàn)的做法。
在過(guò)去的幾十年間,連續(xù)的軟件功能層被抽象為更高級(jí)的開(kāi)發(fā)工具?,F(xiàn)如今的大多數(shù)代碼都是用像 Python 這樣簡(jiǎn)單易學(xué)的高級(jí)語(yǔ)言完成的,相對(duì)而言,程序員很少需要了解如何直接和硬件對(duì)話。
數(shù)據(jù)科學(xué)也在快速地走著同樣的道路。在未來(lái)的三到五年,越高級(jí)的工具對(duì)基礎(chǔ)技術(shù)的需求會(huì)變得越低,這些基礎(chǔ)技術(shù)包括高性能計(jì)算(CPU 的分區(qū)問(wèn)題)、數(shù)據(jù)整理(準(zhǔn)備原始數(shù)據(jù)以便進(jìn)行分析)以及機(jī)器學(xué)習(xí)系統(tǒng)內(nèi)部或初級(jí)統(tǒng)計(jì)方法等。所有這些過(guò)程都將在機(jī)器內(nèi)部進(jìn)行。
如今,包括 Trifacta、Element Analytics 和 Kylo 在內(nèi)的數(shù)十家公司都在推出新的數(shù)據(jù)分析工具,它們中的大多數(shù)旨在減少繁瑣的數(shù)據(jù)準(zhǔn)備工作,幫助數(shù)據(jù)科學(xué)家迅速完成分析工作。此外還出現(xiàn)了可以自動(dòng)選擇算法和調(diào)整參數(shù)的數(shù)據(jù)科學(xué)框架(如 Auto-sklearn 和DataRobot)。這些框架和工具與數(shù)據(jù)管理平臺(tái)相結(jié)合,為未來(lái)的數(shù)據(jù)消費(fèi)者建立了大型構(gòu)建塊。
數(shù)據(jù)科學(xué)家的前進(jìn)道路
在未來(lái)幾年,我認(rèn)為數(shù)據(jù)科學(xué)家將至少分為五類:
- 通用人才:第一類是數(shù)據(jù)科學(xué)的通用人才,他們會(huì)對(duì)數(shù)據(jù)做出解釋并使用數(shù)據(jù)。這些人的工作是指導(dǎo)終端用戶,幫助用戶對(duì)數(shù)據(jù)提出問(wèn)題,但他們并不會(huì)自己找出答案。這更像是一個(gè)過(guò)渡性的工作,更可能在五年內(nèi)出現(xiàn)。
- 行業(yè)專家:由行業(yè)專家組成的是第二類,也是人數(shù)最多的一類。他們將在制造、醫(yī)藥科學(xué)以及金融這樣的特定垂直領(lǐng)域中使用數(shù)據(jù)科學(xué)技術(shù)和工具。我認(rèn)為未來(lái)的大部分工作崗位都在這里。但這也不是數(shù)據(jù)科學(xué)工作。
- 深度專家:有專業(yè)數(shù)據(jù)科學(xué)技術(shù)的深度專家組成了第三類,也是人數(shù)最少的一類。這一類人從事的是純數(shù)據(jù)科學(xué)工作。他們的工作是以抽象的方式研究數(shù)據(jù)科學(xué)、提升算法性能并設(shè)計(jì)出新的通用方式。他們就像如今的計(jì)算機(jī)科學(xué)家,主要工作是建立理論基礎(chǔ),而非解決日常問(wèn)題。
- 分析開(kāi)發(fā)人員:第四類是從數(shù)據(jù)科學(xué)家轉(zhuǎn)為分析開(kāi)發(fā)的人。這些人是軟件開(kāi)發(fā)專家,他們的工作是處理數(shù)據(jù)交互問(wèn)題,以及通過(guò)數(shù)據(jù)報(bào)告幫助人們做出推論。算法設(shè)計(jì)也是他們工作的一小部分,數(shù)據(jù)平臺(tái)和以一站式方式完成大量工作的魯棒代碼庫(kù)會(huì)輔助他們。
- 數(shù)據(jù)工程師:另外,還會(huì)催生出像數(shù)據(jù)工程師這樣的新工作,他們會(huì)構(gòu)建將數(shù)據(jù)轉(zhuǎn)換并傳輸?shù)交A(chǔ)平臺(tái)的管道,在這個(gè)管道中會(huì)對(duì)數(shù)據(jù)進(jìn)行分析和可視化 。盡管數(shù)據(jù)科學(xué)家通常因他們出色的算法而得到認(rèn)可,但他們高達(dá) 80% 的時(shí)間都花在收集數(shù)據(jù)、清理數(shù)據(jù)和組織數(shù)據(jù)上。
結(jié)論
在十年內(nèi),數(shù)據(jù)科學(xué)將會(huì)融入特定行業(yè)的應(yīng)用和廣泛應(yīng)用的生產(chǎn)力工具中,因此我們可能認(rèn)為它不再是一個(gè)熱門行業(yè)。正如一代又一代的數(shù)學(xué)和統(tǒng)計(jì)學(xué)的學(xué)生不會(huì)再將自己視為數(shù)學(xué)家或統(tǒng)計(jì)學(xué)家,而是在商界和學(xué)術(shù)界中扮演了各種各樣的角色,新崛起的數(shù)據(jù)科學(xué)的畢業(yè)生未來(lái)也將會(huì)成為制造工程師以及醫(yī)藥科學(xué)領(lǐng)域的研究人員。
原文地址:https://www.forbes.com/sites/forbestechcouncil/2019/03/01/radical-change-is-coming-to-data-science-jobs