數(shù)據(jù)科學(xué)家與數(shù)據(jù)分析師的三個(gè)區(qū)別
近年來(lái),很少有科技行業(yè)的工作像數(shù)據(jù)科學(xué)家這樣受到如此熱烈的追捧,隨著越來(lái)越多的公司收集數(shù)據(jù)、分析數(shù)據(jù)以獲得競(jìng)爭(zhēng)優(yōu)勢(shì),數(shù)據(jù)科學(xué)家被評(píng)為過(guò)去四年來(lái)美國(guó)最好的工作。
然而,數(shù)據(jù)科學(xué)家和另一個(gè)常見(jiàn)的大數(shù)據(jù)角色——數(shù)據(jù)分析師之間的區(qū)別仍然不清晰。
數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師有相同的目標(biāo):通過(guò)解釋信息提供關(guān)鍵業(yè)務(wù)決策和趨勢(shì)。但這些也為他們的角色帶來(lái)了不同的技能、教育和經(jīng)驗(yàn)水平要求,并且影響了他們的需求和薪酬。
根據(jù)Indeed的調(diào)查,下面是這兩個(gè)角色的細(xì)分:
數(shù)據(jù)分析師需要做什么?
數(shù)據(jù)分析人員使用結(jié)構(gòu)化數(shù)據(jù),這些結(jié)構(gòu)化數(shù)據(jù)大多是電子表格或數(shù)據(jù)庫(kù)的形式(例如,零售商店購(gòu)買(mǎi)歷史或醫(yī)療記錄),發(fā)現(xiàn)業(yè)務(wù)方面的見(jiàn)解。然后這些專(zhuān)業(yè)人員創(chuàng)建報(bào)告、圖表和其他可視化,以便將發(fā)現(xiàn)成果傳達(dá)給管理層或其他業(yè)務(wù)人員,并幫助做出決策。
例如,在運(yùn)輸行業(yè)工作的數(shù)據(jù)分析師可能會(huì)從數(shù)據(jù)集中收集、處理和組織信息,如調(diào)度記錄或運(yùn)輸數(shù)據(jù)庫(kù),以發(fā)現(xiàn)問(wèn)題并提出建議,從而提高服務(wù)效率,并為公司降低成本。
數(shù)據(jù)科學(xué)家需要做什么?
數(shù)據(jù)科學(xué)家的工作與數(shù)據(jù)分析師類(lèi)似,但活動(dòng)規(guī)模更大。這些專(zhuān)業(yè)人員通常需要研究更大、更復(fù)雜的數(shù)據(jù)集,包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)科學(xué)家還需要設(shè)計(jì)實(shí)驗(yàn)來(lái)解決復(fù)雜的代碼問(wèn)題,并建立預(yù)測(cè)模型和機(jī)器學(xué)習(xí)算法。
數(shù)據(jù)科學(xué)家還致力于確定需要提出哪些問(wèn)題,并根據(jù)業(yè)務(wù)問(wèn)題回答數(shù)據(jù)問(wèn)題,目的是幫助企業(yè)做出更好的決策。
以Spotify為例。該公司的數(shù)據(jù)分析師可能會(huì)專(zhuān)注于研究音樂(lè)聆聽(tīng)模式。但是,數(shù)據(jù)科學(xué)家可能會(huì)將tb級(jí)的數(shù)據(jù)轉(zhuǎn)換成受眾細(xì)分模型,幫助工程師構(gòu)建個(gè)性化的音樂(lè)推薦引擎,或者檢查用戶(hù)行為和貨幣化研究,從而生成有針對(duì)性的廣告。
要成為一名數(shù)據(jù)科學(xué)家或數(shù)據(jù)分析師,你需要什么技能?
Indeed稱(chēng),數(shù)據(jù)分析師最需要的10項(xiàng)技能如下:
- 機(jī)器學(xué)習(xí)
- 腳本
- SQL
- Stata
- Microsoft Excel
- Tableau
- Python
- R
- Microsoft SQL服務(wù)器
- SAS
數(shù)據(jù)分析師的平均年薪為65364美元,不過(guò)會(huì)因地區(qū)的不同而有所不同。
Indeed稱(chēng),數(shù)據(jù)科學(xué)家最需要的10項(xiàng)技能如下:
- 機(jī)器學(xué)習(xí)
- 腳本
- Python
- R
- SQL
- Spark
- Java
- 數(shù)據(jù)挖掘
- Stata
- Hadoop
數(shù)據(jù)科學(xué)家的平均年薪為121189美元,不過(guò)主要是大城市。換句話(huà)說(shuō),數(shù)據(jù)科學(xué)家的年收入比數(shù)據(jù)分析師高出86%。
報(bào)告發(fā)現(xiàn),盡管這兩個(gè)職位都最需要機(jī)器學(xué)習(xí)技能,但招聘要求有很大不同:超過(guò)34%的數(shù)據(jù)科學(xué)職位要求機(jī)器學(xué)習(xí)技能,但只有3%的數(shù)據(jù)分析師要求此技能 。因此,盡管機(jī)器學(xué)習(xí)可能會(huì)給數(shù)據(jù)分析師帶來(lái)競(jìng)爭(zhēng)優(yōu)勢(shì),但實(shí)際工作中可能并不需要。
數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師之間的主要區(qū)別是什么?
這兩個(gè)職位之間有三個(gè)關(guān)鍵區(qū)別:
- 數(shù)據(jù)分析師回答業(yè)務(wù)部門(mén)提出的一系列定義明確的問(wèn)題,而數(shù)據(jù)科學(xué)家則制定并回答開(kāi)放式問(wèn)題,以獲得業(yè)務(wù)洞察力。
- 數(shù)據(jù)分析師主要使用來(lái)自單一來(lái)源的結(jié)構(gòu)化數(shù)據(jù),而數(shù)據(jù)科學(xué)家則專(zhuān)注于分析來(lái)自多個(gè)不連續(xù)來(lái)源的非結(jié)構(gòu)化數(shù)據(jù)。
- 數(shù)據(jù)分析師組織和分類(lèi)數(shù)據(jù)以解決當(dāng)前的問(wèn)題,而數(shù)據(jù)科學(xué)家則利用他們?cè)谟?jì)算機(jī)科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)方面的背景來(lái)預(yù)測(cè)未來(lái)情況。
報(bào)告指出:“歸根結(jié)底,沒(méi)有數(shù)據(jù)分析師,數(shù)據(jù)科學(xué)家就不可能成功,反之亦然。”“進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域需要更多的前期投資(更高的教育、技能要求),但就薪資而言,回報(bào)也會(huì)更高。此外,數(shù)據(jù)科學(xué)就業(yè)市場(chǎng)的增長(zhǎng)速度似乎比數(shù)據(jù)分析師就業(yè)市場(chǎng)更快,這意味著未來(lái)這個(gè)熱門(mén)職位可能會(huì)有更多的機(jī)會(huì)。”