數(shù)據(jù)科學VS統(tǒng)計學:你屬于哪種職業(yè),要不要轉行?
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)。
21世紀初,也許數(shù)據(jù)科學家的頭銜在任何行業(yè)都不常見,但它迅速成為近幾年職業(yè)趨勢中爆發(fā)的熱詞。我們真的是第一次看到這樣的工作嗎?事實上,早在數(shù)據(jù)科學出現(xiàn)之前,我們已經(jīng)有了一個非常相似的職業(yè),現(xiàn)在也依然存在著——那就是統(tǒng)計學家。
兩者的區(qū)別是什么?它們有什么相似之處?本文就將來回答這些問題。
數(shù)據(jù)科學家
這個角色最近變得非常受歡迎是有原因的。當你需要為公司招聘一位數(shù)據(jù)科學家時,你正在將多種角色融合到一個職位中。
成為一名數(shù)據(jù)科學家所需要的技能令人望而生畏,這個職業(yè)通常是跨職能的——需要同時掌握業(yè)務的技術技能和軟技能。僅僅懂得編碼技術還不夠,還要知道如何與非技術性的利益相關者和公司領導一起解決重要的業(yè)務問題。有一些直接的技能是數(shù)據(jù)科學家需要知道的,但是有一些與職業(yè)不相稱的技能,也必須在一些情況下通過一段時間的實踐來掌握。
這些技能技術含量較低,通常包括但不限于:形成一個問題,形成一個問題陳述,為回答該問題創(chuàng)建一個過程,向利益相關者展示發(fā)現(xiàn)并解釋結果。
數(shù)據(jù)科學所需的一些關鍵技能:機器學習庫、Python、R編程、SQL……
統(tǒng)計學家
統(tǒng)計學家這一職業(yè)比數(shù)據(jù)科學家早出現(xiàn)很多年,無數(shù)的行業(yè)都需要這個職位。如果你想在醫(yī)療保健、安全、學術、市場營銷、經(jīng)濟等多個領域工作,你一定要成為該領域的統(tǒng)計學家。
統(tǒng)計學家的主要職責包括但不限于:實驗設計、開展研究、估算和開展調查。你還需要有強大的數(shù)學和實驗設計背景。這個職位還需要軟技能,包括向利益相關者報告你的調查結果,以及根據(jù)這些統(tǒng)計結果所需要的相應改變。
統(tǒng)計所需的一些關鍵技能:SAS編程、實驗、設計、數(shù)學……
相似性
如你所見,即使這兩個職業(yè)所需的一些技能并不完全相同,但有一些是相似的。以下是這兩個職業(yè)的一些相似之處:
- 對數(shù)學的理解力
- 調查問題
- 探索性數(shù)據(jù)分析
- 趨勢分析
- 預見性
- 可視化
- 向非技術用戶報告調查結果
當然不止于此,這些僅僅是我在自己所了解到的職業(yè)以及各自的工作描述中遇到的一些相似之處。統(tǒng)計是否會隨著時間的推移變得更像數(shù)據(jù)科學,還是反過來——或者它們是否會相互分化,這是一個有趣的問題。
差異性
現(xiàn)在,我們來討論一下這些職業(yè)之間的區(qū)別。首先,統(tǒng)計學家比數(shù)據(jù)科學家存在的時間要長得多,這意味著差異可能存在于新技術中。
統(tǒng)計主要包括:
- 一次性報告
- 使用SAS編程
- 關注線性回歸診斷圖
- 重視顯著性檢驗
- 注重t檢驗、方差分析和多元方差分析等
- 收集更多的人工數(shù)據(jù)(有時來自調查)
- 通常情況下,統(tǒng)計學家常見于醫(yī)療保健和經(jīng)濟領域
- 更學術化
數(shù)據(jù)科學主要包括:
- 自動化
- 使用SQL查詢收集數(shù)據(jù)
- 機器學習庫,如 sklearn和TensorFlow
- 使用Python和R編程語言
- 部署自動模型(用于應用程序)
- 重視軟件工程實踐
以上描述的差異也可以從工作描述和個人經(jīng)驗中感受到。由于公司不同,你可能會發(fā)現(xiàn)這些技能有重疊的部分。
綜上所述,統(tǒng)計學家和數(shù)據(jù)科學家,數(shù)據(jù)科學研究和統(tǒng)計研究的區(qū)別是什么?可以用一個詞來概括——新技術帶來的自動化。
其中的一個職業(yè)比另一個更重要嗎?不,它們都是重要的角色。如果你想專注于顯著性、檢驗、實驗設計、正態(tài)分布和診斷性繪圖,那么去當統(tǒng)計學家吧。如果你想練習更多的軟件工程,比如編碼和機器學習模型的自動化,就去當數(shù)據(jù)科學家吧。你會發(fā)現(xiàn),這兩個職業(yè)的很多工作描述互相重疊,但很少發(fā)現(xiàn)統(tǒng)計學家需要使用機器學習庫。
希望這篇文章對正在考慮開始新職業(yè)或轉行的你有幫助。