5個(gè)步驟開啟你的數(shù)據(jù)科學(xué)職業(yè)生涯!
本文為剛剛接觸數(shù)據(jù)科學(xué)的新人,提出五個(gè)職場(chǎng)準(zhǔn)備的建議。
數(shù)據(jù)科學(xué)已經(jīng)成為21世紀(jì)最熱門的工作領(lǐng)域,但如何才能成為數(shù)據(jù)科學(xué)家呢? 作為一名有抱負(fù)的數(shù)據(jù)科學(xué)家,或是準(zhǔn)備從事數(shù)據(jù)科學(xué)工作的學(xué)生,你應(yīng)該做好哪些準(zhǔn)備? 需要什么技能?不要擔(dān)心! 本文將會(huì)回答以上所有問(wèn)題,并提供相關(guān)的資源鏈接,幫助你開啟新的職業(yè)生涯!
數(shù)據(jù)科學(xué)是一個(gè)跨學(xué)科的領(lǐng)域,這意味著數(shù)據(jù)科學(xué)家要了解多個(gè)領(lǐng)域的知識(shí),并成為不同領(lǐng)域的專家。 數(shù)據(jù)科學(xué)家必須在以下方面具備堅(jiān)實(shí)的基礎(chǔ):
- 計(jì)算機(jī)科學(xué)
- 統(tǒng)計(jì)研究(需要扎實(shí)的基礎(chǔ))
- 線性代數(shù)
- 數(shù)據(jù)處理(數(shù)據(jù)分析的專業(yè)知識(shí))
- 機(jī)器學(xué)習(xí)
- 軟件工程
- Python編程
- R編程
- 業(yè)務(wù)領(lǐng)域知識(shí)
為了成為一名高水平的數(shù)據(jù)科學(xué)家,下圖是你需要掌握的一些知識(shí)領(lǐng)域:
除非你像激光束一樣,將研究集中在這些領(lǐng)域,否則對(duì)上圖中的一個(gè)或多個(gè)主題感到陌生是很正常的。 或者你了解兩三個(gè)主題,但對(duì)其余主題了解甚少。 例如,你可能是一名計(jì)算機(jī)科學(xué)專業(yè)的學(xué)生,掌握數(shù)學(xué)知識(shí)但不了解統(tǒng)計(jì)研究分析所要求的高級(jí)統(tǒng)計(jì)知識(shí)。或者,你可能是一名有一些編程基礎(chǔ)的統(tǒng)計(jì)學(xué)家。
有很多方法可以幫助你開啟數(shù)據(jù)科學(xué)的職業(yè)生涯。 其中,你必須做的五件事是:
- 向具有多年經(jīng)驗(yàn)的前輩學(xué)習(xí)Python和R
- 在GitHub上構(gòu)建數(shù)據(jù)科學(xué)作品集
- 加入Kaggle并參加數(shù)據(jù)科學(xué)競(jìng)賽
- 練習(xí)面試問(wèn)題
- 做好基本的網(wǎng)絡(luò)聲譽(yù)管理,以提升形象
1. 向具有多年行業(yè)經(jīng)驗(yàn)的前輩學(xué)習(xí)Python和R
行業(yè)經(jīng)驗(yàn)是無(wú)可替代的。 比起一位熱心的業(yè)余愛好者(如在線提供的許多課程),擁有5年以上數(shù)據(jù)科學(xué)行業(yè)工作經(jīng)驗(yàn)的人將是講師的不二人選。 學(xué)習(xí)Python和R是一方面,掌握Python和R是完全不同的事情。如果想在這個(gè)行業(yè)做得好,需要做到掌握技能,而不僅僅是具備基本能力。一定要確保你的講師具有可靠的行業(yè)經(jīng)驗(yàn),因?yàn)檫@種經(jīng)歷會(huì)幫助你拿到***的數(shù)據(jù)科學(xué)公司的offer。相比于擁有相關(guān)專業(yè)博士學(xué)位的學(xué)者,從擁有行業(yè)經(jīng)驗(yàn)的專家那里會(huì)學(xué)到最多。
2. 在GitHub上構(gòu)建數(shù)據(jù)科學(xué)作品集
在GitHub上擁有在線作品集(online portfolio)至關(guān)重要!
如果你不對(duì)學(xué)習(xí)的內(nèi)容進(jìn)行編程練習(xí),也沒有將課程應(yīng)用于實(shí)際數(shù)據(jù)和現(xiàn)實(shí)情景,那么再好的培訓(xùn)都是無(wú)效的。你需要做數(shù)據(jù)科學(xué)項(xiàng)目,并且盡量使你的項(xiàng)目具有吸引力。
GitHub作品集應(yīng)該遵循以下準(zhǔn)則:
3. 加入Kaggle并參加數(shù)據(jù)科學(xué)競(jìng)賽
Kaggle.com就是你的訓(xùn)練場(chǎng)。
如果你準(zhǔn)備入手?jǐn)?shù)據(jù)科學(xué),立即成為Kaggler吧! 或者,如果你更傾向于開發(fā),請(qǐng)加入TopCoder!(TopCoder也有數(shù)據(jù)科學(xué)發(fā)展路徑)。 Kaggle是公認(rèn)的數(shù)據(jù)科學(xué)的發(fā)源地,因?yàn)镵aggle多年來(lái)一直舉辦數(shù)據(jù)科學(xué)競(jìng)賽,并且是國(guó)際上所有***數(shù)據(jù)科學(xué)競(jìng)賽的集合地。 收到知名公司offer的最簡(jiǎn)單方法之一就是在Kaggle上獲得盡可能高的排名。 更重要的是,你可以將自己的表現(xiàn)與行業(yè)中的***競(jìng)爭(zhēng)對(duì)手進(jìn)行比較。
4. 練習(xí)面試問(wèn)題
現(xiàn)在,很多網(wǎng)站都有數(shù)據(jù)科學(xué)崗位面試中使用的問(wèn)題集。沒有企業(yè)會(huì)讓你死記硬背200個(gè)面試問(wèn)題,但他們確實(shí)希望你能夠在代碼(***是Python)或偽代碼中解決基本的數(shù)據(jù)科學(xué)和算法問(wèn)題。 ***還要了解基本概念,例如交叉驗(yàn)證是什么,維度的詛咒,過(guò)擬合的問(wèn)題以及在實(shí)際場(chǎng)景中如何處理它。此外,你還需要能解釋主要數(shù)據(jù)科學(xué)算法的內(nèi)部細(xì)節(jié),例如AdaBoost。 線性代數(shù),統(tǒng)計(jì)學(xué)和一些基本的多變量微積分的知識(shí)也可以幫助你在競(jìng)爭(zhēng)中搶占先機(jī)。
5. 管理你的網(wǎng)絡(luò)聲譽(yù)
這似乎與數(shù)據(jù)科學(xué)無(wú)關(guān),但它是任何求職的基本要求。想想未來(lái)的雇主在看到求職者名姓名后的***件事是什么?他會(huì)先百度這個(gè)名字。當(dāng)搜索你的名字時(shí),會(huì)出現(xiàn)什么內(nèi)容?你的網(wǎng)絡(luò)資料能否承受以下考驗(yàn)?
如果有以上這些潛在的問(wèn)題,你可能需要調(diào)整自己的網(wǎng)絡(luò)個(gè)人資料。你可以通過(guò)博客文章,成熟的網(wǎng)絡(luò)評(píng)論,甚至為自己創(chuàng)建博客,向世界展現(xiàn)積極的自己。在如今的這個(gè)在線、數(shù)字、互聯(lián)的世界,這對(duì)于求職者來(lái)說(shuō)至關(guān)重要。
人才市場(chǎng)上待挑選的產(chǎn)品
在人才市場(chǎng)上,你試圖將自己和你的網(wǎng)絡(luò)信譽(yù)銷售給從未見過(guò)你的人,他甚至沒有聽過(guò)你的名字。因此,互聯(lián)網(wǎng)資料將成為關(guān)鍵,以確保你在競(jìng)爭(zhēng)中搶占先機(jī)。目前許多培訓(xùn)網(wǎng)站提供的課程,講師都是業(yè)余愛好者或具有不到2年行業(yè)經(jīng)驗(yàn)的人士。所以,不要滿足于低價(jià)課程,在互聯(lián)網(wǎng)上,一分耕耘一分收獲。如果這是你理想的職業(yè)領(lǐng)域,初期投資肯定會(huì)有更多的長(zhǎng)期回報(bào)。
記得保持終身學(xué)習(xí)的態(tài)度。 機(jī)器學(xué)習(xí)和AI是以驚人速度發(fā)展的領(lǐng)域。訂閱RSS源和在線資源,讓你了解領(lǐng)域的***發(fā)展,這是必須要做的事情。隨時(shí)跟進(jìn)***的研究最能體現(xiàn)你的卓越追求,這些可以通過(guò)Feedly和Inoreader之類的閱讀應(yīng)用程序輕松完成。學(xué)習(xí)可能是你在大學(xué)里做的事情,但掌握是你一生所追求的目標(biāo),別輕易放棄。如果你可以按照文中提到的那樣來(lái)完善自己,你一定可以獲得自己理想的工作。***,再次強(qiáng)調(diào),一定要特別注意在GitHub上的數(shù)據(jù)科學(xué)作品集,可以幫助你在競(jìng)爭(zhēng)中脫穎而出!
譯者簡(jiǎn)介:王雨桐,UIUC統(tǒng)計(jì)學(xué)在讀碩士,本科統(tǒng)計(jì)專業(yè),目前專注于Coding技能的提升。理論到應(yīng)用的轉(zhuǎn)換中,敬畏數(shù)據(jù),持續(xù)進(jìn)化。