小白上路?工程師轉(zhuǎn)型?應(yīng)屆畢業(yè)生?三種“圈外人”的數(shù)據(jù)科學(xué)入行指南
大數(shù)據(jù)文摘出品
編譯:李雷、羅然、Aileen
許多數(shù)據(jù)科學(xué)職業(yè)建議(或求職/面試準(zhǔn)備建議)都有類(lèi)似的問(wèn)題:受眾太寬,建議泛泛。
本文作者深受其害,這些繁多的資料使得不少有抱負(fù)的準(zhǔn)數(shù)據(jù)科學(xué)家很困惑,到底如何分配時(shí)間到他們想進(jìn)入的領(lǐng)域。
這篇文章中,本文作者將針對(duì)三種不同的、想要進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域的人群,給出自己的經(jīng)驗(yàn),幫助他們迅速有效入行。
雖然沒(méi)有適合每個(gè)人的***解決方案,但這三類(lèi)建議值得想轉(zhuǎn)行的你一看。
第1類(lèi):新手上路
如果你剛剛進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,請(qǐng)記住這一點(diǎn):這個(gè)領(lǐng)域發(fā)展很快,我在這里給出的建議基本上在你工作時(shí)已經(jīng)過(guò)時(shí)了。能滿(mǎn)足2017年招聘崗位要求的建議策略,在如今可能就不滿(mǎn)足,而今天的數(shù)據(jù)科學(xué)領(lǐng)域招聘標(biāo)準(zhǔn)與一兩年后的標(biāo)準(zhǔn)之間的差異可能更大。
因此,如果你打算在數(shù)據(jù)科學(xué)領(lǐng)域發(fā)展事業(yè),并且沒(méi)有編程經(jīng)驗(yàn)和STEM(科學(xué)Science,科技Technology,工程Engineering,數(shù)學(xué)Mathematics四門(mén)學(xué)科英文首字母的縮寫(xiě))背景,那么這里有一些建議:
- 首先要保持開(kāi)放的心態(tài)。如果你是一個(gè)新手,那么你實(shí)際上并不知道什么是數(shù)據(jù)科學(xué),所以它完全有可能不是你想要的工作領(lǐng)域。請(qǐng)與LinkedIn上的一些數(shù)據(jù)科學(xué)家進(jìn)行聯(lián)系,請(qǐng)他們喝咖啡并向他們請(qǐng)教;并關(guān)注數(shù)據(jù)科學(xué)播客。要成為數(shù)據(jù)科學(xué)家需要花費(fèi)大量的時(shí)間和精力,如果僅因你自認(rèn)為駕馭數(shù)據(jù)科學(xué)很酷,然后就一頭扎進(jìn)去,這并不是冒險(xiǎn)的好理由。請(qǐng)確保充分了解數(shù)據(jù)科學(xué)中不好的方面,比如數(shù)據(jù)整理,以及構(gòu)建數(shù)據(jù)生產(chǎn)流水線(xiàn),而這些工作占了數(shù)據(jù)科學(xué)家日常工作的大部分時(shí)間。
- 如果你決定要從事數(shù)據(jù)科學(xué)領(lǐng)域的工作,那太好了!你首先要做的是學(xué)習(xí)Python。盡快在MOOC(大規(guī)模網(wǎng)絡(luò)公開(kāi)課平臺(tái)即慕課)上選擇相關(guān)的課程項(xiàng)目。當(dāng)熟悉Python基本用法后,請(qǐng)學(xué)習(xí)如何使用Jupyter notebooks工具,并選學(xué)一些數(shù)據(jù)科學(xué)領(lǐng)域的網(wǎng)絡(luò)公開(kāi)課。
- 如果你是完全從零開(kāi)始的,一開(kāi)始就以高級(jí)的數(shù)據(jù)科學(xué)職位為目標(biāo)可能不太好,選擇一些入門(mén)級(jí)的職位比較好,比如數(shù)據(jù)可視化或數(shù)據(jù)分析職業(yè)的需求量很大,并且市場(chǎng)需求也大。這些崗位的人員通常與數(shù)據(jù)科學(xué)家一起工作,一旦你積累了相關(guān)經(jīng)驗(yàn),就為今后的勝任更高級(jí)的數(shù)據(jù)科學(xué)相關(guān)職位奠定了基礎(chǔ)。
如何包裝個(gè)人品牌:如果你已經(jīng)準(zhǔn)備好申請(qǐng)工作,你可能會(huì)驚訝地發(fā)現(xiàn)個(gè)人品牌在數(shù)據(jù)科學(xué)中非常重要。由于你沒(méi)有任何專(zhuān)業(yè)經(jīng)驗(yàn),或者沒(méi)有計(jì)算機(jī)科學(xué)專(zhuān)業(yè)的研究生學(xué)位,你也許會(huì)擔(dān)心個(gè)人亮點(diǎn)不足。但實(shí)際上這可能是***的優(yōu)勢(shì)所在:如自學(xué)成才的開(kāi)發(fā)人員/數(shù)據(jù)科學(xué)家,這些將成為公司可以利用的快速學(xué)習(xí)和努力工作的優(yōu)點(diǎn)。但問(wèn)題是,你背負(fù)著去實(shí)現(xiàn)那個(gè)形象的重?fù)?dān):這是一座陡峭的山需要你去攀登,但是回報(bào)肯定是值得的。
第2類(lèi):軟件工程師
在我遇到的專(zhuān)業(yè)數(shù)據(jù)科學(xué)家中約有20%是軟件工程師,一方面,他們有從編寫(xiě)程序到形成產(chǎn)品的工作經(jīng)驗(yàn),是開(kāi)發(fā)團(tuán)隊(duì)中難得的經(jīng)驗(yàn)人才。另一方面,對(duì)于全棧開(kāi)發(fā)人員的需求很多,使得公司比較愿意朝著全棧工程師方向培養(yǎng)軟件工程師,即使他們的錄用通知上寫(xiě)的職位是“數(shù)據(jù)科學(xué)”。所以你要避免被當(dāng)作軟件工程師而不是數(shù)據(jù)科學(xué)家。
其他一些建議:
- 首先可以先往更注重后端/數(shù)據(jù)庫(kù)的方向上靠。把深化對(duì)數(shù)據(jù)生成線(xiàn)流水線(xiàn)的認(rèn)識(shí)作為良好的開(kāi)端,可以幫助你建立關(guān)鍵的數(shù)據(jù)處理技能;當(dāng)然也可以幫你重塑自己,把自己塑造成一個(gè)經(jīng)驗(yàn)豐富的數(shù)據(jù)管理者。
- 機(jī)器學(xué)習(xí)工程可能是更容易過(guò)渡到數(shù)據(jù)科學(xué)領(lǐng)域的,因?yàn)樗驮擃I(lǐng)域的研究?jī)?nèi)容最接近。你可以先著手部署模型或?qū)⑺鼈兗傻浆F(xiàn)有應(yīng)用程序,因?yàn)檫@可以充分利用你的現(xiàn)有技能,這是邁出***步的好方法,反正以后你總是可以投入更多精力到模型開(kāi)發(fā)中的。
- 為了讓招聘人印象深刻,你很可能需要建立機(jī)器學(xué)習(xí)或數(shù)據(jù)科學(xué)項(xiàng)目。那么利用你的軟件工程技能,把這些項(xiàng)目集成到可以向招聘人員和技術(shù)主管展示的應(yīng)用程序中。這會(huì)特別有效,因?yàn)樗苤庇^(guān),并體現(xiàn)了你作為一個(gè)全棧數(shù)據(jù)科學(xué)家的潛力。
- 要記住的是:在過(guò)渡期,你的薪資極大可能會(huì)變少。即使是高級(jí)軟件工程師換到數(shù)據(jù)科學(xué)領(lǐng)域時(shí),通常也是要先過(guò)渡到初級(jí)職位的,但令人驚訝的是,他們中的很多人在做決定時(shí)并沒(méi)有考慮這個(gè)因素,然而拿到的薪資少了,卻又失望。
如何包裝個(gè)人品牌:一個(gè)最簡(jiǎn)單的方法就是充分利用你的軟件開(kāi)發(fā)經(jīng)驗(yàn)。作為初級(jí)職員,已經(jīng)知道如何編寫(xiě)干凈、文檔齊全的代碼,以及如何與他人協(xié)作,這是大多數(shù)職位申請(qǐng)者不具備的。如果要真正做到善于寫(xiě)“干凈的產(chǎn)品代碼”,你還需要盡可能多的去學(xué)習(xí)數(shù)據(jù)科學(xué)領(lǐng)域中類(lèi)似的好案例。
第3類(lèi):新CS、數(shù)學(xué)或物理學(xué)畢業(yè)生
如果你是應(yīng)屆理科本科,碩士或博士畢業(yè)生,那么你統(tǒng)計(jì)學(xué)和數(shù)學(xué)基礎(chǔ)可能很好。但你可能從來(lái)沒(méi)有申請(qǐng)過(guò)真正的工作職位,也不知道如何準(zhǔn)備面試。而且就算你在讀期間一直有編碼,但很可能無(wú)法編寫(xiě)干凈、組織良好的代碼。
所以要記住以下幾點(diǎn):
- 你在讀期間所學(xué)的R是不夠的。如果你是一名物理學(xué)家,并且賭定要用MATLAB或Mathematica的技能找到工作,那這可能不太會(huì)如愿;所以學(xué)習(xí)Python吧。
- 你可能需要盡快學(xué)習(xí)這些你沒(méi)接觸過(guò)的東西:協(xié)作版本控制(學(xué)習(xí)如何用GitHub與其他人一起工作)、容器化(學(xué)習(xí)如何使用Docker)和開(kāi)發(fā)(學(xué)習(xí)如何用AWS或類(lèi)似的服務(wù)在云上部署模型)。另外,SQL也是必須的。
- 學(xué)習(xí)Python中的測(cè)試驅(qū)動(dòng)開(kāi)發(fā),如何使用文檔字符串,如何對(duì)代碼進(jìn)行模塊化,以及如何使用Jupyter筆記本(如果還不會(huì)的話(huà))。
- 如果你的領(lǐng)域特別注重?cái)?shù)學(xué),那么深度學(xué)習(xí)可能是一個(gè)很好的探索方向。但你可能會(huì)發(fā)現(xiàn),從更傳統(tǒng)的“scikit-learn”類(lèi)型的數(shù)據(jù)科學(xué)開(kāi)始起步,再過(guò)渡到深度學(xué)習(xí)可能更容易。最重要的是要入行,并盡快開(kāi)始編程。
如何包裝個(gè)人品牌::特別是如果你學(xué)的是數(shù)學(xué)或物理專(zhuān)業(yè),那么***的策略是要呈現(xiàn)出自己是具有深厚理論知識(shí)的人。要做到這一點(diǎn),你需要能夠自信地解釋各種模型是如何工作的,***要熟悉文獻(xiàn)中***的熱點(diǎn)(特別是如果你的目標(biāo)是深度學(xué)習(xí)的話(huà))。
警告:當(dāng)然我所提供的建議并不能涵蓋所有職業(yè)。對(duì)于軟件工程師而言,他們確實(shí)比其他人走的遠(yuǎn)一些,一些有數(shù)學(xué)基礎(chǔ)的初學(xué)者可能是最適合的深度學(xué)習(xí)的研究者。但是以上這些建議能為你的技能精進(jìn)提供一個(gè)好的起點(diǎn)。
***,無(wú)論您是軟件工程師、應(yīng)屆畢業(yè)生,還是完全初學(xué)者,都要問(wèn)自己一個(gè)關(guān)鍵問(wèn)題:在上述建議中,什么樣的職業(yè)軌跡最接近你。如果你是想成功入門(mén)數(shù)據(jù)分析師或數(shù)據(jù)可視化專(zhuān)家,那么這將是協(xié)助你走上正確的職業(yè)軌跡的***方法。
相關(guān)報(bào)道:
https://towardsdatascience.com/3-common-data-science-career-transitions-and-how-to-make-them-happen-588c3618942f
【本文是51CTO專(zhuān)欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】