讓你掛掉數(shù)據(jù)科學(xué)家面試的4宗罪
“數(shù)據(jù)科學(xué)家”可能是本世紀(jì)最性感的工作。但雇用一個(gè)數(shù)據(jù)科學(xué)家卻不是如此。
對(duì)于立志在數(shù)據(jù)科學(xué)領(lǐng)域有一定作為的新手來(lái)說(shuō),“數(shù)據(jù)科學(xué)家”可不僅僅是一個(gè)光彩照人的代名詞。
新手需要不斷的學(xué)習(xí),才能成長(zhǎng)為一名具有創(chuàng)造力的數(shù)據(jù)科學(xué)家。
另外,作為小白的你可能急切想得到一份數(shù)據(jù)科學(xué)的職位。
但你在面試的時(shí)候,面試官讓你“掛掉”的原因可能有數(shù)百種。
總的來(lái)說(shuō),可以分為四種。為了更好的理解這四項(xiàng)失誤,文摘菌將此類比狙擊手的訓(xùn)練。
讓我們開(kāi)始吧......那么,讓數(shù)據(jù)科學(xué)家面試失敗被拒的4宗罪是什么?
用機(jī)器學(xué)習(xí)流行語(yǔ)來(lái)修飾你的簡(jiǎn)歷
與任何工作一樣,用行業(yè)術(shù)語(yǔ)來(lái)刻畫個(gè)人簡(jiǎn)歷可能會(huì)很吸引人的。數(shù)據(jù)科學(xué)領(lǐng)域也不乏各種流行用語(yǔ)。也許這種表面功夫可能能提高你的簡(jiǎn)歷通過(guò)人力資源自動(dòng)揀選的機(jī)會(huì),但往往更可能會(huì)事與愿違。
很多時(shí)候,簡(jiǎn)歷上聲稱的高級(jí)分析技能實(shí)際上只是會(huì)用excel數(shù)據(jù)透視表、SQL查詢或Google分析。就算不管因此而在面試上浪費(fèi)掉的時(shí)間,這種拙劣的策略也會(huì)導(dǎo)致求職者徹底失敗或者喪失信心。
對(duì)于一個(gè)有抱負(fù)的狙擊手來(lái)說(shuō),這種行為無(wú)異于光說(shuō)不做,穿著軍服拿著槍,卻不去訓(xùn)練自己成為一名士兵。盡管這聽(tīng)起來(lái)很荒謬,但是做一只披著狼皮的羊一點(diǎn)意思也沒(méi)有。
建模少而只顧程序庫(kù)調(diào)用
許多求職者都聲稱他們?nèi)绾问煜そ?,但?shí)際上他們都只是在努力解釋模型函數(shù)的調(diào)用和參數(shù)。其實(shí)在問(wèn)到諸如某項(xiàng)技術(shù)是做什么的之前,比如Random Forest,還有一個(gè)更重要的問(wèn)題就是為什么你會(huì)首先選擇它。
說(shuō)實(shí)在的,一個(gè)模型是可以通過(guò)單行庫(kù)調(diào)用來(lái)運(yùn)行。但是,機(jī)器學(xué)習(xí)絕不僅僅是這樣。比如說(shuō),人們需要明白什么情況下邏輯回歸比SVM更合適。又或者,什么時(shí)候簡(jiǎn)單的外推法會(huì)比ARIMA或Holt-Winters等預(yù)測(cè)技術(shù)更強(qiáng)大。
一個(gè)好的狙擊手需要做的不僅僅是瞄準(zhǔn)和射擊。其實(shí),射擊訓(xùn)練只占狙擊學(xué)校課程的20%。真正的狙擊手需要其他細(xì)節(jié)技能,比如耐心、紀(jì)律和好的觀察評(píng)估目標(biāo)距離的能力。
缺乏數(shù)據(jù)分析必不可少的基礎(chǔ)知識(shí)
盡管對(duì)機(jī)器學(xué)習(xí)技術(shù)的直觀理解可以成為求職者的強(qiáng)項(xiàng),但他們往往在這方面反而做得不足。他們常常忽視投入實(shí)踐培訓(xùn)以掌握更多基礎(chǔ)技能,如統(tǒng)計(jì)和探索性數(shù)據(jù)分析。
建模僅占整個(gè)數(shù)據(jù)分析生命周期的一小部分。在任何成功的機(jī)器學(xué)習(xí)(ML)項(xiàng)目中,超過(guò)50%的時(shí)間都是花在準(zhǔn)備數(shù)據(jù),討論和尋找方法上。還有大約25%的時(shí)間花在之后的模型解釋和建議上。
即使求職者都標(biāo)榜他們的分析項(xiàng)目有90%的準(zhǔn)確率,但是如果你看到他們?cè)诮忉宲值(當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率)是什么,和為什么模型需要置信區(qū)間時(shí)那種越說(shuō)越?jīng)]自信的表情,你就會(huì)覺(jué)得這對(duì)他們來(lái)說(shuō)簡(jiǎn)直是一場(chǎng)悲劇。
就像狙擊手首先需要成為一名偉大的步兵一樣,牢牢掌握基礎(chǔ)知識(shí)在所有學(xué)科中都是至關(guān)重要的。如果一個(gè)人在戰(zhàn)斗中不會(huì)修槍或是開(kāi)槍走火的話,那么他槍法再好又有什么用?
不懂應(yīng)用分析技術(shù)來(lái)解決業(yè)務(wù)問(wèn)題
顯然要在我們剛才討論過(guò)的各方面都做到很好已經(jīng)是一項(xiàng)艱巨的任務(wù)。但是我們還沒(méi)講到整個(gè)鏈條中的關(guān)鍵環(huán)節(jié),而這正是大多數(shù)面試沒(méi)有了下文的原因。
數(shù)據(jù)科學(xué)家的最終使命是解決業(yè)務(wù)問(wèn)題,而不僅僅是分析數(shù)據(jù)或建立一個(gè)偉大的模型,這是數(shù)據(jù)分析的***目標(biāo)。人們需要在用分析工具處理任何數(shù)據(jù)之前就界定好正確的業(yè)務(wù)問(wèn)題,并制定解決問(wèn)題的一系列步驟。
當(dāng)求職者被問(wèn)及企業(yè)如何解決客戶流失問(wèn)題時(shí),如果他急于用數(shù)據(jù)分析來(lái)解釋,或者更有甚者,單靠模型名稱來(lái)胡亂預(yù)測(cè)客戶流失,那么面試就沒(méi)法繼續(xù)下去了。較好的方式是從探討客戶注冊(cè)的原因以及客戶的期望和影響業(yè)務(wù)的核心因素是什么開(kāi)始。
這就好比一個(gè)專家級(jí)別的狙擊手無(wú)所不知,但卻不能隱蔽自己或找到真正需要除掉的目標(biāo)。這樣的人真的很危險(xiǎn),因?yàn)樨i隊(duì)友比神對(duì)手更具風(fēng)險(xiǎn)性。
總結(jié):對(duì)數(shù)據(jù)科學(xué)的追求
總之,我們對(duì)數(shù)據(jù)科學(xué)的追求必須有一定的規(guī)則:
- 通過(guò)問(wèn)題重構(gòu)和一系列步驟推演來(lái)應(yīng)對(duì)挑戰(zhàn),解決業(yè)務(wù)問(wèn)題;
- 把基礎(chǔ)知識(shí)技能應(yīng)用于統(tǒng)計(jì)學(xué)和探索性數(shù)據(jù)分析中,以獲得數(shù)據(jù)感并代分析方法;
- 選擇一系列分析技術(shù)或機(jī)器學(xué)習(xí)模型,然后為業(yè)務(wù)用戶處理和解釋分析結(jié)果;
- 并通過(guò)正確定位自己的專業(yè)知識(shí)來(lái)展現(xiàn)這些技能,這是數(shù)據(jù)科學(xué)家所必備的。
好吧,愿你能消除這些缺陷,并在數(shù)據(jù)分析職場(chǎng)中獲得一席之地!
相關(guān)報(bào)道:
https://towardsdatascience.com/4-ways-to-fail-a-data-scientist-job-interview-d9c4c85c683
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】