讓你掛掉數(shù)據(jù)科學(xué)家面試的4宗罪
“數(shù)據(jù)科學(xué)家”可能是本世紀最性感的工作。但雇用一個數(shù)據(jù)科學(xué)家卻不是如此。
對于立志在數(shù)據(jù)科學(xué)領(lǐng)域有一定作為的新手來說,“數(shù)據(jù)科學(xué)家”可不僅僅是一個光彩照人的代名詞。
新手需要不斷的學(xué)習,才能成長為一名具有創(chuàng)造力的數(shù)據(jù)科學(xué)家。
另外,作為小白的你可能急切想得到一份數(shù)據(jù)科學(xué)的職位。
但你在面試的時候,面試官讓你“掛掉”的原因可能有數(shù)百種。
總的來說,可以分為四種。為了更好的理解這四項失誤,文摘菌將此類比狙擊手的訓(xùn)練。
讓我們開始吧......那么,讓數(shù)據(jù)科學(xué)家面試失敗被拒的4宗罪是什么?
用機器學(xué)習流行語來修飾你的簡歷
與任何工作一樣,用行業(yè)術(shù)語來刻畫個人簡歷可能會很吸引人的。數(shù)據(jù)科學(xué)領(lǐng)域也不乏各種流行用語。也許這種表面功夫可能能提高你的簡歷通過人力資源自動揀選的機會,但往往更可能會事與愿違。
很多時候,簡歷上聲稱的高級分析技能實際上只是會用excel數(shù)據(jù)透視表、SQL查詢或Google分析。就算不管因此而在面試上浪費掉的時間,這種拙劣的策略也會導(dǎo)致求職者徹底失敗或者喪失信心。
對于一個有抱負的狙擊手來說,這種行為無異于光說不做,穿著軍服拿著槍,卻不去訓(xùn)練自己成為一名士兵。盡管這聽起來很荒謬,但是做一只披著狼皮的羊一點意思也沒有。
建模少而只顧程序庫調(diào)用
許多求職者都聲稱他們?nèi)绾问煜そ?,但實際上他們都只是在努力解釋模型函數(shù)的調(diào)用和參數(shù)。其實在問到諸如某項技術(shù)是做什么的之前,比如Random Forest,還有一個更重要的問題就是為什么你會首先選擇它。
說實在的,一個模型是可以通過單行庫調(diào)用來運行。但是,機器學(xué)習絕不僅僅是這樣。比如說,人們需要明白什么情況下邏輯回歸比SVM更合適。又或者,什么時候簡單的外推法會比ARIMA或Holt-Winters等預(yù)測技術(shù)更強大。
一個好的狙擊手需要做的不僅僅是瞄準和射擊。其實,射擊訓(xùn)練只占狙擊學(xué)校課程的20%。真正的狙擊手需要其他細節(jié)技能,比如耐心、紀律和好的觀察評估目標距離的能力。
缺乏數(shù)據(jù)分析必不可少的基礎(chǔ)知識
盡管對機器學(xué)習技術(shù)的直觀理解可以成為求職者的強項,但他們往往在這方面反而做得不足。他們常常忽視投入實踐培訓(xùn)以掌握更多基礎(chǔ)技能,如統(tǒng)計和探索性數(shù)據(jù)分析。
建模僅占整個數(shù)據(jù)分析生命周期的一小部分。在任何成功的機器學(xué)習(ML)項目中,超過50%的時間都是花在準備數(shù)據(jù),討論和尋找方法上。還有大約25%的時間花在之后的模型解釋和建議上。
即使求職者都標榜他們的分析項目有90%的準確率,但是如果你看到他們在解釋p值(當原假設(shè)為真時所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率)是什么,和為什么模型需要置信區(qū)間時那種越說越?jīng)]自信的表情,你就會覺得這對他們來說簡直是一場悲劇。
就像狙擊手首先需要成為一名偉大的步兵一樣,牢牢掌握基礎(chǔ)知識在所有學(xué)科中都是至關(guān)重要的。如果一個人在戰(zhàn)斗中不會修槍或是開槍走火的話,那么他槍法再好又有什么用?
不懂應(yīng)用分析技術(shù)來解決業(yè)務(wù)問題
顯然要在我們剛才討論過的各方面都做到很好已經(jīng)是一項艱巨的任務(wù)。但是我們還沒講到整個鏈條中的關(guān)鍵環(huán)節(jié),而這正是大多數(shù)面試沒有了下文的原因。
數(shù)據(jù)科學(xué)家的最終使命是解決業(yè)務(wù)問題,而不僅僅是分析數(shù)據(jù)或建立一個偉大的模型,這是數(shù)據(jù)分析的***目標。人們需要在用分析工具處理任何數(shù)據(jù)之前就界定好正確的業(yè)務(wù)問題,并制定解決問題的一系列步驟。
當求職者被問及企業(yè)如何解決客戶流失問題時,如果他急于用數(shù)據(jù)分析來解釋,或者更有甚者,單靠模型名稱來胡亂預(yù)測客戶流失,那么面試就沒法繼續(xù)下去了。較好的方式是從探討客戶注冊的原因以及客戶的期望和影響業(yè)務(wù)的核心因素是什么開始。
這就好比一個專家級別的狙擊手無所不知,但卻不能隱蔽自己或找到真正需要除掉的目標。這樣的人真的很危險,因為豬隊友比神對手更具風險性。
總結(jié):對數(shù)據(jù)科學(xué)的追求
總之,我們對數(shù)據(jù)科學(xué)的追求必須有一定的規(guī)則:
- 通過問題重構(gòu)和一系列步驟推演來應(yīng)對挑戰(zhàn),解決業(yè)務(wù)問題;
- 把基礎(chǔ)知識技能應(yīng)用于統(tǒng)計學(xué)和探索性數(shù)據(jù)分析中,以獲得數(shù)據(jù)感并代分析方法;
- 選擇一系列分析技術(shù)或機器學(xué)習模型,然后為業(yè)務(wù)用戶處理和解釋分析結(jié)果;
并通過正確定位自己的專業(yè)知識來展現(xiàn)這些技能,這是數(shù)據(jù)科學(xué)家所必備的。
好吧,愿你能消除這些缺陷,并在數(shù)據(jù)分析職場中獲得一席之地!