為什么這么多數(shù)據(jù)科學(xué)家選擇辭職
數(shù)據(jù)科學(xué)家的挫折
是的,我是數(shù)據(jù)科學(xué)家。
我們讀了很多關(guān)于數(shù)據(jù)科學(xué)是21世紀(jì)最性感的工作的故事,以及作為一個數(shù)據(jù)科學(xué)家人你可以賺到的誘人的錢,這看起來像是一份絕對理想的工作。
考慮到這個領(lǐng)域有大量高技能的人專門去解決復(fù)雜的問題(是的,“專門去”是一件積極的事情),這份工作有很多值得熱愛的地方。
但事實(shí)是,正如英國《金融時(shí)報(bào)》這篇文章所述,數(shù)據(jù)科學(xué)家通常“每周花1-2小時(shí)尋找新工作”。
此外,文章還指出,“機(jī)器學(xué)習(xí)專家在開發(fā)者名單中排名第一,占14.3%。數(shù)據(jù)科學(xué)家緊隨其后,為13.2%。”這些數(shù)據(jù)是由堆棧溢出在基于6.4萬名開發(fā)人員的調(diào)查中收集的。 我也是如此,最近我自己也換了數(shù)據(jù)科學(xué)工作。 那么為什么這么多數(shù)據(jù)科學(xué)家在尋找新的工作呢?
在回答這個問題之前,我應(yīng)該澄清一下,我仍然是一個數(shù)據(jù)科學(xué)家人。總的來說,我喜歡這份工作,我不想阻止其他人渴望成為數(shù)據(jù)科學(xué)家,因?yàn)檫@份工作有趣、刺激且有回報(bào)。這篇文章的目的是唱反調(diào),揭露這項(xiàng)工作的一些負(fù)面影響。 在我看來,我認(rèn)為許多數(shù)據(jù)科學(xué)家對他們的工作不滿意有四大原因。
期望與現(xiàn)實(shí)不符
我認(rèn)識的許多初級數(shù)據(jù)科學(xué)家(包括我自己)都想進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,因?yàn)檫@一切都是為了用對企業(yè)產(chǎn)生巨大影響的全新機(jī)器學(xué)習(xí)算法來解決復(fù)雜的問題。
這是一個機(jī)會,讓我們覺得我們正在做的工作比我們以前做過的任何事情都重要。然而,情況往往并非如此。 在我看來,期望與現(xiàn)實(shí)不符的事實(shí)是許多數(shù)據(jù)科學(xué)家離開的最終原因。這有很多原因,我不能列一個詳盡的清單,但這篇文章基本上是我遇到的一些原因的清單。
每家公司都不一樣,所以我不能代表他們所有人,除了許多公司雇傭沒有合適基礎(chǔ)設(shè)施的數(shù)據(jù)科學(xué)家來開始從人工智能中獲取價(jià)值。
這導(dǎo)致了人工智能中的冷啟動問題。再加上這些公司在雇用初級員工之前沒有雇用資深/有經(jīng)驗(yàn)的數(shù)據(jù)從業(yè)者,你現(xiàn)在已經(jīng)為雙方找到了一個幻滅和不愉快的關(guān)系的秘訣。
數(shù)據(jù)科學(xué)家人可能是來編寫智能機(jī)器學(xué)習(xí)算法來提高洞察力的,但他們不能這樣做,因?yàn)樗麄兊牡谝豁?xiàng)工作是整理數(shù)據(jù)基礎(chǔ)設(shè)施或創(chuàng)建分析報(bào)告。
相比之下,該公司只想要一張他們可以每天在董事會上展示的圖表。然后公司會感到沮喪,因?yàn)樗麄冋J(rèn)為價(jià)值沒有被足夠快地驅(qū)動,所有這些導(dǎo)致數(shù)據(jù)科學(xué)家對他們的角色不滿意。
羅伯特·張?jiān)谒牟┛臀恼轮薪o初級數(shù)據(jù)科學(xué)家提出了一個非常有見地的建議: 重要的是要評估我們的愿望與我們所處環(huán)境的關(guān)鍵路徑有多一致。尋找關(guān)鍵路徑與你的最一致的項(xiàng)目、團(tuán)隊(duì)和公司。
這突出了雇主和數(shù)據(jù)科學(xué)家之間的雙向關(guān)系。如果公司不在正確的地方,或者目標(biāo)與數(shù)據(jù)科學(xué)家一致,那么數(shù)據(jù)科學(xué)家找到其他東西只是時(shí)間問題。
對于那些感興趣的人來說,胡參孫有一個關(guān)于分析團(tuán)隊(duì)如何在Wish建立的精彩系列,我也覺得非常有見地。
數(shù)據(jù)科學(xué)家失望的另一個原因與我對學(xué)術(shù)界失望的原因相似:我相信我將能夠?qū)κ澜绺鞯氐娜藗儺a(chǎn)生巨大的影響,而不僅僅是在公司內(nèi)部。
事實(shí)上,如果公司的核心業(yè)務(wù)不是機(jī)器學(xué)習(xí)(我以前的雇主是一家媒體出版公司),那么你所做的數(shù)據(jù)科學(xué)很可能只會帶來微小的增量收益。這些可以累積成一些非常重要的東西,或者你可能幸運(yùn)地偶然發(fā)現(xiàn)了一個金礦項(xiàng)目,但這并不常見。
政治至高無上
《政治》雜志已經(jīng)有一篇精彩的文章專門討論這個問題:數(shù)據(jù)科學(xué)中最難的事情:政治,我敦促你閱讀它。
那篇文章的前幾句話差不多概括了我想說的話: 當(dāng)我早上6點(diǎn)醒來學(xué)習(xí)支持向量機(jī)時(shí),我想:“這真的很難!但是,嘿,至少我會對我未來的雇主變得非常有價(jià)值!”。
如果我能得到德洛爾,我會回到過去,打電話給“公牛隊(duì)”我自己。 如果你真的認(rèn)為知道很多機(jī)器學(xué)習(xí)算法會讓你成為最有價(jià)值的數(shù)據(jù)科學(xué)家,那么回到我上面的第一點(diǎn):期望與現(xiàn)實(shí)不符。
事實(shí)是,商界最有影響力的人需要對你有一個好的印象。這可能意味著你必須不斷地做一些特別的工作,比如從數(shù)據(jù)庫中獲取數(shù)字,在合適的時(shí)間給合適的人,做簡單的項(xiàng)目,這樣合適的人才會對你有正確的看法。在我以前的地方,我不得不經(jīng)常這樣做。盡管令人沮喪,但這是工作中不可或缺的一部分。
對于任何數(shù)據(jù),你都是最直接的人
在做任何事情取悅合適的人之后,那些有影響力的人往往不明白“數(shù)據(jù)科學(xué)家”是什么意思。這意味著你將成為分析專家,也將成為報(bào)告專家,別忘了你也將成為數(shù)據(jù)庫專家。 對你的技能做出過多假設(shè)的不只是非技術(shù)高管。
技術(shù)領(lǐng)域的其他同事認(rèn)為你知道所有相關(guān)的數(shù)據(jù)。你知道你在Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、r、Scala、Tensorflow、A/B測試、NLP、任何機(jī)器學(xué)習(xí)(以及任何其他你能想到的與of — BTW有關(guān)的數(shù)據(jù),如果你看到一份寫有所有這些內(nèi)容的工作規(guī)范,請保持清晰。
這是一家公司的工作規(guī)范,該公司不知道他們的數(shù)據(jù)策略是什么,他們會雇用任何人,因?yàn)樗麄冋J(rèn)為雇用任何數(shù)據(jù)人員都可以解決他們所有的數(shù)據(jù)問題)。
但它并沒有就此止步。因?yàn)槟阒浪羞@些,而且你顯然可以訪問所有的數(shù)據(jù),所以你應(yīng)該能夠通過……得到所有問題的答案。
嗯,它應(yīng)該在5分鐘前到達(dá)相關(guān)人員的收件箱。 試圖告訴每個人你實(shí)際知道和控制的事情可能很難。不是因?yàn)閷?shí)際上有人會對你不以為然,而是因?yàn)樽鳛橐粋€沒有什么行業(yè)經(jīng)驗(yàn)的年輕數(shù)據(jù)科學(xué)家人,你會擔(dān)心人們會對你不以為然。這可能是一個相當(dāng)困難的情況。
在孤立的團(tuán)隊(duì)中工作
當(dāng)我們看到成功的數(shù)據(jù)產(chǎn)品時(shí),我們通常會看到經(jīng)過專業(yè)設(shè)計(jì)的用戶界面,它具有智能功能,最重要的是,它是一種有用的輸出,至少用戶可以通過它來解決相關(guān)的問題。
現(xiàn)在,如果一個數(shù)據(jù)科學(xué)家人只花時(shí)間學(xué)習(xí)如何編寫和執(zhí)行機(jī)器學(xué)習(xí)算法,那么他們只能是團(tuán)隊(duì)中的一小部分(盡管是必要的),這將導(dǎo)致一個生產(chǎn)有價(jià)值產(chǎn)品的項(xiàng)目的成功。這意味著獨(dú)立工作的數(shù)據(jù)科學(xué)團(tuán)隊(duì)將難以提供價(jià)值!
盡管如此,許多公司仍然有數(shù)據(jù)科學(xué)團(tuán)隊(duì),他們提出自己的項(xiàng)目并編寫代碼來嘗試解決問題。在某些情況下,這就足夠了。
例如,如果所需要的只是一個每季度制作一次的靜態(tài)電子表格,那么它可以提供一些價(jià)值。另一方面,如果目標(biāo)是在定制的網(wǎng)站構(gòu)建產(chǎn)品中優(yōu)化提供智能建議,那么這將涉及許多不同的技能,絕大多數(shù)數(shù)據(jù)科學(xué)家不應(yīng)該期望這些技能(只有真正的數(shù)據(jù)科學(xué)獨(dú)角獸才能解決這個問題)。
因此,如果項(xiàng)目由一個獨(dú)立的數(shù)據(jù)科學(xué)團(tuán)隊(duì)承擔(dān),它很可能會失敗(或者需要很長時(shí)間,因?yàn)樵诖笮推髽I(yè)中組織獨(dú)立的團(tuán)隊(duì)來從事協(xié)作項(xiàng)目并不容易)。
因此,要成為一個有效的數(shù)據(jù)科學(xué)家,僅僅在Kaggle比賽中表現(xiàn)出色并完成一些在線課程是不夠的。幸運(yùn)的是(取決于你對它的看法),它涉及到理解等級制度和政治在商業(yè)中是如何運(yùn)作的。
在尋找一份能滿足你需求的數(shù)據(jù)科學(xué)工作時(shí),找到一家與你的關(guān)鍵路徑相一致的公司應(yīng)該是一個關(guān)鍵目標(biāo)。然而,您可能仍然需要重新調(diào)整您對數(shù)據(jù)科學(xué)角色的期望。