自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

想當(dāng)數(shù)據(jù)科學(xué)家的你這13個(gè)錯(cuò)誤可別犯

大數(shù)據(jù)
當(dāng)你看這篇文章的時(shí)候,我們知道你已經(jīng)決定把數(shù)據(jù)科學(xué)當(dāng)作你的工作。當(dāng)下越來(lái)越多的企業(yè)需要數(shù)據(jù)支持其決策,世界也變得越來(lái)越緊密,幾乎每個(gè)企業(yè)都需要大量的數(shù)據(jù)科學(xué)實(shí)踐。

前言

當(dāng)你看這篇文章的時(shí)候,我們知道你已經(jīng)決定把數(shù)據(jù)科學(xué)當(dāng)作你的工作。當(dāng)下越來(lái)越多的企業(yè)需要數(shù)據(jù)支持其決策,世界也變得越來(lái)越緊密,幾乎每個(gè)企業(yè)都需要大量的數(shù)據(jù)科學(xué)實(shí)踐。因此,對(duì)數(shù)據(jù)科學(xué)家的需求是巨大的。當(dāng)然,人才短缺也是業(yè)內(nèi)所公認(rèn)的。

然而,成為一名數(shù)據(jù)科學(xué)家并不容易。它需要解決問(wèn)題的能力、結(jié)構(gòu)化思維、編碼以及各種技術(shù)技能,才能真正成功。如果你只有非技術(shù)和非數(shù)學(xué)的背景,那么你很有可能通過(guò)書籍和視頻來(lái)學(xué)習(xí)。然而這類資源大多并沒有教你工業(yè)界對(duì)數(shù)據(jù)科學(xué)家要求的能力。

這也是渴望成功的數(shù)據(jù)科學(xué)家需要努力彌補(bǔ)自我學(xué)習(xí)與實(shí)際工作之間差距的主要原因之一。

在本文中,我將討論業(yè)余數(shù)據(jù)科學(xué)家所犯的常見錯(cuò)誤(我自己也犯了其中某些錯(cuò)誤),并提供了一些比較實(shí)用的資源,旨在幫助您避免數(shù)據(jù)科學(xué)中的這些陷阱。

[[239623]]

目錄

• 學(xué)習(xí)理論概念而不應(yīng)用它們

• 不學(xué)習(xí)先決知識(shí)而直接學(xué)習(xí)機(jī)器學(xué)習(xí)技術(shù)

• 完全依靠認(rèn)證和學(xué)位

• 誤以為你在機(jī)器學(xué)習(xí)競(jìng)賽中看到的是真實(shí)的工作現(xiàn)狀

• 注重模型的精度勝過(guò)其適用性和可解釋性

• 在簡(jiǎn)歷中使用過(guò)多的數(shù)據(jù)科學(xué)術(shù)語(yǔ)

• 優(yōu)先考慮該使用的工具和各種庫(kù)而不是業(yè)務(wù)本身要解決的問(wèn)題

• 沒有花費(fèi)足夠的時(shí)間去探索和可視化數(shù)據(jù)

• 缺乏結(jié)構(gòu)化的方法來(lái)解決問(wèn)題

• 試圖一次學(xué)習(xí)多個(gè)工具

• 不能堅(jiān)持學(xué)習(xí)

• 遠(yuǎn)離討論和競(jìng)賽

• 不去提升溝通技巧

1. 學(xué)習(xí)理論概念而不應(yīng)用它們

 

 

 

[[239624]]

資料來(lái)源:認(rèn)知課 - YouTube

正如我在 AV 實(shí)踐問(wèn)題那篇文章中提到的那樣:掌握機(jī)器學(xué)習(xí)技術(shù)背后的理論是很好的,但如果你不應(yīng)用它們,它們只是理論。當(dāng)我開始學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí),我也犯了同樣的錯(cuò)誤:我學(xué)習(xí)了書籍和在線課程,但并不總是用它們來(lái)解決問(wèn)題。

因此當(dāng)我有機(jī)會(huì)應(yīng)用我所學(xué)的知識(shí)去解決面臨的挑戰(zhàn)或問(wèn)題時(shí),我卻忘了一大半!我們需要學(xué)習(xí)的東西有很多,比如算法、推導(dǎo)、研究論文等。你很有可能在中途失去學(xué)習(xí)動(dòng)力并放棄。我已經(jīng)看到這種情況發(fā)生在很多試圖進(jìn)入這個(gè)領(lǐng)域的人身上。

如何避免這個(gè)問(wèn)題?

你必須在理論和實(shí)踐之間保持一個(gè)平衡。一旦你學(xué)習(xí)了一個(gè)概念,請(qǐng)立即訪問(wèn) Google,找到可以使用它的數(shù)據(jù)集或問(wèn)題。你會(huì)發(fā)現(xiàn)這樣做之后可以更好地理解理論知識(shí)。您還可以使用 AV 的 DataHack 平臺(tái),完成上面的練習(xí)題和參與比賽。

必須承認(rèn)的是你無(wú)法通過(guò)一次學(xué)習(xí)掌握所有的東西,在練習(xí)時(shí)查漏補(bǔ)缺,這樣會(huì)使你學(xué)到更多東西!

2. 不學(xué)習(xí)先決知識(shí)而直接學(xué)習(xí)機(jī)器學(xué)習(xí)技術(shù)

資料來(lái)源:倫敦帝國(guó)理工學(xué)院 - YouTube

大多數(shù)立志要成為數(shù)據(jù)科學(xué)家的人都受到機(jī)器人視頻或有趣的預(yù)測(cè)模型的鼓舞,當(dāng)然也有些人是在高薪誘惑下入行的。遺憾的是(不好意思讓你們失望了!),在你到達(dá)那里之前,你還有一條漫長(zhǎng)的路要走。

在應(yīng)用一項(xiàng)技術(shù)解決問(wèn)題之前你應(yīng)該了解其背后的工作原理,這樣做將有助于你了解算法如何工作,知道如何去微調(diào)它,并且還將幫助你在現(xiàn)有技術(shù)的基礎(chǔ)上搭建新的技術(shù)。數(shù)學(xué)在里面發(fā)揮著重要作用,因此了解某些概念總是有幫助的。在日常的企業(yè)數(shù)據(jù)科學(xué)家角色中,您可能不需要了解高級(jí)微積分,但有一個(gè)總體的了解肯定是有幫助的。

如果您有好奇心或想要進(jìn)入研究領(lǐng)域,那么在深入了解機(jī)器學(xué)習(xí)的核心技術(shù)之前,您需要了解的四個(gè)關(guān)鍵組件是:

• 線性代數(shù)

• 微積分

• 統(tǒng)計(jì)學(xué)

• 概率論

如何避免這個(gè)問(wèn)題?

正如房子是一磚一瓦建造的,數(shù)據(jù)科學(xué)家的看家本領(lǐng)也是由掌握一個(gè)一個(gè)知識(shí)點(diǎn)開始的。有大量的資源可以幫助您學(xué)習(xí)這些知識(shí)點(diǎn)。為了幫助您入門,下面我為每個(gè)知識(shí)點(diǎn)主題列出了一個(gè)資源:

 數(shù)據(jù)科學(xué)家線性代數(shù)綜合入門指南

• 可汗學(xué)院的微積分課程

 數(shù)據(jù)科學(xué)概率基礎(chǔ)的案例解釋

您還可以查看 Analytics Vidhya 的「數(shù)據(jù)科學(xué)入門」課程,其中包括了有關(guān)統(tǒng)計(jì)和概率的綜合模塊。

3. 完全依靠認(rèn)證和學(xué)位

自從數(shù)據(jù)科學(xué)變得非常受歡迎以來(lái),各地的認(rèn)證和學(xué)位幾乎都出現(xiàn)了,給招聘經(jīng)理和招聘人員增加了不少煩惱。瀏覽我的 LinkedIn 資料,至少 5 張認(rèn)證圖片被我自豪地展示在那里。雖然得到這些認(rèn)證并非易事,但完全依賴它們也是非常危險(xiǎn)的。

數(shù)以萬(wàn)計(jì)渴望成功的數(shù)據(jù)科學(xué)家報(bào)名并完成了種類繁多的在線課程。如果說(shuō)完成這些課程曾經(jīng)能為你的數(shù)據(jù)科學(xué)簡(jiǎn)歷添加一些獨(dú)特的價(jià)值,那么現(xiàn)在已經(jīng)不是這種情況 了。招聘經(jīng)理對(duì)這些證書并不那么看重了, 他們更加重視你的知識(shí)結(jié)構(gòu),以及你如何在現(xiàn)實(shí)生活中應(yīng)用它們。

與客戶打交道、處理項(xiàng)目截止日期、了解數(shù)據(jù)科學(xué)項(xiàng)目的生命周期如何工作、如何設(shè)計(jì)模型以適應(yīng)現(xiàn)有業(yè)務(wù)框架,這些只是你作為一個(gè)成功的數(shù)據(jù)科學(xué)家所要做好的工作的一部分,而這些僅僅只有課程認(rèn)證或?qū)W位是不夠的。

如何避免這個(gè)問(wèn)題?

不要誤解我的意思:認(rèn)證是很有價(jià)值的,但只有當(dāng)你將這些知識(shí)應(yīng)用到課堂之外并將其展示出來(lái)時(shí)才有價(jià)值。不管你對(duì)真實(shí)數(shù)據(jù)做何種分析,確保你寫下它。創(chuàng)建自己的博客、在 LinkedIn 上發(fā)布,并征求社區(qū)的反饋意見。這表明你愿意學(xué)習(xí)并且有很多想法,愿意接受別人提出的建議并將其用于你的項(xiàng)目中。

你應(yīng)該對(duì)實(shí)習(xí)持開放態(tài)度(無(wú)論你的經(jīng)驗(yàn)水平如何)。你將學(xué)習(xí)到很多關(guān)于數(shù)據(jù)科學(xué)團(tuán)隊(duì)如何工作的經(jīng)驗(yàn),這會(huì)使你在參加下一次面試時(shí)受益。

如果你正在尋找下一個(gè)項(xiàng)目,那么你來(lái)對(duì)地方了。我們有一個(gè)很棒的按難度分級(jí)的項(xiàng)目清單。現(xiàn)在就開始吧。

4. 誤以為你在機(jī)器學(xué)習(xí)競(jìng)賽中看到的是真實(shí)的工作現(xiàn)狀

 

 

 

 

 

 

這是近來(lái)數(shù)據(jù)科學(xué)家們最大誤解之一。競(jìng)賽和黑客馬拉松提供了相當(dāng)干凈、一塵不染的數(shù)據(jù)集(好吧,說(shuō)得是有點(diǎn)過(guò)了,懂我的意思就好)。你下載它們?nèi)缓笾纸鉀Q問(wèn)題。即使這些數(shù)據(jù)集有一些缺失數(shù)值的數(shù)據(jù)列也不會(huì)多么麻煩,找到一種插補(bǔ)技術(shù)然后填空就好。

不幸的是真實(shí)世界里的項(xiàng)目并不這樣。真實(shí)世界中有一條涉及與一群人一起工作的端到端的流程。你幾乎總得和混亂、未清洗的數(shù)據(jù)打交道。俗話說(shuō)得好,“花費(fèi)你 70-80% 的時(shí)間,收集、清洗數(shù)據(jù)”是一點(diǎn)也不為過(guò)的。你會(huì)(很可能)不喜歡這個(gè)令人筋疲力盡的過(guò)程,但它最終會(huì)變成你日常工作的一部分。

此外還有一點(diǎn)我們將在下文中詳談,那就是簡(jiǎn)單的模型要優(yōu)先于任何復(fù)雜的、堆砌的集成模型。準(zhǔn)確性不總是最終目標(biāo),這是你會(huì)在工作中學(xué)到的最矛盾的事。

如何避免這個(gè)問(wèn)題?

令人尷尬的是避開這個(gè)誤區(qū)的重要因素是經(jīng)驗(yàn),你獲得越多經(jīng)驗(yàn)(這種情況下實(shí)習(xí)會(huì)大有助益),你越能區(qū)分這兩者。這就是社交媒體的方便之處:多跟數(shù)據(jù)科學(xué)家們聊聊,問(wèn)問(wèn)他們的經(jīng)驗(yàn)。

另外,我建議看看這個(gè) Quora 問(wèn)題,來(lái)自世界各地的科學(xué)家就這個(gè)問(wèn)題在上邊表達(dá)了他們的看法。競(jìng)賽排行榜確實(shí)適合衡量你的學(xué)習(xí)進(jìn)度,但面試官想知道的是你怎樣去優(yōu)化一個(gè)算法來(lái)產(chǎn)生影響,而不是為優(yōu)化而優(yōu)化。學(xué)習(xí)一個(gè)數(shù)據(jù)科學(xué)項(xiàng)目如何運(yùn)轉(zhuǎn),一個(gè)團(tuán)隊(duì)里有哪些不同的角色(從數(shù)據(jù)工程師到數(shù)據(jù)架構(gòu)師),基于你的理解構(gòu)建你的回答。

5. 注重模型的精度勝過(guò)其適用性和可解釋性

 

 

 

 

來(lái)源:Design Shack

正如以上所述,精確度并不總是業(yè)務(wù)所追求的。固然一個(gè)能以 95% 的精確度預(yù)測(cè)貸款違約的模型相當(dāng)不錯(cuò),但若你無(wú)法解釋這個(gè)模型如何做到這一點(diǎn),什么特性使其如此,以及你在建構(gòu)模型時(shí)的思路是什么,你的客戶就會(huì)拒絕這個(gè)模型。

極少地,如果有的話,你會(huì)看到深度神經(jīng)網(wǎng)絡(luò)用于商業(yè)應(yīng)用中。向客戶解釋一個(gè)神經(jīng)網(wǎng)絡(luò)(更別說(shuō)深度神經(jīng)網(wǎng)絡(luò))是如何利用其隱藏層、卷積層等來(lái)得到其結(jié)果是不可能的。首要且必須考慮應(yīng)該是我們能夠理解模型之下發(fā)生著什么。如果你沒法判斷年齡、家庭成員數(shù)目、抑或此前的信用記錄是否與拒絕信貸申請(qǐng)有關(guān),你該如何向你的客戶做出建議讓他們能改進(jìn)他們的業(yè)務(wù)?

另一個(gè)關(guān)鍵方面是你的模型能否契合組織業(yè)已存在的框架。如果開發(fā)環(huán)境不能支持你使用的 10 種不同的工具和庫(kù),這將相當(dāng)失敗,你將不得不用一種更簡(jiǎn)單的方法從零開始重新設(shè)計(jì)并重建模型。

如何避免這個(gè)問(wèn)題?

避免這個(gè)錯(cuò)誤的最好方法便是與業(yè)界人士交流,沒有比經(jīng)驗(yàn)更好的老師。選擇一個(gè)領(lǐng)域(金融,人力資源,銷售,運(yùn)營(yíng)等)并與他們聯(lián)系,了解他們的項(xiàng)目是如何運(yùn)轉(zhuǎn)的。

除此之外,練習(xí)構(gòu)建簡(jiǎn)單的模型并向非技術(shù)人員解釋它們。隨后提升模型的復(fù)雜度并繼續(xù)這么做,直到即使是你也不能理解其表層之下發(fā)生著什么。這將教會(huì)你何時(shí)停止,以及為何現(xiàn)實(shí)世界的應(yīng)用中簡(jiǎn)單的模型總是更受青睞。

6. 在簡(jiǎn)歷中使用過(guò)多的數(shù)據(jù)科學(xué)術(shù)語(yǔ)

 

 

 

 

如果你之前這么干過(guò),你就應(yīng)該知道我指的是什么。如果你的簡(jiǎn)歷現(xiàn)在就有這個(gè)問(wèn)題,請(qǐng)立即修正!你或許清楚一堆技術(shù)和工具,但只是簡(jiǎn)單地羅列他們無(wú)異于使?jié)撛诘恼衅附?jīng)理對(duì)你失去興趣。

你的簡(jiǎn)歷是對(duì)你取得的成就以及你如何做到的概括,而不是不是簡(jiǎn)單羅列的事情清單。當(dāng)招聘官查看簡(jiǎn)歷的時(shí)候,他/她希望能以簡(jiǎn)潔明快的方式了解你的背景知識(shí)以及你所取得的成就。如果半頁(yè)簡(jiǎn)歷都充斥著模糊的數(shù)據(jù)科學(xué)術(shù)語(yǔ),例如線性回歸、XGBoost、LightBGM,卻沒有任何解釋,你的簡(jiǎn)歷可能通不過(guò)篩選輪。

如何避免這個(gè)問(wèn)題?

使簡(jiǎn)歷變得整潔的最簡(jiǎn)單方法便是使用項(xiàng)目符號(hào)。只列出你用來(lái)完成某件事情(可以是項(xiàng)目或競(jìng)賽)的技術(shù)。扼要地闡述你是如何使用它們的,這將幫助招聘官理解你的想法。

當(dāng)你申請(qǐng)對(duì)經(jīng)驗(yàn)要求較少或入門級(jí)的工作時(shí),你的簡(jiǎn)歷需要反映你能給業(yè)務(wù)帶來(lái)何種潛在影響。你可能會(huì)申請(qǐng)不同領(lǐng)域的工作角色,因而有一個(gè)固定的簡(jiǎn)歷模板是非常有幫助的,你只要對(duì)應(yīng)于不同的崗位要求對(duì)你的簡(jiǎn)歷稍作調(diào)整以反應(yīng)出你對(duì)此行業(yè)的興趣就可以了。

7. 優(yōu)先考慮該使用的工具和各種庫(kù)而不是業(yè)務(wù)本身要解決的問(wèn)題

 

 

 

 

來(lái)源:Data Science Lab

讓我們通過(guò)一個(gè)例子來(lái)理解一下為何這是一個(gè)錯(cuò)誤。想象你有一個(gè)房?jī)r(jià)數(shù)據(jù)集,而且你要預(yù)測(cè)未來(lái)房地產(chǎn)的價(jià)值。數(shù)據(jù)庫(kù)中有超過(guò) 200 個(gè)變量,包括建筑物數(shù)量、房間數(shù)量、租戶數(shù)量、家庭規(guī)模、庭院大小、是否有水龍頭等。你很可能無(wú)法理解某些變量的意義,但你依然可以建構(gòu)一個(gè)準(zhǔn)確的模型,只是關(guān)于為何某個(gè)特定變量不產(chǎn)生影響,你可能完全沒有頭緒。

隨后事實(shí)證明,那個(gè)變量是現(xiàn)實(shí)世界中的關(guān)鍵要素。這是個(gè)災(zāi)難性的錯(cuò)誤。

有著庫(kù)和工具的堅(jiān)實(shí)基礎(chǔ)是件好事,但這也只能在一定程度上幫到你。將這些知識(shí)與領(lǐng)域提出的業(yè)務(wù)問(wèn)題結(jié)合起來(lái)才是真正的數(shù)據(jù)科學(xué)家所做的,你應(yīng)該了解你感興趣(或正謀求職位)的領(lǐng)域中的基本挑戰(zhàn)。

如何避免這個(gè)問(wèn)題?

這里有不少選擇:

• 如果你正在謀求某個(gè)特定領(lǐng)域中的數(shù)據(jù)科學(xué)家職位,去關(guān)注該領(lǐng)域的公司如何應(yīng)用數(shù)據(jù)科學(xué)。

• 若可行,尋找特定領(lǐng)域的數(shù)據(jù)集并著手處理它們。這會(huì)是你的簡(jiǎn)歷中一個(gè)非常突出的要點(diǎn)。

8. 沒有花費(fèi)足夠的時(shí)間去探索和可視化數(shù)據(jù)

 

 

 

 

數(shù)據(jù)可視化是數(shù)據(jù)科學(xué)中的一個(gè)重要方面,但許多渴望成功的數(shù)據(jù)科學(xué)家都傾向于草草了事并進(jìn)入后續(xù)的模型構(gòu)建階段。這種方法或許能在競(jìng)賽中奏效,但絕對(duì)會(huì)在現(xiàn)實(shí)世界中失敗。理解你的數(shù)據(jù)是你要去做的最重要的事情,你的模型的輸出會(huì)反映這一點(diǎn)。

通過(guò)花時(shí)間了解數(shù)據(jù)集并嘗試不同的可視化圖表,你將能對(duì)要解決的挑戰(zhàn)或問(wèn)題有更為深入的理解。你定會(huì)驚訝于通過(guò)這么做獲得的洞見!逐漸明晰的模式和趨勢(shì)、一目了然的暗含規(guī)律,更棒的是,可視化是向客戶展示你的發(fā)現(xiàn)的最佳方式!

作為一名數(shù)據(jù)科學(xué)家,你需要有天生的好奇心。這是數(shù)據(jù)科學(xué)非常有吸引力的地方之一:你越是好奇,你便會(huì)問(wèn)越多的問(wèn)題,這將助你對(duì)數(shù)據(jù)有更好的理解,并助你發(fā)現(xiàn)之前沒有發(fā)現(xiàn)的問(wèn)題!

如何避免這個(gè)問(wèn)題?

練習(xí)!下次處理一個(gè)數(shù)據(jù)集的時(shí)候花更多時(shí)間在這個(gè)步驟上,你會(huì)驚訝于它給你帶來(lái)的洞見。提出問(wèn)題,并請(qǐng)教你的經(jīng)理、領(lǐng)域中的專家,在互聯(lián)網(wǎng)上尋求解決方案。若你什么都沒找到,可以在社交媒體上繼續(xù)詢問(wèn),條條大路通羅馬!

為了助你起步,我在下邊列出了幾項(xiàng)你可以參閱的資源:

 Comprehensive Guide to Data Visualization in R

 A Comprehensive Guide to Data Exploration(強(qiáng)烈推薦)

 18 Free Exploratory Data Analysis Tools For People who don't code well

9. 缺乏結(jié)構(gòu)化的方法來(lái)解決問(wèn)題

 

 

 

 

來(lái)源:MindMatters.co.in

結(jié)構(gòu)化思考對(duì)數(shù)據(jù)科學(xué)家有諸多好處:

• 讓你將一個(gè)問(wèn)題從邏輯上分為幾個(gè)部分

• 讓你將問(wèn)題如何發(fā)展以及如何設(shè)計(jì)你的方法的過(guò)程可視化

• 讓你以邏輯化和易于理解的方式幫助用戶或客戶理解你框架的流程

有更多的理由認(rèn)為具有結(jié)構(gòu)化的思維方式是非常有幫助的。可以想象,沒有結(jié)構(gòu)化的思維方式是違反直覺的。你的工作和解決問(wèn)題的方法都是隨意的,當(dāng)遇到復(fù)雜的問(wèn)題時(shí),你還會(huì)忘記自己的步驟。

當(dāng)你面試的時(shí)候,你將不可避免地面對(duì)一些案例研究的題目,例如一些估計(jì)問(wèn)題或者謎題。在面試的壓力和時(shí)間限制之下,面試官會(huì)看你如何組織你的思路來(lái)得到你最終的結(jié)果。很多情況下,這將成為你取得工作的關(guān)鍵因素,要么因此與這個(gè)工作失之交臂,要么因此得到這個(gè)工作。

如何避免這個(gè)問(wèn)題?

你可以通過(guò)簡(jiǎn)單的培訓(xùn)和嚴(yán)謹(jǐn)?shù)姆椒ǐ@得結(jié)構(gòu)化的思維方式。下面列出了一些文章,可以幫助你開始這個(gè)關(guān)鍵的學(xué)習(xí):

 The Art of Structured Thinking and Analysis

 Tools for Improving Structured Thinking

• Must for Data Scientists & Analysts: Brain Training for Analytical Thinking

10. 試圖一次學(xué)習(xí)多個(gè)工具

 

 

[[239629]]

 

 

我見過(guò)這個(gè)太多次了。由于每個(gè)工具都有其缺點(diǎn)和其獨(dú)特的功能,人們傾向于嘗試一次學(xué)習(xí)所有的工具。這是個(gè)壞主意,因?yàn)槟阕罱K掌握不了它們中的任何一個(gè)。工具只是實(shí)現(xiàn)數(shù)據(jù)科學(xué)的一種手段而不是最終目標(biāo)!

如何避免這個(gè)問(wèn)題?

選擇一個(gè)工具并堅(jiān)持下去,直到你掌握它為止。如果你已經(jīng)開始學(xué)習(xí) R,那么不要被 Python 誘惑。堅(jiān)持使用 R,從入門到精通,然后嘗試將另一種工具融入你的技能組合中,你可以通過(guò)這種方法學(xué)到更多。

每個(gè)工具都有一個(gè)出色的用戶社區(qū),你可以在遇到困難時(shí)使用。使用我們的論壇來(lái)提問(wèn),在線搜索,永不言棄。我們的目的是通過(guò)一個(gè)工具學(xué)習(xí)數(shù)據(jù)科學(xué),而不是通過(guò)數(shù)據(jù)科學(xué)學(xué)習(xí)一個(gè)工具。

11. 不能堅(jiān)持學(xué)習(xí)

這個(gè)問(wèn)題適用于所有數(shù)據(jù)科學(xué)家而不僅僅是新手,那就是我們?nèi)菀追中?。我們學(xué)習(xí)一段時(shí)間(比如一個(gè)月),然后我們?cè)诮酉聛?lái)的兩個(gè)月里停止了學(xué)習(xí)。在那之后試圖接著之前的知識(shí)點(diǎn)繼續(xù)學(xué)習(xí),那將是一場(chǎng)噩夢(mèng)。早先學(xué)過(guò)的概念基本忘光了,筆記也丟了,感覺就像我們最近幾個(gè)月完全浪費(fèi)了一樣。

我個(gè)人也經(jīng)歷過(guò)這一點(diǎn)。由于總是需要同時(shí)處理各種事情,我們可以找借口和理由不學(xué)習(xí)。但這最終是我們自己的損失。如果數(shù)據(jù)科學(xué)就像打開教科書和塞滿一切一樣容易,那么到今天,每個(gè)人都能成為數(shù)據(jù)科學(xué)家。然而事實(shí)上它需要長(zhǎng)期的努力和學(xué)習(xí),這是人們?nèi)菀缀鲆暤囊稽c(diǎn),直到為時(shí)已晚。

如何避免這個(gè)問(wèn)題?

為自己設(shè)定目標(biāo)。繪制出時(shí)間表并貼在墻上:計(jì)劃你想要學(xué)習(xí)的方式和內(nèi)容,并為自己設(shè)定截止日期。例如,當(dāng)我想學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)時(shí),我給了自己幾周時(shí)間學(xué)習(xí),然后在黑客馬拉松比賽中測(cè)試了我學(xué)到的東西。

當(dāng)你決定成為一名數(shù)據(jù)科學(xué)家,你就應(yīng)該準(zhǔn)備好投入時(shí)間和精力。如果你不斷尋找不去學(xué)習(xí)的借口,這個(gè)領(lǐng)域可能并不適合你。

12. 遠(yuǎn)離討論和競(jìng)賽

這一節(jié)是對(duì)我們上述其中幾點(diǎn)的一個(gè)總結(jié)??释晒Φ臄?shù)據(jù)科學(xué)家傾向于回避在社區(qū)中發(fā)布他們的分析,因?yàn)樗麄儞?dān)心受到批評(píng)。但是如果你不收到社區(qū)的反饋,你就不會(huì)成長(zhǎng)為數(shù)據(jù)科學(xué)家。

數(shù)據(jù)科學(xué)是一個(gè)需要討論、思考和頭腦風(fēng)暴的領(lǐng)域。你不能坐在井底工作,你需要合作并理解其他數(shù)據(jù)科學(xué)家的觀點(diǎn)。同樣,人們不參加比賽是因?yàn)樗麄冇X得自己不會(huì)贏,這顯然是一種錯(cuò)誤的心態(tài)!你參加這些比賽是為了學(xué)習(xí)而不是贏,贏是額外的獎(jiǎng)勵(lì),而學(xué)習(xí)才是目標(biāo)。

如何避免這個(gè)問(wèn)題?

這很簡(jiǎn)單,開始參加討論和比賽!沒有進(jìn)入前 5%是沒什么問(wèn)題的。如果你從整個(gè)過(guò)程中學(xué)到一個(gè)新技術(shù),那么你就是靠自己贏得了勝利。

13. 不去提升溝通技巧

 

 

[[239630]]

 

來(lái)源:Jim Harvey

溝通技巧是最容易被數(shù)據(jù)科學(xué)家低估和忽略的一項(xiàng)能力,我還沒有遇到一個(gè)強(qiáng)調(diào)這一點(diǎn)的課程。你可以學(xué)到所有的最新技術(shù),掌握多種工具并制作出最好看的圖表,但如果你無(wú)法向客戶解釋你的分析結(jié)果,你不會(huì)成為一個(gè)出色的數(shù)據(jù)科學(xué)家。

不僅僅是客戶,你還將與不熟悉數(shù)據(jù)科學(xué)的團(tuán)隊(duì)成員合作,IT、人力資源、財(cái)務(wù)、運(yùn)營(yíng)等。可以打包票的是在面試中,面試官會(huì)自始至終地觀察你的溝通表達(dá)能力。

假設(shè)你使用邏輯回歸構(gòu)建了一個(gè)信用風(fēng)險(xiǎn)模型。作為一個(gè)練習(xí),請(qǐng)花點(diǎn)時(shí)間思考一下你將如何向非技術(shù)人員解釋你是如何得出最終結(jié)論的。如果你的解釋中出現(xiàn)了任何一個(gè)技術(shù)詞匯,那么你需要盡快行動(dòng)起來(lái),提高你的表達(dá)溝通能力了!

如何避免這個(gè)問(wèn)題?

目前大多數(shù)數(shù)據(jù)科學(xué)家來(lái)自計(jì)算機(jī)科學(xué)背景,所以我理解這可能是一項(xiàng)令人生畏的技能。但要成為一名成功的數(shù)據(jù)科學(xué)家并取得職業(yè)提升,你別無(wú)選擇,只能磨練自己的個(gè)性。

我認(rèn)為最有用的一點(diǎn)是向非技術(shù)人員解釋數(shù)據(jù)科學(xué)術(shù)語(yǔ),它可以幫助我衡量我對(duì)問(wèn)題闡述的清晰度。如果你在中小型公司工作,請(qǐng)?jiān)跔I(yíng)銷或銷售部門找一個(gè)人并與他們一起做這個(gè)練習(xí)。從長(zhǎng)遠(yuǎn)來(lái)看,它將會(huì)極大地幫助你。

互聯(lián)網(wǎng)上有大量的免費(fèi)資源可以幫助你入門數(shù)據(jù)科學(xué),但請(qǐng)記住,練習(xí)是培養(yǎng)軟技能的關(guān)鍵。確保你今天就開始行動(dòng)起來(lái)。

結(jié)束語(yǔ)

這絕對(duì)不是一個(gè)詳盡的清單,渴望成功的數(shù)據(jù)科學(xué)家往往還會(huì)犯很多其他的錯(cuò)誤,但這些是我見過(guò)的最常犯的錯(cuò)誤。如前所述,我的目標(biāo)是希望幫助其他人盡可能多地避免這些提到的問(wèn)題。

我很想聽聽你對(duì)本文內(nèi)容的看法以及你對(duì)類似問(wèn)題的個(gè)人經(jīng)歷。請(qǐng)使用下面的評(píng)論部分告訴我們!

責(zé)任編輯:武曉燕 來(lái)源: 網(wǎng)絡(luò)大數(shù)據(jù)
相關(guān)推薦

2019-05-05 10:59:26

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)編碼

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2019-01-29 10:53:07

數(shù)據(jù)開發(fā)Python

2019-01-28 18:43:02

數(shù)據(jù)科學(xué)家Python技巧

2018-02-07 14:41:16

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)學(xué)

2017-08-22 10:25:43

IT人才數(shù)據(jù)科學(xué)HR

2022-10-13 15:31:32

Python軟件工程編碼

2019-07-11 12:59:27

數(shù)據(jù)科學(xué)家概率分布統(tǒng)計(jì)

2018-01-31 22:30:05

數(shù)據(jù)科學(xué)家數(shù)據(jù)專家工程師

2021-01-22 15:25:42

數(shù)據(jù)科學(xué)數(shù)據(jù)分析IT

2019-07-03 16:10:27

數(shù)據(jù)科學(xué)家數(shù)據(jù)庫(kù)數(shù)據(jù)工程師

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2012-12-06 15:36:55

CIO

2019-03-25 21:18:41

數(shù)據(jù)科學(xué)家大數(shù)據(jù)技能

2016-03-10 13:56:42

數(shù)據(jù)科學(xué)數(shù)據(jù)科學(xué)家數(shù)據(jù)分析

2023-03-17 08:00:00

人工智能工具數(shù)據(jù)科學(xué)家

2018-11-29 13:30:15

數(shù)據(jù)科學(xué)家項(xiàng)目數(shù)據(jù)

2016-04-11 14:15:06

數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)