自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

我從高效數(shù)據(jù)科學(xué)家那里偷走的15個(gè)習(xí)慣

企業(yè)動(dòng)態(tài)
當(dāng)涉及到數(shù)據(jù)科學(xué)領(lǐng)域時(shí),你需要使用一些書中的所有技巧,以使自己獲得一個(gè)使你超越終點(diǎn)的優(yōu)勢(shì)。那么,為什么不嘗試一下行業(yè)的良好習(xí)慣呢?

[[389961]]

大數(shù)據(jù)文摘出品

來源:medium

編譯:在赤道的熊貓

當(dāng)涉及到數(shù)據(jù)科學(xué)領(lǐng)域時(shí),你需要使用一些書中的所有技巧,以使自己獲得一個(gè)使你超越終點(diǎn)的優(yōu)勢(shì)。

那么,為什么不嘗試一下行業(yè)的良好習(xí)慣呢?

本文并不是成為高效數(shù)據(jù)科學(xué)家的“快速致富”方法。相反,它分享了幫助好的數(shù)據(jù)科學(xué)家達(dá)到他們現(xiàn)在的位置的習(xí)慣。

人們常說,數(shù)據(jù)科學(xué)家的價(jià)值取決于他們對(duì)組織的影響。這種影響起始于通過養(yǎng)成良好習(xí)慣成為一名有效的數(shù)據(jù)科學(xué)家。

與時(shí)俱進(jìn)

僅在過去十年左右的時(shí)間里,出現(xiàn)了多少當(dāng)前的數(shù)據(jù)科學(xué)技術(shù)?他們中的大多數(shù)。

帶著想要在數(shù)據(jù)科學(xué)領(lǐng)域做出巨大成就的動(dòng)機(jī),你已成為終身學(xué)習(xí)的一員。不用擔(dān)心,它聽起來并不那么可怕。

但是,你任何時(shí)候都應(yīng)該記住的是,你需要與時(shí)俱進(jìn)。因此,如果你一生都在使用MATLAB進(jìn)行數(shù)據(jù)分析,請(qǐng)嘗試學(xué)習(xí)使用Python來編程。如果你一直在使用Matplotlib來可視化數(shù)據(jù),請(qǐng)嘗試使用Plotly進(jìn)行一些創(chuàng)新。

如何養(yǎng)成這種習(xí)慣:每周花一個(gè)小時(shí)(或盡可能多的時(shí)間),然后嘗試新技術(shù)。閱讀博客文章,找出哪些技術(shù)是相關(guān)的,然后選擇幾個(gè)你想添加到堆棧中的技術(shù)。然后,創(chuàng)建一些個(gè)人項(xiàng)目,來學(xué)習(xí)如何充分利用新技術(shù)。

適當(dāng)維護(hù)文檔

我似乎總是很幸運(yùn)能夠閱讀和處理具有糟糕文檔的代碼,而沒有支持注釋來幫助我了解到底發(fā)生了什么。

直到一天,我意識(shí)到這只是一個(gè)糟糕的程序員的標(biāo)志。

我所遇到的的所有優(yōu)秀程序員都提供清晰,簡(jiǎn)潔的文檔,并通過提供有用的注釋來描述某些代碼行的用途。對(duì)于使用復(fù)雜算法和機(jī)器學(xué)習(xí)模型來解決問題的數(shù)據(jù)科學(xué)家而言,這一點(diǎn)尤為重要。

如何養(yǎng)成這種習(xí)慣:花一些時(shí)間閱讀有良好的代碼文檔或有關(guān)如何編寫良好的代碼文檔的文章。要練習(xí),為舊的個(gè)人項(xiàng)目寫文檔,或者花一些時(shí)間來修改當(dāng)前項(xiàng)目的文檔。

由于數(shù)據(jù)科學(xué)世界中有很大一部分都運(yùn)行在Python上,請(qǐng)閱讀這篇關(guān)于如何記錄Python代碼的好文章:

https://realpython.com/documenting-python-code/

融入到數(shù)據(jù)科學(xué)的社群

人們?cè)?jīng)認(rèn)為開發(fā)人員是不能融入社會(huì)的流浪者,他們束手無(wú)策的編寫注定要統(tǒng)治世界的代碼。這是一種過時(shí)的概括。它無(wú)法反映整個(gè)技術(shù)行業(yè)的現(xiàn)代復(fù)雜性。

“沒有人是一個(gè)小島。” ——最受數(shù)據(jù)科學(xué)家喜愛的名言

數(shù)據(jù)科學(xué)的復(fù)雜性要求在數(shù)據(jù)科學(xué)界內(nèi)外建立一個(gè)龐大的專業(yè)人員支持網(wǎng)絡(luò),來解決數(shù)據(jù)科學(xué)家必不可少的各種問題。

但是,社區(qū)的重要性不僅限于專業(yè)層面。隨著數(shù)據(jù)科學(xué)領(lǐng)域的不斷擴(kuò)大,我們有必要為未來的分析師和工程師鋪平道路,以便他們也可以發(fā)揮影響并進(jìn)一步支持其他數(shù)據(jù)科學(xué)家。

隨著數(shù)據(jù)科學(xué)領(lǐng)域的“性別”逐漸減少,進(jìn)行必要更改的唯一方法是發(fā)起整個(gè)社區(qū)的運(yùn)動(dòng),以激勵(lì)行業(yè)進(jìn)行更好的變革。

如何養(yǎng)成這種習(xí)慣:成為一名導(dǎo)師,撰寫內(nèi)容豐富的博客文章,加入數(shù)據(jù)科學(xué)論壇并幫助回答問題,建立一個(gè)YouTube頻道來分享你的經(jīng)驗(yàn),參加Kaggle競(jìng)賽和黑客馬拉松或創(chuàng)建課程來幫助未來的數(shù)據(jù)科學(xué)家學(xué)習(xí)他們需要進(jìn)入這個(gè)行業(yè)的技能。

定期重構(gòu)你的代碼

重構(gòu)是清理代碼而不更改其原始功能的過程。雖然重構(gòu)是軟件開發(fā)環(huán)境中必然產(chǎn)生的過程,但是重構(gòu)對(duì)于數(shù)據(jù)科學(xué)家來說可能是一個(gè)有用的習(xí)慣。

重構(gòu)時(shí)我的口頭禪是“少即是多”。

我發(fā)現(xiàn),當(dāng)我最初編寫解決數(shù)據(jù)科學(xué)問題的代碼時(shí),我通常會(huì)拋棄良好的編碼習(xí)慣,而編寫在需要時(shí)可用的代碼。換句話說,我寫了很多沒有結(jié)構(gòu)的代碼。然后,在獲得解決方案后,我重新清理代碼。

如何養(yǎng)成這種習(xí)慣:看一下舊代碼,想一想是否可以更高效地編寫相同的代碼。如果是這樣,請(qǐng)花一些時(shí)間來學(xué)習(xí)最佳編碼實(shí)踐,找出可以縮短,優(yōu)化和闡明代碼的方法。

看一下這篇很棒的文章,它概述了代碼重構(gòu)的最佳實(shí)踐:

https://www.altexsoft.com/blog/engineering/code-refactoring-best-practices-when-and-when-not-to-do-it/

優(yōu)化你的工作區(qū),工具和工作流程

現(xiàn)在有許多用可提高IDE效率的擴(kuò)展,吃驚的是,有些人還沒有選擇優(yōu)化其工作流程。

這種習(xí)慣對(duì)于每個(gè)人來說都是如此獨(dú)特,以至于真正要確定哪些工具,工作空間和工作流程使你成為可能的最有效和最高效的數(shù)據(jù)科學(xué)家。

如何養(yǎng)成這種習(xí)慣:每年一次(如果更適合你,則每年一次),評(píng)估你的整體有效性和效率,并確定可以改進(jìn)的地方。也許這意味著早上要首先研究機(jī)器學(xué)習(xí)算法,或者坐在健身球上而不是椅子上,或者在IDE中添加一個(gè)新擴(kuò)展名,從而為你的代碼添色。嘗試使用不同的工作空間,工具和工作流程,直到輸入最佳表單為止。

專注于理解商業(yè)問題

據(jù)我所知,在數(shù)據(jù)科學(xué)界,75%的工作是理解商業(yè)問題,25%的工作是編寫模型來解決問題。

編程,算法和數(shù)學(xué)是簡(jiǎn)單的部分。了解如何實(shí)施它們來解決特定的商業(yè)問題,卻不是那么容易?;ㄙM(fèi)更多的時(shí)間來理解業(yè)務(wù)問題和你要解決的目標(biāo),過程的其他部分將更容液。

要了解你所從事的行業(yè)所面臨的問題,你需要進(jìn)行一些調(diào)查,來收集一些背景信息,去充實(shí)你在這個(gè)方面的知識(shí)。例如,你需要了解是什么使特定業(yè)務(wù)的客戶產(chǎn)生興趣,或者一個(gè)工程公司試圖達(dá)到什么目標(biāo)。

如何養(yǎng)成這種習(xí)慣:花一些時(shí)間研究你正在工作的公司及其所從事的行業(yè)。編寫一份可以參考的備忘單,包括公司的主要目標(biāo)和在這個(gè)特定行業(yè)的問題。別忘了寫下你可能要用來解決業(yè)務(wù)問題的算法或有關(guān)機(jī)器學(xué)習(xí)模型的,這些算法將來可能會(huì)有用。每當(dāng)你發(fā)現(xiàn)有用的內(nèi)容時(shí),請(qǐng)將其添加到這個(gè)備忘單中。

采用簡(jiǎn)約風(fēng)格

不,不是生活。是在在你的代碼和工作流程中。

經(jīng)常有人爭(zhēng)辯說,最好的數(shù)據(jù)科學(xué)家使用最少的代碼,最少的數(shù)據(jù)和最簡(jiǎn)單的算法來完成工作。

盡管提倡極簡(jiǎn)主義,我不希望你認(rèn)為是不充足的。通常,當(dāng)人們討論代碼中的極簡(jiǎn)主義的重要性時(shí),會(huì)有人嘗試開發(fā)僅使用幾行代碼的離譜解決方案。不要那么做。是的,這種代碼可以給人留下深刻的印象。但這真的是你最好地利用時(shí)間的方式嗎?

相反,一旦你熟悉了數(shù)據(jù)科學(xué)的概念,就可以開始尋找可以優(yōu)化的代碼來將其變得簡(jiǎn)單,簡(jiǎn)潔和簡(jiǎn)短。使用簡(jiǎn)單的算法來完成工作,并且別忘了編寫可重用的函數(shù)來消除冗余。

如何養(yǎng)成這種習(xí)慣:當(dāng)你逐漸在數(shù)據(jù)科學(xué)領(lǐng)域獲得進(jìn)步時(shí),開始敦促自己編寫更有效的解決方案,寫更少的代碼,并使用更簡(jiǎn)單的算法和模型來完成工作。學(xué)習(xí)如何在不降低代碼有效性的情況下縮短代碼,并留下大量注釋來解釋合同約定版本的代碼。

使用功能消除復(fù)雜性和冗余

我首先要承認(rèn)在我第一次寫數(shù)據(jù)分析代碼時(shí)嚴(yán)重忽略了函數(shù)的方法。當(dāng)我難以通過各種分析來推理自己的方式時(shí),Spaghetti代碼充滿了我的IDE。如果你查看我的代碼,你會(huì)認(rèn)為我寫的太差了,你會(huì)想刪除它。

一旦我湊合得到了一個(gè)不錯(cuò)的結(jié)果,我會(huì)回去嘗試修復(fù)這個(gè)相當(dāng)于嚴(yán)重事故的代碼。通過將代碼做成函數(shù),我可以快速消除不必要的代碼的復(fù)雜性和冗余。如果我只對(duì)代碼重新編譯,我已經(jīng)將其簡(jiǎn)化到當(dāng)我重新閱讀它時(shí)我理解我是如何做到的。

如何養(yǎng)成這種習(xí)慣:在寫代碼時(shí)請(qǐng)不要忘記函數(shù)的重要性。人們經(jīng)常說,最好的開發(fā)人員是懶惰的開發(fā)人員,因?yàn)樗麄儠?huì)找出如何創(chuàng)建不需要很多工作的解決方案。在你寫出解決方案后,請(qǐng)重新將多余或復(fù)雜的代碼寫成函數(shù),以幫助組織和簡(jiǎn)化代碼。

應(yīng)用測(cè)試驅(qū)動(dòng)的開發(fā)方法

測(cè)試驅(qū)動(dòng)開發(fā)(TDD)是一種軟件開發(fā)原理,專注于編寫具有不斷測(cè)試的增量改進(jìn)的代碼。TDD在“紅色,綠色,重構(gòu)”系統(tǒng)上運(yùn)行,該系統(tǒng)鼓勵(lì)開發(fā)人員構(gòu)建測(cè)試套件,編寫實(shí)現(xiàn)代碼,然后優(yōu)化代碼庫(kù)。

數(shù)據(jù)科學(xué)家可以成功使用TDD,來構(gòu)建分析pipeline,進(jìn)行概念證明,使用數(shù)據(jù)子集并確保在開發(fā)過程中不會(huì)破壞功能代碼。

如何養(yǎng)成這種習(xí)慣:學(xué)習(xí)TDD的知識(shí),并考慮是否可以在你的工作流中使用這個(gè)原理, TDD并不是針對(duì)每個(gè)問題的完美答案,但如果嚴(yán)謹(jǐn)?shù)氖褂茫? TDD可能會(huì)很有用。

這篇文章對(duì)TDD進(jìn)行了很好的描述,并提供了有關(guān)如何將其實(shí)現(xiàn)到數(shù)據(jù)科學(xué)項(xiàng)目中的示例:

https://towardsdatascience.com/tdd-datascience-689c98492fcc

進(jìn)行少量頻繁的提交

你是否經(jīng)歷過提出pull request,計(jì)算機(jī)上出現(xiàn)了錯(cuò)誤消息而且使你的計(jì)算機(jī)崩潰了嗎?我有。那感覺糟透了。

在你想痛擊那個(gè)做出這個(gè)提交的人時(shí),喘口氣,并記住,這個(gè)人顯然沒有花時(shí)間去養(yǎng)成良好的習(xí)慣。

團(tuán)隊(duì)合作的軟件開發(fā)的黃金法則是什么?進(jìn)行少量頻繁的提交。

如何養(yǎng)成這種習(xí)慣:經(jīng)常練習(xí)提交代碼更改,并定期做出請(qǐng)求來獲取最新的代碼。你或他人所做的每項(xiàng)更改都可能破壞整個(gè)項(xiàng)目,因此,進(jìn)行易于恢復(fù)且可能僅影響項(xiàng)目一部分或一部分的小更改很重要。

優(yōu)先發(fā)展自我

取決于你詢問的人,這個(gè)行業(yè)有過多或過少的數(shù)據(jù)科學(xué)家。

無(wú)論行業(yè)是處于飽和還是干旱狀態(tài),你都將與大量高素質(zhì)且常常是過高素質(zhì)的求職者競(jìng)爭(zhēng)。這意味著在申請(qǐng)工作之前,你需要已經(jīng)養(yǎng)成自我提高的習(xí)慣。如今,每個(gè)人都因?yàn)楹侠淼脑蛟谔岣咦陨砑寄埽@一趨勢(shì)對(duì)數(shù)據(jù)科學(xué)家來說也不例外。

如何養(yǎng)成這種習(xí)慣:列出技能清單,看看你如何滿足雇主在工作崗位上的要求。你是否能有效使用相關(guān)庫(kù)(例如Keras,NumPy,Pandas,PyTorch,TensorFlow,Matplotlib,Seaborn和Plotly)的Pythonista嗎?你能否寫一份備忘錄來詳細(xì)說明你的最新發(fā)現(xiàn)以及它們?nèi)绾螌⒛愕墓镜男侍岣?5%?你是否愿意作為團(tuán)隊(duì)的一部分來完成一個(gè)項(xiàng)目?你要試圖找出你的不足之處,而且找到一些好的的在線課程或資源來增強(qiáng)你的技能。

在開始一個(gè)項(xiàng)目時(shí)你要知道項(xiàng)目的期望結(jié)果是什么

Stephen Covey在高效能人才的7個(gè)習(xí)慣中討論了“從始至終”的原則。

為了有效地將其與數(shù)據(jù)科學(xué)項(xiàng)目聯(lián)系起來,您需要在項(xiàng)目的規(guī)劃階段問自己,這個(gè)項(xiàng)目的期望結(jié)果是什么。這將有助于你了解項(xiàng)目的整體結(jié)構(gòu),并提供實(shí)現(xiàn)目標(biāo)所需的成果的路線圖。不僅如此,確定項(xiàng)目的結(jié)果將使您對(duì)整個(gè)項(xiàng)目的可行性和可持續(xù)性有所了解。

如何養(yǎng)成這種習(xí)慣:在每個(gè)項(xiàng)目開始時(shí)都要進(jìn)行一個(gè)計(jì)劃會(huì)議來準(zhǔn)確地列出了你希望在項(xiàng)目結(jié)束時(shí)實(shí)現(xiàn)的目標(biāo)。確定要嘗試解決的問題,或要收集的證據(jù)。然后,你可以開始回答可行性和可持續(xù)性問題。這些問題將影響項(xiàng)目的里程碑和結(jié)果。之后,你可以使用制定清晰的計(jì)劃,來輔助你編寫代碼和機(jī)器學(xué)習(xí)模型來完成項(xiàng)目。

理解,然后你能被理解

當(dāng)理查德·費(fèi)曼不能夠成功的解釋給大學(xué)新生新生自旋V2粒子服從的原理時(shí),他說道:“我想我可以有把握地說,沒有人真正理解量子力學(xué)。”費(fèi)曼被稱為“偉大的解釋者”,他留下了數(shù)據(jù)科學(xué)家只能希望效仿的遺產(chǎn)。

數(shù)據(jù)科學(xué)是一種使用數(shù)據(jù)講述一個(gè)引人入勝的故事的藝術(shù),只有當(dāng)講故事的人理解了他們?cè)噲D講的故事后,它才能成功。換句話說,理解你的任務(wù)才能使你能夠被理解。在了解你要完成的任務(wù)時(shí)盡早養(yǎng)成這種習(xí)慣,這樣你就可以與其他人以相當(dāng)?shù)睦斫馑椒窒硭?,這將使你成為會(huì)議室中最有效的數(shù)據(jù)科學(xué)家。

如何養(yǎng)成這種習(xí)慣:使用費(fèi)曼技術(shù)來加深對(duì)要嘗試發(fā)現(xiàn)的概念以及要解決的問題的理解。此方法非常適合于分析數(shù)據(jù)然后向一般非數(shù)據(jù)科學(xué)利益相關(guān)者解釋結(jié)果的數(shù)據(jù)科學(xué)過程。簡(jiǎn)而言之,你可以將對(duì)主題的解釋精簡(jiǎn)到可以用任何人都可以理解的簡(jiǎn)單,非專業(yè)術(shù)語(yǔ)解釋的程度。

閱讀研究文獻(xiàn)

在這個(gè)由研究生和博士主導(dǎo)的領(lǐng)域,行業(yè)的新聞和見解通常由發(fā)表的文獻(xiàn)分享。

研究文獻(xiàn)是了解他人如何解決問題,擴(kuò)大我們的視野以及了解最新趨勢(shì)的有效方法。

如何養(yǎng)成這種習(xí)慣:每周選擇一篇或兩篇與你當(dāng)前的工作或?qū)ψ非蠡蜓芯扛信d趣的技術(shù)有關(guān)的文獻(xiàn)。盡量為每周的文獻(xiàn)閱讀留出時(shí)間,并將其作為優(yōu)先事項(xiàng)。熟悉閱讀論文的Three Pass 方法來幫助你快速收集相關(guān)信息。要真正鞏固你對(duì)論文的理解,請(qǐng)嘗試將你從閱讀中學(xué)到的東西應(yīng)用到你的項(xiàng)目中或者與同事分享你學(xué)到的東西。

樂于改變

從使用的技術(shù)到實(shí)現(xiàn)的目標(biāo),數(shù)據(jù)科學(xué)的世界正在迅速變化。不要成為那些束手無(wú)策,不愿改變的數(shù)據(jù)科學(xué)家。

樂于接受變革,這不僅會(huì)迫使你不斷提高專業(yè)水平,而且還使你在瞬息萬(wàn)變的行業(yè)中保持重要地位,一旦你落后,該行業(yè)將使你脫穎而出。

如何養(yǎng)成這種習(xí)慣:每當(dāng)有新技術(shù)或新方法發(fā)布新聞時(shí),你可以嘗試一下,看看新技術(shù)或新方法帶來了什么。即使你只是閱讀文檔,也可以隨時(shí)了解該行業(yè)不斷變化的趨勢(shì)。此外,你可以將有關(guān)技術(shù)的觀點(diǎn)帶入你的公司,并幫助他們應(yīng)對(duì)技術(shù)變化和進(jìn)步。作為一個(gè)對(duì)實(shí)時(shí)新技術(shù)敏感的人,你將會(huì)一直處于領(lǐng)先位置,也可以指導(dǎo)你的團(tuán)隊(duì)和公司尋求更好,更有效的解決方案。

在數(shù)據(jù)科學(xué)職業(yè)的任何階段,養(yǎng)成良好的習(xí)慣可以發(fā)展你成為團(tuán)隊(duì)高效成員的潛力,你將會(huì)對(duì)任何需要解決的問題做出重大影響。

沒有比現(xiàn)在更好的時(shí)間為未來的成功做好準(zhǔn)備。

相關(guān)報(bào)道:

https://towardsdatascience.com/15-habits-i-stole-from-highly-effective-data-scientists-441b1d46c572?source=extreme_main_feed---------37-73--------------------2305a9c9_2b59_44a4_8f7f_b7036d51f7f0-------

【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】

戳這里,看該作者更多好文 

 

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2017-04-12 09:34:30

數(shù)據(jù)科學(xué)家統(tǒng)計(jì)學(xué)家好習(xí)慣

2018-11-19 06:00:32

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2012-12-06 15:36:55

CIO

2016-03-10 13:56:42

數(shù)據(jù)科學(xué)數(shù)據(jù)科學(xué)家數(shù)據(jù)分析

2016-04-11 14:15:06

數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘工具

2020-03-20 14:40:48

數(shù)據(jù)科學(xué)Python學(xué)習(xí)

2015-08-25 13:20:29

數(shù)據(jù)科學(xué)

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2012-06-12 09:33:59

2018-10-18 09:00:00

機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)算法數(shù)據(jù)科學(xué)家

2020-05-11 13:46:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)大數(shù)據(jù)

2015-06-11 10:27:29

數(shù)據(jù)科學(xué)家

2016-05-11 10:36:16

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)大數(shù)據(jù)

2019-07-05 10:29:17

大數(shù)據(jù)數(shù)據(jù)科學(xué)家

2019-12-04 15:02:22

數(shù)據(jù)科學(xué)家故事數(shù)據(jù)分析

2018-03-01 15:34:20

數(shù)據(jù)科學(xué)面試招聘
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)