自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

干貨 :送你12個(gè)關(guān)于數(shù)據(jù)科學(xué)學(xué)習(xí)的關(guān)鍵提示(附鏈接)

大數(shù)據(jù)
根據(jù)Glassdoor在美國(guó)區(qū)的統(tǒng)計(jì),“數(shù)據(jù)科學(xué)家”排名為2019年最誘人的工作。平均基礎(chǔ)工資為$108k,工作滿意度為4.3–5★,加上被預(yù)測(cè)有大量空缺,這個(gè)結(jié)果一點(diǎn)都不令人吃驚。

小結(jié): 數(shù)據(jù)科學(xué)家需要強(qiáng)大的數(shù)學(xué)和編碼能力,但溝通能力和其它軟技能也是走向成功不可缺少的基本功。

干貨 :送你12個(gè)關(guān)于數(shù)據(jù)科學(xué)學(xué)習(xí)的關(guān)鍵提示(附鏈接)

根據(jù)Glassdoor在美國(guó)區(qū)的統(tǒng)計(jì),“數(shù)據(jù)科學(xué)家”排名為2019年最誘人的工作。平均基礎(chǔ)工資為$108k,工作滿意度為4.3–5★,加上被預(yù)測(cè)有大量空缺,這個(gè)結(jié)果一點(diǎn)都不令人吃驚。

問(wèn)題是,一個(gè)人該如何修煉才能走上正軌并獲得勝任這份工作的資格?

為了找到答案,我們總結(jié)了大量文章里的建議,很多可以歸納為編碼與數(shù)學(xué)上的硬技能(hard skills)。但強(qiáng)大的計(jì)算能力并不是全部。一名優(yōu)秀的數(shù)據(jù)科學(xué)家仍需要和相關(guān)業(yè)務(wù)人員進(jìn)行有效溝通,這里便需要一些軟技能(soft skills)。

干貨 :送你12個(gè)關(guān)于數(shù)據(jù)科學(xué)學(xué)習(xí)的關(guān)鍵提示(附鏈接)

鑄造你的教育地基:3個(gè)要點(diǎn)

Drace Zhan作為 NYC Data Science Academy 的數(shù)據(jù)科學(xué)家,強(qiáng)調(diào)了教育基礎(chǔ)的必要性,包括編碼基礎(chǔ)和數(shù)學(xué)能力:

  • NYC Data Science Academy:https://nycdatascience.com/

R/Python + SQL。如果你沒(méi)有編碼能力,那你就需要大量的網(wǎng)絡(luò)等其它領(lǐng)域的力量來(lái)補(bǔ)充這個(gè)缺陷。我見到過(guò)一些數(shù)據(jù)科學(xué)家,有的數(shù)學(xué)能力比較薄弱,或者對(duì)相關(guān)領(lǐng)域欠缺經(jīng)驗(yàn),但他們總有很強(qiáng)的編碼能力。Python是很理想,R正在變得有點(diǎn)落后,***兩樣武器都帶上。SQL對(duì)于數(shù)據(jù)分析師來(lái)說(shuō)同樣極其重要。

  • R/Python + SQL:https://www.techopedia.com/definition/3533/python

強(qiáng)大的數(shù)學(xué)能力。對(duì)一些常用的理論有著較好的理解:generalized linear models(廣義線性模型),decision tree(決策樹),K-means(聚類分析)和statistical tests(假設(shè)檢驗(yàn))。這好過(guò)手握大量模型甚至專業(yè)模型如遞歸神經(jīng)網(wǎng)絡(luò)(RNN),卻僅僅是淺嘗輒止。

  • decision tree:https://www.techopedia.com/definition/28634/decision-tree
  • K-means:https://www.techopedia.com/definition/32057/k-means-clustering

這些都是需要培養(yǎng)的核心技能,盡管一些專家還加入了其它東西。例如,一份 KDnuggests 清單包含了編碼成分,Zhan在此基礎(chǔ)上還加入了一些其他有用的東西,包括Hadoop平臺(tái),Apache Spark,數(shù)據(jù)可視化,非結(jié)構(gòu)化數(shù)據(jù),機(jī)器學(xué)習(xí)和AI。

  • Apache Spark:https://www.techopedia.com/definition/30113/apache-spark

但如果我們從一份Kaggle調(diào)研中尋求線索,關(guān)于“那些在實(shí)際生活中被使用的最普遍的工具”,我們會(huì)有不同的發(fā)現(xiàn)。下面這張圖是名列前15的硬技能。

Python,R和SQL排在前三,第四名是 Jupyter notebooks,接下來(lái)是 TensorFlow,Amazon Web Services,Unix shell,Tableau,C/C++,NoSQL,MATLAB/Octave和Java,都排在Hadoop和Spark前面。頗讓人意外的是,Microsoft’s Excel Data Mining也被列進(jìn)來(lái)了。

  • TensorFlow:https://www.techopedia.com/definition/32862/tensorflow
  • Amazon Web Services:https://www.techopedia.com/definition/26426/amazon-web-services-aws
  • Unix:https://www.techopedia.com/definition/4637/unix
  • C++:https://www.techopedia.com/definition/26184/c-programming-language
  • NoSQL:https://www.techopedia.com/definition/27689/nosql-database
  • Java:https://www.techopedia.com/definition/3927/java

干貨 :送你12個(gè)關(guān)于數(shù)據(jù)科學(xué)學(xué)習(xí)的關(guān)鍵提示(附鏈接)

圖片出自 Kaggle
  • https://www.kaggle.com/surveys/2017

在KDnuggests清單中也包括了關(guān)于正規(guī)教育的建議。大多數(shù)據(jù)科學(xué)家都擁有高學(xué)歷,46%是博士,88%的人擁有至少碩士學(xué)位。他們的本科學(xué)位通常是相關(guān)領(lǐng)域。大約1/3是數(shù)學(xué)和統(tǒng)計(jì)學(xué),這也是***的職業(yè)軌跡。接下來(lái)***的是計(jì)算機(jī)科學(xué)學(xué)位,占有19%,工程學(xué)16%。當(dāng)然專門針對(duì)數(shù)據(jù)科學(xué)的技術(shù)工具通常不會(huì)設(shè)在大學(xué)課程中,但是可以通過(guò)專門的訓(xùn)練營(yíng)或在線課程習(xí)得。

課程之外:2個(gè)要點(diǎn)

Hank Yun是威爾康奈爾醫(yī)學(xué)院肺科的一名助理研究員,同時(shí)也是NYC數(shù)據(jù)科學(xué)學(xué)院的學(xué)生。他建議有抱負(fù)的數(shù)據(jù)科學(xué)家圍繞他們將要從事的工作進(jìn)行計(jì)劃,并找到一位導(dǎo)師。

  • Hank Yun:https://medium.com/@jhaseon

他說(shuō):“不要犯我曾經(jīng)犯過(guò)的錯(cuò)誤。那時(shí)我對(duì)自己說(shuō),我知道數(shù)據(jù)科學(xué),因?yàn)槲覅⒓恿苏n程并獲得了證書。”這確實(shí)是個(gè)不錯(cuò)的開始,但當(dāng)你開始學(xué)的時(shí)候,腦海中要有一個(gè)計(jì)劃。然后在該領(lǐng)域中找到一名導(dǎo)師,并立刻開始一個(gè)令你充滿激情的項(xiàng)目。

當(dāng)你還是個(gè)新手,你不知道你不知道什么。所以如果有個(gè)人指導(dǎo)你前行,告訴你,什么是對(duì)于現(xiàn)在的你最重要的,什么不是,這將很有幫助。別把時(shí)間扔在學(xué)習(xí)那些***根本無(wú)法施展的東西!

知道從你的工具包里取出哪樣工具:保持領(lǐng)先的要點(diǎn)

由于數(shù)據(jù)科學(xué)工具的排名不盡相同,有人可能會(huì)困惑,到底該把精力集中在哪些上面。Celeste Fralick是McAfee軟件安全公司的***數(shù)據(jù)科學(xué)家。他在CIO article上強(qiáng)調(diào)了這個(gè)問(wèn)題:“一名數(shù)據(jù)科學(xué)家需要處在調(diào)查曲線的前端,但別忘了去明白,什么技術(shù)該什么時(shí)候用。” 這句話意思是,別被新鮮與性感的外表蠱惑,而實(shí)際問(wèn)題需要更多工作。意識(shí)到對(duì)于生態(tài)系統(tǒng)的計(jì)算成本,可解釋性,延遲,帶寬,和其它系統(tǒng)邊界條件,還有客戶的到期時(shí)間,它本身就能幫助數(shù)據(jù)科學(xué)家知道,使用什么技術(shù)最合適。

  • CIO article:https://www.cio.com/article/3263790/data-science/the-essential-skills-and-traits-of-an-expert-data-scientist.html

基本軟技能:另外6個(gè)要點(diǎn)

Fralick提到了數(shù)據(jù)科學(xué)工作需要的非技術(shù)性技能。這也是為什么KDnuggests清單包括了這4項(xiàng):求知欲,團(tuán)隊(duì)合作,溝通技巧和商業(yè)頭腦。Zhan給列出的清單中也包含了一些關(guān)鍵的軟技能,如 “有效溝通能力”,“領(lǐng)域經(jīng)驗(yàn)” 與上面的 “商業(yè)頭腦” 類似??傊?,都是指將數(shù)據(jù)科學(xué)實(shí)際應(yīng)用到商業(yè)中。

Olivia Parr-Rud提供了她自己的想法,又加入了另外2項(xiàng)軟技能:創(chuàng)新,勇于堅(jiān)持。她說(shuō):“我認(rèn)為數(shù)據(jù)科學(xué)是科學(xué)也是藝術(shù)。它需要利用大腦兩側(cè)的力量。很多人談及數(shù)據(jù)科學(xué),說(shuō)它主要使用左腦。但我發(fā)現(xiàn),想要成功,數(shù)據(jù)科學(xué)家就得充分調(diào)用他們的全腦。”

她解釋道,在該領(lǐng)域前行,不僅需要技術(shù)能力,還要有創(chuàng)造性和領(lǐng)導(dǎo)性遠(yuǎn)見。

大多數(shù)左腦/線性任務(wù)可以被自動(dòng)化或外包。為了提供身為一名數(shù)據(jù)科學(xué)家的競(jìng)爭(zhēng)優(yōu)勢(shì),我們必須能識(shí)別大量信息中的模式(patterns)和綜合性(synthesize),也就要用到左右腦。我們必須是有創(chuàng)造力的思考者。很多優(yōu)秀的結(jié)論都是來(lái)自于左右腦的協(xié)同工作。

她還強(qiáng)調(diào)為什么清晰地表達(dá)遠(yuǎn)見是基本的:

  • “作為數(shù)據(jù)科學(xué)家,我們的目標(biāo)是幫助客戶增長(zhǎng)利潤(rùn)。大多數(shù)主管不理解我們是做什么的,我們是如何去做的。所以我們需要像***一樣去思考,以股東們可以理解和信任的方式,表達(dá)我們的發(fā)現(xiàn)與建議。”

總結(jié)

這個(gè)提示單里包含大量地技術(shù)工具,技能,和能力,還有可量化的品質(zhì),像創(chuàng)造力,領(lǐng)導(dǎo)力。數(shù)據(jù)科學(xué)不僅僅是個(gè)數(shù)字游戲。數(shù)據(jù)科學(xué)家也不是在虛空中建模,而是要能提出實(shí)用的,能解決商業(yè)中實(shí)際問(wèn)題的灼見。那些可以在該領(lǐng)域中獲得成功的人,不僅僅精通技術(shù),還能理解工作中團(tuán)隊(duì)各成員的需求。

譯者簡(jiǎn)介:國(guó)相潔,馬德里自治大學(xué)本科,經(jīng)濟(jì)與金融專業(yè)。從數(shù)據(jù)分析師起步,夢(mèng)想成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家。希望在成長(zhǎng)的路上,結(jié)交志趣相投的朋友,不負(fù)青春。

責(zé)任編輯:未麗燕 來(lái)源: Artinspiring/Dreamstime.com
相關(guān)推薦

2019-01-28 06:13:11

數(shù)據(jù)工程師數(shù)據(jù)科學(xué)家數(shù)據(jù)分析

2019-08-19 09:31:47

數(shù)據(jù)機(jī)器學(xué)習(xí)統(tǒng)計(jì)學(xué)習(xí)

2016-12-02 20:27:27

Yelp數(shù)據(jù)可視化機(jī)器學(xué)習(xí)算法

2020-07-06 09:57:57

編程語(yǔ)言數(shù)據(jù)Python

2024-01-03 09:22:19

2018-08-06 13:46:07

編程語(yǔ)言Python數(shù)據(jù)科學(xué)庫(kù)

2019-12-13 07:58:34

數(shù)據(jù)科學(xué)數(shù)據(jù)科學(xué)家統(tǒng)計(jì)

2019-07-31 15:14:40

Python數(shù)據(jù)科學(xué)可視化

2025-01-07 13:30:33

2023-07-05 10:03:21

2019-08-27 11:15:20

機(jī)器人人工智能編程

2019-11-08 10:26:59

云計(jì)算數(shù)據(jù)中心IT

2013-12-16 14:51:09

大數(shù)據(jù)

2022-06-13 14:36:20

元宇宙虛擬現(xiàn)實(shí)科技

2022-11-04 15:56:41

2017-02-07 14:40:52

2016-08-31 07:30:03

數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)API

2020-07-22 11:21:05

數(shù)據(jù)科學(xué)大數(shù)據(jù)分析大數(shù)據(jù)

2012-06-28 15:57:08

Hadoop

2013-12-13 09:30:45

大數(shù)據(jù)R語(yǔ)言物聯(lián)網(wǎng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)