自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

2020年,四步突破數(shù)據(jù)科學(xué)

大數(shù)據(jù) 新聞
如果打算今年進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,這是個(gè)很棒的決定。該領(lǐng)域廣受認(rèn)可,而且好找工作,工資也不錯(cuò),就連管理部門(mén)也慢慢意識(shí)到數(shù)據(jù)科學(xué)是不可或缺的。說(shuō)了這么多,來(lái)探索必備技能以及滿足你上手操作的技能。

這沒(méi)什么問(wèn)題,但你很可能列出一張事無(wú)巨細(xì)、耗時(shí)費(fèi)力、近乎難以實(shí)現(xiàn)的目標(biāo)清單,讓你應(yīng)接不暇,而且很有可能失去動(dòng)力,因?yàn)閷?shí)在是有太多任務(wù)了。

如果打算今年進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,這是個(gè)很棒的決定。該領(lǐng)域廣受認(rèn)可,而且好找工作,工資也不錯(cuò),就連管理部門(mén)也慢慢意識(shí)到數(shù)據(jù)科學(xué)是不可或缺的。

不過(guò)在開(kāi)始之前,請(qǐng)?jiān)试S我說(shuō)些打擊的話(有必要說(shuō)):用一年的時(shí)間去學(xué)數(shù)據(jù)科學(xué)的所有內(nèi)容是不夠的。

別誤會(huì),一年的時(shí)間足夠你找到第一份工作,但不可能一步登天,從零成為數(shù)據(jù)科學(xué)團(tuán)隊(duì)的領(lǐng)頭人(如果做到了,請(qǐng)?jiān)谠u(píng)論區(qū)分享你的故事)。

說(shuō)了這么多,來(lái)探索必備技能以及滿足你上手操作的技能。

[[313950]]

1. 數(shù)據(jù)庫(kù)?

我們分析的數(shù)據(jù)很可能出自某個(gè)數(shù)據(jù)庫(kù),這是不同于書(shū)籍或課程的典型情況——不會(huì)獲得格式正確的CSV文件。通常,你需要具備專(zhuān)業(yè)知識(shí)(或認(rèn)識(shí)懂這方面知識(shí)的人),對(duì)SQL也要有一定的了解。

如果用Python或R語(yǔ)言分析,那就不要用太多時(shí)間來(lái)學(xué)SQL分析函數(shù)、PLSQL/T-SQL和所有那些高難度東西。在這種情況下,SQL的任務(wù)很大程度上依靠的是結(jié)合幾組表格,在上面進(jìn)行分析。

這個(gè)過(guò)程要花的時(shí)間取決于使用方式以及先驗(yàn)知識(shí),但新手在這里花的時(shí)間不會(huì)超過(guò)一個(gè)月。

2. 現(xiàn)在來(lái)談?wù)剶?shù)據(jù)科學(xué)

如果按照上面的每一步來(lái),還沒(méi)有先驗(yàn)知識(shí),此時(shí)可能是2020年的8月或9月。時(shí)間已經(jīng)過(guò)去很多了,但你已經(jīng)具備尋求第一份工作的所有先決條件。

不是所有都要?jiǎng)倓偤谩?/p>

要找一份數(shù)據(jù)科學(xué)的工作,目前也只提了先決條件。后面這兩個(gè)月,建議對(duì)一些基礎(chǔ)的數(shù)據(jù)分析和可視化庫(kù)有所了解,如:

  • Numpy
  • Pandas
  • Matplotlib
  • Scipy
  • Statsmodels

這是在你不懂的情況下(如果不知道為何需要這些知識(shí)的話學(xué)起來(lái)會(huì)感到無(wú)聊)。

不要走馬觀花式看課程,到網(wǎng)站上下載數(shù)據(jù)集然后完整地分析。再到網(wǎng)上看其他人對(duì)于同一數(shù)據(jù)集是如何處理的,看自己怎么改進(jìn)。

同樣,在這兩個(gè)月時(shí)間內(nèi),應(yīng)該熟悉一些機(jī)器學(xué)習(xí)的算法,如:

  • 線性回歸(Linear Regression)
  • 邏輯回歸(Logistic Regression)
  • 分類(lèi)與回歸樹(shù)(Classification and Regression Trees)
  • KNN(k-NearestNeighbor,K最近鄰分類(lèi)算法)
  • 樸素貝葉斯分類(lèi)(Naive Bayes)
  • SVM(Support Vector Machine,支持向量機(jī))

也許實(shí)際操作中不會(huì)用到這些,但它們是日后學(xué)習(xí)更多高級(jí)算法XGBoost和神經(jīng)網(wǎng)絡(luò)(Neural networks)的基礎(chǔ)。有了分析數(shù)據(jù)庫(kù),記得不要只顧著跟教程,而要自己完成高質(zhì)量的任務(wù)。如果你喜歡,嘗試用Numpy從零開(kāi)始運(yùn)用算法,不過(guò)并不強(qiáng)制大家。

3. 編程呢?

沒(méi)錯(cuò),數(shù)據(jù)科學(xué)離不開(kāi)編程技能。如果找到一份工作,但不會(huì)寫(xiě)代碼,你很可能知道自己該做什么卻不知從何下手,也有可能會(huì)經(jīng)歷SOCPS(一種不知道怎么寫(xiě)代碼就從Stack Overfow網(wǎng)站上復(fù)制粘貼的綜合癥),甚至不看問(wèn)題和答案。

在網(wǎng)上搜索更好的解決方案是可以的,但應(yīng)該知道怎么自己寫(xiě)出一套基本方案。

之前從沒(méi)寫(xiě)過(guò)的話,可以從小入手,讀讀有關(guān)Python或R的書(shū)籍及其在數(shù)據(jù)科學(xué)中的角色,先有個(gè)全面的了解,再深入學(xué)習(xí)語(yǔ)法。不用擔(dān)心要記所有的內(nèi)容,能確保在遇到困難時(shí)該朝哪個(gè)方向看就行。

要是已經(jīng)讀過(guò)相關(guān)書(shū)籍或上過(guò)講編程的課也了解語(yǔ)法,就是不知道怎么解決問(wèn)題,那就花些時(shí)間學(xué)學(xué)算法和數(shù)據(jù)結(jié)構(gòu)。同時(shí)看一些常規(guī)的編碼問(wèn)題采訪,這些會(huì)讓你“文思泉涌”。

對(duì)自己的編程技能很滿意對(duì)嗎?那可太棒了!現(xiàn)在騰點(diǎn)時(shí)間給分析庫(kù)——Numpy和Pandas庫(kù)。

每個(gè)人在編碼上花的時(shí)間也不同。新手小白和僅需了解庫(kù)的知識(shí)的人就不一樣??梢哉f(shuō)完全不懂的人3-4個(gè)月的時(shí)間足矣,如果是只需學(xué)習(xí)庫(kù)的知識(shí)的人,大概1個(gè)月的時(shí)間就可以。

4. 提高數(shù)學(xué)技能

你一定聽(tīng)說(shuō)過(guò)數(shù)據(jù)科學(xué)首先要求優(yōu)秀的數(shù)學(xué)能力。要了解的數(shù)學(xué)知識(shí)因工作崗位而異,至于入門(mén)需要掌握多少,筆者給出的回答是:沒(méi)你想得多。

且聽(tīng)我一一敘述。初學(xué)者會(huì)試圖掌握任何相關(guān)領(lǐng)域的知識(shí),比如說(shuō)計(jì)算、線性代數(shù)、概率計(jì)算或統(tǒng)計(jì)學(xué),但必須見(jiàn)好就收。

可別誤會(huì)了,倘若你有的是時(shí)間,那就成為上述領(lǐng)域的專(zhuān)家,否則就不要浪費(fèi)時(shí)間。作為剛步入該領(lǐng)域的初級(jí)數(shù)據(jù)科學(xué)家,不僅要了解數(shù)學(xué)知識(shí),更多是在直觀層面。要知道特定的場(chǎng)合進(jìn)行什么操作,這就是直覺(jué)發(fā)揮作用的時(shí)刻,但無(wú)需花太多時(shí)間著手解決復(fù)雜的數(shù)學(xué)問(wèn)題。

只要悟性強(qiáng),明白怎么編碼,就足夠了。找到工作后你將有大把的時(shí)間鉆研數(shù)學(xué),所以沒(méi)必要提前學(xué)所有的東西。

如果沒(méi)有高數(shù)基礎(chǔ),不建議花2-3個(gè)月的時(shí)間提升數(shù)學(xué)技能。

[[313951]]

接下來(lái)呢?

2020年剩下幾個(gè)月的時(shí)間里,創(chuàng)建個(gè)GitHub賬戶(a),放上最好的分析報(bào)告或機(jī)器學(xué)習(xí)算法,提供給潛在的雇主看。同時(shí)準(zhǔn)備一份漂亮的簡(jiǎn)歷和求職信。

倘若真的喜歡,發(fā)表一篇有關(guān)學(xué)習(xí)歷程的博客。網(wǎng)上的呈現(xiàn)只會(huì)在職業(yè)發(fā)展中對(duì)你有幫助,前提是別發(fā)無(wú)用的信息,但我相信你的判斷力。

就是這樣了,趕緊給理想的公司投簡(jiǎn)歷吧。

責(zé)任編輯:趙寧寧 來(lái)源: 讀芯術(shù)
相關(guān)推薦

2022-11-02 13:16:58

數(shù)據(jù)分析

2021-07-26 09:35:26

SQL數(shù)據(jù)庫(kù)優(yōu)化

2022-12-14 15:14:52

數(shù)據(jù)驅(qū)動(dòng)體驗(yàn)度量

2010-04-28 12:02:37

Forefront網(wǎng)絡(luò)優(yōu)化

2021-11-23 23:43:16

MySQL數(shù)據(jù)庫(kù)Docker

2010-06-12 13:49:16

學(xué)習(xí)UML

2010-06-13 14:19:40

學(xué)習(xí)UML

2010-09-06 11:58:39

ppp撥號(hào)Linux

2010-09-14 17:35:52

2019-12-24 09:15:16

機(jī)器學(xué)習(xí)技術(shù)人工智能

2009-07-09 15:41:15

JDBC連接MySQL

2017-04-17 12:31:45

SDN網(wǎng)絡(luò)虛擬化

2010-04-20 10:12:05

2010-06-02 17:29:02

svnserve服務(wù)

2010-11-19 15:44:04

IT跳槽

2011-07-07 13:09:04

編程

2023-06-01 12:50:48

2013-07-15 14:30:44

產(chǎn)品經(jīng)理

2010-05-28 09:47:43

SVN項(xiàng)目創(chuàng)建

2013-03-18 11:03:48

云計(jì)算部署云計(jì)算CIO
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)