自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何真正學(xué)好數(shù)據(jù)科學(xué)?

大數(shù)據(jù)
作為一個全新的領(lǐng)域,數(shù)據(jù)科學(xué)的飛速發(fā)展讓人激動。數(shù)據(jù)科學(xué)在帶來巨大經(jīng)濟效益的同時,人們在數(shù)據(jù)科學(xué)技術(shù)方面的知識溝也逐漸出現(xiàn),這意味著更多的人需要試圖了解和學(xué)習(xí)數(shù)據(jù)科學(xué)。

[[173626]]

作為一個全新的領(lǐng)域,數(shù)據(jù)科學(xué)的飛速發(fā)展讓人激動。數(shù)據(jù)科學(xué)在帶來巨大經(jīng)濟效益的同時,人們在數(shù)據(jù)科學(xué)技術(shù)方面的知識溝也逐漸出現(xiàn),這意味著更多的人需要試圖了解和學(xué)習(xí)數(shù)據(jù)科學(xué)。

“我該如何學(xué)習(xí)數(shù)據(jù)科學(xué)”這個問題是初學(xué)者需要邁過的第一個門檻。大家在解決這個問題的時候,通常采用的辦法是給自己安排一大串的課程去學(xué)習(xí),當然還有一大摞的課本來閱讀,線性代數(shù)和統(tǒng)計學(xué)成為大家必須要打交道的“新朋友”。我們使出了“洪荒之力”拼了命地學(xué)習(xí),我們甚至沒有編程的學(xué)習(xí)背景,但是我們相信有有朝一日一定可以具備處理數(shù)據(jù)的能力。

但這個過程往往充滿了頭痛,因為我們找到了海量的學(xué)習(xí)資源,卻依舊找不到學(xué)習(xí)的方法,就像臨考前你的老師告訴你書上的“都是重點”一樣。我們在學(xué)校里按照這樣的方法讀了這么多年的書,如果數(shù)據(jù)科學(xué)的學(xué)習(xí)仍要如此循規(guī)蹈矩,大概很多人會半途而廢吧。

但不可否認,有一些人是通過讀海量的書獲得成功的,但我更建議大家去不斷積累和嘗試。比如,當我們在一些小事中獲得啟發(fā)的時候,我們的學(xué)習(xí)之路便開啟了。我們心中應(yīng)該清楚為了什么而學(xué),只有這樣我們才可以及時掌握到有用的技能。

這就是為什么我不認為你的第一個目標應(yīng)該是學(xué)習(xí)線性代數(shù)或統(tǒng)計數(shù)據(jù)。如果你想學(xué)數(shù)據(jù)科學(xué),你的第一個目標應(yīng)該是學(xué)會愛數(shù)據(jù)。如果你感興趣,我將帶你一起了解如何真正學(xué)到科學(xué)數(shù)據(jù)的方法。

1、學(xué)會熱愛數(shù)據(jù)

我們一味地學(xué)習(xí)新技術(shù),卻很少關(guān)注自己的學(xué)習(xí)動機。數(shù)據(jù)科學(xué)是一個廣泛甚至有些模糊的領(lǐng)域,這使它很難掌握。如果沒有動力,你很可能學(xué)到一半就開始自我懷疑。我知道這不怪你,因為你只是沒得到正確的指導(dǎo)。

你需要找到一些能夠激勵你學(xué)下去的事物,找到了它,即使偶爾的熬夜讓公式們看起來模糊,你也仍然會欣然地浮想聯(lián)翩,你甚至想到這也許是神經(jīng)網(wǎng)絡(luò)在發(fā)揮作用。你需要在學(xué)習(xí)中找到一些“橋梁”,一些能讓統(tǒng)計學(xué)、線性代數(shù)和神經(jīng)網(wǎng)絡(luò)聯(lián)系到一起的橋梁。找到了它,你也就自然而然地不會被“接下來我該學(xué)什么”這樣的問題所困惑。

我學(xué)習(xí)數(shù)據(jù)科學(xué)的起點是預(yù)測股市,盡管那時候我對它不甚了解。在早期的一些程序中,我沒有經(jīng)過統(tǒng)計就開始編碼進行預(yù)測,盡管我知道可能預(yù)測的誤差比較大,我仍然日以繼夜的完善,以求做到更好。我著迷于改善程序的表現(xiàn),漸漸地我發(fā)現(xiàn)我也開始癡迷于股票市場。因為不斷讓自己學(xué)著去熱愛數(shù)據(jù),我產(chǎn)生了學(xué)下去的更多動力,我想要使我的程序更加完美。

我知道并不是所有人都癡迷于股市,但它對于我它卻如此重要,因為正是股市激發(fā)了我,并幫助我找到真正想學(xué)的東西。

數(shù)據(jù)科學(xué)的偉大之處在于你可以和成千上萬有趣的事物一起工作:它可以找出你所在城市中新鮮有趣的東西;在地圖上標出互聯(lián)網(wǎng)上所有的設(shè)備;以年的頻率更新世界各地的難民位置…這一切的一切,都是在發(fā)現(xiàn)問題,然后努力去找到解決問題的答案。

2、 通過實際操作來學(xué)習(xí)數(shù)據(jù)科學(xué)

學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)、圖像識別和其他尖端的技術(shù)是很重要的,但遺憾的是大多數(shù)的數(shù)據(jù)科學(xué)并不是直接教授你這些的:

  • 90%的時間都是在做數(shù)據(jù)清理l 懂得一些算法比一無所知要好很多
  • 如果你了解線性回歸、K-means聚類和邏輯回歸,能夠解釋和翻譯它們的結(jié)果,并且能夠從頭到尾的完成整個步驟,你將比那些了解單個算法但不會使用的人,更受用人單位的青睞。

這些都在告訴我們,最好的學(xué)習(xí)辦法就是進入項目組去一同工作。通過項目組的合作,你可以快速獲得一些實用性和用處很大的技能。當然,你也能夠通過這種途徑找到自己的投資拍檔。

項目的開始,你需要找到一個不錯的數(shù)據(jù)集,然后回答一個你感興趣的問題,開始不斷重復(fù)清洗。以下是一些尋找數(shù)據(jù)集的好去處:

  • 100+ Interesting Data Sets for Statisticsl Datasets subreddit
  • UCI machine learning repository

另一種方法是找到一個深層問題。比如預(yù)測股票市場,其實可以拆分成很多小的步驟。我第一次連接到雅虎財經(jīng)API的時候,我獲取到了每日的價格數(shù)據(jù);然后我創(chuàng)建了一系列的指標,比如過去一段時間里的平均價格,然后運用它去預(yù)測未來的趨勢。這里并沒有用到真正的算法,僅僅是技術(shù)上的分析。后來我發(fā)現(xiàn)這樣的辦法并不奏效,于是我開始學(xué)習(xí)統(tǒng)計學(xué),掌握線性回歸的辦法。我之后又連接到另一個API,抓取到了每一分鐘的數(shù)據(jù),并把它們保存到一個SQL數(shù)據(jù)庫,如此反復(fù),直到我的算法越來越完美。

這樣做的好處是為我之后的學(xué)習(xí)找到了方向。我不僅學(xué)習(xí)了SQL語法,我還運用它儲存了關(guān)于價格的數(shù)據(jù)。這恰恰說明只學(xué)習(xí)而不操作,最終只能是徒勞無功的,并且對于你今后從事數(shù)據(jù)科學(xué)的工作起不到半點作用。

3、學(xué)會和別人溝通你的見解

數(shù)據(jù)科學(xué)家需要不斷地向別人傳達他們的技能和研究結(jié)果,這一點,恰恰也是一個合格的數(shù)據(jù)科學(xué)家和一個偉大的數(shù)據(jù)科學(xué)家之間的區(qū)別。雖然溝通的理念有時候很復(fù)雜,但這里有一些你可以嘗試做的事情:

  • 開通一個博客,發(fā)表你的數(shù)據(jù)分析成果l 多向你的朋友和家人練習(xí)講授數(shù)據(jù)科學(xué)的理念,你會驚奇地發(fā)現(xiàn),自己在這個過程中對數(shù)據(jù)科學(xué)的領(lǐng)悟會不斷加深l 學(xué)會在聚會上演講l 使用github來掌控所有的分析
  • 多瀏覽一些諸如Quora和DataTau的社區(qū)

4、 向你的同行學(xué)習(xí)

你會驚奇地發(fā)現(xiàn)和別人團隊合作能學(xué)到很多東西,在數(shù)據(jù)科學(xué)領(lǐng)域,團隊合作甚至在崗位設(shè)置上非常重要,這里我有一些想法:

  • 利用聚會尋找能夠一起合作的人l 為開源軟件包做貢獻l 給那些常常寫相關(guān)博客的人發(fā)消息以尋求合作
  • 積極參加數(shù)據(jù)科學(xué)競賽,你可以從中結(jié)識到很多朋友

5、 不斷給自己增加新的困難和挑戰(zhàn)

你是否對你從事的項目已經(jīng)輕車熟路?你是否已經(jīng)很久沒有嘗試一個新的理念了?那么,你需要一些更高一等級的困難來磨練自己了。數(shù)據(jù)科學(xué)是一座需要一步一步攀登的高山,如果你安于現(xiàn)狀,你將很快被淘汰。如果你覺得自己已經(jīng)太安逸于所學(xué),這里有一些建議給你:

  • 嘗試處理更大的數(shù)據(jù)集l 看看是否可以使你的算法更快l 如何將算法擴展到多個處理器?你能做到嗎?l 嘗試理解你使用做多的算法,看看它們是否改變了你的假設(shè)?
  • 嘗試教一些新手你正在做的事情

學(xué)習(xí)任何新知識都需要正確的方法,數(shù)據(jù)科學(xué)也是如此。當你想要達到一個很遠的地方時,你的手里首先需要一個合適的指導(dǎo)方針。任何人都可以學(xué)習(xí)數(shù)據(jù)科學(xué),只要你能保持一個正確的心態(tài)。

責(zé)任編輯:趙寧寧 來源: 36大數(shù)據(jù)
相關(guān)推薦

2020-04-29 13:45:42

機器學(xué)習(xí)ML數(shù)據(jù)科學(xué)家

2022-06-27 17:40:14

大數(shù)據(jù)數(shù)據(jù)科學(xué)

2018-02-07 14:41:16

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)學(xué)

2021-01-12 11:27:57

KSA模型數(shù)據(jù)

2016-05-03 15:12:35

數(shù)據(jù)科學(xué)

2015-09-22 10:36:09

數(shù)據(jù)面試工作

2018-06-19 09:00:25

數(shù)據(jù)科學(xué)數(shù)據(jù)算法

2018-06-21 08:31:13

數(shù)據(jù)數(shù)據(jù)科學(xué)大數(shù)據(jù)

2022-09-30 08:07:22

Embedding轉(zhuǎn)換概率

2022-06-02 08:00:00

數(shù)據(jù)科學(xué)機器學(xué)習(xí)工具

2017-01-04 16:01:44

數(shù)據(jù)科學(xué)機器學(xué)習(xí)數(shù)據(jù)

2017-01-05 19:52:33

大數(shù)據(jù)企業(yè)應(yīng)用

2023-08-30 11:50:28

2020-05-27 11:16:49

數(shù)據(jù)科學(xué)機器學(xué)習(xí)Python

2021-08-30 10:08:50

大數(shù)據(jù)數(shù)據(jù)安全數(shù)據(jù)防泄漏

2011-03-03 10:11:15

數(shù)據(jù)庫優(yōu)化

2019-03-04 14:52:42

數(shù)據(jù)分析簡歷工作經(jīng)歷

2010-01-26 10:53:58

學(xué)C++

2018-12-21 08:33:15

數(shù)據(jù)中心機房運維

2015-04-13 16:00:24

數(shù)據(jù)庫選型關(guān)系型數(shù)據(jù)庫NoSQL
點贊
收藏

51CTO技術(shù)棧公眾號