自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

你想成為數(shù)據(jù)科學(xué)家嗎?不要把機(jī)器學(xué)習(xí)當(dāng)成入門第一課

人工智能 機(jī)器學(xué)習(xí)
很多人在聽到“數(shù)據(jù)科學(xué)”一詞時,首先想到的就是“機(jī)器學(xué)習(xí)”。我也一樣,在首次接觸到機(jī)器學(xué)習(xí)這個聽起來十分炫酷的概念時,對數(shù)據(jù)科學(xué)產(chǎn)生了濃厚興趣。所以當(dāng)我尋找學(xué)習(xí)數(shù)據(jù)科學(xué)的切入點(diǎn)時,也受其影響。

本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)

 很多人在聽到“數(shù)據(jù)科學(xué)”一詞時,首先想到的就是“機(jī)器學(xué)習(xí)”。我也一樣,在首次接觸到機(jī)器學(xué)習(xí)這個聽起來十分炫酷的概念時,對數(shù)據(jù)科學(xué)產(chǎn)生了濃厚興趣。所以當(dāng)我尋找學(xué)習(xí)數(shù)據(jù)科學(xué)的切入點(diǎn)時,也受其影響。

[[360181]]

這是我犯過的最大錯誤,也是本文重點(diǎn):如果想要成為一名數(shù)據(jù)科學(xué)家,請不要從機(jī)器學(xué)習(xí)開始。

顯然,要成為一名“真正全能”的數(shù)據(jù)科學(xué)家,最終必須掌握機(jī)器學(xué)習(xí)的概念。但你會驚訝于沒有它你能走多遠(yuǎn)。為什么不從機(jī)器學(xué)習(xí)開始呢?

1.機(jī)器學(xué)習(xí)僅是數(shù)據(jù)科學(xué)的一小部分。

數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)就像是圖中所示的矩形和正方形。機(jī)器學(xué)習(xí)是數(shù)據(jù)科學(xué)的一部分,但數(shù)據(jù)科學(xué)并不一定是機(jī)器學(xué)習(xí),就像正方形是一種矩形,但矩形不一定是正方形一樣。事實(shí)上,機(jī)器學(xué)習(xí)建模僅占數(shù)據(jù)科學(xué)家工作的5-10%,其余大部分時間基本投入在其他地方。

如果一開始便投身于機(jī)器學(xué)習(xí),你將付出大量的時間和精力,卻收獲甚微。

2.若想全面理解機(jī)器學(xué)習(xí),首先需要掌握其他幾門學(xué)科的基礎(chǔ)知識。

機(jī)器學(xué)習(xí)的核心是建立在統(tǒng)計、數(shù)學(xué)和概率的基礎(chǔ)上。在學(xué)習(xí)機(jī)器學(xué)習(xí)之前,必須先掌握基本理論知識,夯實(shí)理論基礎(chǔ)。例如:

  • 線性回歸是大部分訓(xùn)練營教授的第一個“機(jī)器學(xué)習(xí)算法”,但它實(shí)際上是統(tǒng)計方法。
  • 進(jìn)行主成分分析的前提是,學(xué)習(xí)矩陣和特征向量(線性代數(shù))理念。
  • 樸素貝葉斯是完全基于貝葉斯定理(概率)的機(jī)器學(xué)習(xí)模型。

因此,將上述內(nèi)容歸結(jié)為兩點(diǎn):一是學(xué)習(xí)基礎(chǔ)知識會使學(xué)習(xí)更高級的內(nèi)容變得更加輕松容易;二是通過學(xué)習(xí)基礎(chǔ)知識,可掌握多個機(jī)器學(xué)習(xí)概念。

3. 機(jī)器學(xué)習(xí)并不能解決一切。

許多數(shù)據(jù)科學(xué)家都糾結(jié)于此,甚至包括我自己。和我最初的想法一致,大部分?jǐn)?shù)據(jù)科學(xué)家認(rèn)為“數(shù)據(jù)科學(xué)”和“機(jī)器學(xué)習(xí)”相輔相成,不可分割。因此,每每遇到問題,數(shù)據(jù)科學(xué)家都首先考慮以機(jī)器學(xué)習(xí)模型作為解決方案。但并非解決所有數(shù)據(jù)科學(xué)問題都需要機(jī)器學(xué)習(xí)模型。

在某些情況下,采用Excel或Pandas進(jìn)行簡單的分析就足以解決當(dāng)前問題。

在其他情況下,某個問題或許與機(jī)器學(xué)習(xí)完全無關(guān)??赡軆H需要使用腳本清理和操縱數(shù)據(jù)、構(gòu)建數(shù)據(jù)管道或創(chuàng)建交互式儀表板即可解決,這些問題都無需機(jī)器學(xué)習(xí)。

你應(yīng)該如何做?

正如上文所述,學(xué)習(xí)基礎(chǔ)知識會讓學(xué)習(xí)更高級的內(nèi)容變得更加輕松容易,并掌握多個機(jī)器學(xué)習(xí)概念。我知道,如果你正在學(xué)習(xí)統(tǒng)計學(xué)、數(shù)學(xué)或編程基礎(chǔ)知識,你可能會感覺自己在成為一名“數(shù)據(jù)科學(xué)家”的道路上,并未取得進(jìn)步,但學(xué)習(xí)這些基礎(chǔ)知識定會對你未來的學(xué)習(xí)大有裨益。

若想從現(xiàn)在開始一些切實(shí)具體的行動,可以參考以下步驟:

  • 從統(tǒng)計入手。在數(shù)學(xué)、統(tǒng)計學(xué)和編程基礎(chǔ)這三個組成部分中,個人認(rèn)為統(tǒng)計是最重要的一環(huán)。如果你害怕學(xué)習(xí)統(tǒng)計,那么數(shù)據(jù)科學(xué)可能并不適合你。推薦觀看佐治亞理工學(xué)院的課程《統(tǒng)計方法》(Statistical Methods),或者可汗學(xué)院的視頻系列(Khan Academy’s videoseries)。
  • 學(xué)習(xí)Python和SQL。我個人工作中從未使用過R語言,所以對R沒有太多意見。如果你是一個R型人才,推薦嘗試Python和SQL。使用Python和SQL的能力越強(qiáng),在數(shù)據(jù)收集、操縱和實(shí)現(xiàn)方面就會越容易。

除此之外,熟悉Pandas、NumPy和Scijit-learn等Python庫也是一個不錯的選擇。而由于二叉樹是許多高級機(jī)器學(xué)習(xí)算法(如XGBoost)的基礎(chǔ),所以也推薦大家學(xué)習(xí)。

  • 學(xué)習(xí)線性代數(shù)基礎(chǔ)。處理任何與矩陣相關(guān)的事情時,線性代數(shù)就變得極其重要。這一點(diǎn)在推薦系統(tǒng)和深度學(xué)習(xí)應(yīng)用中十分常見。
  • 學(xué)習(xí)數(shù)據(jù)操縱。數(shù)據(jù)操縱至少占數(shù)據(jù)科學(xué)家工作的50%。更具體地說,學(xué)習(xí)更多關(guān)于特征工程、探索性數(shù)據(jù)分析和數(shù)據(jù)準(zhǔn)備的知識。

我的總體建議是,由于機(jī)器學(xué)習(xí)一沒有充分利用時間,二無助于你成為工作中卓有成就的數(shù)據(jù)科學(xué)家,因此,以機(jī)器學(xué)習(xí)為學(xué)習(xí)重點(diǎn)并不可取。不過要注意的是,這是一篇個人觀點(diǎn)十分強(qiáng)烈的文章,所以,取你所想,取你所益。

 

責(zé)任編輯:華軒 來源: 讀芯術(shù)
相關(guān)推薦

2018-11-29 13:30:15

數(shù)據(jù)科學(xué)家項(xiàng)目數(shù)據(jù)

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2020-04-10 11:58:56

AI咨詢數(shù)據(jù)科學(xué)

2016-10-21 19:59:43

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)

2018-03-27 11:02:55

2019-05-13 16:31:37

數(shù)據(jù)科學(xué)家專業(yè)人才職業(yè)

2018-10-18 09:00:00

機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)算法數(shù)據(jù)科學(xué)家

2012-12-27 09:52:23

數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2020-03-20 14:40:48

數(shù)據(jù)科學(xué)Python學(xué)習(xí)

2013-04-11 10:03:55

2019-08-22 09:23:58

數(shù)據(jù)科學(xué)工程師數(shù)據(jù)處理

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2020-07-19 15:17:41

機(jī)器學(xué)習(xí)技術(shù)工程師

2020-03-13 14:13:48

機(jī)器學(xué)習(xí)數(shù)據(jù)科學(xué)編程

2018-11-05 17:33:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)

2012-12-06 15:36:55

CIO
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號