自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

機(jī)器學(xué)習(xí):都有哪些具體分類?項目的流程是怎樣?

人工智能 機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)、人工智能應(yīng)該是近幾年最火的關(guān)鍵詞之一了。今天分享一些機(jī)器學(xué)習(xí)的基礎(chǔ)知識。如果有啥不正確的地方,歡迎各位大佬指正。

 機(jī)器學(xué)習(xí)、人工智能應(yīng)該是近幾年最火的關(guān)鍵詞之一了。今天分享一些機(jī)器學(xué)習(xí)的基礎(chǔ)知識。如果有啥不正確的地方,歡迎各位大佬指正。

[[383223]]

01機(jī)器學(xué)習(xí)的定義

在說機(jī)器學(xué)習(xí)之前先明確一下,什么是人類的學(xué)習(xí)行為呢?

可以這樣總結(jié),人類從歷史經(jīng)驗中獲取規(guī)律,并將其應(yīng)用到新的類似場景中,就是人類的學(xué)習(xí)行為。

相對應(yīng)的,機(jī)器學(xué)習(xí)是指讓機(jī)器去訓(xùn)練、去學(xué)習(xí),讓機(jī)器從大量數(shù)據(jù)中找到數(shù)據(jù)中的內(nèi)在特征,從而對新事物做出判斷。

02機(jī)器學(xué)習(xí)的分類

機(jī)器學(xué)習(xí)有哪些類別呢?按照不同的分類方式,有不同的細(xì)分類別。梳理了一下,主要有以下的概況圖:

 

 

 

 

(1)按照學(xué)習(xí)目標(biāo)分類

什么是機(jī)器學(xué)習(xí)目標(biāo)呢?通俗來講,就是我們想通過機(jī)器學(xué)習(xí),最終實現(xiàn)的結(jié)果形態(tài)是什么樣。

按照學(xué)習(xí)目標(biāo),主要可以分為三類:回歸問題、分類問題、排序問題。

  • 回歸問題:解決的是目標(biāo)是連續(xù)性變量的問題。比如想根據(jù)身高預(yù)測體重,體重就是一個連續(xù)性變量。
  • 分類問題:解決的是目標(biāo)是離散的標(biāo)簽的問題。比如預(yù)測一個人是男還是女。
  • 排序問題:模型輸出的是經(jīng)過排序的對象列表。

(2)按照訓(xùn)練數(shù)據(jù)的特性分類

上文提到了,進(jìn)行機(jī)器學(xué)習(xí)是需要訓(xùn)練數(shù)據(jù)為基礎(chǔ)的(不然機(jī)器沒法學(xué)習(xí)呀)。按照訓(xùn)練數(shù)據(jù)的特性,主要分為以下兩類:

  • 有監(jiān)督學(xué)習(xí):通過已有的訓(xùn)練樣本去訓(xùn)練得到一個最優(yōu)模型,再利用這個模型將所有的輸入映射為相應(yīng)的輸出,對輸出進(jìn)行簡單的判斷從而實現(xiàn)預(yù)測和分類的目的,也就具有了對未知數(shù)據(jù)進(jìn)行預(yù)測和分類的能力。有監(jiān)督算法常見的有:線性回歸算法、BP神經(jīng)網(wǎng)絡(luò)算法、決策樹、支持向量機(jī)、KNN等。
  • 無監(jiān)督學(xué)習(xí):訓(xùn)練樣本的標(biāo)記信息未知,目標(biāo)是通過對無標(biāo)記訓(xùn)練樣本的學(xué)習(xí)來揭示數(shù)據(jù)的內(nèi)在性質(zhì)及規(guī)律,為進(jìn)一步的數(shù)據(jù)分析提供基礎(chǔ),此類學(xué)習(xí)任務(wù)中研究最多、應(yīng)用最廣的是"聚類",聚類目的在于把相似的東西聚在一起,主要通過計算樣本間和群體間距離得到。深度學(xué)習(xí)和PCA都屬于無監(jiān)督學(xué)習(xí)的范疇。無監(jiān)督算法常見的有:密度估計、異常檢測、層次聚類、EM算法、K-Means算法、DBSCAN算法等。

(3)按照模型的復(fù)雜程度分類

按照模型的復(fù)雜度,主要分為兩類:線性模型和非線性模型。

  • 線性模型:決策邊界為直線。例如邏輯回歸模型。
  • 非線性模型:決策邊界為非直線。例如神經(jīng)網(wǎng)絡(luò)模型。

(4)按照模型功能分類

按照模型的功能來分類,主要分為判別模型與生成模型。

  • 判別模型:由數(shù)據(jù)直接學(xué)習(xí)決策函數(shù)f(x)或條件概率分布P(y|x)進(jìn)行預(yù)測的模型,其關(guān)心的是對給定的輸入x,應(yīng)該預(yù)測什么樣的輸出y。常見的k近鄰法、感知機(jī)、決策樹、邏輯回歸、線性回歸、最大熵模型。
  • 生成模型:由數(shù)據(jù)學(xué)習(xí)輸入和輸出聯(lián)合概率分布P(x,y),然后求出后驗概率分布P(y|x)進(jìn)行預(yù)測的模型。常見的生成模型樸素貝葉斯、隱馬爾可夫(em算法)。

03機(jī)器學(xué)習(xí)的基本流程

對于一個機(jī)器學(xué)習(xí)項目而言,主要的流程有以下概況:

 

 

 

 

(1)數(shù)據(jù)預(yù)處理

數(shù)據(jù)清洗是檢測和去除數(shù)據(jù)集中的噪聲數(shù)據(jù)和無關(guān)數(shù)據(jù),處理遺漏數(shù)據(jù),去除空白數(shù)據(jù)域和知識背景下的白噪聲。

(2)數(shù)據(jù)切分

在機(jī)器學(xué)習(xí)中,通常將所有的數(shù)據(jù)劃分為三份:訓(xùn)練數(shù)據(jù)集、驗證數(shù)據(jù)集和測試數(shù)據(jù)集。它們的功能分別為

  • 訓(xùn)練數(shù)據(jù)集(train dataset):用來構(gòu)建機(jī)器學(xué)習(xí)模型
  • 驗證數(shù)據(jù)集(validation dataset):輔助構(gòu)建模型,用于在構(gòu)建過程中評估模型,為模型提供無偏估計,進(jìn)而調(diào)整模型超參數(shù)
  • 測試數(shù)據(jù)集(test dataset):用來評估訓(xùn)練好的最終模型的性能

關(guān)于數(shù)據(jù)如何進(jìn)行切分,后續(xù)再進(jìn)行分享。

(3)特征工程

特征構(gòu)建是指從原始數(shù)據(jù)中人工的找出一些具有物理意義的特征。需要花時間去觀察原始數(shù)據(jù),思考問題的潛在形式和數(shù)據(jù)結(jié)構(gòu),對數(shù)據(jù)敏感性和機(jī)器學(xué)習(xí)實戰(zhàn)經(jīng)驗?zāi)軒椭卣鳂?gòu)建。

關(guān)于機(jī)器學(xué)習(xí),就先分享這些。歡迎大家繼續(xù)關(guān)注~

責(zé)任編輯:華軒 來源: 首席數(shù)據(jù)科學(xué)家
相關(guān)推薦

2015-12-30 11:18:20

2021-03-09 15:21:13

Python機(jī)器學(xué)習(xí)開發(fā)

2021-04-12 09:00:00

機(jī)器學(xué)習(xí)深度學(xué)習(xí)技術(shù)

2022-07-05 22:11:57

機(jī)器視覺人工智能

2021-08-05 10:20:24

機(jī)器人人工智能技術(shù)

2018-06-29 10:34:40

區(qū)塊鏈數(shù)字貨幣比特幣

2022-06-05 21:16:08

機(jī)器學(xué)習(xí)Python

2017-01-06 13:33:35

初學(xué)實踐分類網(wǎng)絡(luò)

2014-04-14 09:58:18

開源項目

2021-06-10 19:02:37

大數(shù)據(jù)統(tǒng)計學(xué)機(jī)器學(xué)習(xí)

2021-04-26 13:22:55

人工智能機(jī)器學(xué)習(xí)

2023-02-07 07:16:54

人工智能機(jī)器學(xué)習(xí)方法

2014-04-23 13:45:40

iOS項目目錄結(jié)構(gòu)開發(fā)流程

2020-08-10 15:05:02

機(jī)器學(xué)習(xí)人工智能計算機(jī)

2021-03-10 14:21:33

人工智能機(jī)器學(xué)習(xí)算法

2019-01-23 11:45:47

機(jī)器學(xué)習(xí)人工智能機(jī)器人

2022-08-15 15:16:20

機(jī)器學(xué)習(xí)圖片深度學(xué)習(xí)

2020-09-23 10:21:32

人工智能

2020-07-07 16:55:19

機(jī)器學(xué)習(xí)人工智能計算機(jī)

2017-02-27 14:24:12

機(jī)器學(xué)習(xí)深度學(xué)習(xí)數(shù)學(xué)
點贊
收藏

51CTO技術(shù)棧公眾號