自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

人工智能 機(jī)器學(xué)習(xí) 算法
人工智能正在做不可思議的事情-駕駛汽車,調(diào)酒,打仗-但是,盡管機(jī)器人面具受到了沉重的關(guān)注和關(guān)注,但任何真正的技術(shù)愛好者都知道基本的機(jī)器學(xué)習(xí)算法,這些算法可以移動(dòng)并控制可實(shí)現(xiàn)驚人成就的機(jī)器人技術(shù)。

 人工智能正在做不可思議的事情-駕駛汽車,調(diào)酒,打仗-但是,盡管機(jī)器人面具受到了沉重的關(guān)注和關(guān)注,但任何真正的技術(shù)愛好者都知道基本的機(jī)器學(xué)習(xí)算法,這些算法可以移動(dòng)并控制可實(shí)現(xiàn)驚人成就的機(jī)器人技術(shù)。

有四種主要的機(jī)器學(xué)習(xí)算法-決策樹,隨機(jī)森林,支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)-在最近的AI開發(fā)中常用。 機(jī)器人技術(shù)背后的算法甚至比機(jī)器本身重要得多,更不用說機(jī)器學(xué)習(xí)的非物理應(yīng)用了。

機(jī)器學(xué)習(xí)基礎(chǔ)

機(jī)器學(xué)習(xí)由多個(gè)領(lǐng)域組成,其中與人工智能應(yīng)用最相關(guān)的一個(gè)領(lǐng)域是監(jiān)督學(xué)習(xí)。 在機(jī)器學(xué)習(xí)的這一部分中,算法被賦予x并被告知預(yù)測(cè)y。 在自動(dòng)駕駛汽車的應(yīng)用中,x可能是當(dāng)前汽車前方的圖像。 我們將假定圖像像素為700像素寬,400像素長(zhǎng),它們將形成700 * 400 = 280,000尺寸的x。

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

在上面的示例中,前方道路的圖像被轉(zhuǎn)換為長(zhǎng)度為280,000的矢量,然后將其輸入經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型中。 在這種情況下,模型可能會(huì)輸出1表示"行進(jìn)安全"(如果認(rèn)為道路行進(jìn)不安全,則輸出0)。 自動(dòng)駕駛汽車中圖像識(shí)別的其他領(lǐng)域包括深度感知(識(shí)別物體有多遠(yuǎn))或讀取限速標(biāo)志。 除了圖像分類之外,機(jī)器學(xué)習(xí)的其他應(yīng)用程序還包括確定計(jì)算一個(gè)人過街的速度或確定前方汽車向右轉(zhuǎn)的可能性。

在文本實(shí)例中,文本被矢量化或轉(zhuǎn)換為數(shù)字?jǐn)?shù)組。 文本可以被分類,例如在真實(shí)/偽造新聞中,或用于生成(創(chuàng)建唯一文本)。

機(jī)器學(xué)習(xí)算法輸入和輸出的所有內(nèi)容都是純數(shù)字的,因此每種算法本質(zhì)上都是數(shù)學(xué)的。 機(jī)器學(xué)習(xí)算法只需執(zhí)行一組數(shù)學(xué)過程即可將多維x數(shù)據(jù)轉(zhuǎn)換為(通常)奇異的y值。 監(jiān)督學(xué)習(xí)的主要子類是分類和回歸。 前者致力于將x劃分為一組離散的類別(例如,圖像是貓還是狗),而后者則致力于以連續(xù)的比例分配xay(例如,基于諸如臥室數(shù)量等屬性的房?jī)r(jià)) 。

數(shù)據(jù)的每個(gè)維度也稱為要素。 在圖像的情況下,每個(gè)像素都是一個(gè)特征,或者在預(yù)測(cè)房?jī)r(jià)的示例中,每個(gè)房屋屬性(例如,臥室,浴室的數(shù)量,是否有水濱等)都是一個(gè)特征。

決策樹

決策樹算法基于以下簡(jiǎn)單思想:遵循一組是/否問題以得出最終結(jié)論。 例如,一個(gè)例子是問一個(gè)朋友接下來要嘗試哪種食物。 您的朋友可能會(huì)根據(jù)他們的經(jīng)驗(yàn)問您一系列"是/否"問題,以確定您應(yīng)該嘗試哪種食物。 示例樹可能如下所示:

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

根據(jù)您對(duì)朋友問題的是/否回答,您的朋友沿著樹下的路徑到達(dá)終點(diǎn)。 對(duì)于真實(shí)數(shù)據(jù)集,決策樹可能深達(dá)數(shù)十層。 決策樹在分類方面非常強(qiáng)大。 在數(shù)據(jù)集中,算法嘗試通過將最有區(qū)別的特征放在頂部來構(gòu)造樹。 最具特色的功能是提供最多信息的最佳功能。

一個(gè)功能的"好"程度可以通過其信息增益來衡量,也可以通過僅基于該功能將數(shù)據(jù)分為兩類來提供多少信息。

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

決策樹的各層在頂部添加了最多的信息獲取功能,在底部添加了最少的信息獲取功能。 在實(shí)際數(shù)據(jù)集中,決策樹仍會(huì)構(gòu)造是/否問題,但可以用許多方式來表達(dá)它們,例如:

  • 浴室數(shù)量是否大于或等于3?
  • 房子在水邊嗎?

決策樹算法還可以通過較小的方式用于回歸,也可以提供概率置信度(基于獲得的信息量)。 決策樹可以通過復(fù)雜的數(shù)據(jù)結(jié)構(gòu)選擇方法,但也可以解釋。 決策樹可用于診斷癌癥,阿爾茨海默氏癥或相關(guān)的醫(yī)療狀況。 他們能夠捕捉人類醫(yī)生永遠(yuǎn)無法完成的復(fù)雜性和深度。

隨機(jī)森林

決策樹可以使用隨機(jī)森林算法進(jìn)行改進(jìn)。 決策樹的問題在于,由于它們?cè)噲D最大程度地獲取信息,因此很容易過度擬合。 此時(shí),模型變得非常擅長(zhǎng)對(duì)數(shù)據(jù)進(jìn)行分類,以致于無法在將要使用的新數(shù)據(jù)上很好地表現(xiàn)數(shù)據(jù)。 這類似于孩子記住對(duì)問題的確切措詞的確切答案,但不能回答具有不同措辭的問題。

在機(jī)器學(xué)習(xí)中,決策樹被認(rèn)為是高偏置算法。 就像您的朋友推薦嘗試食物的類比,僅一個(gè)朋友一個(gè)人就會(huì)使您有偏頗的選擇。 隨機(jī)森林通過在"森林"中包含多個(gè)決策樹模型來擴(kuò)展決策樹算法。

類似于一個(gè)朋友推薦食物的例子,想象一下問十個(gè)不同的朋友來指導(dǎo)您完成相同的是/否問題解答過程。 由于每個(gè)朋友都有不同的口味和經(jīng)驗(yàn),因此他們會(huì)提出不同的問題,并得出自己應(yīng)該嘗試哪種食物的結(jié)論。 最后,您選擇十個(gè)朋友中大多數(shù)同意您應(yīng)點(diǎn)的食物。 這樣可以做出更全面的決策,而不僅僅是基于一個(gè)朋友,而是從許多人的全球角度出發(fā)。

隨機(jī)森林算法包括許多決策樹。 每個(gè)人都接受數(shù)據(jù)的不同子集的訓(xùn)練,這些子集都是隨機(jī)選擇的。 每個(gè)模型都在不同的數(shù)據(jù)子集上進(jìn)行訓(xùn)練,類似于具有不同的體驗(yàn)和品味。 在每個(gè)子集上構(gòu)建決策樹之后,隨機(jī)森林模型會(huì)匯總其投票以得出最終決策。

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

隨機(jī)森林模型可以執(zhí)行決策樹算法可以完成的相同任務(wù)。 其優(yōu)點(diǎn)在于,它可以提供更平衡的透視圖,但訓(xùn)練起來的計(jì)算量也更大。 在某些情況下,隨機(jī)森林甚至可能比決策樹更差。 無論如何,決策樹和隨機(jī)森林都是非常強(qiáng)大的分類算法,在AI中有許多應(yīng)用。

支持向量機(jī)(SVM)

支持向量機(jī)(SVM)算法是機(jī)器學(xué)習(xí)中用于二進(jìn)制分類(將數(shù)據(jù)點(diǎn)分為兩類之一)的一種常用且功能強(qiáng)大的算法。 SVM算法構(gòu)造一條線,將數(shù)據(jù)分為兩類,如下所示。

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

但是,SVM的前提是數(shù)據(jù)是線性可分離的,這意味著可以將它們放在帶有直線(或超平面)的兩個(gè)不同類別中。 然而,這并非總是如此:

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

在這種情況下,純線性SVM分隔符無法容納真實(shí)的彎曲邊界。 因此,為了解決皮膚問題,SVM應(yīng)用了各種內(nèi)核函數(shù)以在可線性分離的邊界之間拉直數(shù)據(jù)。 盡管這是一個(gè)簡(jiǎn)化,但這是內(nèi)核技巧的主要思想。 例如,考慮指數(shù)邊界,并且應(yīng)用對(duì)數(shù)對(duì)拉直的效果。

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

還將訓(xùn)練適用于數(shù)據(jù)的哪些函數(shù),包括但不限于多項(xiàng)式,S形,高斯函數(shù)以及這些函數(shù)的任意組合,以提供最容易線性分離的數(shù)據(jù)。 在高維數(shù)據(jù)中,無論數(shù)據(jù)的結(jié)構(gòu)如何,SVM都可以很好地運(yùn)行。

支持向量機(jī)有時(shí)被用作低維圖像分類的一種低計(jì)算成本的方法,該模式易于識(shí)別,因此支持向量機(jī)可以正確地對(duì)其進(jìn)行分類,但不能保證復(fù)雜數(shù)據(jù)關(guān)系的常用算法即神經(jīng)網(wǎng)絡(luò)。

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)中最強(qiáng)大的算法家族。 但是,數(shù)學(xué)上已經(jīng)證明,沒有"通用"算法可以在所有數(shù)據(jù)集上發(fā)揮最佳性能,因此,不應(yīng)將神經(jīng)網(wǎng)絡(luò)用作對(duì)任何數(shù)據(jù)集的切刀解決方案。 最重要的是,它們的培訓(xùn)成本可能很高,因此應(yīng)謹(jǐn)慎使用。

就是說,神經(jīng)網(wǎng)絡(luò)是最先進(jìn)的AI應(yīng)用程序中使用最廣泛的算法。 它們?cè)诖竽X中模擬神經(jīng)元及其之間的聯(lián)系。 在神經(jīng)網(wǎng)絡(luò)中,存在三種類型的層:

  • 輸入圖層,用于接收信息。 輸入層中神經(jīng)元的數(shù)量與輸入(X)的維數(shù)相對(duì)應(yīng)。 例如,如果圖像數(shù)據(jù)集為28 x 28像素,則輸入層將具有28 x 28 = 784個(gè)神經(jīng)元。
  • 輸出層,輸出神經(jīng)網(wǎng)絡(luò)的決策。 輸出層中神經(jīng)元的數(shù)量與輸出的維數(shù)(y)相對(duì)應(yīng)。 例如,一個(gè)旨在將新聞分類為真實(shí)(1)或偽造(0)的數(shù)據(jù)集將只有一個(gè)輸出神經(jīng)元。
  • 隱藏層,它們連接輸入層和輸出層。 隱藏層為神經(jīng)網(wǎng)絡(luò)增加了更多的復(fù)雜性和信息。 通常,隱藏層越多,神經(jīng)網(wǎng)絡(luò)可以執(zhí)行的功能越復(fù)雜和"智能"。

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

每個(gè)神經(jīng)元就像一個(gè)小型計(jì)算器-信息經(jīng)過傳遞,轉(zhuǎn)換,然后傳遞到下一層。 神經(jīng)元具有輸入要通過的激活函數(shù),該函數(shù)將輸入簡(jiǎn)單地轉(zhuǎn)換為更好地幫助神經(jīng)網(wǎng)絡(luò)理解和處理信息的格式。

神經(jīng)元之間的每個(gè)連接也具有權(quán)重。 信息通過連接傳遞時(shí),將乘以權(quán)重。

 

了解AI背后的引擎,4個(gè)技術(shù)愛好者應(yīng)該知道的機(jī)器學(xué)習(xí)算法

 

每個(gè)神經(jīng)元都會(huì)執(zhí)行少量計(jì)算,將它們與權(quán)重鏈接在一起時(shí),現(xiàn)代神經(jīng)網(wǎng)絡(luò)便會(huì)在龐大的規(guī)模上運(yùn)行-數(shù)十個(gè)隱藏層,每層數(shù)百個(gè)神經(jīng)元以及數(shù)百萬個(gè)參數(shù)(權(quán)重),它們可以生成文本, 讀取圖像并執(zhí)行其他"智能"操作。

神經(jīng)網(wǎng)絡(luò)的反向傳播算法可調(diào)整權(quán)重。 在神經(jīng)網(wǎng)絡(luò)中,調(diào)整神經(jīng)網(wǎng)絡(luò)之間的權(quán)重。 如果網(wǎng)絡(luò)足夠大,可能要花費(fèi)數(shù)小時(shí)甚至數(shù)天的時(shí)間來訓(xùn)練幾千萬個(gè)砝碼中的每一個(gè)。

神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)一直是最新技術(shù)發(fā)展背后的算法,其中包括AlphaGo擊敗世界圍棋冠軍,創(chuàng)造逼真的藝術(shù)品并產(chǎn)生音樂。

現(xiàn)在您了解了AI的引擎。

謝謝閱讀! 如果您對(duì)AI中的這四種算法或機(jī)器學(xué)習(xí)有任何疑問或澄清,請(qǐng)隨時(shí)做出回應(yīng)。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2019-08-09 10:15:14

機(jī)器學(xué)習(xí)人工智能監(jiān)督學(xué)習(xí)

2021-01-12 10:50:48

人工智能Instagramer科技

2014-02-13 10:15:39

編程業(yè)余愛好

2013-12-26 10:32:30

編程學(xué)習(xí)

2010-05-11 10:08:00

2011-05-30 13:58:56

PHP

2017-03-23 15:17:20

Linuxsudo棋盤

2018-06-12 07:38:05

Linux 開源

2023-11-02 08:32:11

機(jī)器學(xué)習(xí)人工智能

2020-12-14 12:54:07

數(shù)據(jù)類型數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2015-06-05 09:12:52

OpenStack設(shè)計(jì)指導(dǎo)開發(fā)者

2011-01-05 09:36:19

VirtualBSD

2011-04-07 10:42:11

編輯器云計(jì)算

2011-08-29 17:56:18

Paper Camer拍照應(yīng)用

2021-01-10 15:31:05

Mac終端Linux

2014-04-01 09:48:09

Linux高清壁紙

2020-11-23 09:26:22

機(jī)器學(xué)習(xí)技術(shù)算法

2010-06-18 09:00:54

2009-02-27 09:59:07

LinuxFedora 10愛好者

2011-07-18 15:44:40

網(wǎng)絡(luò)安全技術(shù)周刊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)