自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="3hl10"><p id="3hl10"><th id="3hl10"></th></p></blockquote>

<meter id="3hl10"><dfn id="3hl10"></dfn></meter>

<abbr id="3hl10"></abbr>

<samp id="3hl10"><option id="3hl10"></option></samp>

<abbr id="3hl10"><table id="3hl10"></table></abbr>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

機(jī)器學(xué)習(xí)中的算法(2)-支持向量機(jī)(SVM)基礎(chǔ)

作者：leftnoteasy 2014-07-08 10:31:08

數(shù)據(jù)庫(kù) 算法

SVM(Support Vector Machine)的文章，覺(jué)得SVM是一個(gè)非常有趣，而且自成一派的方向，所以今天準(zhǔn)備寫(xiě)一篇關(guān)于關(guān)于SVM的文章。

關(guān)于SVM的論文、書(shū)籍都非常的多，引用強(qiáng)哥的話“SVM是讓?xiě)?yīng)用數(shù)學(xué)家真正得到應(yīng)用的一種算法”。SVM對(duì)于大部分的普通人來(lái)說(shuō)，要完全理解其中的數(shù)學(xué)是非常困難的，所以要讓這些普通人理解，得要把里面的數(shù)學(xué)知識(shí)用簡(jiǎn)單的語(yǔ)言去講解才行。而且想明白了這些數(shù)學(xué)，對(duì)學(xué)習(xí)其他的內(nèi)容也是大有裨益的。我就是屬于絕大多數(shù)的普通人，為了看明白SVM，看了不少的資料，這里把我的心得分享分享。

其實(shí)現(xiàn)在能夠找到的，關(guān)于SVM的中文資料已經(jīng)不少了，不過(guò)個(gè)人覺(jué)得，每個(gè)人的理解都不太一樣，所以還是決定寫(xiě)一寫(xiě)，一些雷同的地方肯定是不可避免的，不過(guò)還是希望能夠?qū)懗鲆稽c(diǎn)與別人不一樣的地方吧。另外本文準(zhǔn)備不談太多的數(shù)學(xué)（因?yàn)楹芏辔恼露颊勥^(guò)了），盡量簡(jiǎn)單地給出結(jié)論，就像題目一樣-機(jī)器學(xué)習(xí)中的算法（之前叫做機(jī)器學(xué)習(xí)中的數(shù)學(xué)），所以本系列的內(nèi)容將更偏重應(yīng)用一些。如果想看更詳細(xì)的數(shù)學(xué)解釋?zhuān)梢钥纯磪⒖嘉墨I(xiàn)中的資料。

一、線性分類(lèi)器：

首先給出一個(gè)非常非常簡(jiǎn)單的分類(lèi)問(wèn)題（線性可分），我們要用一條直線，將下圖中黑色的點(diǎn)和白色的點(diǎn)分開(kāi)，很顯然，圖上的這條直線就是我們要求的直線之一（可以有無(wú)數(shù)條這樣的直線）

假如說(shuō)，我們令黑色的點(diǎn) = -1，白色的點(diǎn) = +1，直線f(x) = w.x + b，這兒的x、w是向量，其實(shí)寫(xiě)成這種形式也是等價(jià)的f(x) = w1x1 + w2x2 … + wnxn + b, 當(dāng)向量x的維度=2的時(shí)候，f(x) 表示二維空間中的一條直線，當(dāng)x的維度=3的時(shí)候，f(x) 表示3維空間中的一個(gè)平面，當(dāng)x的維度=n > 3的時(shí)候，表示n維空間中的n-1維超平面。這些都是比較基礎(chǔ)的內(nèi)容，如果不太清楚，可能需要復(fù)習(xí)一下微積分、線性代數(shù)的內(nèi)容。

剛剛說(shuō)了，我們令黑色白色兩類(lèi)的點(diǎn)分別為+1, -1，所以當(dāng)有一個(gè)新的點(diǎn)x需要預(yù)測(cè)屬于哪個(gè)分類(lèi)的時(shí)候，我們用sgn(f(x))，就可以預(yù)測(cè)了，sgn表示符號(hào)函數(shù)，當(dāng)f(x) > 0的時(shí)候，sgn(f(x)) = +1, 當(dāng)f(x) < 0的時(shí)候sgn(f(x)) = –1。

但是，我們?cè)鯓硬拍苋〉靡粋€(gè)***的劃分直線f(x)呢？下圖的直線表示幾條可能的f(x)

一個(gè)很直觀的感受是，讓這條直線到給定樣本中最近的點(diǎn)最遠(yuǎn)，這句話讀起來(lái)比較拗口，下面給出幾個(gè)圖，來(lái)說(shuō)明一下：

***種分法：

第二種分法：

這兩種分法哪種更好呢？從直觀上來(lái)說(shuō)，就是分割的間隙越大越好，把兩個(gè)類(lèi)別的點(diǎn)分得越開(kāi)越好。就像我們平時(shí)判斷一個(gè)人是男還是女，就是很難出現(xiàn)分錯(cuò)的情況，這就是男、女兩個(gè)類(lèi)別之間的間隙非常的大導(dǎo)致的，讓我們可以更準(zhǔn)確的進(jìn)行分類(lèi)。在SVM中，稱(chēng)為Maximum Marginal，是SVM的一個(gè)理論基礎(chǔ)之一。選擇使得間隙***的函數(shù)作為分割平面是由很多道理的，比如說(shuō)從概率的角度上來(lái)說(shuō)，就是使得置信度最小的點(diǎn)置信度***（聽(tīng)起來(lái)很拗口），從實(shí)踐的角度來(lái)說(shuō)，這樣的效果非常好，等等。這里就不展開(kāi)講，作為一個(gè)結(jié)論就ok了，:)

上圖被紅色和藍(lán)色的線圈出來(lái)的點(diǎn)就是所謂的支持向量(support vector)。

上圖就是一個(gè)對(duì)之前說(shuō)的類(lèi)別中的間隙的一個(gè)描述。Classifier Boundary就是f(x)，紅色和藍(lán)色的線（plus plane與minus plane）就是support vector所在的面，紅色、藍(lán)色線之間的間隙就是我們要***化的分類(lèi)間的間隙。

這里直接給出M的式子：（從高中的解析幾何就可以很容易的得到了，也可以參考后面Moore的ppt）

另外支持向量位于wx + b = 1與wx + b = -1的直線上，我們?cè)谇懊娉松弦粋€(gè)該點(diǎn)所屬的類(lèi)別y（還記得嗎?y不是+1就是-1），就可以得到支持向量的表達(dá)式為：y(wx + b) = 1，這樣就可以更簡(jiǎn)單的將支持向量表示出來(lái)了。

當(dāng)支持向量確定下來(lái)的時(shí)候，分割函數(shù)就確定下來(lái)了，兩個(gè)問(wèn)題是等價(jià)的。得到支持向量，還有一個(gè)作用是，讓支持向量后方那些點(diǎn)就不用參與計(jì)算了。這點(diǎn)在后面將會(huì)更詳細(xì)的講講。

在這個(gè)小節(jié)的***，給出我們要優(yōu)化求解的表達(dá)式：

||w||的意思是w的二范數(shù)，跟上面的M表達(dá)式的分母是一個(gè)意思，之前得到，M = 2 / ||w||，***化這個(gè)式子等價(jià)于最小化||w||, 另外由于||w||是一個(gè)單調(diào)函數(shù)，我們可以對(duì)其加入平方，和前面的系數(shù)，熟悉的同學(xué)應(yīng)該很容易就看出來(lái)了，這個(gè)式子是為了方便求導(dǎo)。

這個(gè)式子有還有一些限制條件，完整的寫(xiě)下來(lái)，應(yīng)該是這樣的：（原問(wèn)題）

s.t的意思是subject to，也就是在后面這個(gè)限制條件下的意思，這個(gè)詞在svm的論文里面非常容易見(jiàn)到。這個(gè)其實(shí)是一個(gè)帶約束的二次規(guī)劃(quadratic programming, QP)問(wèn)題，是一個(gè)凸問(wèn)題，凸問(wèn)題就是指的不會(huì)有局部***解，可以想象一個(gè)漏斗，不管我們開(kāi)始的時(shí)候?qū)⒁粋€(gè)小球放在漏斗的什么位置，這個(gè)小球最終一定可以掉出漏斗，也就是得到全局***解。s.t.后面的限制條件可以看做是一個(gè)凸多面體，我們要做的就是在這個(gè)凸多面體中找到***解。這些問(wèn)題這里不展開(kāi)，因?yàn)檎归_(kāi)的話，一本書(shū)也寫(xiě)不完。如果有疑問(wèn)請(qǐng)看看wikipedia。

二、轉(zhuǎn)化為對(duì)偶問(wèn)題，并優(yōu)化求解:

這個(gè)優(yōu)化問(wèn)題可以用拉格朗日乘子法去解，使用了KKT條件的理論，這里直接作出這個(gè)式子的拉格朗日目標(biāo)函數(shù)：

求解這個(gè)式子的過(guò)程需要拉格朗日對(duì)偶性的相關(guān)知識(shí)（另外pluskid也有一篇文章專(zhuān)門(mén)講這個(gè)問(wèn)題），并且有一定的公式推導(dǎo)，如果不感興趣，可以直接跳到后面用藍(lán)色公式表示的結(jié)論，該部分推導(dǎo)主要參考自plukids的文章。

首先讓L關(guān)于w，b最小化，分別令L關(guān)于w，b的偏導(dǎo)數(shù)為0，得到關(guān)于原問(wèn)題的一個(gè)表達(dá)式

將兩式帶回L(w,b,a)得到對(duì)偶問(wèn)題的表達(dá)式

新問(wèn)題加上其限制條件是（對(duì)偶問(wèn)題）:

這個(gè)就是我們需要最終優(yōu)化的式子。至此，得到了線性可分問(wèn)題的優(yōu)化式子。

求解這個(gè)式子，有很多的方法，比如SMO等等，個(gè)人認(rèn)為，求解這樣的一個(gè)帶約束的凸優(yōu)化問(wèn)題與得到這個(gè)凸優(yōu)化問(wèn)題是比較獨(dú)立的兩件事情，所以在這篇文章中準(zhǔn)備完全不涉及如何求解這個(gè)話題，如果之后有時(shí)間可以補(bǔ)上一篇文章來(lái)談?wù)?)。

三、線性不可分的情況（軟間隔）：

接下來(lái)談?wù)劸€性不可分的情況，因?yàn)榫€性可分這種假設(shè)實(shí)在是太有局限性了：

下圖就是一個(gè)典型的線性不可分的分類(lèi)圖，我們沒(méi)有辦法用一條直線去將其分成兩個(gè)區(qū)域，每個(gè)區(qū)域只包含一種顏色的點(diǎn)。

要想在這種情況下的分類(lèi)器，有兩種方式，一種是用曲線去將其完全分開(kāi)，曲線就是一種非線性的情況，跟之后將談到的核函數(shù)有一定的關(guān)系：

另外一種還是用直線，不過(guò)不用去保證可分性，就是包容那些分錯(cuò)的情況，不過(guò)我們得加入懲罰函數(shù)，使得點(diǎn)分錯(cuò)的情況越合理越好。其實(shí)在很多時(shí)候，不是在訓(xùn)練的時(shí)候分類(lèi)函數(shù)越***越好，因?yàn)橛?xùn)練函數(shù)中有些數(shù)據(jù)本來(lái)就是噪聲，可能就是在人工加上分類(lèi)標(biāo)簽的時(shí)候加錯(cuò)了，如果我們?cè)谟?xùn)練（學(xué)習(xí)）的時(shí)候把這些錯(cuò)誤的點(diǎn)學(xué)習(xí)到了，那么模型在下次碰到這些錯(cuò)誤情況的時(shí)候就難免出錯(cuò)了（假如老師給你講課的時(shí)候，某個(gè)知識(shí)點(diǎn)講錯(cuò)了，你還信以為真了，那么在考試的時(shí)候就難免出錯(cuò)）。這種學(xué)習(xí)的時(shí)候?qū)W到了“噪聲”的過(guò)程就是一個(gè)過(guò)擬合（over-fitting），這在機(jī)器學(xué)習(xí)中是一個(gè)大忌，我們寧愿少學(xué)一些內(nèi)容，也堅(jiān)決杜絕多學(xué)一些錯(cuò)誤的知識(shí)。還是回到主題，用直線怎么去分割線性不可分的點(diǎn)：

我們可以為分錯(cuò)的點(diǎn)加上一點(diǎn)懲罰，對(duì)一個(gè)分錯(cuò)的點(diǎn)的懲罰函數(shù)就是這個(gè)點(diǎn)到其正確位置的距離：

在上圖中，藍(lán)色、紅色的直線分別為支持向量所在的邊界，綠色的線為決策函數(shù)，那些紫色的線表示分錯(cuò)的點(diǎn)到其相應(yīng)的決策面的距離，這樣我們可以在原函數(shù)上面加上一個(gè)懲罰函數(shù)，并且?guī)掀湎拗茥l件為：

公式中藍(lán)色的部分為在線性可分問(wèn)題的基礎(chǔ)上加上的懲罰函數(shù)部分，當(dāng)xi在正確一邊的時(shí)候，ε=0，R為全部的點(diǎn)的數(shù)目，C是一個(gè)由用戶去指定的系數(shù)，表示對(duì)分錯(cuò)的點(diǎn)加入多少的懲罰，當(dāng)C很大的時(shí)候，分錯(cuò)的點(diǎn)就會(huì)更少，但是過(guò)擬合的情況可能會(huì)比較嚴(yán)重，當(dāng)C很小的時(shí)候，分錯(cuò)的點(diǎn)可能會(huì)很多，不過(guò)可能由此得到的模型也會(huì)不太正確，所以如何選擇C是有很多學(xué)問(wèn)的，不過(guò)在大部分情況下就是通過(guò)經(jīng)驗(yàn)嘗試得到的。

接下來(lái)就是同樣的，求解一個(gè)拉格朗日對(duì)偶問(wèn)題，得到一個(gè)原問(wèn)題的對(duì)偶問(wèn)題的表達(dá)式：

藍(lán)色的部分是與線性可分的對(duì)偶問(wèn)題表達(dá)式的不同之處。在線性不可分情況下得到的對(duì)偶問(wèn)題，不同的地方就是α的范圍從[0, +∞)，變?yōu)榱薣0, C]，增加的懲罰ε沒(méi)有為對(duì)偶問(wèn)題增加什么復(fù)雜度。

四、核函數(shù)：

剛剛在談不可分的情況下，提了一句，如果使用某些非線性的方法，可以得到將兩個(gè)分類(lèi)***劃分的曲線，比如接下來(lái)將要說(shuō)的核函數(shù)。

我們可以讓空間從原本的線性空間變成一個(gè)更高維的空間，在這個(gè)高維的線性空間下，再用一個(gè)超平面進(jìn)行劃分。這兒舉個(gè)例子，來(lái)理解一下如何利用空間的維度變得更高來(lái)幫助我們分類(lèi)的（例子以及圖片來(lái)自pluskid的kernel函數(shù)部分）：

下圖是一個(gè)典型的線性不可分的情況

但是當(dāng)我們把這兩個(gè)類(lèi)似于橢圓形的點(diǎn)映射到一個(gè)高維空間后，映射函數(shù)為：

用這個(gè)函數(shù)可以將上圖的平面中的點(diǎn)映射到一個(gè)三維空間（z1,z2,z3)，并且對(duì)映射后的坐標(biāo)加以旋轉(zhuǎn)之后就可以得到一個(gè)線性可分的點(diǎn)集了。

用另外一個(gè)哲學(xué)例子來(lái)說(shuō)：世界上本來(lái)沒(méi)有兩個(gè)完全一樣的物體，對(duì)于所有的兩個(gè)物體，我們可以通過(guò)增加維度來(lái)讓他們最終有所區(qū)別，比如說(shuō)兩本書(shū)，從(顏色，內(nèi)容)兩個(gè)維度來(lái)說(shuō)，可能是一樣的，我們可以加上作者這個(gè)維度，是在不行我們還可以加入頁(yè)碼，可以加入擁有者，可以加入購(gòu)買(mǎi)地點(diǎn)，可以加入筆記內(nèi)容等等。當(dāng)維度增加到無(wú)限維的時(shí)候，一定可以讓任意的兩個(gè)物體可分了。

回憶剛剛得到的對(duì)偶問(wèn)題表達(dá)式：

我們可以將紅色這個(gè)部分進(jìn)行改造，令：

這個(gè)式子所做的事情就是將線性的空間映射到高維的空間,k(x, xj)有很多種，下面是比較典型的兩種：

上面這個(gè)核稱(chēng)為多項(xiàng)式核，下面這個(gè)核稱(chēng)為高斯核，高斯核甚至是將原始空間映射為無(wú)窮維空間，另外核函數(shù)有一些比較好的性質(zhì)，比如說(shuō)不會(huì)比線性條件下增加多少額外的計(jì)算量，等等，這里也不再深入。一般對(duì)于一個(gè)問(wèn)題，不同的核函數(shù)可能會(huì)帶來(lái)不同的結(jié)果，一般是需要嘗試來(lái)得到的。

五、一些其他的問(wèn)題：

1）如何進(jìn)行多分類(lèi)問(wèn)題：

上面所談到的分類(lèi)都是2分類(lèi)的情況，當(dāng)N分類(lèi)的情況下，主要有兩種方式，一種是1 vs (N – 1)一種是1 vs 1，前一種方法我們需要訓(xùn)練N個(gè)分類(lèi)器，第i個(gè)分類(lèi)器是看看是屬于分類(lèi)i還是屬于分類(lèi)i的補(bǔ)集（出去i的N-1個(gè)分類(lèi)）。

后一種方式我們需要訓(xùn)練N * (N – 1) / 2個(gè)分類(lèi)器，分類(lèi)器(i,j)能夠判斷某個(gè)點(diǎn)是屬于i還是屬于j。

這種處理方式不僅在SVM中會(huì)用到，在很多其他的分類(lèi)中也是被廣泛用到，從林教授（libsvm的作者）的結(jié)論來(lái)看，1 vs 1的方式要優(yōu)于1 vs (N – 1)。

2）SVM會(huì)overfitting嗎？

SVM避免overfitting，一種是調(diào)整之前說(shuō)的懲罰函數(shù)中的C，另一種其實(shí)從式子上來(lái)看，min ||w||^2這個(gè)看起來(lái)是不是很眼熟？在最小二乘法回歸的時(shí)候，我們看到過(guò)這個(gè)式子，這個(gè)式子可以讓函數(shù)更平滑，所以SVM是一種不太容易o(hù)ver-fitting的方法。

參考文檔：

主要的參考文檔來(lái)自4個(gè)地方，wikipedia（在文章中已經(jīng)給出了超鏈接了），pluskid關(guān)于SVM的博文，Andrew moore的ppt（文章中不少圖片都是引用或者改自Andrew Moore的ppt，以及prml

責(zé)任編輯：彭凡來(lái)源：博客園

機(jī)器學(xué)習(xí)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)