自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<legend id="sp1vg"><track id="sp1vg"><dfn id="sp1vg"></dfn></track></legend>

<style id="sp1vg"></style>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

作者：聞數(shù)起舞 2020-12-20 20:31:56

人工智能機(jī)器學(xué)習(xí)

線性回歸可能是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法。對(duì)于初學(xué)者來(lái)說(shuō)非常好，因?yàn)樗褂煤?jiǎn)單的公式。因此，這對(duì)學(xué)習(xí)機(jī)器學(xué)習(xí)概念很有幫助。在本文中，我將嘗試逐步解釋多元線性回歸。

從頭開(kāi)始學(xué)習(xí)為Python中任意數(shù)量的變量開(kāi)發(fā)多元線性回歸。

線性回歸可能是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法。對(duì)于初學(xué)者來(lái)說(shuō)非常好，因?yàn)樗褂煤?jiǎn)單的公式。因此，這對(duì)學(xué)習(xí)機(jī)器學(xué)習(xí)概念很有幫助。在本文中，我將嘗試逐步解釋多元線性回歸。

概念和公式

線性回歸使用我們?cè)趯W(xué)校都學(xué)過(guò)的簡(jiǎn)單公式：

Y = C + AX

提醒一下，Y是輸出或因變量，X是輸入或自變量，A是斜率，C是截距。

對(duì)于線性回歸，對(duì)于相同的公式，我們遵循以下符號(hào)：

如果我們有多個(gè)自變量，則線性回歸的公式將如下所示：

在這里，" h"稱為假設(shè)。這是預(yù)測(cè)的輸出變量。Theta0是偏差項(xiàng)，所有其他theta值是系數(shù)。它們首先是隨機(jī)啟動(dòng)的，然后使用算法進(jìn)行優(yōu)化，以便此公式可以緊密預(yù)測(cè)因變量。

成本函數(shù)和梯度下降

當(dāng)theta值從一開(kāi)始就被初始化時(shí)，該公式未經(jīng)過(guò)訓(xùn)練以預(yù)測(cè)因變量。該假設(shè)與原始輸出變量" Y"相去甚遠(yuǎn)。這是估算所有訓(xùn)練數(shù)據(jù)的累積距離的公式：

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

這稱為成本函數(shù)。如果您注意到了，它從假設(shè)(預(yù)測(cè)輸出)中減去y(原始輸出)，取平方去掉負(fù)數(shù)，求和除以2乘以m。在此，m是訓(xùn)練數(shù)據(jù)的數(shù)量。您可能會(huì)看到成本函數(shù)是原始輸出和預(yù)測(cè)輸出之間差異的指示。機(jī)器學(xué)習(xí)算法的思想是最小化成本函數(shù)，以使原始輸出與預(yù)測(cè)輸出之間的差異更小。為此，我們需要優(yōu)化theta值。

這是我們更新theta值的方法。我們將成本函數(shù)相對(duì)于每個(gè)theta值的偏微分，然后從現(xiàn)有theta值中減去該值，

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

在此，alpha是學(xué)習(xí)率，它是一個(gè)常數(shù)。我沒(méi)有為所有theta值顯示相同的公式。但這是所有theta值的相同公式。經(jīng)過(guò)微分后，公式得出為：

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

這稱為梯度下降。

逐步實(shí)現(xiàn)算法

我要使用的數(shù)據(jù)集來(lái)自吳安德(Andre Ng)的Coursera機(jī)器學(xué)習(xí)課程。我將在此頁(yè)面底部提供鏈接。請(qǐng)隨時(shí)下載數(shù)據(jù)集并通過(guò)本教程進(jìn)行練習(xí)。我鼓勵(lì)您在閱讀數(shù)據(jù)集時(shí)進(jìn)行練習(xí)(如果這對(duì)您來(lái)說(shuō)是新的)。那是了解它的唯一方法。

在此數(shù)據(jù)集中，只有兩個(gè)變量。但是我開(kāi)發(fā)了適用于任意數(shù)量變量的算法。如果您對(duì)10個(gè)變量或20個(gè)變量使用相同的算法，那么它也應(yīng)該工作。我將在Python中使用Numpy和Pandas庫(kù)。所有這些豐富的Python庫(kù)使機(jī)器學(xué)習(xí)算法更加容易。導(dǎo)入包和數(shù)據(jù)集：

import pandas as pd 
import numpy as np 
 
df = pd.read_csv('ex1data2.txt', header = None) 
df.head()

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

(1) 在偏項(xiàng)中添加一列。之所以選擇1，是因?yàn)槿绻鷮⒁粋€(gè)值乘以任意值，則該值不會(huì)改變。

df = pd.concat([pd.Series(1, index=df.index, name='00'), df], axis=1) 
df.head()

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

(2) 定義輸入變量或自變量X以及輸出變量或因變量y。在此數(shù)據(jù)集中，列0和1是輸入變量，列2是輸出變量。

X = df.drop(columns=2) 
y = df.iloc[:, 3]

(3) 通過(guò)將每一列除以該列的最大值來(lái)標(biāo)準(zhǔn)化輸入變量。這樣，每列的值將在0到1之間。此步驟不是必需的。但這會(huì)使算法更快地達(dá)到最佳狀態(tài)。同樣，如果您注意到數(shù)據(jù)集，則列0的元素與列1的元素相比太大。如果對(duì)數(shù)據(jù)集進(jìn)行規(guī)范化，則可以防止第一列在算法中占主導(dǎo)地位。

for i in range(1, len(X.columns)):  
    X[i-1] = X[i-1]/np.max(X[i-1]) 
X.head()

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

(4) 初始化theta值。我將它們初始化為零。但是任何其他數(shù)字都可以。

theta = np.array([0]*len(X.columns)) 
#Output: array([0, 0, 0])

(5) 計(jì)算在上式中以m表示的訓(xùn)練數(shù)據(jù)的數(shù)量：

m = len(df)

(6) 定義假設(shè)函數(shù)

def hypothesis(theta, X):  
    return theta*X

(7) 使用上述成本函數(shù)的公式定義成本函數(shù)

def computeCost(X, y, theta):  
    y1 = hypothesis(theta, X)  
    y1=np.sum(y1, axis=1)  
    return sum(np.sqrt((y1-y)**2))/(2*47)

(8) 編寫梯度下降函數(shù)。此函數(shù)將以X，y，theta，學(xué)習(xí)率(公式中的alpha)和歷元(或迭代)作為輸入。我們需要不斷更新theta值，直到成本函數(shù)達(dá)到最小值為止。

def gradientDescent(X, y, theta, alpha, i): 
    J = []  #cost function in each iterations 
    k = 0 
    while k < i:         
        y1 = hypothesis(theta, X) 
        y1 = np.sum(y1, axis=1) 
        for c in range(0, len(X.columns)): 
            theta[c] = theta[c] - alpha*(sum((y1-y)*X.iloc[:,c])/len(X)) 
        j = computeCost(X, y, theta) 
        J.append(j) 
        k += 1 
    return J, j, theta

(9) 使用梯度下降函數(shù)獲得最終成本，每次迭代的成本列表以及優(yōu)化的參數(shù)theta。我選擇alpha為0.05。但是您可以嘗試使用其他一些值(例如0.1、0.01、0.03、0.3)來(lái)查看會(huì)發(fā)生什么。我運(yùn)行了10000次迭代。請(qǐng)嘗試進(jìn)行更多或更少的迭代，以查看差異。

J, j, theta = gradientDescent(X, y, theta, 0.05, 10000)

(10) 使用優(yōu)化的theta預(yù)測(cè)輸出

y_hat = hypothesis(theta, X)y_hat = np.sum(y_hat, axis=1)

(11) 繪制原始y和預(yù)測(cè)輸出y_hat

%matplotlib inline 
import matplotlib.pyplot as plt 
plt.figure() 
plt.scatter(x=list(range(0, 47)),yy= y, color='blue')  
plt.scatter(x=list(range(0, 47)), y=y_hat, color='black') 
plt.show()

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

一些輸出點(diǎn)幾乎與預(yù)測(cè)輸出重疊。有些接近但不重疊。

(12) 繪制每次迭代的成本以查看行為

plt.figure() 
plt.scatter(x=list(range(0, 10000)), y=J) 
plt.show()

免費(fèi)Python機(jī)器學(xué)習(xí)課程二：多元線性回歸

每次迭代的成本都在下降。這表明算法運(yùn)行良好。

希望對(duì)您有所幫助，您也可以自己嘗試一下。我鼓勵(lì)您下載數(shù)據(jù)集，并在閱讀本章以學(xué)習(xí)機(jī)器學(xué)習(xí)概念時(shí)嘗試自己運(yùn)行所有代碼。這是數(shù)據(jù)集的鏈接：

https://github.com/rashida048/Machine-Learning-With-Python/blob/master/ex1data2.txt

責(zé)任編輯：趙寧寧來(lái)源：今日頭條

Python 機(jī)器學(xué)習(xí)多元線性回歸

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<cite id="d5uuv"></cite>