自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

免費Python機器學習課程三:多項式回歸

人工智能 機器學習
線性回歸的改進版本中的多項式回歸。如果您知道線性回歸,那么對您來說很簡單。如果沒有,我將在本文中解釋這些公式。

線性回歸的改進版本中的多項式回歸。如果您知道線性回歸,那么對您來說很簡單。如果沒有,我將在本文中解釋這些公式。還有其他先進且更有效的機器學習算法。但是,學習基于線性的回歸技術是一個好主意。因為它們簡單,快速并且可以使用眾所周知的公式。盡管它可能不適用于復雜的數據集。

[[359167]]

多項式回歸公式

僅當輸入變量和輸出變量之間存在線性相關性時,線性回歸才能很好地執(zhí)行。如前所述,多項式回歸建立在線性回歸的基礎上。如果您需要線性回歸的基礎知識,請訪問線性回歸:

Python中的線性回歸算法

學習線性回歸的概念并從頭開始在python中開發(fā)完整的線性回歸算法

多項式回歸可以更好地找到輸入要素與輸出變量之間的關系,即使該關系不是線性的。它使用與線性回歸相同的公式:

Y = BX + C

我敢肯定,我們都在學校學過這個公式。對于線性回歸,我們使用如下符號:

免費Python機器學習課程三:多項式回歸

在這里,我們從數據集中獲得X和Y。X是輸入要素,Y是輸出變量。Theta值是隨機初始化的。

對于多項式回歸,公式如下所示:

免費Python機器學習課程三:多項式回歸

我們在這里添加更多術語。我們使用相同的輸入功能,并采用不同的指數以制作更多功能。這樣,我們的算法將能夠更好地了解數據。

冪不必為2、3或4。它們也可以為1 / 2、1 / 3或1/4。然后,公式將如下所示:

免費Python機器學習課程三:多項式回歸

成本函數和梯度下降

成本函數給出了預測假設與值之間的距離的概念。公式為:

免費Python機器學習課程三:多項式回歸

這個方程可能看起來很復雜。它正在做一個簡單的計算。首先,從原始輸出變量中減去假設。取平方消除負值。然后將該值除以訓練示例數量的2倍。

什么是梯度下降?它有助于微調我們隨機初始化的theta值。我不打算在這里進行微積分。如果對每個θ取成本函數的偏微分,則可以得出以下公式:

免費Python機器學習課程三:多項式回歸

在這里,alpha是學習率。您選擇alpha的值。

多項式回歸的Python實現

這是多項式回歸的逐步實現。

(1) 在此示例中,我們將使用一個簡單的虛擬數據集,該數據集提供職位的薪水數據。導入數據集:

  1. import pandas as pd 
  2. import numpy as np 
  3. df = pd.read_csv('position_salaries.csv') 
  4. df.head() 
免費Python機器學習課程三:多項式回歸

(2) 添加theta 0的偏差列。該偏差列將僅包含1。因為如果將1乘以數字,則它不會改變。

  1. df = pd.concat([pd.Series(1, index=df.index, name='00'), df], axis=1
  2. df.head() 
免費Python機器學習課程三:多項式回歸

(3) 刪除"位置"列。由于"位置"列中包含字符串,并且算法無法理解字符串。我們有"級別"列來代表職位。

  1. dfdf = df.drop(columns='Position'

(4) 定義我們的輸入變量X和輸出變量y。在此示例中,"級別"是輸入功能,而"薪水"是輸出變量。我們要預測各個級別的薪水。

  1. y = df['Salary']X = df.drop(columns = 'Salary'
  2. X.head() 
免費Python機器學習課程三:多項式回歸

(5) 以"級別"列的指數為基礎,創(chuàng)建"級別1"和"級別2"列。

  1. X['Level1'] = X['Level']**2 
  2. X['Level2'] = X['Level']**3 
  3. X.head() 
免費Python機器學習課程三:多項式回歸

(6) 現在,標準化數據。用每一列除以該列的最大值。這樣,我們將獲得每列的值,范圍從0到1。即使沒有規(guī)范化,該算法也應該起作用。但這有助于收斂更快。同樣,計算m的值,它是數據集的長度。

  1. m = len(X) 
  2. XX = X/X.max() 

(7) 定義假設函數。這將使用X和theta來預測" y"。

  1. def hypothesis(X, theta):  
  2.   y1 = theta*X  
  3.   return np.sum(y1, axis=1

(8) 使用上面的成本函數公式定義成本函數:

  1. def cost(X, y, theta):  
  2.   y1 = hypothesis(X, theta)  
  3.   return sum(np.sqrt((y1-y)**2))/(2*m) 

(9) 編寫梯度下降函數。我們將不斷更新theta值,直到找到最佳成本。對于每次迭代,我們將計算成本以供將來分析。

  1. def gradientDescent(X, y, theta, alpha, epoch): 
  2.     J=[] 
  3.     k=0 
  4.     while k < epoch: 
  5.         y1 = hypothesis(X, theta) 
  6.         for c in range(0, len(X.columns)): 
  7.             theta[c] = theta[c] - alpha*sum((y1-y)* X.iloc[:, c])/m 
  8.         j = cost(X, y, theta) 
  9.         J.append(j) 
  10.         k += 1 
  11.     return J, theta 

(10) 定義了所有功能。現在,初始化theta。我正在初始化零數組。您可以采用任何其他隨機值。我選擇alpha為0.05,我將迭代700個紀元的theta值。

  1. theta = np.array([0.0]*len(X.columns)) 
  2. J, theta = gradientDescent(X, y, theta, 0.05, 700) 

(11) 我們還獲得了最終的theta值以及每次迭代的成本。讓我們使用最終theta查找薪水預測。

  1. y_hat = hypothesis(X, theta) 

(12) 現在根據水平繪制原始薪水和我們的預期薪水。

  1. %matplotlib inline 
  2. import matplotlib.pyplot as plt 
  3. plt.figure() 
  4. plt.scatter(x=X['Level'],yy= y)            
  5. plt.scatter(x=X['Level'], y=y_hat
  6. plt.show() 
免費Python機器學習課程三:多項式回歸

我們的預測并不完全符合薪資趨勢,但接近。線性回歸只能返回一條直線。但是在多項式回歸中,我們可以得到這樣的曲線。如果該線不是一條好曲線,則多項式回歸也可以學習一些更復雜的趨勢。

(13) 讓我們繪制我們在梯度下降函數中每個時期計算的成本。

  1. plt.figure() 
  2. plt.scatter(x=list(range(0, 700)), y=J
  3. plt.show() 
免費Python機器學習課程三:多項式回歸

成本從一開始就急劇下降,然后下降緩慢。在一個好的機器學習算法中,成本應該一直下降直到收斂。請隨意嘗試不同的時期和不同的學習率(alpha)。

  • 這是數據集:salary_data https://github.com/rashida048/Machine-Learning-With-Python/blob/master/position_salaries.csv
  • 請點擊以下鏈接獲取完整的工作代碼:多項式回歸 https://github.com/rashida048/Machine-Learning-With-Python/blob/master/polynomial%20regression.ipynb

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2024-10-22 10:23:58

2020-12-19 10:54:25

機器學習線性回歸算法

2020-12-23 07:54:56

Python機器學習邏輯回歸算法

2020-12-20 20:31:56

Python機器學習多元線性回歸

2020-12-24 06:54:45

Python機器學習多類分類邏輯回歸

2020-12-25 10:08:53

Python機器學習神經網絡算法

2020-12-29 06:45:30

Python機器學習K均值聚類

2022-09-25 23:34:42

算法回歸算法機器學習

2020-12-27 21:14:06

Python機器學習算法

2021-01-01 14:59:51

Python機器學習算法

2020-12-28 08:26:51

Python機器學習數據集

2020-06-01 08:43:23

機器學習函數模型

2019-05-29 07:59:54

機器學習深度學習自然語言

2020-11-10 08:37:05

Python線性回歸機器學習

2017-06-14 17:18:43

機器學習數據研究回歸

2017-09-01 13:19:21

機器學習Logostic回歸

2014-08-22 10:06:46

機器學習

2024-01-30 14:23:06

2021-04-21 10:47:48

機器學習邏輯回歸

2017-05-17 08:24:08

TensorFlow機器學習線性回歸
點贊
收藏

51CTO技術棧公眾號