自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<mark id="o1ex2"></mark>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

從頭開(kāi)始：用Python實(shí)現(xiàn)帶隨機(jī)梯度下降的Logistic回歸

作者：機(jī)器之心編譯 2017-08-28 18:41:34

開(kāi)發(fā) 開(kāi)發(fā)工具

在本教程中，你將了解如何在 Python 中實(shí)現(xiàn)隨機(jī)梯度下降的 logistic 回歸算法。

logistic 回歸是一種著名的二元分類(lèi)問(wèn)題的線(xiàn)性分類(lèi)算法。它容易實(shí)現(xiàn)、易于理解，并在各類(lèi)問(wèn)題上有不錯(cuò)的效果，即使該方法的原假設(shè)與數(shù)據(jù)有違背時(shí)。

在本教程中，你將了解如何在 Python 中實(shí)現(xiàn)隨機(jī)梯度下降的 logistic 回歸算法。學(xué)完本教程后，你將了解：

如何使用 logistic 回歸模型進(jìn)行預(yù)測(cè)。
如何使用隨機(jī)梯度下降(stochastic gradient descent)來(lái)估計(jì)系數(shù)(coefficient)。
如何將 logistic 回歸應(yīng)用到真實(shí)的預(yù)測(cè)問(wèn)題。

讓我們開(kāi)始吧!

一、描述

本節(jié)將簡(jiǎn)要介紹 logistic 回歸算法、隨機(jī)梯度下降以及本教程使用的 Pima 印第安人糖尿病數(shù)據(jù)集。

logistic 回歸算法

logistic 回歸算法以該方法的核心函數(shù)命名，即 logistic 函數(shù)。logistic 回歸的表達(dá)式為方程，非常像線(xiàn)性回歸。輸入值(X)通過(guò)線(xiàn)性地組合權(quán)重或系數(shù)值來(lái)預(yù)測(cè)輸出值(y)。

與線(xiàn)性回歸的主要區(qū)別在于，模型的輸出值是二值(0 或 1)，而不是連續(xù)的數(shù)值。

yhat = e^(b0 + b1 * x1) / (1 + e^(b0 + b1 * x1))

公式可簡(jiǎn)化為：

yhat = 1.0 / (1.0 + e^(-(b0 + b1 * x1)))

這里 e 是自然對(duì)數(shù)的底(歐拉數(shù))，yhat 是預(yù)測(cè)值，b0 是偏差或截距項(xiàng)，b1 是單一輸入變量(x1)的參數(shù)。

yhat 預(yù)測(cè)值為 0 到 1 之間的實(shí)數(shù)，它需要舍入到整數(shù)值并映射到預(yù)測(cè)類(lèi)值。

輸入數(shù)據(jù)中的每一列都有一個(gè)相關(guān)系數(shù) b(一個(gè)常數(shù)實(shí)數(shù)值)，這個(gè)系數(shù)是從訓(xùn)練集中學(xué)習(xí)的。存儲(chǔ)在存儲(chǔ)器或文件中的最終模型的實(shí)際上是等式中的系數(shù)(β值或 b)。

logistic 回歸算法的系數(shù)必須從訓(xùn)練集中估計(jì)。

二、隨機(jī)梯度下降

梯度下降是通過(guò)順著成本函數(shù)(cost function)的梯度來(lái)最小化函數(shù)的過(guò)程。

這涉及到成本函數(shù)的形式及導(dǎo)數(shù)，使得從任意給定點(diǎn)能推算梯度并在該方向上移動(dòng)，例如，沿坡向下(downhill)直到最小值。

在機(jī)器學(xué)習(xí)中，我們可以使用一種技術(shù)來(lái)評(píng)估和更新每次迭代后的系數(shù)，這種技術(shù)稱(chēng)為隨機(jī)梯度下降，它可以使模型的訓(xùn)練誤差(training error)最小化。

此優(yōu)化算法每次將每個(gè)訓(xùn)練樣本傳入模型。模型對(duì)訓(xùn)練樣本進(jìn)行預(yù)測(cè)，計(jì)算誤差并更新模型以便減少下一預(yù)測(cè)的誤差。

該過(guò)程可以找到使訓(xùn)練誤差最小的一組系數(shù)。每次迭代，機(jī)器學(xué)習(xí)中的系數(shù)(b)通過(guò)以下等式更新：

bb = b + learning_rate * (y - yhat) * yhat * (1 - yhat) * x

其中 b 是被優(yōu)化的系數(shù)或權(quán)重，learning_rate 是必須設(shè)置的學(xué)習(xí)速率(例如 0.01)，(y - y hat)是訓(xùn)練數(shù)據(jù)基于權(quán)重計(jì)算的模型預(yù)測(cè)誤差，y hat 是通過(guò)系數(shù)計(jì)算的預(yù)測(cè)值，x 是輸入值。

三、Pima 印第安人糖尿病數(shù)據(jù)集

Pima Indians 數(shù)據(jù)集包含了根據(jù)基本醫(yī)療細(xì)節(jié)預(yù)測(cè) Pima 印第安人 5 年內(nèi)糖尿病的發(fā)病情況。

它是一個(gè)二元分類(lèi)問(wèn)題，其中預(yù)測(cè)是 0(無(wú)糖尿病)或 1(糖尿病)。

它包含 768 行和 9 列。所有值都是數(shù)字型數(shù)值，含有浮點(diǎn)值(float)。下面的例子展示了數(shù)據(jù)前幾行的結(jié)構(gòu)。

6,148,72,35,0,33.6,0.627,50,1 
1,85,66,29,0,26.6,0.351,31,0 
8,183,64,0,0,23.3,0.672,32,1 
1,89,66,23,94,28.1,0.167,21,0 
0,137,40,35,168,43.1,2.288,33,1 
...

通過(guò)預(yù)測(cè)多數(shù)類(lèi)(零規(guī)則算法 Zero Rule Algorithm)，這個(gè)問(wèn)題的基線(xiàn)性能為 65.098%的分類(lèi)準(zhǔn)確率(accuracy)。你可以在 UCI 機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù)中了解有關(guān)此數(shù)據(jù)集的更多信息：https://archive.ics.uci.edu/ml/datasets/Pima+Indians+Diabetes

下載數(shù)據(jù)集，并將其保存到你當(dāng)前的工作目錄，文件名為 pima-indians-diabetes.csv。

四、教程

本教程分為 3 部分。

進(jìn)行預(yù)測(cè)
估計(jì)系數(shù)
糖尿病數(shù)據(jù)集預(yù)測(cè)

學(xué)完這三部分，你將具有應(yīng)用 logistic 回歸與隨機(jī)梯度下降的基礎(chǔ)，并可以開(kāi)始處理你自己的預(yù)測(cè)建模問(wèn)題。

1. 進(jìn)行預(yù)測(cè)

***步是開(kāi)發(fā)一個(gè)可以進(jìn)行預(yù)測(cè)的函數(shù)。

在隨機(jī)梯度下降中估計(jì)系數(shù)值以及模型最終確定后在測(cè)試集上進(jìn)行預(yù)測(cè)都需要這個(gè)預(yù)測(cè)函數(shù)。

下面是一個(gè)名為 predict() 的函數(shù)，給定一組系數(shù)，它預(yù)測(cè)每一行的輸出值。

***個(gè)系數(shù)始終為截距項(xiàng) (intercept)，也稱(chēng)為偏差或 b0，因?yàn)樗仟?dú)立的，不是輸入值的系數(shù)。

# Make a prediction with coefficients 
def predict(row, coefficients): 
 yhat = coefficients[0] 
 for i in range(len(row)-1): 
 yhat += coefficients[i + 1] * row[i] 
 return 1.0 / (1.0 + exp(-yhat))

我們可以設(shè)計(jì)一個(gè)小數(shù)據(jù)集來(lái)測(cè)試我們的 predict() 函數(shù)。

X1 X2 Y 
2.7810836 2.550537003 0 
1.465489372 2.362125076 0 
3.396561688 4.400293529 0 
1.38807019 1.850220317 0 
3.06407232 3.005305973 0 
7.627531214 2.759262235 1 
5.332441248 2.088626775 1 
6.922596716 1.77106367 1 
8.675418651 -0.242068655 1 
7.673756466 3.508563011 1

下面是數(shù)據(jù)集的散點(diǎn)圖，不同顏色代表不同類(lèi)別。

我們還可以使用先前準(zhǔn)備的系數(shù)對(duì)該數(shù)據(jù)集進(jìn)行預(yù)測(cè)。

把這些放在一起，我們可以測(cè)試下面的 predict() 函數(shù)。

# Make a prediction 
from math import exp 
  
# Make a prediction with coefficients 
def predict(row, coefficients): 
 yhat = coefficients[0] 
 for i in range(len(row)-1): 
 yhat += coefficients[i + 1] * row[i] 
 return 1.0 / (1.0 + exp(-yhat)) 
  
# test predictions 
dataset = [[2.7810836,2.550537003,0], 
 [1.465489372,2.362125076,0], 
 [3.396561688,4.400293529,0], 
 [1.38807019,1.850220317,0], 
 [3.06407232,3.005305973,0], 
 [7.627531214,2.759262235,1], 
 [5.332441248,2.088626775,1], 
 [6.922596716,1.77106367,1], 
 [8.675418651,-0.242068655,1], 
 [7.673756466,3.508563011,1]] 
coef = [-0.406605464, 0.852573316, -1.104746259] 
for row in dataset: 
 yhat = predict(row, coef) 
 print("Expected=%.3f, Predicted=%.3f [%d]" % (row[-1], yhat, round(yhat)))

有兩個(gè)輸入值(X1 和 X2)和三個(gè)系數(shù)(b0，b1 和 b2)。該模型的預(yù)測(cè)方程是：

y = 1.0 / (1.0 + e^(-(b0 + b1 * X1 + b2 * X2)))

或者，代入我們主觀選擇的具體系數(shù)值，方程為：

y = 1.0 / (1.0 + e^(-(-0.406605464 + 0.852573316 * X1 + -1.104746259 * X2)))

運(yùn)行此函數(shù)，我們得到的預(yù)測(cè)值相當(dāng)接近預(yù)期的輸出值(y)，并且四舍五入時(shí)能預(yù)測(cè)出正確的類(lèi)別。

Expected=0.000, Predicted=0.299 [0] 
Expected=0.000, Predicted=0.146 [0] 
Expected=0.000, Predicted=0.085 [0] 
Expected=0.000, Predicted=0.220 [0] 
Expected=0.000, Predicted=0.247 [0] 
Expected=1.000, Predicted=0.955 [1] 
Expected=1.000, Predicted=0.862 [1] 
Expected=1.000, Predicted=0.972 [1] 
Expected=1.000, Predicted=0.999 [1] 
Expected=1.000, Predicted=0.905 [1]

現(xiàn)在我們已經(jīng)準(zhǔn)備好實(shí)現(xiàn)隨機(jī)梯度下降算法來(lái)優(yōu)化系數(shù)值了。

2. 估計(jì)系數(shù)

我們可以使用隨機(jī)梯度下降來(lái)估計(jì)訓(xùn)練集的系數(shù)值。

隨機(jī)梯度下降需要兩個(gè)參數(shù)：

學(xué)習(xí)速率(Learning Rate)：用于限制每次迭代時(shí)每個(gè)系數(shù)的校正量。
迭代次數(shù)(Epochs)：更新系數(shù)前遍歷訓(xùn)練集數(shù)據(jù)的次數(shù)。

函數(shù)中有 3 層循環(huán)：

每次迭代(epoch)的循環(huán)。
每次迭代的訓(xùn)練集數(shù)據(jù)的每一行的循環(huán)。
每次迭代的每一行數(shù)據(jù)的每個(gè)系數(shù)的每次更新的循環(huán)。

就這樣，在每一次迭代中，我們更新訓(xùn)練集中每一行數(shù)據(jù)的每個(gè)系數(shù)。系數(shù)的更新基于模型的訓(xùn)練誤差值。這個(gè)誤差通過(guò)期望輸出值(真實(shí)的因變量)與估計(jì)系數(shù)確定的預(yù)測(cè)值之間的差來(lái)計(jì)算。

每一個(gè)輸入屬性(自變量)對(duì)應(yīng)一個(gè)系數(shù)，這些系數(shù)在迭代中不斷更新，例如：

b1(t+1) = b1(t) + learning_rate * (y(t) - yhat(t)) * yhat(t) * (1 - yhat(t)) * x1(t)

列表開(kāi)頭的特殊系數(shù)(也稱(chēng)為截距)以類(lèi)似方式更新，除了與輸入值無(wú)關(guān)：

b0(t+1) = b0(t) + learning_rate * (y(t) - yhat(t)) * yhat(t) * (1 - yhat(t))

現(xiàn)在我們可以把這所有一切放在一起。下面是一個(gè)名為 coefficients_sgd() 的函數(shù)，它使用隨機(jī)梯度下降計(jì)算訓(xùn)練集的系數(shù)值。

# Estimate logistic regression coefficients using stochastic gradient descent 
def coefficients_sgd(train, l_rate, n_epoch): 
 coef = [0.0 for i in range(len(train[0]))] 
 for epoch in range(n_epoch): 
 sum_error = 0 
 for row in train: 
 yhat = predict(row, coef) 
 error = row[-1] - yhat 
 sum_error += error**2 
 coef[0] = coef[0] + l_rate * error * yhat * (1.0 - yhat) 
 for i in range(len(row)-1): 
 coef[i + 1] = coef[i + 1] + l_rate * error * yhat * (1.0 - yhat) * row[i] 
 print('>epoch=%d, lrate=%.3f, error=%.3f' % (epoch, l_rate, sum_error)) 
 return coef

此外，每次迭代我們記錄誤差平方和 SSE(一個(gè)正值)，以便我們?cè)诿總€(gè)外循環(huán)開(kāi)始時(shí)可以 print 出結(jié)果。

我們可以用上面的小數(shù)據(jù)集測(cè)試這個(gè)函數(shù)。

from math import exp 
  
# Make a prediction with coefficients 
def predict(row, coefficients): 
 yhat = coefficients[0] 
 for i in range(len(row)-1): 
 yhat += coefficients[i + 1] * row[i] 
 return 1.0 / (1.0 + exp(-yhat)) 
  
# Estimate logistic regression coefficients using stochastic gradient descent 
def coefficients_sgd(train, l_rate, n_epoch): 
 coef = [0.0 for i in range(len(train[0]))] 
 for epoch in range(n_epoch): 
 sum_error = 0 
 for row in train: 
 yhat = predict(row, coef) 
 error = row[-1] - yhat 
 sum_error += error**2 
 coef[0] = coef[0] + l_rate * error * yhat * (1.0 - yhat) 
 for i in range(len(row)-1): 
 coef[i + 1] = coef[i + 1] + l_rate * error * yhat * (1.0 - yhat) * row[i] 
 print('>epoch=%d, lrate=%.3f, error=%.3f' % (epoch, l_rate, sum_error)) 
 return coef 
  
# Calculate coefficients 
dataset = [[2.7810836,2.550537003,0], 
 [1.465489372,2.362125076,0], 
 [3.396561688,4.400293529,0], 
 [1.38807019,1.850220317,0], 
 [3.06407232,3.005305973,0], 
 [7.627531214,2.759262235,1], 
 [5.332441248,2.088626775,1], 
 [6.922596716,1.77106367,1], 
 [8.675418651,-0.242068655,1], 
 [7.673756466,3.508563011,1]] 
l_rate = 0.3 
n_epoch = 100 
coef = coefficients_sgd(dataset, l_rate, n_epoch) 
print(coef)

我們使用更大的學(xué)習(xí)速率 0.3，并循環(huán) 100 次迭代來(lái)訓(xùn)練模型，或?qū)⑾禂?shù)更新 100 次。

運(yùn)行該示例代碼，每次迭代時(shí)會(huì) print 出該次迭代的誤差平方和以及該迭代確定的***系數(shù)。

>epoch=95, lrate=0.300, error=0.023 
>epoch=96, lrate=0.300, error=0.023 
>epoch=97, lrate=0.300, error=0.023 
>epoch=98, lrate=0.300, error=0.023 
>epoch=99, lrate=0.300, error=0.022 
[-0.8596443546618897, 1.5223825112460005, -2.218700210565016]

你可以看到誤差持續(xù)下降，甚至在***一次迭代。我們可以訓(xùn)練更長(zhǎng)的時(shí)間(更多次迭代)或增加每次迭代更新系數(shù)的程度(更高的學(xué)習(xí)率)。

測(cè)試這些代碼，看看你有什么新想法。

現(xiàn)在，讓我們將此算法應(yīng)用于實(shí)際數(shù)據(jù)集。

3. 糖尿病數(shù)據(jù)集預(yù)測(cè)

在本節(jié)中，我們將使用隨機(jī)梯度下降算法對(duì)糖尿病數(shù)據(jù)集進(jìn)行 logistic 回歸模型訓(xùn)練。

該示例假定數(shù)據(jù)集的 CSV 副本位于當(dāng)前工作目錄中，文件名為 pima-indians-diabetes.csv。

首先加載數(shù)據(jù)集，將字符串值轉(zhuǎn)換為數(shù)字，并將每個(gè)列標(biāo)準(zhǔn)化為 0 到 1 范圍內(nèi)的值。這是通過(guò)輔助函數(shù) load_csv()和 str_column_to_float()來(lái)加載和準(zhǔn)備數(shù)據(jù)集以及 dataset_minmax()和 normalize_dataset()來(lái)標(biāo)準(zhǔn)化的。

我們將使用 k 折交叉驗(yàn)證(k-fold cross validation)來(lái)估計(jì)學(xué)習(xí)到的模型在未知數(shù)據(jù)上的預(yù)測(cè)效果。這意味著我們將構(gòu)建和評(píng)估 k 個(gè)模型，并將預(yù)測(cè)效果的平均值作為模型的評(píng)價(jià)標(biāo)準(zhǔn)。分類(lèi)準(zhǔn)確率將用于評(píng)估每個(gè)模型。這些過(guò)程由輔助函數(shù) cross_validation_split()，accuracy_metric() 和 evaluate_algorithm() 提供。

我們將使用上面創(chuàng)建的 predict()、coefficients_sgd() 函數(shù)和一個(gè)新的 logistic_regression() 函數(shù)來(lái)訓(xùn)練模型。

下面是完整示例：

# Logistic Regression on Diabetes Dataset 
from random import seed 
from random import randrange 
from csv import reader 
from math import exp 
  
# Load a CSV file 
def load_csv(filename): 
 dataset = list() 
 with open(filename, 'r') as file: 
 csv_reader = reader(file) 
 for row in csv_reader: 
 if not row: 
 continue 
 dataset.append(row) 
 return dataset 
  
# Convert string column to float 
def str_column_to_float(dataset, column): 
 for row in dataset: 
 row[column] = float(row[column].strip()) 
  
# Find the min and max values for each column 
def dataset_minmax(dataset): 
 minmax = list() 
 for i in range(len(dataset[0])): 
 col_values = [row[i] for row in dataset] 
 value_min = min(col_values) 
 value_max = max(col_values) 
 minmax.append([value_min, value_max]) 
 return minmax 
  
# Rescale dataset columns to the range 0-1 
def normalize_dataset(dataset, minmax): 
 for row in dataset: 
 for i in range(len(row)): 
 row[i] = (row[i] - minmax[i][0]) / (minmax[i][1] - minmax[i][0]) 
  
# Split a dataset into k folds 
def cross_validation_split(dataset, n_folds): 
 dataset_split = list() 
 dataset_copy = list(dataset) 
 fold_size = len(dataset) / n_folds 
 for i in range(n_folds): 
 fold = list() 
 while len(fold) < fold_size: 
 index = randrange(len(dataset_copy)) 
 fold.append(dataset_copy.pop(index)) 
 dataset_split.append(fold) 
 return dataset_split 
  
# Calculate accuracy percentage 
def accuracy_metric(actual, predicted): 
 correct = 0 
 for i in range(len(actual)): 
 if actual[i] == predicted[i]: 
 correct += 1 
 return correct / float(len(actual)) * 100.0 
  
# Evaluate an algorithm using a cross validation split 
def evaluate_algorithm(dataset, algorithm, n_folds, *args): 
 folds = cross_validation_split(dataset, n_folds) 
 scores = list() 
 for fold in folds: 
 train_set = list(folds) 
 train_set.remove(fold) 
 train_set = sum(train_set, []) 
 test_set = list() 
 for row in fold: 
 row_copy = list(row) 
 test_set.append(row_copy) 
 row_copy[-1] = None 
 predicted = algorithm(train_set, test_set, *args) 
 actual = [row[-1] for row in fold] 
 accuracy = accuracy_metric(actual, predicted) 
 scores.append(accuracy) 
 return scores 
  
# Make a prediction with coefficients 
def predict(row, coefficients): 
 yhat = coefficients[0] 
 for i in range(len(row)-1): 
 yhat += coefficients[i + 1] * row[i] 
 return 1.0 / (1.0 + exp(-yhat)) 
  
# Estimate logistic regression coefficients using stochastic gradient descent 
def coefficients_sgd(train, l_rate, n_epoch): 
 coef = [0.0 for i in range(len(train[0]))] 
 for epoch in range(n_epoch): 
 for row in train: 
 yhat = predict(row, coef) 
 error = row[-1] - yhat 
 coef[0] = coef[0] + l_rate * error * yhat * (1.0 - yhat) 
 for i in range(len(row)-1): 
 coef[i + 1] = coef[i + 1] + l_rate * error * yhat * (1.0 - yhat) * row[i] 
 return coef 
  
# Linear Regression Algorithm With Stochastic Gradient Descent 
def logistic_regression(train, test, l_rate, n_epoch): 
 predictions = list() 
 coef = coefficients_sgd(train, l_rate, n_epoch) 
 for row in test: 
 yhat = predict(row, coef) 
 yhat = round(yhat) 
 predictions.append(yhat) 
 return(predictions) 
  
# Test the logistic regression algorithm on the diabetes dataset 
seed(1) 
# load and prepare data 
filename = 'pima-indians-diabetes.csv' 
dataset = load_csv(filename) 
for i in range(len(dataset[0])): 
 str_column_to_float(dataset, i) 
# normalize 
minmax = dataset_minmax(dataset) 
normalize_dataset(dataset, minmax) 
# evaluate algorithm 
n_folds = 5 
l_rate = 0.1 
n_epoch = 100 
scores = evaluate_algorithm(dataset, logistic_regression, n_folds, l_rate, n_epoch) 
print('Scores: %s' % scores) 
print('Mean Accuracy: %.3f%%' % (sum(scores)/float(len(scores))))

令 k 折交叉驗(yàn)證的 k 值為 5，每次迭代時(shí)用于評(píng)估的數(shù)量為 768/5 = 153.6 或剛好超過(guò) 150 個(gè)記錄。通過(guò)實(shí)驗(yàn)選擇學(xué)習(xí)速率 0.1 和訓(xùn)練迭代次數(shù) 100。

你可以嘗試其它的設(shè)置，看看模型的評(píng)估分?jǐn)?shù)是否比我的更好。

運(yùn)行此示例代碼，print 5 折交叉驗(yàn)證的每一次的分?jǐn)?shù)，*** print 分類(lèi)準(zhǔn)確率的平均值。

可以看到，此算法的準(zhǔn)確率大約為 77%，而如果我們使用零規(guī)則算法預(yù)測(cè)多數(shù)類(lèi)，基線(xiàn)值為 65%，本算法的準(zhǔn)確率高于基線(xiàn)值。

Scores: [73.20261437908496, 75.81699346405229, 75.81699346405229, 83.66013071895425, 78.43137254901961] 
Mean Accuracy: 77.386%

五、擴(kuò)展

以下是本教程的一些擴(kuò)展，你可以自己來(lái)實(shí)現(xiàn)這些算法。

調(diào)整(Tune)示例中的參數(shù)。調(diào)整學(xué)習(xí)速率、迭代次數(shù)，甚至調(diào)整數(shù)據(jù)預(yù)處理方法，以改進(jìn)數(shù)據(jù)集的準(zhǔn)確率得分。
批處理(Batch)隨機(jī)梯度下降。改變隨機(jī)梯度下降算法，使得模型在歷次迭代中的更新能不斷積累，并且只在迭代結(jié)束后的一個(gè)批處理中更新系數(shù)。
其它分類(lèi)問(wèn)題。嘗試用該技術(shù)解決其它 UCI 機(jī)器學(xué)習(xí)庫(kù)中的二值分類(lèi)問(wèn)題。

六、回顧

在本教程中，你了解了如何使用隨機(jī)梯度下降算法實(shí)現(xiàn) logistic 回歸。

你現(xiàn)在知道：

如何對(duì)多變量分類(lèi)問(wèn)題進(jìn)行預(yù)測(cè)。
如何使用隨機(jī)梯度下降優(yōu)化一組系數(shù)。
如何將該技術(shù)應(yīng)用到真正的分類(lèi)預(yù)測(cè)建模問(wèn)題。

原文：

https://machinelearningmastery.com/implement-logistic-regression-stochastic-gradient-descent-scratch-python/

【本文是51CTO專(zhuān)欄機(jī)構(gòu)“機(jī)器之心”的原創(chuàng)譯文，微信公眾號(hào)“機(jī)器之心( id: almosthuman2014)”】

戳這里，看該作者更多好文

責(zé)任編輯：趙寧寧來(lái)源： 51CTO專(zhuān)欄

Python Logistic回歸隨機(jī)梯度下降

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)