自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

最強(qiáng)總結(jié)，機(jī)器學(xué)習(xí)必會的評估指標(biāo)

作者：程序員小寒 2024-09-09 14:42:09

人工智能機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)的評估指標(biāo)是用于衡量模型在特定任務(wù)中的性能，幫助我們判斷模型是否在測試集上有效，并指導(dǎo)模型的優(yōu)化和調(diào)整。

今天給大家分享機(jī)器學(xué)習(xí)中常用的評估指標(biāo)。

機(jī)器學(xué)習(xí)的評估指標(biāo)是用于衡量模型在特定任務(wù)中的性能，幫助我們判斷模型是否在測試集上有效，并指導(dǎo)模型的優(yōu)化和調(diào)整。

評估指標(biāo)因任務(wù)的不同而有所區(qū)別，常見的任務(wù)包括分類、回歸等。

分類問題評估指標(biāo)

分類問題是指將輸入樣本分類為某個離散標(biāo)簽的任務(wù)。

常見的評估指標(biāo)有以下幾種。

1.混淆矩陣

顧名思義，混淆矩陣給出一個 N*N 矩陣作為輸出，其中 N 是目標(biāo)類的數(shù)量。

混淆矩陣是分類器做出的正確和錯誤預(yù)測數(shù)量的表格總結(jié)。

該矩陣將實際值與機(jī)器學(xué)習(xí)模型的預(yù)測值進(jìn)行比較。

真正例（True Positive, TP）：模型正確預(yù)測為正例的數(shù)量。
假正例（False Positive, FP）：模型錯誤預(yù)測為正例的數(shù)量。
真負(fù)例（True Negative, TN）：模型正確預(yù)測為負(fù)例的數(shù)量。
假負(fù)例（False Negative, FN）：模型錯誤預(yù)測為負(fù)例的數(shù)量。

2.準(zhǔn)確率 (Accuracy)

準(zhǔn)確率是指模型預(yù)測正確的樣本數(shù)占總樣本數(shù)的比例。

公式

適用場景

當(dāng)各類別樣本數(shù)量較為均衡時，準(zhǔn)確率是一個好的評估指標(biāo)。

from sklearn.metrics import accuracy_score

y_true = [0, 1, 0, 1]
y_pred = [0, 0, 0, 1]
accuracy = accuracy_score(y_true, y_pred)
print("Accuracy:", accuracy)

3.精確率 (Precision)

精確率是指被模型預(yù)測為正類的樣本中，真正為正類的比例。

公式

適用場景

當(dāng)誤將負(fù)類預(yù)測為正類的代價較高時（如垃圾郵件分類）。

from sklearn.metrics import precision_score

y_true = [0, 1, 0, 1]
y_pred = [0, 0, 0, 1]
precision = precision_score(y_true, y_pred)
print("Precision:", precision)

4.召回率 (Recall)

召回率是指正類樣本中被模型正確預(yù)測為正類的比例。

公式

適用場景

當(dāng)誤將正類預(yù)測為負(fù)類的代價較高時（如疾病檢測）。

from sklearn.metrics import recall_score

y_true = [0, 1, 0, 1]
y_pred = [0, 0, 0, 1]
recall = recall_score(y_true, y_pred)
print("Recall:", recall)

5.特異性

特異性是分類模型對負(fù)類樣本的識別能力的度量，它表示所有真實為負(fù)類的樣本中，模型正確識別為負(fù)類的比例。

公式

from sklearn.metrics import confusion_matrix

y_true = [0, 1, 0, 1]
y_pred = [0, 0, 0, 1]
tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel()
specificity = tn / (tn + fp)
print("Specificity:", specificity)

6.F1-Score

F1-Score 是精確率和召回率的調(diào)和平均，用于平衡兩者之間的影響。

適用場景

當(dāng)需要在精確率和召回率之間找到平衡點時，使用 F1-Score。

from sklearn.metrics import f1_score

y_true = [0, 1, 0, 1]
y_pred = [0, 0, 0, 1]
f1 = f1_score(y_true, y_pred)
print("F1 Score:", f1)

7.AUC-ROC

AUC (Area Under the Curve) 表示 ROC 曲線下的面積，AUC 越高，模型越好。下圖顯示了 ROC 曲線，y 軸為 TPR（真陽性率），x 軸為 FPR（假陽性率）。

回歸問題評估指標(biāo)

回歸問題的目標(biāo)是預(yù)測連續(xù)值，常見的評估指標(biāo)有以下幾種。

1.均方誤差 (MSE)

MSE 是預(yù)測值與真實值之間差異的平方的平均值，常用于衡量模型的預(yù)測誤差。

適用場景

對大誤差比較敏感的場景，因為誤差平方放大了大的偏差。

from sklearn.metrics import mean_squared_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mse = mean_squared_error(y_true, y_pred)
print("Mean Squared Error (MSE):", mse)

2. 均方根誤差 (RMSE)

RMSE是 MSE 的平方根，用于衡量預(yù)測誤差的平均幅度。

RMSE 的單位與原始預(yù)測變量相同，因此便于理解。

from sklearn.metrics import mean_squared_error
import numpy as np

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mse = mean_squared_error(y_true, y_pred)
rmse = np.sqrt(mse)
print("Root Mean Squared Error (RMSE):", rmse)

3. 平均絕對誤差 (MAE)

MAE 是預(yù)測值與真實值之間差異的絕對值的平均值，衡量模型預(yù)測誤差的平均大小。

適用場景

對所有誤差同等看待的場景。

from sklearn.metrics import mean_absolute_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mae = mean_absolute_error(y_true, y_pred)
print("Mean Absolute Error (MAE):", mae)

4. R方值

R2 表示模型解釋了目標(biāo)變量總變異的比例，取值范圍為 0到1，數(shù)值越大表示模型越好。

適用場景

適用于評估回歸模型的整體性能。

from sklearn.metrics import r2_score

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
r2 = r2_score(y_true, y_pred)
print("R-squared (R^2):", r2)

5.調(diào)整后的 R2

調(diào)整后的是在的基礎(chǔ)上引入了對模型復(fù)雜度的懲罰，考慮了模型中自變量的數(shù)量。

其公式為

其中：

n 是樣本數(shù)量。
p 是模型中的自變量（特征）數(shù)量。

from sklearn.metrics import r2_score
def adjusted_r2(r2, n, k):
    return 1 - (1 - r2) * (n - 1) / (n - k - 1)

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
r2 = r2_score(y_true, y_pred)
n = len(y_true)  # Number of observations
k = 1  # Number of predictors
adj_r2 = adjusted_r2(r2, n, k)
print("Adjusted R-squared:", adj_r2)

責(zé)任編輯：華軒來源：程序員學(xué)長

機(jī)器學(xué)習(xí)評估指標(biāo)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

^{<sub id="wsvmx"></sub>}

^{<blockquote id="wsvmx"></blockquote>}