自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

機(jī)器學(xué)習(xí)中常用的損失函數(shù)你知多少？

作者：機(jī)器之心編譯 2018-09-13 22:56:15

開(kāi)發(fā) 開(kāi)發(fā)工具機(jī)器學(xué)習(xí)

本文作者將常用的損失函數(shù)分為了兩大類(lèi)：分類(lèi)和回歸。然后又分別對(duì)這兩類(lèi)進(jìn)行了細(xì)分和講解，其中回歸中包含了一種不太常見(jiàn)的損失函數(shù)：平均偏差誤差，可以用來(lái)確定模型中存在正偏差還是負(fù)偏差。

機(jī)器通過(guò)損失函數(shù)進(jìn)行學(xué)習(xí)。這是一種評(píng)估特定算法對(duì)給定數(shù)據(jù)建模程度的方法。如果預(yù)測(cè)值與實(shí)際結(jié)果偏離較遠(yuǎn)，損失函數(shù)會(huì)得到一個(gè)非常大的值。在一些優(yōu)化函數(shù)的輔助下，損失函數(shù)逐漸學(xué)會(huì)減少預(yù)測(cè)值的誤差。本文將介紹幾種損失函數(shù)及其在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的應(yīng)用。

損失函數(shù)和優(yōu)化

沒(méi)有一個(gè)適合所有機(jī)器學(xué)習(xí)算法的損失函數(shù)。針對(duì)特定問(wèn)題選擇損失函數(shù)涉及到許多因素，比如所選機(jī)器學(xué)習(xí)算法的類(lèi)型、是否易于計(jì)算導(dǎo)數(shù)以及數(shù)據(jù)集中異常值所占比例。

從學(xué)習(xí)任務(wù)的類(lèi)型出發(fā)，可以從廣義上將損失函數(shù)分為兩大類(lèi)——回歸損失和分類(lèi)損失。在分類(lèi)任務(wù)中，我們要從類(lèi)別值有限的數(shù)據(jù)集中預(yù)測(cè)輸出，比如給定一個(gè)手寫(xiě)數(shù)字圖像的大數(shù)據(jù)集，將其分為 0～9 中的一個(gè)。而回歸問(wèn)題處理的則是連續(xù)值的預(yù)測(cè)問(wèn)題，例如給定房屋面積、房間數(shù)量以及房間大小，預(yù)測(cè)房屋價(jià)格。

NOTE  
        n        - Number of training examples. 
        i        - ith training example in a data set. 
        y(i)     - Ground truth label for ith training example. 
        y_hat(i) - Prediction for ith training example.

回歸損失

1. 均方誤差/平方損失/L2 損失

數(shù)學(xué)公式：

均方誤差

顧名思義，均方誤差(MSE)度量的是預(yù)測(cè)值和實(shí)際觀測(cè)值間差的平方的均值。它只考慮誤差的平均大小，不考慮其方向。但由于經(jīng)過(guò)平方，與真實(shí)值偏離較多的預(yù)測(cè)值會(huì)比偏離較少的預(yù)測(cè)值受到更為嚴(yán)重的懲罰。再加上 MSE 的數(shù)學(xué)特性很好，這使得計(jì)算梯度變得更容易。

import numpy as np 
y_hat = np.array([0.000, 0.166, 0.333]) 
y_true = np.array([0.000, 0.254, 0.998]) 
def rmse(predictions, targets): 
    differences = predictions - targets 
    differencesdifferences_squared = differences ** 2 
    mean_of_differences_squared = differences_squared.mean() 
    rmse_val = np.sqrt(mean_of_differences_squared) 
    return rmse_val 
print("d is: " + str(["%.8f" % elem for elem in y_hat])) 
print("p is: " + str(["%.8f" % elem for elem in y_true])) 
rmsermse_val = rmse(y_hat, y_true) 
print("rms error is: " + str(rmse_val))

2. 平均絕對(duì)誤差/L1 損失

數(shù)學(xué)公式：

平均絕對(duì)誤差

平均絕對(duì)誤差(MAE)度量的是預(yù)測(cè)值和實(shí)際觀測(cè)值之間絕對(duì)差之和的平均值。和 MSE 一樣，這種度量方法也是在不考慮方向的情況下衡量誤差大小。但和 MSE 的不同之處在于，MAE 需要像線(xiàn)性規(guī)劃這樣更復(fù)雜的工具來(lái)計(jì)算梯度。此外，MAE 對(duì)異常值更加穩(wěn)健，因?yàn)樗皇褂闷椒健?/p>

import numpy as np 
y_hat = np.array([0.000, 0.166, 0.333]) 
y_true = np.array([0.000, 0.254, 0.998]) 
 
print("d is: " + str(["%.8f" % elem for elem in y_hat])) 
print("p is: " + str(["%.8f" % elem for elem in y_true])) 
 
def mae(predictions, targets): 
    differences = predictions - targets 
    absolute_differences = np.absolute(differences) 
    mean_absolute_differences = absolute_differences.mean() 
    return mean_absolute_differences 
maemae_val = mae(y_hat, y_true) 
print ("mae error is: " + str(mae_val))

3. 平均偏差誤差(mean bias error)

與其它損失函數(shù)相比，這個(gè)函數(shù)在機(jī)器學(xué)習(xí)領(lǐng)域沒(méi)有那么常見(jiàn)。它與 MAE 相似，唯一的區(qū)別是這個(gè)函數(shù)沒(méi)有用絕對(duì)值。用這個(gè)函數(shù)需要注意的一點(diǎn)是，正負(fù)誤差可以互相抵消。盡管在實(shí)際應(yīng)用中沒(méi)那么準(zhǔn)確，但它可以確定模型存在正偏差還是負(fù)偏差。

數(shù)學(xué)公式：

平均偏差誤差

二、分類(lèi)損失

1. Hinge Loss/多分類(lèi) SVM 損失

簡(jiǎn)言之，在一定的安全間隔內(nèi)(通常是 1)，正確類(lèi)別的分?jǐn)?shù)應(yīng)高于所有錯(cuò)誤類(lèi)別的分?jǐn)?shù)之和。因此 hinge loss 常用于***間隔分類(lèi)(maximum-margin classification)，最常用的是支持向量機(jī)。盡管不可微，但它是一個(gè)凸函數(shù)，因此可以輕而易舉地使用機(jī)器學(xué)習(xí)領(lǐng)域中常用的凸優(yōu)化器。

數(shù)學(xué)公式：

SVM 損失(Hinge Loss)

思考下例，我們有三個(gè)訓(xùn)練樣本，要預(yù)測(cè)三個(gè)類(lèi)別(狗、貓和馬)。以下是我們通過(guò)算法預(yù)測(cè)出來(lái)的每一類(lèi)的值：

Hinge loss/多分類(lèi) SVM 損失

計(jì)算這 3 個(gè)訓(xùn)練樣本的 hinge loss：

## 1st training example 
max(0, (1.49) - (-0.39) + 1) + max(0, (4.21) - (-0.39) + 1) 
max(0, 2.88) + max(0, 5.6) 
2.88 + 5.6 
8.48 (High loss as very wrong prediction) 
## 2nd training example 
max(0, (-4.61) - (3.28)+ 1) + max(0, (1.46) - (3.28)+ 1) 
max(0, -6.89) + max(0, -0.82) 
0 + 0 
0 (Zero loss as correct prediction) 
## 3rd training example 
max(0, (1.03) - (-2.27)+ 1) + max(0, (-2.37) - (-2.27)+ 1) 
max(0, 4.3) + max(0, 0.9) 
4.3 + 0.9 
5.2 (High loss as very wrong prediction)

交叉熵?fù)p失/負(fù)對(duì)數(shù)似然：

這是分類(lèi)問(wèn)題中最常見(jiàn)的設(shè)置。隨著預(yù)測(cè)概率偏離實(shí)際標(biāo)簽，交叉熵?fù)p失會(huì)逐漸增加。

數(shù)學(xué)公式：

交叉熵?fù)p失

注意，當(dāng)實(shí)際標(biāo)簽為 1(y(i)=1) 時(shí)，函數(shù)的后半部分消失，而當(dāng)實(shí)際標(biāo)簽是為 0(y(i=0)) 時(shí)，函數(shù)的前半部分消失。簡(jiǎn)言之，我們只是把對(duì)真實(shí)值類(lèi)別的實(shí)際預(yù)測(cè)概率的對(duì)數(shù)相乘。還有重要的一點(diǎn)是，交叉熵?fù)p失會(huì)重重懲罰那些置信度高但是錯(cuò)誤的預(yù)測(cè)值。

import numpy as np 
predictions = np.array([[0.25,0.25,0.25,0.25], 
                        [0.01,0.01,0.01,0.96]]) 
targets = np.array([[0,0,0,1], 
                   [0,0,0,1]]) 
def cross_entropy(predictions, targets, epsilon=1e-10): 
    predictions = np.clip(predictions, epsilon, 1. - epsilon) 
    N = predictions.shape[0] 
    ce_loss = -np.sum(np.sum(targets * np.log(predictions + 1e-5)))/N 
    return ce_loss 
cross_entropycross_entropy_loss = cross_entropy(predictions, targets) 
print ("Cross entropy loss is: " + str(cross_entropy_loss))

【本文是51CTO專(zhuān)欄機(jī)構(gòu)“機(jī)器之心”的原創(chuàng)文章，微信公眾號(hào)“機(jī)器之心( id: almosthuman2014)”】

戳這里，看該作者更多好文

責(zé)任編輯：趙寧寧來(lái)源： 51CTO專(zhuān)欄

機(jī)器學(xué)習(xí)損失函數(shù)深度學(xué)習(xí)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<pre id="sjoa1"><fieldset id="sjoa1"></fieldset></pre>