自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="fqucz"><p id="fqucz"></p></sub>

<sub id="fqucz"></sub>

<sub id="fqucz"><p id="fqucz"></p></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

機器學習模型和高斯過程的不確定性

作者：佚名 2022-09-14 22:51:08

人工智能機器學習

在本文中，我們將嘗試解釋什么是模型不確定性，以及為什么我們應(yīng)該在機器學習模型中關(guān)注它，并給出一個如何使用高斯過程模型處理不確定性的例子。

介紹

讓我們以一個例子來說明我們所面臨的問題。想象一下，我們訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)模型來預(yù)測包含汽車圖像的概率。當我們使用這些概率來對有汽車的圖像進行分類時，我們的模型有很好的準確性。在某些時候，我們給神經(jīng)網(wǎng)絡(luò)模型一個它從未見過的圖像，例如企鵝。該模型表示，圖像包含一輛汽車的概率為97%。基于這個例子，你會相信模型的預(yù)測嗎?事實證明，這是神經(jīng)網(wǎng)絡(luò)的典型行為，因為企鵝與我們的訓(xùn)練數(shù)據(jù)相差太大。這種知道未知對象的能力是我們要尋找的，因為它在一些決策應(yīng)用中是至關(guān)重要的，比如自動駕駛汽車。

什么是模型不確定性？

當我們談?wù)摍C器學習模型時，有兩種類型的不確定性：

隨機不確定性:它來自于數(shù)據(jù)生成過程中的隨機性，例如，實驗中的測量噪聲。不管我們的模型有多好，這種不確定性都無法減少。
認知不確定性：它來自于知識的缺乏，這在機器學習中意味著要么我們沒有足夠的數(shù)據(jù)，要么我們的模型不夠?qū)I(yè)。如果我們獲得了新知識，這種不確定性可以減少。

考慮到這一點，讓我們看一下高斯過程給出的不確定性估計的具體例子。

高斯過程回歸

高斯過程(GP)是貝葉斯機器學習模型。這意味著對于一個給定的數(shù)據(jù)輸入點，我們將得到一個預(yù)測分布，而不是像我們在神經(jīng)網(wǎng)絡(luò)中得到的點估計。預(yù)測方差可以解釋為不確定性的估計。

但是，這些模型是如何工作的呢?讓我們想象我們有以下回歸問題

要解決的問題是找到更適合數(shù)據(jù)的函數(shù)。為此，我們假設(shè)觀測y是產(chǎn)生數(shù)據(jù)的函數(shù)的噪聲觀測。也就是說,

y=f(x)+?

其中， ? ～ ??(0, σ2)是加性高斯噪聲，方差σ2對應(yīng)于任意不確定性。

對于GP模型，我們假設(shè)生成數(shù)據(jù)的函數(shù)可以從高斯過程中得到，它可以被視為函數(shù)的分布。我們可以用均值函數(shù)m(x)和協(xié)方差函數(shù)k(x,x)來描述GP，即:

GP(m(x),k(x,x))

在實踐中，我們在函數(shù)p(f) ~??(0,k(x, x)) 上放置了一個 GP 先驗，其中將均值函數(shù)設(shè)置為0以簡化所需的計算而不損失通用性是一種常見的做法。這使得GP完全由其協(xié)方差函數(shù)或核來表征。核函數(shù)的選擇將決定學習的函數(shù)的主要屬性(平滑性、平穩(wěn)性等)。常見的核選擇是徑向基函數(shù)或RBF核，它假定函數(shù)是平穩(wěn)的。

如果我們使用貝葉斯規(guī)則將這些先驗知識與觀察到的數(shù)據(jù)結(jié)合起來，我們將獲得函數(shù)值的后驗分布。

分母中有一個有趣的項，稱為邊際似然(marginal likelihood)或模型證據(jù)(model's evidence)，它是一個歸一化常數(shù)，可用于訓(xùn)練模型和尋找核函數(shù)的最佳參數(shù)。我們會得到滿足給定屬性并與數(shù)據(jù)兼容的函數(shù)。

注意，在我們沒有觀察數(shù)據(jù)的區(qū)域，函數(shù)的可變性比我們有數(shù)據(jù)點的區(qū)域要高。有趣的是，我們可以利用這個后驗得到一個預(yù)測分布來進行預(yù)測和相關(guān)的不確定性估計，最重要的是，這個分布可以以封閉形式計算。這里不會詳細介紹，但它是均值和方差的高斯分布。這個問題的預(yù)測分布如下所示:

圖中的藍線代表預(yù)測的平均值，藍色陰影區(qū)域代表預(yù)測方差或總不確定性。正如預(yù)期的那樣，該模型對其在觀測數(shù)據(jù)附近的預(yù)測更有信心，并且隨著我們遠離這些數(shù)據(jù)，不確定性將會增加。

如果您對實現(xiàn)感興趣，這里是使用 Python 和 GPflow生成最后一個圖形的代碼：

import matplotlib.pyplot as plt
import numpy as np
import gpflow
# 生成數(shù)據(jù)的函數(shù)
def f(x):
    return np.sin(2*np.pi*x)
# 我們生成一些假設(shè)高斯加性噪聲的數(shù)據(jù)
X = np.array([0, 0, 0.2, 0.21, 0.7, 0.75, 0.8, 0.83, 0.9])
N = len(X)
epsilon = np.random.normal(scale=0.1, size=N)
y = f(X) + epsilon
X = X.reshape(-1, 1)
y = y.reshape(-1, 1)
# Plot the problem
plt.figure(figsize=(12, 6))
plt.plot(X, y, "kx", mew=2, c="g")
plt.xlabel("x")
plt.ylabel("y")
plt.savefig("problem.png", dpi=300)
# 定義核
kernel = gpflow.kernels.RBF()
# 構(gòu)建模型
model = gpflow.models.GPR(data=(X, y), kernel=kernel, mean_function=None)
# Train the model
opt = gpflow.optimizers.Scipy()
opt.minimize(model.training_loss, model.trainable_variables) 
# 生成用于預(yù)測的測試點
x_test = np.linspace(-0.5, 1.5, 100).reshape(100, 1)  # test points must be of shape (N, D)
## predict mean and variance of latent GP at test points
mean, var = model.predict_f(x_test)
## 繪制預(yù)測
plt.figure(figsize=(12, 6))
plt.plot(X, y, "kx", mew=2, c="g")
plt.plot(x_test, mean, "C0", lw=2)
plt.fill_between(
    xx[:, 0],
    mean[:, 0] - 2 * np.sqrt(var[:, 0]),
    mean[:, 0] + 2 * np.sqrt(var[:, 0]),
    color="C0",
    alpha=0.2,
)
_ = plt.xlim(-0.5, 1.5)
plt.xlabel("x")
plt.ylabel("y")
plt.show()

結(jié)論

在本文中，我們看到一些機器學習模型可能在訓(xùn)練數(shù)據(jù)之外給出過度自信的預(yù)測，這在實際應(yīng)用中可能成為一個問題。我們還展示了高斯過程模型如何給不確定性進行估計。

責任編輯：華軒來源：不靠譜的貓

機器學習模型高斯過程

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="2bf3r"></style>

<sub id="2bf3r"></sub>