自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="xyttf"></style><sub id="xyttf"></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

神經(jīng)網(wǎng)絡(luò)中的分位數(shù)回歸和分位數(shù)損失

作者：Shiro Matsumoto 2024-01-01 15:37:59

人工智能機(jī)器學(xué)習(xí)

在使用機(jī)器學(xué)習(xí)構(gòu)建預(yù)測(cè)模型時(shí)，我們不只是想知道“預(yù)測(cè)值(點(diǎn)預(yù)測(cè))”，而是想知道“預(yù)測(cè)值落在某個(gè)范圍內(nèi)的可能性有多大(區(qū)間預(yù)測(cè))”。

在使用機(jī)器學(xué)習(xí)構(gòu)建預(yù)測(cè)模型時(shí)，我們不只是想知道“預(yù)測(cè)值(點(diǎn)預(yù)測(cè))”，而是想知道“預(yù)測(cè)值落在某個(gè)范圍內(nèi)的可能性有多大(區(qū)間預(yù)測(cè))”。例如當(dāng)需要進(jìn)行需求預(yù)測(cè)時(shí)，如果只儲(chǔ)備最可能的需求預(yù)測(cè)量，那么缺貨的概率非常的大。但是如果庫(kù)存處于預(yù)測(cè)的第95個(gè)百分位數(shù)(需求有95%的可能性小于或等于該值)，那么缺貨數(shù)量會(huì)減少到大約20分之1。

獲得這些百分位數(shù)值的機(jī)器學(xué)習(xí)方法有：

scikit-learn:GradientBoostingRegressor(loss='quantile, alpha=alpha)
LightGBM: LGBMRegressor(objective='quantile', alpha=alpha)
XGBoost: XGBoostRegressor(objective='reg:quantileerror', quantile_alpha=alpha) (version 2.0~)

這種”預(yù)測(cè)值落在某個(gè)范圍內(nèi)的可能性有多大(區(qū)間預(yù)測(cè))”的方法都被稱(chēng)作分位數(shù)回歸，上面的這些機(jī)器學(xué)習(xí)的方法是用了一種叫做Quantile Loss的損失。

Quantile loss是用于評(píng)估分位數(shù)回歸模型性能的一種損失函數(shù)。在分位數(shù)回歸中，我們不僅關(guān)注預(yù)測(cè)的中心趨勢(shì)（如均值），還關(guān)注在分布的不同分位數(shù)處的預(yù)測(cè)準(zhǔn)確性。Quantile loss允許我們根據(jù)所關(guān)注的分位數(shù)來(lái)量化預(yù)測(cè)的不確定性。

假設(shè)我們有一個(gè)預(yù)測(cè)問(wèn)題，其中我們要預(yù)測(cè)一個(gè)連續(xù)型變量的分布，并且我們關(guān)注不同的分位數(shù)，例如中位數(shù)、0.25分位數(shù)、0.75分位數(shù)等。對(duì)于第q分位數(shù)，Quantile Loss定義為：

這里：

yy 是真實(shí)值。
yy 是模型的預(yù)測(cè)值。
qq 是目標(biāo)分位數(shù)，取值范圍為0,10,1。

這個(gè)損失函數(shù)的核心思想是，當(dāng)模型的預(yù)測(cè)值超過(guò)真實(shí)值時(shí)，損失是預(yù)測(cè)值與真實(shí)值的差值乘以q。當(dāng)預(yù)測(cè)值低于真實(shí)值時(shí)，損失是預(yù)測(cè)值與真實(shí)值的差值乘以1?q。這確保了對(duì)于不同的分位數(shù)，我們有不同的懲罰。如果我們更關(guān)心較小分位數(shù)（例如，中位數(shù)），我們會(huì)設(shè)定較小的q，反之亦然。

用Pytorch實(shí)現(xiàn)分位數(shù)損失

下面是一個(gè)使用Pytorch將分位數(shù)損失定義為自定義損失函數(shù)的示例。

import torch
 
 def quantile_loss(y_true, y_pred, quantile):
     errors = y_true - y_pred
     loss = torch.mean(torch.max((quantile - 1) * errors, quantile * errors))
     return loss

對(duì)于訓(xùn)練來(lái)說(shuō)，跟正常的訓(xùn)練方法一樣：

for epoch in range(num_epochs):
    for batch_x, batch_y in dataloader:
        optimizer.zero_grad()
        outputs = model(batch_x)
        loss = quantile_loss(outputs, batch_y, quantile)
        loss.backward()
        optimizer.step()

讓我們看看這個(gè)自定義的損失函數(shù)是否如預(yù)期的那樣工作。

Pytorch分位數(shù)損失測(cè)試

首先，我們嘗試為x生成均勻隨機(jī)分布(-5~5)，為y生成與x指數(shù)成比例的正態(tài)隨機(jī)分布，看看是否可以從x預(yù)測(cè)y的分位數(shù)點(diǎn)。

# Generate dummy data
 num_samples = 10000
 shape = (num_samples, 1)
 torch.manual_seed(0)
 
 # x is uniform random from -5 to 5
 # y is random normal distribution * exp(scaled x)
 x_tensor = torch.rand(shape) * 10 - 5
 x_scaled = x_tensor / 5
 y_tensor = torch.randn(shape) * torch.exp(x_scaled)
 
 # Convert values to NumPy array (for graphs)
 x = x_tensor.numpy()
 y = y_tensor.numpy()

網(wǎng)絡(luò)結(jié)構(gòu)很簡(jiǎn)單，兩個(gè)中間層64個(gè)節(jié)點(diǎn)+每層relu。在沒(méi)有任何正則化或提前停止的情況下使用100次epoch。待預(yù)測(cè)的四分位數(shù)(百分位數(shù))在列中為[0.500,0.700,0.950,0.990,0.995]，在行中為批大小[1,4,16,64,256]，總共有25個(gè)預(yù)測(cè)。在10,000個(gè)訓(xùn)練數(shù)據(jù)實(shí)例(藍(lán)色)中，低于預(yù)測(cè)輸出值(紅色)的實(shí)例的比率在圖中被標(biāo)記為“實(shí)際”值。

低于指定百分位數(shù)值的樣本百分比通常接近指定值，并且輸出分位數(shù)預(yù)測(cè)的是非常直接的。

再考慮一個(gè)稍微復(fù)雜的例子，其中y=clip(x， - 2,2) + randn。其中clip(x， - 2,2)是剪輯函數(shù)(將值限制在指定范圍內(nèi))。當(dāng)數(shù)字超出給定范圍時(shí)，該函數(shù)將其限制到最近的邊界（如果將范圍設(shè)置為-2到2，并輸入-5的輸入值，該函數(shù)將返回-2;如果輸入10，它將返回2)，而randn是遵循正態(tài)分布的隨機(jī)數(shù)。網(wǎng)絡(luò)結(jié)構(gòu)和其他設(shè)置與前一種情況相同。

與前一種情況一樣，低于指定百分位數(shù)值的樣本百分比通常接近指定值。分位數(shù)預(yù)測(cè)的理想形狀總是左上角圖中紅線(xiàn)的形狀。它應(yīng)該隨著指定的百分位數(shù)的增加而平行向上移動(dòng)。當(dāng)移動(dòng)到圖的右下方時(shí)，預(yù)測(cè)的紅線(xiàn)呈現(xiàn)出更線(xiàn)性的形狀，這不是一個(gè)理想的結(jié)果。

讓我們用一個(gè)更復(fù)雜的形狀，我們的目標(biāo)是y=2sin(x) + randn。其他設(shè)置與前一種情況相同。

可以看到低于指定百分位數(shù)值的樣本百分比通常接近指定值。當(dāng)向5x5圖的右下方移動(dòng)時(shí)，分位數(shù)預(yù)測(cè)的形狀偏離了正弦形狀。在圖的右下方，預(yù)測(cè)值的紅線(xiàn)變得更加線(xiàn)性。

如何選擇Q

我們看到，如果設(shè)置過(guò)高的quantile，會(huì)得到扁平化的值，那么如何判斷使用Quantile Loss得到的結(jié)果是否“扁平”，如何“避免扁平呢”?

檢測(cè)“扁平化”的方法之一是一起計(jì)算第50、68和95個(gè)百分位值，并檢查這些值之間的關(guān)系，即使要獲得的最終值是99.5百分位值。如果樣本分布服從正態(tài)分布，以μ為均值，σ為標(biāo)準(zhǔn)差

在μ±σ區(qū)間內(nèi)的概率約為68；在μ±2σ區(qū)間內(nèi)的概率約為95；在μ±3σ區(qū)間內(nèi)的概率約為99.7

如果第68百分位-第50百分位、第95百分位-第50百分位和99.5百分位-第50百分位值的比值明顯偏離1:2:3，我們可以確定偏離的百分位值已經(jīng)“變平”。

避免扁平化”的第一種方法是減少批量大小，如上面的實(shí)驗(yàn)所示。較小的批量大小避免了這個(gè)問(wèn)題，并且不太可能產(chǎn)生平坦的預(yù)測(cè)。但是減少批大小也有缺點(diǎn)，比如收斂不穩(wěn)定和增加訓(xùn)練時(shí)間，所以它只是有時(shí)一個(gè)容易采用的選擇。

第二種方法是在同一批次中收集相似的樣本，而不是隨機(jī)生成批次。這避免了“在批內(nèi)低于和高于預(yù)測(cè)值的樣本比例與指定的百分位數(shù)值之間的平衡”。

最后"扁平化"是無(wú)法避免的，我們只能進(jìn)行緩解，下列符號(hào)用于下列方程。

P0:第50個(gè)百分位值
P1:第68個(gè)百分位值
P2:第95百分位值
P3: 99.5百分位值

使用上述變量，可以使用以下流程圖獲得適當(dāng)?shù)?9.5%百分位數(shù)值。

總結(jié)

分位數(shù)回歸是一種強(qiáng)大的統(tǒng)計(jì)工具，對(duì)于那些關(guān)注數(shù)據(jù)分布中不同區(qū)域的問(wèn)題，以及需要更加靈活建模的情況，都是一種有價(jià)值的方法。

本文將介紹了在神經(jīng)網(wǎng)絡(luò)種自定義損失實(shí)現(xiàn)分位數(shù)回歸，并且介紹了如何檢測(cè)和緩解預(yù)測(cè)結(jié)果的"扁平化"問(wèn)題。Quantile loss在一些應(yīng)用中很有用，特別是在金融領(lǐng)域的風(fēng)險(xiǎn)管理問(wèn)題中，因?yàn)樗峁┝艘粋€(gè)在不同分位數(shù)下評(píng)估模型性能的方法。

責(zé)任編輯：華軒來(lái)源： DeepHub IMBA

機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<del id="zqrpf"></del>