自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="90cuq"></style>

<pre id="90cuq"></pre>

<ruby id="90cuq"><tt id="90cuq"><pre id="90cuq"></pre></tt></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

線性回歸中，為什么使用均方誤差損失函數(shù)？

發(fā)布于 2024-11-4 16:32

瀏覽

0收藏

在線性回歸中，通常使用均方誤差作為損失函數(shù)。

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

但你知道為什么用它嗎？

要知道，很多函數(shù)都能衡量預(yù)測值和真實值之間的不同，在所有候選者中，均方誤差有什么特殊之處嗎？

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

據(jù)我所知，很多人都會回答：

1.均方誤差是可微的，所以才作為損失函數(shù)。->錯

2.與絕對誤差相比，均方誤差對大的誤差懲罰更多 ->錯

很遺憾，上述回答都是錯的。

也許從概率視角出發(fā)，可以幫助我們更好理解，為什么均方誤差更合適。

在線性回歸中，通過輸入X預(yù)測目標(biāo)變量y。

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

作為誤差項，捕獲數(shù)據(jù)點i的隨機噪聲。

根據(jù)中心極限定理，假設(shè)噪聲服從均值為0的高斯分布。

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

誤差項的概率密度函數(shù)可以寫成如下形式：

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

帶入線性回歸公式中的誤差項：

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

上述公式表明，在某個參數(shù)下，觀察到數(shù)據(jù)點i的似然。

接下來，我們可以定義似然函數(shù)：

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

這意味著通過改變??，我們可以擬合一個分布到觀測數(shù)據(jù)并量化觀察到它的可能性。

我們進一步將其寫成各個數(shù)據(jù)點的乘積，因為我們假設(shè)所有觀測是獨立的。

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

因此，得到：

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

由于對數(shù)函數(shù)是單調(diào)的，我們使用對數(shù)似然并對其進行最大化。這被稱為最大似然估計（MLE）。

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

簡化后，得到:

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

重申一下，目標(biāo)是找到能夠最大化上述表達式的??。但是，第一個項與??無關(guān)。

因此，最大化上述表達式等價于最小化第二個項。

線性回歸中，為什么使用均方誤差損失函數(shù)？-AI.x社區(qū)

如果你仔細觀察，這正是平方誤差。

因此，你可以通過最小化平方誤差來最大化對數(shù)似然。這就是在線性回歸中使用最小二乘法的起源。

可以看到，在線性回歸中使用平方誤差作為損失函數(shù)是有明確的證明和推理的。機器學(xué)習(xí)中的一切都不是憑空產(chǎn)生的。

本文轉(zhuǎn)載自公眾號人工智能大講堂

原文鏈接：??https://mp.weixin.qq.com/s/0-hO-91C_gVIYlnEjt-A6A??

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

為什么我們勸你棄用LangChain？

51CTO技術(shù)棧 ? 6045瀏覽 ? 0回復(fù)
什么是提示詞工程(prompt engineering)？為什么需要提示詞工程？

AI探索時代 ? 5934瀏覽 ? 0回復(fù)
為什么最新的LLM使用混合專家(MoE)架構(gòu)

51CTO內(nèi)容精選 ? 2915瀏覽 ? 0回復(fù)
什么是多模態(tài)大模型？為什么需要多模態(tài)大模型？

AI探索時代 ? 4439瀏覽 ? 0回復(fù)
【機器學(xué)習(xí)】圖解線性回歸

魚蟲子 ? 2296瀏覽 ? 0回復(fù)
【機器學(xué)習(xí)】圖解多重線性回歸

魚蟲子 ? 1979瀏覽 ? 0回復(fù)
為什么預(yù)訓(xùn)練大模型要使用無監(jiān)督學(xué)習(xí)的方式？

AI探索時代 ? 2360瀏覽 ? 0回復(fù)
深入理解預(yù)訓(xùn)練與微調(diào)，為什么需要預(yù)訓(xùn)練，什么是微調(diào)？

AI探索時代 ? 3733瀏覽 ? 0回復(fù)
什么是序列到序列(Seq2Seq)模型？以及為什么圖像理解領(lǐng)域主要使用的是CNN網(wǎng)絡(luò)而不是Transformer網(wǎng)絡(luò)？

AI探索時代 ? 1719瀏覽 ? 0回復(fù)
人工智能小白到高手：什么是損失函數(shù)

AI取經(jīng)路 ? 1884瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)之損失函數(shù)與優(yōu)化函數(shù)——梯度下降

AI探索時代 ? 1867瀏覽 ? 0回復(fù)
深度學(xué)習(xí)的‘黃金法則’：為什么選擇ReLU？

人工智能訓(xùn)練營 ? 2102瀏覽 ? 0回復(fù)
人工智能基礎(chǔ)：Softmax 函數(shù)和分類交叉熵損失的導(dǎo)數(shù)

sbf_2000 ? 1499瀏覽 ? 0回復(fù)
原來機器學(xué)習(xí)這么簡單—線性回歸

寶寶數(shù)模AI ? 1575瀏覽 ? 0回復(fù)
你為什么要用GraphGAG？

熵減AI ? 1541瀏覽 ? 0回復(fù)
X-CLR：通過新型對比損失函數(shù)提升圖像識別能力

51CTO內(nèi)容精選 ? 1572瀏覽 ? 0回復(fù)
為什么 RAG 一定需要 Rerank？

玄姐聊AGI ? 1618瀏覽 ? 0回復(fù)
「DeepSeek-V3 技術(shù)解析」：無輔助損失函數(shù)的負載均衡

Baihai_IDP ? 957瀏覽 ? 0回復(fù)
哈佛大學(xué)：高維回歸中的Scaling Law是重整化的自然結(jié)果

ceesoft ? 878瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

訓(xùn)練大模型時，顯存都哪去了？ 2024-11-19 12:41:34發(fā)布
生產(chǎn)環(huán)境測試模型的四種方法 2024-11-15 11:22:05發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：什么時候Mahalanobis距離比歐式距離更合適？

下一篇：什么是主動學(xué)習(xí)？

社區(qū)精華內(nèi)容

目錄

<style id="9ylia"></style>

<p id="9ylia"></p>

<cite id="9ylia"><track id="9ylia"><sup id="9ylia"></sup></track></cite>