自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

DeepNetwork中一般Dropout原理

發(fā)布于 2025-1-24 10:50

瀏覽

0收藏

Dropout現(xiàn)在這個(gè)操作在目前這個(gè)深度學(xué)習(xí)時(shí)代中是非常常見的一個(gè)操作。對于Dropout的好處我們也聽過很多，降低過擬合，提高模型的魯棒性，控制模型復(fù)雜度等blabla。。

但我比較好奇的是，Dropout是怎么實(shí)現(xiàn)以上好處，經(jīng)過一番了解，簡單描述下。

DeepNetwork中一般Dropout原理-AI.x社區(qū)

Dropout實(shí)際上我們可以先理解成給予Network結(jié)構(gòu)中的一種噪音，但是我們這個(gè)噪音不是隨便給，是有一定數(shù)學(xué)理論支撐，我們是選擇無偏差地往網(wǎng)絡(luò)結(jié)構(gòu)中加入噪音。

DeepNetwork中一般Dropout原理-AI.x社區(qū)

DeepNetwork中一般Dropout原理-AI.x社區(qū)

通常來說，訓(xùn)練的時(shí)候才需要用到dropout，推理的時(shí)候不需要。理由也很簡單，一個(gè)保證推理的時(shí)候有確定性輸出，另一個(gè)是dropout的好處并沒有在推理時(shí)體現(xiàn)，無需徒增計(jì)算。

DeepNetwork中一般Dropout原理-AI.x社區(qū)

這是李沐在《動(dòng)手學(xué)深度學(xué)習(xí)》里面實(shí)現(xiàn)的代碼，不得不說真的簡單易懂。

當(dāng)dropout等于1的時(shí)候，要返回跟上一層輸出shape一致的全零矩陣。當(dāng)dropout=0時(shí)，說明無需丟棄，則返回原值。

當(dāng)在0<dropout<1之間，(torch.randn(X.shape) > dropout).float()生成一個(gè)跟X的shape一致的零一矩陣表示不同輸出與否，然后這個(gè)mask*X就是實(shí)際輸出的X結(jié)果，再除以之前期望公式所需要的(1-dropout)，得到最終結(jié)果。

論文出處：https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf

本文轉(zhuǎn)載自 ??沐白AI筆記??，作者：沐白

標(biāo)簽

深度學(xué)習(xí)

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

深入理解Sora技術(shù)原理

卓勝微wjp ? 3414瀏覽 ? 0回復(fù)
LLM CoT的工作原理

ceesoft ? 2706瀏覽 ? 0回復(fù)
VAE變分自編碼器原理解析看這一篇就夠了！另附Python代碼實(shí)現(xiàn)

angel ? 6789瀏覽 ? 0回復(fù)
GraphRAG項(xiàng)目雨后春筍般涌現(xiàn)！

PaperAgent ? 2755瀏覽 ? 0回復(fù)
【創(chuàng)新一夏學(xué)習(xí)季】熱浪升溫，創(chuàng)新一夏，釋放開發(fā)潛能

AI.x社區(qū)官方賬號 ? 52.8w瀏覽 ? 39回復(fù)
谷歌開源Gemma Scope，更好解釋大模型工作原理

Aceryt ? 2899瀏覽 ? 0回復(fù)
一文徹底理解大模型 Agent 智能體原理和案例

玄姐聊AGI ? 3825瀏覽 ? 0回復(fù)
多模態(tài)大模型的實(shí)現(xiàn)原理，以及技術(shù)難點(diǎn)

AI探索時(shí)代 ? 4545瀏覽 ? 0回復(fù)
一文徹底理解大模型 Agent 智能體原理和案例

玄姐聊AGI ? 3775瀏覽 ? 0回復(fù)
一文詳解MHA、GQA、MQA原理

大模型自然語言處理 ? 3515瀏覽 ? 0回復(fù)
文檔截圖嵌入統(tǒng)一多模態(tài)檢索方法原理

大模型自然語言處理 ? 1863瀏覽 ? 0回復(fù)
一文詳解集成學(xué)習(xí)算法原理

寶寶數(shù)模AI ? 1855瀏覽 ? 0回復(fù)
Word2vec算法原理詳解

人工智能訓(xùn)練營 ? 1698瀏覽 ? 0回復(fù)
深入解析Transformers、BERT與SBERT：從原理到應(yīng)用

Halo咯咯 ? 3009瀏覽 ? 0回復(fù)
帶你一文讀懂爆火的 DeepSeek-R1 新模型技術(shù)，為何震動(dòng)了全球 AI 圈

玄姐聊AGI ? 6531瀏覽 ? 1回復(fù)
一文讀懂AI智能體的原理類型、功能優(yōu)勢和最常見使用場景

數(shù)字化助推器 ? 4528瀏覽 ? 0回復(fù)
白話DeepSeek R1的GRPO強(qiáng)化學(xué)習(xí)算法：原理、圖解、視頻

后向傳播 ? 2614瀏覽 ? 0回復(fù)
深入解析變分自編碼器（VAE）：理論、數(shù)學(xué)原理、實(shí)現(xiàn)與應(yīng)用

唐克 ? 3274瀏覽 ? 0回復(fù)
解鎖多模態(tài)大語言模型：從原理到實(shí)戰(zhàn)，一文全掌握！

Halo咯咯 ? 2378瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

ControlNet作者：視頻生成論文Frameback，超低顯存生成高質(zhì)量視頻，ComfyUI必備組件！ 7天前發(fā)布
Deepseek新論文！如何讓AI自己學(xué)會(huì)更公平地打分？ 2025-04-11 00:26:06發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：選擇哪個(gè)Batchsize對模型效果最好？

下一篇： NLP：生動(dòng)理解TF-IDF算法

社區(qū)精華內(nèi)容

目錄

<li id="baie6"></li>