自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="1nau9"></cite>

<p id="1nau9"></p>

<cite id="1nau9"><track id="1nau9"></track></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展

發(fā)布于 2024-6-25 10:13

瀏覽

0收藏

CNN基本部件介紹

1. 局部感受野

在圖像中局部像素之間的聯(lián)系較為緊密，而距離較遠(yuǎn)的像素聯(lián)系相對較弱。因此，其實每個神經(jīng)元沒必要對圖像全局進(jìn)行感知，只需要感知局部信息，然后在更高層局部信息綜合起來即可得到全局信息。卷積操作即是局部感受野的實現(xiàn)，并且卷積操作因為能夠權(quán)值共享，所以也減少了參數(shù)量。

2. 池化

池化是將輸入圖像進(jìn)行縮小，減少像素信息，只保留重要信息，主要是為了減少計算量。主要包括最大池化和均值池化。

3. 激活函數(shù)

激活函數(shù)的用是用來加入非線性。常見的激活函數(shù)有sigmod, tanh, relu，前兩者常用在全連接層，relu常見于卷積層

4. 全連接層

全連接層在整個卷積神經(jīng)網(wǎng)絡(luò)中起分類器的作用。在全連接層之前需要將之前的輸出展平

經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)

1. LeNet5

由兩個卷積層，兩個池化層，兩個全連接層組成。卷積核都是5×5，stride=1，池化層使用maxpooling

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

2. AlexNet

模型共八層（不算input層），包含五個卷積層、三個全連接層。最后一層使用softmax做分類輸出

AlexNet使用了ReLU做激活函數(shù)；防止過擬合使用dropout和數(shù)據(jù)增強；雙GPU實現(xiàn)；使用LRN

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

3. VGG

全部使用3×3卷積核的堆疊，來模擬更大的感受野，并且網(wǎng)絡(luò)層數(shù)更深。VGG有五段卷積，每段卷積后接一層最大池化。卷積核數(shù)目逐漸增加。

總結(jié)：LRN作用不大；越深的網(wǎng)絡(luò)效果越好；1×1的卷積也很有效但是沒有3×3好

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

4. GoogLeNet(inception v1)

從VGG中我們了解到，網(wǎng)絡(luò)層數(shù)越深效果越好。但是隨著模型越深參數(shù)越來越多，這就導(dǎo)致網(wǎng)絡(luò)比較容易過擬合，需要提供更多的訓(xùn)練數(shù)據(jù)；另外，復(fù)雜的網(wǎng)絡(luò)意味更多的計算量，更大的模型存儲，需要更多的資源，且速度不夠快。GoogLeNet就是從減少參數(shù)的角度來設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)的。

GoogLeNet通過增加網(wǎng)絡(luò)寬度的方式來增加網(wǎng)絡(luò)復(fù)雜度，讓網(wǎng)絡(luò)可以自己去應(yīng)該如何選擇卷積核。這種設(shè)計減少了參數(shù) ，同時提高了網(wǎng)絡(luò)對多種尺度的適應(yīng)性。使用了1×1卷積可以使網(wǎng)絡(luò)在不增加參數(shù)的情況下增加網(wǎng)絡(luò)復(fù)雜度。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

Inception-v2

在v1的基礎(chǔ)上加入batch normalization技術(shù)，在tensorflow中，使用BN在激活函數(shù)之前效果更好；將5×5卷積替換成兩個連續(xù)的3×3卷積，使網(wǎng)絡(luò)更深，參數(shù)更少

Inception-v3

核心思想是將卷積核分解成更小的卷積，如將7×7分解成1×7和7×1兩個卷積核，使網(wǎng)絡(luò)參數(shù)減少，深度加深

Inception-v4結(jié)構(gòu)

引入了ResNet，使訓(xùn)練加速，性能提升。但是當(dāng)濾波器的數(shù)目過大（>1000）時，訓(xùn)練很不穩(wěn)定，可以加入activate scaling因子來緩解

5.Xception

在Inception-v3的基礎(chǔ)上提出，基本思想是通道分離式卷積，但是又有區(qū)別。模型參數(shù)稍微減少，但是精度更高。Xception先做1×1卷積再做3×3卷積，即先將通道合并，再進(jìn)行空間卷積。depthwise正好相反，先進(jìn)行空間3×3卷積，再進(jìn)行通道1×1卷積。核心思想是遵循一個假設(shè)：卷積的時候要將通道的卷積與空間的卷積進(jìn)行分離。而MobileNet-v1用的就是depthwise的順序，并且加了BN和ReLU。Xception的參數(shù)量與Inception-v3相差不大，其增加了網(wǎng)絡(luò)寬度，旨在提升網(wǎng)絡(luò)準(zhǔn)確率，而MobileNet-v1旨在減少網(wǎng)絡(luò)參數(shù)，提高效率。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

6. MobileNet系列

V1

使用depthwise separable convolutions；放棄pooling層，而使用stride=2的卷積。標(biāo)準(zhǔn)卷積的卷積核的通道數(shù)等于輸入特征圖的通道數(shù)；而depthwise卷積核通道數(shù)是1；還有兩個參數(shù)可以控制，a控制輸入輸出通道數(shù)；p控制圖像（特征圖）分辨率。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

V2

相比v1有三點不同：1.引入了殘差結(jié)構(gòu)；2.在dw之前先進(jìn)行1×1卷積增加feature map通道數(shù)，與一般的residual block是不同的；3.pointwise結(jié)束之后棄用ReLU，改為linear激活函數(shù)，來防止ReLU對特征的破環(huán)。這樣做是因為dw層提取的特征受限于輸入的通道數(shù)，若采用傳統(tǒng)的residual block，先壓縮那dw可提取的特征就更少了，因此一開始不壓縮，反而先擴(kuò)張。但是當(dāng)采用擴(kuò)張-卷積-壓縮時，在壓縮之后會碰到一個問題，ReLU會破環(huán)特征，而特征本來就已經(jīng)被壓縮，再經(jīng)過ReLU還會損失一部分特征，應(yīng)該采用linear。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

V3

互補搜索技術(shù)組合：由資源受限的NAS執(zhí)行模塊集搜索，NetAdapt執(zhí)行局部搜索；網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)：將最后一步的平均池化層前移并移除最后一個卷積層，引入h-swish激活函數(shù)，修改了開始的濾波器組。

V3綜合了v1的深度可分離卷積，v2的具有線性瓶頸的反殘差結(jié)構(gòu)，SE結(jié)構(gòu)的輕量級注意力模型。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

7. EffNet

EffNet是對MobileNet-v1的改進(jìn)，主要思想是：將MobileNet-1的dw層分解層兩個3×1和1×3的dw層，這樣第一層之后就采用pooling，從而減少第二層的計算量。EffNet比MobileNet-v1和ShuffleNet-v1模型更小，進(jìn)度更高。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

8. EfficientNet

研究網(wǎng)絡(luò)設(shè)計時在depth, width, resolution上進(jìn)行擴(kuò)展的方式，以及之間的相互關(guān)系?？梢匀〉酶叩男屎蜏?zhǔn)確率。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

9. ResNet

VGG證明更深的網(wǎng)絡(luò)層數(shù)是提高精度的有效手段，但是更深的網(wǎng)絡(luò)極易導(dǎo)致梯度彌散，從而導(dǎo)致網(wǎng)絡(luò)無法收斂。經(jīng)測試，20層以上會隨著層數(shù)增加收斂效果越來越差。ResNet可以很好的解決梯度消失的問題（其實是緩解，并不能真正解決），ResNet增加了shortcut連邊。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

10. ResNeXt

基于ResNet和Inception的split+transform+concate結(jié)合。但效果卻比ResNet、Inception、Inception-ResNet效果都要好?？梢允褂胓roup convolution。一般來說增加網(wǎng)絡(luò)表達(dá)能力的途徑有三種：1.增加網(wǎng)絡(luò)深度，如從AlexNet到ResNet，但是實驗結(jié)果表明由網(wǎng)絡(luò)深度帶來的提升越來越?。?.增加網(wǎng)絡(luò)模塊的寬度，但是寬度的增加必然帶來指數(shù)級的參數(shù)規(guī)模提升，也非主流CNN設(shè)計；3.改善CNN網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計，如Inception系列和ResNeXt等。且實驗發(fā)現(xiàn)增加Cardinatity即一個block中所具有的相同分支的數(shù)目可以更好的提升模型表達(dá)能力。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

11. DenseNet

DenseNet通過特征重用來大幅減少網(wǎng)絡(luò)的參數(shù)量，又在一定程度上緩解了梯度消失問題。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

12. SqueezeNet

提出了fire-module：squeeze層+expand層。Squeeze層就是1×1卷積，expand層用1×1和3×3分別卷積，然后concatenation。squeezeNet參數(shù)是alexnet的1/50，經(jīng)過壓縮之后是1/510，但是準(zhǔn)確率和alexnet相當(dāng)。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

13. ShuffleNet系列

V1

通過分組卷積與1×1的逐點群卷積核來降低計算量，通過重組通道來豐富各個通道的信息。Xception和ResNeXt在小型網(wǎng)絡(luò)模型中效率較低，因為大量的1×1卷積很耗資源，因此提出逐點群卷積來降低計算復(fù)雜度，但是使用逐點群卷積會有副作用，故在此基礎(chǔ)上提出通道shuffle來幫助信息流通。雖然dw可以減少計算量和參數(shù)量，但是在低功耗設(shè)備上，與密集的操作相比，計算、存儲訪問的效率更差，故shufflenet上旨在bottleneck上使用深度卷積，盡可能減少開銷。

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

V2

使神經(jīng)網(wǎng)絡(luò)更加高效的CNN網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計準(zhǔn)則：

輸入通道數(shù)與輸出通道數(shù)保持相等可以最小化內(nèi)存訪問成本

分組卷積中使用過多的分組會增加內(nèi)存訪問成本

網(wǎng)絡(luò)結(jié)構(gòu)太復(fù)雜（分支和基本單元過多）會降低網(wǎng)絡(luò)的并行程度

element-wise的操作消耗也不可忽略

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

14. SENet

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

15. SKNet

15大結(jié)構(gòu)梳理CNN網(wǎng)絡(luò)的發(fā)展-AI.x社區(qū)

本文轉(zhuǎn)自 AI生成未來，作者：zzq

原文鏈接:??https://mp.weixin.qq.com/s/Nvw2ocPNVIjn50U2suD-FA??

標(biāo)簽

網(wǎng)絡(luò)

已于2024-6-25 10:15:01修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

圖像生成模型王牌——Diffusion Transformers系列工作梳理

海因斯DK ? 5104瀏覽 ? 0回復(fù)
這就是大語言模型！ | 一文梳理LLM中的核心概念

angel ? 4210瀏覽 ? 0回復(fù)
大模型的發(fā)展趨勢預(yù)測——大模型會做的更小，還是做的更大

AI探索時代 ? 1780瀏覽 ? 0回復(fù)
一文梳理Transformer在時間序列預(yù)測中的發(fā)展歷程代表工作

海因斯DK ? 6581瀏覽 ? 0回復(fù)
一文梳理大語言模型編程框架

AIGC最前線 ? 2141瀏覽 ? 0回復(fù)
【智匯金秋創(chuàng)造季】智匯成海，致敬開發(fā)者的“超級碼力”！

AI.x社區(qū)官方賬號 ? 33.0w瀏覽 ? 148回復(fù)
推演大模型局限與發(fā)展脈絡(luò)

ceesoft ? 2048瀏覽 ? 0回復(fù)
基于CNN＋PyTorch實現(xiàn)視覺檢測分類

51CTO內(nèi)容精選 ? 1965瀏覽 ? 0回復(fù)
以及為什么圖像理解領(lǐng)域主要使用的是CNN網(wǎng)絡(luò)而不是Transformer網(wǎng)絡(luò)？

AI探索時代 ? 1731瀏覽 ? 0回復(fù)
人工智能智能體(AI Agent)發(fā)展趨勢2024年總結(jié)與2025年展望

十一月雨_55 ? 8319瀏覽 ? 0回復(fù)
關(guān)于神經(jīng)網(wǎng)絡(luò)的輸入格式——數(shù)據(jù)集的處理，關(guān)于神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)說明

AI探索時代 ? 1848瀏覽 ? 0回復(fù)
怎么實現(xiàn)一個神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)

AI探索時代 ? 1560瀏覽 ? 0回復(fù)
不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個你才能知道應(yīng)該怎么學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

AI探索時代 ? 1590瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)的每一層都是干嘛的？這才是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的核心

AI探索時代 ? 1459瀏覽 ? 0回復(fù)
【萬字長文】深度剖析：RAG、AI Agent與Agentic RAG的融合發(fā)展|值得收藏

Halo咯咯 ? 3737瀏覽 ? 0回復(fù)
大模型系列：一文帶你梳理Large Language Model發(fā)展歷程

海因斯DK ? 1721瀏覽 ? 0回復(fù)
AI 大模型：產(chǎn)業(yè)變革的引擎與未來發(fā)展的關(guān)鍵路徑

AI算力補給站 ? 1693瀏覽 ? 0回復(fù)
你了解大模型的生態(tài)體系嗎？大模型從技術(shù)到應(yīng)用的內(nèi)容梳理

AI探索時代 ? 1017瀏覽 ? 0回復(fù)
Kimi-VL開源多模態(tài)大模型結(jié)構(gòu)、訓(xùn)練方法、訓(xùn)練數(shù)據(jù)淺析

大模型自然語言處理 ? 1015瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

Seedream 3.0技術(shù)細(xì)節(jié)重磅發(fā)布！中文圖文生成再進(jìn)化,2K高清+爆改文字渲染,遠(yuǎn)超Canva！ 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇： OpenAI 是如何估計與分析模型計算量的？

下一篇：拳打開源SOTA腳踢商業(yè)閉源的LI-DiT是怎樣煉成的？

社區(qū)精華內(nèi)容

目錄

<style id="ry1dg"></style>

<style id="ry1dg"></style>