自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個你才能知道應(yīng)該怎么學(xué)習(xí)神經(jīng)網(wǎng)絡(luò) 原創(chuàng)

發(fā)布于 2025-3-7 10:02

瀏覽

0收藏

“ 神經(jīng)網(wǎng)絡(luò)模型的主要難點(diǎn)就在于模型本身，而至于模型的效果還與其訓(xùn)練數(shù)據(jù)和過程有關(guān)。”

在學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)的過程中，會有多種不同的神經(jīng)網(wǎng)絡(luò)架構(gòu)；如常見的RNN，CNN等；因此，我們很多人都會被這些亂七八糟的神經(jīng)網(wǎng)絡(luò)架構(gòu)給迷惑住，即想學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)又不知道應(yīng)該怎么入手；面對各種各樣的網(wǎng)絡(luò)模型，也不知道應(yīng)該去學(xué)習(xí)哪種。

但是，我們從問題的最本質(zhì)出發(fā)，不同的神經(jīng)網(wǎng)絡(luò)唯一的區(qū)別就是網(wǎng)絡(luò)結(jié)構(gòu)的不同；之所以有多種神經(jīng)網(wǎng)絡(luò)模型的原因就在于不同的網(wǎng)絡(luò)架構(gòu)能夠完成不同的任務(wù)。

比如，RNN適合文本處理，機(jī)器翻譯；CNN適合圖像處理等。

神經(jīng)網(wǎng)絡(luò)架構(gòu)

在上一篇文章中——???怎么實(shí)現(xiàn)一個神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)???中，實(shí)現(xiàn)一個神經(jīng)網(wǎng)絡(luò)基本上需要經(jīng)過統(tǒng)一的幾個步驟；數(shù)據(jù)集，模型設(shè)計，模型訓(xùn)練等。

數(shù)據(jù)集根據(jù)不同的任務(wù)類型，需要整理和設(shè)計不同的數(shù)據(jù)；而模型設(shè)計就涉及到不同的模型架構(gòu)，如圖片處理就可以使用CNN架構(gòu)；文字處理就可以使用RNN或Transformer架構(gòu)等；或者用戶根據(jù)自己的需求自定義神經(jīng)網(wǎng)絡(luò)架構(gòu)。

所以，從這個角度來看，一個可以使用的神經(jīng)網(wǎng)絡(luò)模型，從流程上來看幾乎都是相同的；區(qū)別只是神經(jīng)網(wǎng)絡(luò)架構(gòu)的異同，但具體的架構(gòu)是由具體的任務(wù)類型所決定的；而不是由神經(jīng)網(wǎng)絡(luò)模型本身所決定的。

甚至在很多情況下，會把多種神經(jīng)網(wǎng)絡(luò)架構(gòu)結(jié)合起來使用。

因此，對我們這些學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)的人來說；我們首先需要的并不是去學(xué)習(xí)哪些復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型，而是應(yīng)該從最簡單的模型結(jié)構(gòu)開始；比如說神經(jīng)網(wǎng)絡(luò)技術(shù)中的Hello World——MINST手寫數(shù)字識別。

不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個你才能知道應(yīng)該怎么學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)-AI.x社區(qū)

為什么很多神經(jīng)網(wǎng)絡(luò)的課程中都會把MINST手寫數(shù)字識別作為第一個神經(jīng)網(wǎng)絡(luò)教程？以及MINST神經(jīng)網(wǎng)絡(luò)模型能成為一個經(jīng)典模型？

原因就在于MINST神經(jīng)網(wǎng)絡(luò)模型——麻雀雖小，但五臟俱全。

在文章的開始，就介紹說不同神經(jīng)網(wǎng)絡(luò)模型的主要區(qū)別就在于模型結(jié)構(gòu)的不同；而MINST神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)特別簡單；加上輸入輸出層也僅僅只是一個三層模型。

MINST手寫數(shù)字識別模型，由一個輸入層，以及兩個全鏈接層組成(第二個全鏈接層也就是輸出層)；因此其模型結(jié)構(gòu)特別簡單，模型結(jié)構(gòu)代碼如下，由P yTorch實(shí)現(xiàn)：

# 定義神經(jīng)網(wǎng)絡(luò)
class MINSTNetwork(nn.Module):    
  def __init__(self):        
    super(Network, self).__init__()        
    # 線性層1 輸入層和隱藏層之間的線性層        
    self.layer1 = nn.Linear(784, 256)        
    self.layer2 = nn.Linear(256, 10) 
       
    # 前向傳播 forward 函數(shù)中 輸入圖像為x    
    def forward(self, x):        
      x = x.view(-1, 28 * 28)  # 使用view函數(shù) 將x展平作為輸入層        
      x = self.layer1(x)  # 將x輸入至layer1        
      x = torch.relu(x)  # 使用relu激活        
      return self.layer2(x)  # 輸入至layer2計算結(jié)果

以上代碼即為MINST神經(jīng)網(wǎng)絡(luò)模型的模型結(jié)構(gòu)；layer1和layer2即為兩個全鏈接層；784是手寫數(shù)字識別的圖片——1*28*28，也就是784個神經(jīng)元作為輸入層；而中間的256就屬于用戶自定義神經(jīng)元的個數(shù)。

MINST手寫數(shù)字識別神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖如下所示，只不過代碼中的中間層神經(jīng)網(wǎng)絡(luò)個數(shù)為256。

不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個你才能知道應(yīng)該怎么學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)-AI.x社區(qū)

我想很多對神經(jīng)網(wǎng)絡(luò)感興趣或者在學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的技術(shù)人員，都看過和實(shí)現(xiàn)過以上圖片和代碼；但網(wǎng)絡(luò)上很多教程都只是介紹，這樣就可以實(shí)現(xiàn)一個手寫數(shù)字識別的神經(jīng)網(wǎng)絡(luò)模型；但從來卻沒有講過這到底是為什么。

而由此這里也帶來了一個問題，即為什么一個神經(jīng)網(wǎng)絡(luò)經(jīng)過兩個全鏈接層，以及在兩個全鏈接層經(jīng)過一次激活函數(shù)之后，就可以實(shí)現(xiàn)手寫數(shù)字的分類？

下圖是詢問DeepSeek得到的回答：

不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個你才能知道應(yīng)該怎么學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)-AI.x社區(qū)

訓(xùn)練過程

輸入數(shù)據(jù)：28x28 的圖像展平為 784 維向量。

第一次全連接層：將 784 維向量映射到 128 維隱藏層。

激活函數(shù)：使用 ReLU 引入非線性。

第二次全連接層：將 128 維隱藏層映射到 10 維輸出層。

輸出：通過 Softmax 函數(shù)得到 10 個類別的概率分布。

從DP的回答來看，它也沒完全說明白為什么兩次全鏈接就可以完成手寫數(shù)字識別；雖然它說了兩個全鏈接層就可以學(xué)習(xí)到輸入數(shù)據(jù)的非線性特征；但具體原因是什么？

而這也是目前學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型最疑惑的地方？

為什么經(jīng)過神經(jīng)網(wǎng)絡(luò)的變換之后，神經(jīng)網(wǎng)絡(luò)就可以學(xué)習(xí)到數(shù)據(jù)的特征；并以此生成新的內(nèi)容；當(dāng)然也可能是作者的數(shù)學(xué)功底不好，沒有真正去深入研究過神經(jīng)網(wǎng)絡(luò)模型的底層數(shù)學(xué)原理。

目前來看，在學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型的過程中，從零開始大模型開發(fā)與微調(diào)算是一本比較專業(yè)，也比較好的書；作者在剛開始學(xué)習(xí)的過程中，發(fā)現(xiàn)看不太懂這本書，但現(xiàn)在有了一定的基礎(chǔ)之后，再看這本書發(fā)現(xiàn)寫的是真有水平。從簡到難，從理論到實(shí)踐都包含在內(nèi)。而現(xiàn)在這本書也是作者經(jīng)?？吹囊槐緯?，雖然有些東西還是看不懂，但過段時間再看發(fā)現(xiàn)就能看懂了。

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/KZGTaV03JM8kVsXYrQ_JiQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

神經(jīng)網(wǎng)絡(luò)

已于2025-3-7 10:02:53修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

在神經(jīng)網(wǎng)絡(luò)中實(shí)現(xiàn)反向傳播

mb61e52f0ac174a ? 2205瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)的通用訓(xùn)練流程

AI探索時代 ? 2400瀏覽 ? 0回復(fù)
你知道神經(jīng)網(wǎng)絡(luò)是怎么運(yùn)作的嗎？神經(jīng)網(wǎng)絡(luò)內(nèi)部原理解析

AI探索時代 ? 2269瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)—終于把梯度下降搞明白了！

人工智能訓(xùn)練營 ? 1871瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了！

人工智能訓(xùn)練營 ? 1642瀏覽 ? 0回復(fù)
Transformer編碼器與解碼器和神經(jīng)網(wǎng)絡(luò)之間的關(guān)系

AI探索時代 ? 1908瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)開發(fā)框架——PyTorch和架構(gòu)Transformer的區(qū)別和聯(lián)系

AI探索時代 ? 2469瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)是怎么學(xué)習(xí)的？

AI探索時代 ? 1654瀏覽 ? 0回復(fù)
怎么學(xué)習(xí)設(shè)計和訓(xùn)練一個大模型——也就是神經(jīng)網(wǎng)絡(luò)？

AI探索時代 ? 1629瀏覽 ? 0回復(fù)
關(guān)于神經(jīng)網(wǎng)絡(luò)的輸入格式——數(shù)據(jù)集的處理，關(guān)于神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)說明

AI探索時代 ? 1841瀏覽 ? 0回復(fù)
關(guān)于神經(jīng)網(wǎng)絡(luò)的一些思考與感受

AI探索時代 ? 1558瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)理論與技術(shù)學(xué)習(xí)以及工具

AI探索時代 ? 1615瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了反向傳播詳解

人工智能訓(xùn)練營 ? 1867瀏覽 ? 0回復(fù)
從一個簡單的神經(jīng)網(wǎng)絡(luò)模型開始

AI探索時代 ? 1538瀏覽 ? 0回復(fù)
怎么實(shí)現(xiàn)一個神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)

AI探索時代 ? 1560瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)的每一層都是干嘛的？這才是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的核心

AI探索時代 ? 1456瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-循環(huán)神經(jīng)網(wǎng)絡(luò)RNN各層詳解及實(shí)例展示

人工智能訓(xùn)練營 ? 1626瀏覽 ? 0回復(fù)
【AIGC】AI、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)之間的關(guān)系詳解：你必須知道的五個關(guān)鍵點(diǎn)！

唐克 ? 823瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)：反向傳播如何更新網(wǎng)絡(luò)參數(shù)

人工智能訓(xùn)練營 ? 285瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究 1天前發(fā)布
關(guān)于基于RAG技術(shù)的智能客服系統(tǒng)解決方案 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：怎么實(shí)現(xiàn)一個神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)

下一篇：神經(jīng)網(wǎng)絡(luò)技術(shù)的核心之——反向傳播算法(BP算法)

社區(qū)精華內(nèi)容

目錄

<legend id="eyat9"><track id="eyat9"></track></legend>