自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<center id="pgxrp"></center>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

什么是神經(jīng)網(wǎng)絡？神經(jīng)網(wǎng)絡開發(fā)框架——PyTorch和架構Transformer的區(qū)別和聯(lián)系原創(chuàng)

發(fā)布于 2025-1-13 10:30

瀏覽

0收藏

“ PyTorch就是工具，而Transformer就是理論；而理論指導工具?！?/strong>

我們都知道大模型的本質是一個神經(jīng)網(wǎng)絡模型，因此我們學習大模型就是在學習神經(jīng)網(wǎng)絡模型；但了解了很多關于神經(jīng)網(wǎng)絡的理論，但大部分人對神經(jīng)網(wǎng)絡都沒有一個清晰的認識，也就是說神經(jīng)網(wǎng)絡到底是什么？它長什么樣？

事實上所謂的神經(jīng)網(wǎng)絡本質上就是一個數(shù)學模型，里面涉及大量的數(shù)學運算；只不過其運算的主要數(shù)據(jù)類型是——向量，具體表現(xiàn)為多維矩陣。

PyTorch和Transformer

在神經(jīng)網(wǎng)絡的學習研究過程中，有兩個東西是繞不過去的；一個是PyTorch神經(jīng)網(wǎng)絡開發(fā)框架，另一個就是Transformer神經(jīng)網(wǎng)絡架構。它們兩者之間的關系就類似于編程語言和算法之間的關系，PyTorch就是編程語言；而Transformer就是算法。

Transformer即可以通過PyTorch框架實現(xiàn)，也可以通過其它框架實現(xiàn)，比如Tensorflow；PyTorch也可以實現(xiàn)其它的網(wǎng)絡架構模型，比如CNN和RNN等。

因此，PyTorch也被稱為科學計算框架，原因就在于神經(jīng)網(wǎng)絡的本質就是數(shù)學模型，而數(shù)學模型就是不停地做科學計算。

如下就是一個簡單的使用PyTorch實現(xiàn)的簡單神經(jīng)網(wǎng)絡模型，從代碼中可以看出，一個神經(jīng)網(wǎng)絡主要由兩部分組成，init初始化方法和forward前向傳播方法。

import torch
import torch.nn as nn


# 定義簡單的神經(jīng)網(wǎng)絡架構
class SimpleNeuralNetwork(nn.Module):
    def __init__(self):
        super(SimpleNeuralNetwork, self).__init__()
        self.layer1 = nn.Linear(10, 5)  # 輸入層10維，輸出5維
        self.layer2 = nn.Linear(5, 2)   # 隱藏層5維，輸出2維


    def forward(self, x):
        x = torch.relu(self.layer1(x))  # 使用ReLU激活函數(shù)
        x = self.layer2(x)              # 輸出層不需要激活函數(shù)
        return x


# 創(chuàng)建模型實例并輸出網(wǎng)絡結構
model = SimpleNeuralNetwork()
print(model)

在init方法中主要用來初始化一些參數(shù)，以及神經(jīng)網(wǎng)絡的網(wǎng)絡層；比如Linear就是一個線性神經(jīng)網(wǎng)絡層——也叫做全連接層。

而forward方法就用來做一些科學計算，也就是神經(jīng)網(wǎng)絡模型中的傳播算法等。比如上面代碼中，就是對目標數(shù)據(jù)x先使用layer1網(wǎng)絡層做一次線性變換，然后再使用relu函數(shù)進行激活。之后在使用layer2線性網(wǎng)絡做一次線性變換，最終返回變換之后x的值。

在神經(jīng)網(wǎng)絡中，除了輸入層與輸出層之外；任何一層網(wǎng)絡的輸入都來自上層網(wǎng)絡的輸出；而任何一層網(wǎng)絡的輸出就是下層網(wǎng)絡的輸入。

所以，神經(jīng)網(wǎng)絡的核心就是：“將現(xiàn)實問題轉化為數(shù)學問題，通過求解數(shù)學問題，從而解決現(xiàn)實問題”。

但是，為什么多維矩陣在經(jīng)過多層神經(jīng)網(wǎng)絡的多次變換之后，就能夠“理解”自然語言，“看懂”圖片和視頻；這個就是Transformer等神經(jīng)網(wǎng)絡架構需要解決的問題了。

從外面來看，神經(jīng)網(wǎng)絡就是一個黑盒，我們輸入一些數(shù)據(jù)，然后神經(jīng)網(wǎng)絡這個黑盒就能根據(jù)某種規(guī)則給我們生成一些新的數(shù)據(jù)；但我們并不知道神經(jīng)網(wǎng)絡中到底發(fā)生了什么。

但把這個黑盒打開之后就可以看到，Transformer這個黑盒是由Encoder-Decoder編碼器和解碼器組成的；而編碼器和解碼器又由更小的組件組成——比如多頭注意力，殘差層等組成。

如上圖所示就是Transformer論文提供的經(jīng)典架構圖；詳細說明了Transformer的編碼器和解碼器是怎么構成的。

因此，PyTorch和Transformer的關系就是工具和理論的關系；沒了工具就無法制造出神經(jīng)網(wǎng)絡，而沒有理論神經(jīng)網(wǎng)絡就無法解決實際問題；這里PyTorch就是制造神經(jīng)網(wǎng)絡的工具；而Transformer就是讓神經(jīng)網(wǎng)絡能夠正常運行的理論。

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/JjKU3j9-RLrxnRpkjv62Ow??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽
神經(jīng)網(wǎng)絡
PyTorch
Transformer

贊

收藏

回復

分享

微博

QQ

微信

舉報
舉報

微信掃碼分享

刪除帖子
刪除取消

回復

相關推薦

在神經(jīng)網(wǎng)絡中實現(xiàn)反向傳播

mb61e52f0ac174a ? 2205瀏覽 ? 0回復
神經(jīng)網(wǎng)絡的通用訓練流程

AI探索時代 ? 2399瀏覽 ? 0回復
你知道神經(jīng)網(wǎng)絡是怎么運作的嗎？神經(jīng)網(wǎng)絡內部原理解析

AI探索時代 ? 2268瀏覽 ? 0回復
神經(jīng)網(wǎng)絡與2024諾貝爾物理獎

魯班模錘1 ? 1953瀏覽 ? 0回復
谷歌AI推出LAuReL：讓神經(jīng)網(wǎng)絡更高效的革命性架構

Halo咯咯 ? 2868瀏覽 ? 0回復
優(yōu)雅談大模型：神經(jīng)網(wǎng)絡與矩陣

魯班模錘1 ? 1945瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡—終于把梯度下降搞明白了！

人工智能訓練營 ? 1871瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡-終于把神經(jīng)網(wǎng)絡參數(shù)更新搞明白了！

人工智能訓練營 ? 1641瀏覽 ? 0回復
Transformer編碼器與解碼器和神經(jīng)網(wǎng)絡之間的關系

AI探索時代 ? 1908瀏覽 ? 0回復
神經(jīng)網(wǎng)絡是怎么學習的？

AI探索時代 ? 1653瀏覽 ? 0回復
關于神經(jīng)網(wǎng)絡的輸入格式——數(shù)據(jù)集的處理，關于神經(jīng)網(wǎng)絡模型的結構說明

AI探索時代 ? 1840瀏覽 ? 0回復
神經(jīng)網(wǎng)絡技術棧介紹——PyTorch，Transformer，NLP，CV，Embedding

AI探索時代 ? 1645瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡-終于把神經(jīng)網(wǎng)絡參數(shù)更新搞明白了反向傳播詳解

人工智能訓練營 ? 1867瀏覽 ? 0回復
再談什么是神經(jīng)網(wǎng)絡，透過現(xiàn)象看本質

AI探索時代 ? 1500瀏覽 ? 0回復
怎么實現(xiàn)一個神經(jīng)網(wǎng)絡？神經(jīng)網(wǎng)絡的組成結構

AI探索時代 ? 1560瀏覽 ? 0回復
不同神經(jīng)網(wǎng)絡之間的區(qū)別，僅僅只是網(wǎng)絡結構的不同，明白了這個你才能知道應該怎么學習神經(jīng)網(wǎng)絡

AI探索時代 ? 1585瀏覽 ? 0回復
神經(jīng)網(wǎng)絡的每一層都是干嘛的？這才是神經(jīng)網(wǎng)絡結構的核心

AI探索時代 ? 1456瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡-循環(huán)神經(jīng)網(wǎng)絡RNN各層詳解及實例展示

人工智能訓練營 ? 1625瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡：反向傳播如何更新網(wǎng)絡參數(shù)

人工智能訓練營 ? 285瀏覽 ? 0回復

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

關于RAG應用中怎么高質量的進行數(shù)據(jù)召回——召回策略的研究 1天前發(fā)布
關于基于RAG技術的智能客服系統(tǒng)解決方案 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復
王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復
Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復
Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復
只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：大模型神經(jīng)網(wǎng)絡之注意力機制——attention

下一篇：神經(jīng)網(wǎng)絡是怎么學習的？

社區(qū)精華內容

目錄

Copyright ? 2005-2025 51CTO.COM 京ICP證060544版權所有未經(jīng)許可請勿轉載

客服

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷