自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

神經(jīng)網(wǎng)絡(luò)的通用訓練流程原創(chuàng)

發(fā)布于 2024-7-12 07:55

瀏覽

0收藏

“ 神經(jīng)網(wǎng)絡(luò)模型核心有三步，模型搭建，數(shù)據(jù)處理，模型訓練評估”

今天總結(jié)一下神經(jīng)網(wǎng)絡(luò)模型的通用訓練步驟和流程，以及其作用。

神經(jīng)網(wǎng)絡(luò)的通用訓練流程 -AI.x社區(qū)

模型通用訓練流程

從功能上來說，所有基于神經(jīng)網(wǎng)絡(luò)搭建的模型都要經(jīng)過以下三個步驟：

模型搭建
數(shù)據(jù)處理
模型訓練及評估

模型搭建需要經(jīng)過以下幾個步驟：

模型定義

根據(jù)任務(wù)需求，可以設(shè)計不同的網(wǎng)絡(luò)層，比如嵌入層，卷積層等。一般的神經(jīng)網(wǎng)絡(luò)模型都由多層網(wǎng)絡(luò)層組成。

網(wǎng)絡(luò)層實現(xiàn)了對輸入信號的處理，比如卷積層是怎么卷積的，活動的神經(jīng)元是哪些。本質(zhì)上是一個函數(shù)，有一個輸入就有一個輸出。

神經(jīng)網(wǎng)絡(luò)的通用訓練流程 -AI.x社區(qū)

前向傳播算法

前向傳播算法是神經(jīng)網(wǎng)絡(luò)模型的核心模塊，用來對傳入的神經(jīng)信號進行處理。比如一個輸入，需要經(jīng)過那幾個網(wǎng)絡(luò)層計算，最后的輸出結(jié)果是什么等。

損失函數(shù)

損失函數(shù)是用來計算模式執(zhí)行結(jié)果是否正確的判官，損失函數(shù)結(jié)果越小，說明網(wǎng)絡(luò)模型訓練效果越好。

優(yōu)化器

優(yōu)化器的作用就是，根據(jù)損失函數(shù)計算的結(jié)果，通過反向傳播算法使用優(yōu)化器對模型的參數(shù)(權(quán)重)進行調(diào)整優(yōu)化，以達到最小損失。比如，梯度下降算法。

神經(jīng)網(wǎng)絡(luò)的通用訓練流程 -AI.x社區(qū)

梯度下降

數(shù)據(jù)處理

數(shù)據(jù)處理屬于模型訓練的準備階段，其主要作用就是整理出一份能滿足某種訓練需求，并且能夠讓神經(jīng)網(wǎng)絡(luò)模型處理的數(shù)據(jù)。

數(shù)據(jù)一般會分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集。

主要步驟分為：

數(shù)據(jù)清洗
數(shù)據(jù)統(tǒng)一格式

比如，在NLP(自然語言處理)中，數(shù)據(jù)需要經(jīng)過清洗，刪除一些無效數(shù)據(jù)，亂碼等；清洗之后需要進行分詞處理，構(gòu)建詞匯表等。

而在CV(計算機視覺)中同樣需要對圖片和視頻進行清洗和裁剪，以及格式統(tǒng)一。

而根據(jù)不同的需求可以進行適當?shù)恼{(diào)整，但主要必須經(jīng)過這兩步處理，主要表現(xiàn)形式為Dataset數(shù)據(jù)集。

神經(jīng)網(wǎng)絡(luò)的通用訓練流程 -AI.x社區(qū)

模型訓練及評估

模型訓練的本質(zhì)就是通過訓練數(shù)據(jù)，及損失函數(shù)和優(yōu)化器不斷調(diào)整模型參數(shù)的過程。

數(shù)據(jù)加載

準備訓練的數(shù)據(jù)需要經(jīng)過加載才能傳入到神經(jīng)網(wǎng)絡(luò)中，而加載的過程也需要解決幾個問題：

能夠加載的數(shù)據(jù)格式文本，圖片，視頻等，數(shù)據(jù)結(jié)構(gòu)，結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)，以及數(shù)據(jù)的加載來源，是本地加載，還是從網(wǎng)絡(luò)中加載等；還有大規(guī)模訓練數(shù)據(jù)的拆分等。

最重要的是，要把數(shù)據(jù)轉(zhuǎn)換成神經(jīng)網(wǎng)絡(luò)能夠識別的形式——張量(tensor)/向量(vector)

分批次處理

分批處理是因為大模型的訓練數(shù)據(jù)量比較大，需要分批次加載，每次加載部分數(shù)據(jù)，否則會導致系統(tǒng)崩潰。

模型訓練

模型的訓練就是把訓練數(shù)據(jù)輸入到模型中，并且使用損失函數(shù)根據(jù)輸出計算損失差，最后使用優(yōu)化器優(yōu)化網(wǎng)絡(luò)模型參數(shù)的過程。

模型根據(jù)數(shù)據(jù)量會進行多次訓練。

神經(jīng)網(wǎng)絡(luò)的通用訓練流程 -AI.x社區(qū)

模型保存與加載

訓練過程中或訓練好的模型，需要被保存下來后續(xù)使用；而使用模型需要先加載模型。

而模型的保存與加載有多種形式，比如模型和參數(shù)是一塊保存還是分開保存，保存的模型和參數(shù)的格式是什么樣的，是否需要分布式保存等；加載模型的方式是什么樣的，以及從哪里加載模型。

模型評估?

模型評估的作用就是使用測試數(shù)據(jù)集，對訓練好的模型進行測試，測試其訓練成果。如果未通過測試，則說明模型訓練有問題，需要進行調(diào)整。

而模型評估的方式方法，以及評估標準是需要考慮的問題。

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/nIHZsKEt6WrShURgXFdF6A??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

神經(jīng)網(wǎng)絡(luò)

已于2024-7-12 07:58:49修改

贊

收藏

回復

舉報

回復

相關(guān)推薦

在神經(jīng)網(wǎng)絡(luò)中實現(xiàn)反向傳播

mb61e52f0ac174a ? 2203瀏覽 ? 0回復
ICLR 2024 Oral｜用巧妙的「傳送」技巧，讓神經(jīng)網(wǎng)絡(luò)的訓練更加高效

輕薄滴假象 ? 2220瀏覽 ? 0回復
你知道神經(jīng)網(wǎng)絡(luò)是怎么運作的嗎？神經(jīng)網(wǎng)絡(luò)內(nèi)部原理解析

AI探索時代 ? 2268瀏覽 ? 0回復
神經(jīng)網(wǎng)絡(luò)與2024諾貝爾物理獎

魯班模錘1 ? 1953瀏覽 ? 0回復
優(yōu)雅談大模型：神經(jīng)網(wǎng)絡(luò)與矩陣

魯班模錘1 ? 1933瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了！

人工智能訓練營 ? 1641瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)開發(fā)框架——PyTorch和架構(gòu)Transformer的區(qū)別和聯(lián)系

AI探索時代 ? 2468瀏覽 ? 0回復
神經(jīng)網(wǎng)絡(luò)是怎么學習的？

AI探索時代 ? 1653瀏覽 ? 0回復
怎么學習設(shè)計和訓練一個大模型——也就是神經(jīng)網(wǎng)絡(luò)？

AI探索時代 ? 1629瀏覽 ? 0回復
關(guān)于神經(jīng)網(wǎng)絡(luò)的輸入格式——數(shù)據(jù)集的處理，關(guān)于神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)說明

AI探索時代 ? 1840瀏覽 ? 0回復
關(guān)于神經(jīng)網(wǎng)絡(luò)的一些思考與感受

AI探索時代 ? 1558瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了反向傳播詳解

人工智能訓練營 ? 1867瀏覽 ? 0回復
從一個簡單的神經(jīng)網(wǎng)絡(luò)模型開始

AI探索時代 ? 1534瀏覽 ? 0回復
怎么實現(xiàn)一個神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)

AI探索時代 ? 1558瀏覽 ? 0回復
不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個你才能知道應(yīng)該怎么學習神經(jīng)網(wǎng)絡(luò)

AI探索時代 ? 1585瀏覽 ? 0回復
神經(jīng)網(wǎng)絡(luò)技術(shù)的核心之——反向傳播算法(BP算法)

AI探索時代 ? 1963瀏覽 ? 0回復
神經(jīng)網(wǎng)絡(luò)的每一層都是干嘛的？這才是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的核心

AI探索時代 ? 1450瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡(luò)-循環(huán)神經(jīng)網(wǎng)絡(luò)RNN各層詳解及實例展示

人工智能訓練營 ? 1625瀏覽 ? 0回復
什么是神經(jīng)網(wǎng)絡(luò)：反向傳播如何更新網(wǎng)絡(luò)參數(shù)

人工智能訓練營 ? 285瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進行數(shù)據(jù)召回——召回策略的研究 1天前發(fā)布
關(guān)于基于RAG技術(shù)的智能客服系統(tǒng)解決方案 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

下一篇：什么監(jiān)督學習，無監(jiān)督學習與深度學習？它們之間有什么區(qū)別和聯(lián)系？

社區(qū)精華內(nèi)容

目錄

<p id="q19xy"></p>

<s id="q19xy"><li id="q19xy"></li></s>

<sub id="q19xy"><rt id="q19xy"></rt></sub>