自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="8hwsm"></p>

<sub id="8hwsm"></sub>

<s id="8hwsm"><li id="8hwsm"></li></s>

<sub id="8hwsm"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

PyTorch vs PyTorch Lightning 框架對比

作者：二旺 2025-01-08 08:30:38

開發(fā) 深度學(xué)習(xí)

在本文中，我們將深入探討普通 PyTorch 和 PyTorch Lightning 之間的區(qū)別，通過實(shí)際示例突出它們的關(guān)鍵差異，并探討每種方法如何適應(yīng)您的工作流程。

在不斷發(fā)展的深度學(xué)習(xí)領(lǐng)域，PyTorch 已經(jīng)成為開發(fā)者和研究人員家喻戶曉的名字。其動態(tài)計(jì)算圖、靈活性以及廣泛的社區(qū)支持使其成為構(gòu)建從簡單神經(jīng)網(wǎng)絡(luò)到復(fù)雜前沿模型的首選框架。然而，靈活性也帶來了編寫大量樣板代碼的責(zé)任——尤其是在訓(xùn)練循環(huán)、日志記錄和分布式學(xué)習(xí)方面。這就是 PyTorch Lightning 的用武之地，它提供了一個結(jié)構(gòu)化的高級接口，自動化了許多底層細(xì)節(jié)。

在本文中，我們將深入探討普通 PyTorch 和 PyTorch Lightning 之間的區(qū)別，通過實(shí)際示例突出它們的關(guān)鍵差異，并探討每種方法如何適應(yīng)您的工作流程。我們還將包括一個比較訓(xùn)練流程的流程圖、相關(guān)引文以供深入研究，以及一些有用的視頻鏈接，以便您可以在這兩個框架之間進(jìn)行有指導(dǎo)的探索。

一、背景：PyTorch 基礎(chǔ)

在比較 PyTorch 和 PyTorch Lightning 之前，有必要回顧一下 PyTorch 最初吸引人的地方。

1. 動態(tài)計(jì)算圖

PyTorch 使用動態(tài)計(jì)算圖，這意味著圖是即時生成的，使開發(fā)者能夠編寫感覺更自然、更直觀的 Python 代碼，便于調(diào)試。在早期框架（如 TensorFlow 的早期版本）中，您必須在運(yùn)行之前定義一個靜態(tài)圖，這在處理動態(tài)輸入或特殊架構(gòu)時引入了復(fù)雜性。

2. Pythonic API

PyTorch 與 Python 深度集成。這種協(xié)同作用使其特別適合開發(fā)者，因?yàn)槟梢岳迷?Python 功能和調(diào)試工具。代碼流暢，使實(shí)驗(yàn)變得簡單直接。

3. 精細(xì)控制

能力越大，責(zé)任越大。在普通的 PyTorch 中，您需要負(fù)責(zé)編寫訓(xùn)練循環(huán)、更新權(quán)重（優(yōu)化器、調(diào)度器）、將數(shù)據(jù)移動到設(shè)備上或從設(shè)備上移出，并自行處理任何特殊的日志記錄或回調(diào)。如果您想要精細(xì)控制或正在構(gòu)建高度專業(yè)化的研究模型，這是理想的選擇。

二、介紹 PyTorch Lightning

PyTorch Lightning 旨在減少樣板代碼并促進(jìn)最佳實(shí)踐，通常被描述為 PyTorch 上的輕量級封裝。它沒有重新發(fā)明輪子，而是專注于簡化訓(xùn)練過程：

減少樣板代碼：您不再需要從頭編寫訓(xùn)練循環(huán)；PyTorch Lightning Trainer 會處理它。
強(qiáng)制執(zhí)行結(jié)構(gòu)：鼓勵采用模塊化方法構(gòu)建神經(jīng)網(wǎng)絡(luò)。您定義一個包含模型架構(gòu)、training_step、validation_step 和其他步驟（如果需要）的 LightningModule。
內(nèi)置功能：內(nèi)置日志記錄（通過 Lightning 的日志記錄器）、分布式訓(xùn)練支持、檢查點(diǎn)、早停等。

PyTorch Lightning 不會限制您，而是保留了 PyTorch 的底層靈活性。如果您需要深入研究，可以覆蓋方法或合并自定義邏輯，而不會失去框架結(jié)構(gòu)的好處。

三、一對一差異

1. 訓(xùn)練循環(huán)與樣板代碼

PyTorch：

您需要手動編寫訓(xùn)練、驗(yàn)證和測試循環(huán)。
您必須跟蹤批次迭代、前向傳播、反向傳播、優(yōu)化器和日志記錄（如果需要）。

PyTorch Lightning：

可以在 LightningModule 中實(shí)現(xiàn) training_step()、validation_step() 和 configure_optimizers() 等方法。
Trainer 負(fù)責(zé)協(xié)調(diào)循環(huán)，在后臺調(diào)用這些方法，并抽象出重復(fù)的部分（例如，for batch in train_loader: ...）。

優(yōu)勢：在 Lightning 中，您可以專注于邏輯（如何訓(xùn)練）而不是腳手架（在哪里放置循環(huán)、如何記錄日志等）。

2. 日志記錄與實(shí)驗(yàn)跟蹤

PyTorch：

通常通過自定義解決方案完成：tensorboardX、日志記錄庫或手動打印語句。
您需要編寫代碼來保存指標(biāo)、寫入日志或生成 TensorBoard 可視化。

PyTorch Lightning：

集成日志記錄器：TensorBoard、Comet、MLflow、Neptune 等。
簡單的調(diào)用如 self.log('train_loss', loss, on_step=True) 在后臺處理指標(biāo)記錄。
內(nèi)置檢查點(diǎn)，根據(jù)驗(yàn)證指標(biāo)自動保存最佳或最新模型。

優(yōu)勢：日志記錄和檢查點(diǎn)幾乎自動化，鼓勵更好的可重復(fù)性。

3. 分布式與多 GPU 支持

PyTorch：

需要 nn.DataParallel 或更高級的方法如 DistributedDataParallel。
您必須仔細(xì)處理設(shè)備分配、批次分割和同步。

PyTorch Lightning：

通過單個參數(shù)啟動多進(jìn)程或多 GPU 訓(xùn)練（例如，Trainer(gpus=2, accelerator='gpu')）。
Lightning 管理分布式采樣、梯度同步等。

優(yōu)勢：它簡化了 HPC（高性能計(jì)算）或多 GPU 使用，讓您專注于模型而不是并行化的細(xì)節(jié)。

4. 代碼組織

PyTorch：

靈活，但如果不強(qiáng)制執(zhí)行一致的代碼結(jié)構(gòu)，可能會變得混亂。
典型的模式是將模型定義放在一個文件中，訓(xùn)練邏輯放在另一個文件中，但您可以自由選擇。

PyTorch Lightning：

強(qiáng)制執(zhí)行最佳實(shí)踐結(jié)構(gòu)：一個類用于 LightningModule，一個類用于數(shù)據(jù)模塊或數(shù)據(jù)加載器，一個 Trainer 用于協(xié)調(diào)運(yùn)行。
這可以在生產(chǎn)場景中創(chuàng)建更易維護(hù)的代碼。

四、實(shí)踐示例

為了更好地說明，讓我們考慮一個在虛擬數(shù)據(jù)集上的簡單前饋網(wǎng)絡(luò)。我們將看一個最小的 PyTorch 方法，然后是 PyTorch Lightning 中的等效方法。雖然以下代碼片段是簡化的，但它們展示了代碼結(jié)構(gòu)的典型差異。

1. PyTorch 中的最小訓(xùn)練循環(huán)


import torch
import torch.nn as nn
import torch.optim as optim

# dataset (features, labels)
X = torch.randn(100, 10)  
y = torch.randint(0, 2, (100,))  

# Simple feedforward model
model = nn.Sequential(
    nn.Linear(10, 16),
    nn.ReLU(),
    nn.Linear(16, 2)
)

# Loss and optimizer
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=1e-3)

# Training loop
epochs = 5
for epoch in range(epochs):
    optimizer.zero_grad()
    outputs = model(X)
    loss = criterion(outputs, y)
    loss.backward()
    optimizer.step()

    # Validation step (just a demonstration - not a separate set)
    with torch.no_grad():
        val_outputs = model(X)
        val_loss = criterion(val_outputs, y)

    # Logging
    print(f"Epoch: {epoch+1}, Train Loss: {loss.item():.4f}, Val Loss: {val_loss.item():.4f}")

關(guān)鍵點(diǎn)：

手動清零梯度、計(jì)算前向傳播、反向傳播和記錄日志。
如果要分離訓(xùn)練集和驗(yàn)證集，必須添加額外的代碼。
除非自己編寫代碼，否則沒有內(nèi)置的檢查點(diǎn)或高級功能。

2. PyTorch Lightning 中的等效訓(xùn)練

import torch
import torch.nn as nn
import torch.optim as optim
import pytorch_lightning as pl
from torch.utils.data import TensorDataset, DataLoader

class SimpleModel(pl.LightningModule):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.model = nn.Sequential(
            nn.Linear(10, 16),
            nn.ReLU(),
            nn.Linear(16, 2)
        )
        self.criterion = nn.CrossEntropyLoss()

    def forward(self, x):
        return self.model(x)

    def training_step(self, batch, batch_idx):
        X, y = batch
        outputs = self.forward(X)
        loss = self.criterion(outputs, y)
        self.log("train_loss", loss)
        return loss

    def validation_step(self, batch, batch_idx):
        X, y = batch
        outputs = self.forward(X)
        loss = self.criterion(outputs, y)
        self.log("val_loss", loss)

    def configure_optimizers(self):
        return optim.Adam(self.parameters(), lr=1e-3)

關(guān)鍵點(diǎn)：

沒有手動循環(huán) epoch，也沒有手動清零梯度。
分離的 training_step 和 validation_step。
日志記錄通過 self.log("train_loss", loss) 自動完成，并與 Lightning 的系統(tǒng)集成。

五、流程圖比較

以下是每個框架中訓(xùn)練流程的簡化圖示：

六、最佳實(shí)踐與使用場景

1. 何時堅(jiān)持使用普通 PyTorch

研究原型：如果您正在試驗(yàn)全新的架構(gòu)，可能會頻繁更改訓(xùn)練循環(huán)。

完全控制：您需要做一些高度定制的事情，比如每次迭代修改梯度更新或?qū)崿F(xiàn)可能不適合 Lightning 回調(diào)結(jié)構(gòu)的奇特優(yōu)化程序。

2. 何時使用 PyTorch Lightning

生產(chǎn)與團(tuán)隊(duì)項(xiàng)目：如果您需要一致、可讀的代碼以便多個開發(fā)者加入。

分布式訓(xùn)練或多 GPU：Lightning 大大減少了多 GPU 或多節(jié)點(diǎn)訓(xùn)練的開銷。

快速實(shí)驗(yàn)：如果您重視以最少的樣板代碼、集成日志記錄和易于調(diào)試的速度構(gòu)建實(shí)驗(yàn)。

3. 混合方法

這并不總是一個二選一的決定。一些團(tuán)隊(duì)在普通 PyTorch 中構(gòu)建原型，然后將穩(wěn)定的代碼遷移到 Lightning 以用于生產(chǎn)。如果您需要部分自動化和部分自定義邏輯，也可以通過覆蓋某些鉤子在 Lightning 中編寫自定義循環(huán)。

七、結(jié)論

在 PyTorch 和 PyTorch Lightning 之間做出選擇最終取決于您對靈活性與自動化的重視程度。PyTorch 提供了無與倫比的控制水平，非常適合前沿研究或需要大量自定義訓(xùn)練循環(huán)的場景。另一方面，PyTorch Lightning 將這種能力封裝在一個結(jié)構(gòu)化、一致的接口中，減少了樣板代碼，簡化了多 GPU 訓(xùn)練，并鼓勵了內(nèi)置日志記錄和模塊化設(shè)計(jì)等最佳實(shí)踐。

對于許多從事生產(chǎn)級代碼的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師來說，Lightning 可以幫助保持代碼的可讀性、可重復(fù)性和效率。如果您是研究人員或喜歡微管理訓(xùn)練過程的每個方面，您可能會繼續(xù)偏愛普通的 PyTorch。事實(shí)上，真正的美在于 PyTorch Lightning 仍然由 PyTorch 驅(qū)動：如果您需要深入了解，自由仍然存在。

責(zé)任編輯：趙寧寧來源：小白玩轉(zhuǎn)Python

PyTorch 開發(fā)深度學(xué)習(xí)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="oa5wr"></cite>