自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<s id="bkxyq"><li id="bkxyq"><menuitem id="bkxyq"></menuitem></li></s>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述

輕薄滴假象

發(fā)布于 2024-4-28 13:07

瀏覽

1收藏

近期，大語(yǔ)言模型、文生圖模型等大規(guī)模 AI 模型迅猛發(fā)展。在這種形勢(shì)下，如何適應(yīng)瞬息萬(wàn)變的需求，快速適配大模型至各類下游任務(wù)，成為了一個(gè)重要的挑戰(zhàn)。受限于計(jì)算資源，傳統(tǒng)的全參數(shù)微調(diào)方法可能會(huì)顯得力不從心，因此需要探索更高效的微調(diào)策略。上述挑戰(zhàn)催生了參數(shù)高效微調(diào)（PEFT）技術(shù)在近期的快速發(fā)展。

為了全面總結(jié) PEFT 技術(shù)的發(fā)展歷程并及時(shí)跟進(jìn)最新的研究進(jìn)展，最近，來(lái)自美國(guó)東北大學(xué)、加州大學(xué) Riverside 分校、亞利桑那州立大學(xué)和紐約大學(xué)研究者們調(diào)研、整理并總結(jié)了參數(shù)高效微調(diào)（PEFT）技術(shù)在大模型上的應(yīng)用及其發(fā)展前景，并總結(jié)為一篇全面且前沿的綜述。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

論文鏈接：???https://arxiv.org/pdf/2403.14608.pdf??

PEFT 提供了一個(gè)高效的針對(duì)預(yù)訓(xùn)練模型的下游任務(wù)適配手段，其通過固定大部分預(yù)訓(xùn)練參數(shù)并微調(diào)極少數(shù)參數(shù)，讓大模型輕裝上陣，迅速適配各種下游任務(wù)，讓大模型變得不再「巨無(wú)霸」。

全文長(zhǎng)達(dá) 24 頁(yè)，涵蓋了近 250 篇最新文獻(xiàn)，剛發(fā)布就已經(jīng)被斯坦福大學(xué)、北京大學(xué)等機(jī)構(gòu)所引用，并在各平臺(tái)都有著不小的熱度。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

具體來(lái)說(shuō)，該綜述分別從 PEFT 算法分類，高效 PEFT 設(shè)計(jì)，PEFT 跨領(lǐng)域應(yīng)用，以及 PEFT 系統(tǒng)設(shè)計(jì)部署四大層面，對(duì) PEFT 的發(fā)展歷程及其最新進(jìn)展進(jìn)行了全面且細(xì)致的闡述。無(wú)論是作為相關(guān)行業(yè)從業(yè)者，或是大模型微調(diào)領(lǐng)域的初學(xué)者，該綜述均可以充當(dāng)一個(gè)全面的學(xué)習(xí)指南。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

1、PEFT 背景介紹

論文首先以最近大熱的 LLaMA 模型作為代表，分析并闡述了大語(yǔ)言模型（LLM）和其他基于 Transformer 的模型的架構(gòu)和計(jì)算流程，并定義了所需的符號(hào)表示，以便于在后文分析各類 PEFT 技術(shù)。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

此外，作者還概述了 PEFT 算法的分類方法。作者根據(jù)不同的操作將 PEFT 算法劃分為加性微調(diào)、選擇性微調(diào)、重參數(shù)化微調(diào)和混合微調(diào)。圖三展示了 PEFT 算法的分類及各分類下包含的具體算法名稱。各分類的具體定義將在后文詳細(xì)講解。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

在背景部分，作者還介紹了驗(yàn)證 PEFT 方法性能所使用的常見下游基準(zhǔn)測(cè)試和數(shù)據(jù)集，便于讀者熟悉常見的任務(wù)設(shè)置。

2、PEFT 方法分類

作者首先給出了加性微調(diào)、選擇性微調(diào)、重參數(shù)化微調(diào)和混合微調(diào)的定義：

加性微調(diào)通過在預(yù)訓(xùn)練模型的特定位置添加可學(xué)習(xí)的模塊或參數(shù)，以最小化適配下游任務(wù)時(shí)模型的可訓(xùn)練的參數(shù)量。
選擇性微調(diào)在微調(diào)過程中只更新模型中的一部分參數(shù)，而保持其余參數(shù)固定。相較于加性微調(diào)，選擇性微調(diào)無(wú)需更改預(yù)訓(xùn)練模型的架構(gòu)。
重參數(shù)化微調(diào)通過構(gòu)建預(yù)訓(xùn)練模型參數(shù)的（低秩的）表示形式用于訓(xùn)練。在推理時(shí)，參數(shù)將被等價(jià)的轉(zhuǎn)化為預(yù)訓(xùn)練模型參數(shù)結(jié)構(gòu)，以避免引入額外的推理延遲。

這三者的區(qū)分如圖四所示：

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

混合微調(diào)結(jié)合了各類 PEFT 方法的優(yōu)勢(shì)，并通過分析不同方法的相似性以構(gòu)建一個(gè)統(tǒng)一的 PEFT 架構(gòu)，或?qū)ふ易顑?yōu)的 PEFT 超參數(shù)。

接下來(lái)，作者對(duì)每個(gè) PEFT 種類進(jìn)一步細(xì)分：

A. 加性微調(diào)：

1）Adapter

Adapter 通過在 Transformer 塊內(nèi)添加小型 Adapter 層，實(shí)現(xiàn)了參數(shù)高效微調(diào)。每個(gè) Adapter 層包含一個(gè)下投影矩陣、一個(gè)激活函數(shù)，和一個(gè)上投影矩陣。下投影矩陣將輸入特征映射到瓶頸維度 r，上投影矩陣將瓶頸特征映射回原始維度 d。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

圖五展示了三種典型的 Adapter 層在模型中的插入策略。Serial Adapter 順序地插入到 Transformer 模塊之后，Parallel Adapter 則并行地插入到 Transformer 模塊旁。CoDA 是一種稀疏的 Adapter 方式，對(duì)于重要的 token，CoDA 同時(shí)利用預(yù)訓(xùn)練 Transformer 模塊和 Adapter 分支進(jìn)行推理；而對(duì)于不重要的 token，CoDA 則僅使用 Adapter 分支進(jìn)行推理，以節(jié)省計(jì)算開銷。

2）Soft Prompt

Soft Prompt 通過在輸入序列的頭部添加可學(xué)習(xí)的向量，以實(shí)現(xiàn)參數(shù)高效微調(diào)。代表性方法包括 Prefix-tuning 和 Prompt Tuning。Prefix-tuning 通過在每個(gè) Transformer 層的鍵、值和查詢矩陣前面添加可學(xué)習(xí)的向量，實(shí)現(xiàn)對(duì)模型表示的微調(diào)。Prompt Tuning 僅僅在首個(gè)詞向量層插入可學(xué)習(xí)向量，以進(jìn)一步減少訓(xùn)練參數(shù)。

3）Others

除了上述兩種分類，還有一些 PEFT 方法同樣也是在訓(xùn)練過程引入新的參數(shù)。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

典型的兩種方法如圖六所示。(IA) 3 引入了三個(gè)縮放向量，用于調(diào)整鍵、值以及前饋網(wǎng)絡(luò)的激活值。SSF 則通過線性變換來(lái)調(diào)整模型的激活值。在每一步操作之后，SSF 都會(huì)添加一個(gè) SSF-ADA 層，以實(shí)現(xiàn)激活值的縮放和平移。

B. 選擇性微調(diào)：

1）非結(jié)構(gòu)化掩碼

這類方法通過在模型參數(shù)上添加可學(xué)習(xí)的二值掩碼來(lái)確定可以微調(diào)的參數(shù)。許多工作，如 Diff pruning、FishMask 和 LT-SFT 等，都專注于計(jì)算掩碼的位置。

2）結(jié)構(gòu)化掩碼

非結(jié)構(gòu)化掩碼對(duì)于掩碼的形狀沒有限制，但這就導(dǎo)致了其影響效率低下。因此，一些工作，如 FAR、S-Bitfit、Xattn Tuning 等均對(duì)掩碼的形狀進(jìn)行了結(jié)構(gòu)化的限制。兩者的區(qū)別如下圖所示：

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

C. 重參數(shù)化微調(diào)：

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

1）低秩分解

這類方法通過尋找預(yù)訓(xùn)練權(quán)重矩陣的各種低維度重參數(shù)化形式，以代表整個(gè)參數(shù)空間進(jìn)行微調(diào)。其中最為典型的方法為 LoRA，它通過添加兩個(gè)額外的上投影和下投影矩陣來(lái)構(gòu)建原始模型參數(shù)的低秩表示用于訓(xùn)練。在訓(xùn)練后，額外引入的參數(shù)還可以被無(wú)縫的合并到預(yù)訓(xùn)練權(quán)重中，避免引入額外推理開銷。DoRA 將權(quán)重矩陣解耦為模長(zhǎng)和方向，并利用 LoRA 來(lái)微調(diào)方向矩陣。

2）LoRA 衍生方法

作者將 LoRA 的衍生方法分為了動(dòng)態(tài)選擇 LoRA 的秩以及 LoRA 在各方面的提升。

LoRA 動(dòng)態(tài)秩中，典型方法為 DyLoRA，其構(gòu)造了一系列秩，用于在訓(xùn)練過程中同時(shí)訓(xùn)練，從而減少了用于尋找最優(yōu)秩所耗費(fèi)的資源。

LoRA 提升中，作者羅列了傳統(tǒng) LoRA 在各個(gè)方面的缺陷以及對(duì)應(yīng)的解決方案。

D. 混合微調(diào)：

這部分研究如何將不同 PEFT 技術(shù)融合進(jìn)統(tǒng)一模型，并尋找一個(gè)最優(yōu)的設(shè)計(jì)模式。此外，也介紹了一些采用神經(jīng)架構(gòu)搜索（NAS）用以得到最優(yōu) PEFT 訓(xùn)練超參數(shù)的方案。

3、高效 PEFT 設(shè)計(jì)

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

這部分，作者探討了提升 PEFT 效率的研究，重點(diǎn)關(guān)注其訓(xùn)練和推理的延遲和峰值內(nèi)存開銷。作者主要通過三個(gè)角度來(lái)描述如何提升 PEFT 的效率。分別是：

PEFT 剪枝策略：即將神經(jīng)網(wǎng)絡(luò)剪枝技術(shù)和 PEFT 技術(shù)結(jié)合，以進(jìn)一步提升效率。代表工作有 AdapterDrop、SparseAdapter 等。

PEFT 量化策略：即通過降低模型精度來(lái)減少模型大小，從而提高計(jì)算效率。在與 PEFT 結(jié)合時(shí)，其主要難點(diǎn)是如何更好的兼顧預(yù)訓(xùn)練權(quán)重以及新增的 PEFT 模塊的量化處理。代表工作有 QLoRA、LoftQ 等。

內(nèi)存高效的 PEFT 設(shè)計(jì)：盡管 PEFT 能夠在訓(xùn)練過程中只更新少量參數(shù)，但是由于需要進(jìn)行梯度計(jì)算和反向傳播，其內(nèi)存占用仍然較大。為了應(yīng)對(duì)這一挑戰(zhàn)，一些方法試圖通過繞過預(yù)訓(xùn)練權(quán)重內(nèi)部的梯度計(jì)算來(lái)減少內(nèi)存開銷，比如 Side-Tuning 和 LST 等。同時(shí)，另一些方法則嘗試避免在 LLM 內(nèi)部進(jìn)行反向傳播，以解決這一問題，例如 HyperTuning、MeZO 等。

4、PEFT 的跨領(lǐng)域應(yīng)用

在這一章中，作者探討了 PEFT 在不同領(lǐng)域的應(yīng)用，并就如何設(shè)計(jì)更優(yōu)的 PEFT 方法以提升特定模型或任務(wù)的性能進(jìn)行了討論。本節(jié)主要圍繞著各種大型預(yù)訓(xùn)練模型展開，包括 LLM、視覺 Transformer（ViT）、視覺文本模型以及擴(kuò)散模型，并詳細(xì)描述了 PEFT 在這些預(yù)訓(xùn)練模型的下游任務(wù)適配中的作用。

在 LLM 方面，作者介紹了如何利用 PEFT 微調(diào) LLM 以接受視覺指令輸入，代表性工作如 LLaMA-Adapter。此外，作者還探討了 PEFT 在 LLM 持續(xù)學(xué)習(xí)中的應(yīng)用，并提及了如何通過 PEFT 微調(diào) LLM 來(lái)擴(kuò)展其上下文窗口。

針對(duì) ViT，作者分別描述了如何利用 PEFT 技術(shù)使其適配下游圖像識(shí)別任務(wù)，以及如何利用 PEFT 賦予 ViT 視頻識(shí)別能力。

在視覺文本模型方面，作者針對(duì)開放集圖像分類任務(wù)，介紹了許多應(yīng)用 PEFT 微調(diào)視覺文本模型的工作。

對(duì)于擴(kuò)散模型，作者識(shí)別了兩個(gè)常見場(chǎng)景：如何添加除文本外的額外輸入，以及如何實(shí)現(xiàn)個(gè)性化生成，并分別描述了 PEFT 在這兩類任務(wù)中的應(yīng)用。

5、PEFT 的系統(tǒng)設(shè)計(jì)挑戰(zhàn)

在這一章中，作者首先描述了基于云服務(wù)的 PEFT 系統(tǒng)所面臨的挑戰(zhàn)。主要包括以下幾點(diǎn)：

集中式 PEFT 查詢服務(wù)：在這種模式下，云服務(wù)器存儲(chǔ)著單個(gè) LLM 模型副本和多個(gè) PEFT 模塊。根據(jù)不同 PEFT 查詢的任務(wù)需求，云服務(wù)器會(huì)選擇相應(yīng)的 PEFT 模塊并將其與 LLM 模型集成。

分布式 PEFT 查詢服務(wù)：在這種模式下，LLM 模型存儲(chǔ)在云服務(wù)器上，而 PEFT 權(quán)重和數(shù)據(jù)集存儲(chǔ)在用戶設(shè)備上。用戶設(shè)備使用 PEFT 方法對(duì) LLM 模型進(jìn)行微調(diào)，然后將微調(diào)后的 PEFT 權(quán)重和數(shù)據(jù)集上傳到云服務(wù)器。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

多 PEFT 訓(xùn)練：挑戰(zhàn)包括如何管理內(nèi)存梯度和模型權(quán)重存儲(chǔ)，以及如何設(shè)計(jì)一個(gè)有效的內(nèi)核來(lái)批量訓(xùn)練 PEFT 等。

針對(duì)上述系統(tǒng)設(shè)計(jì)挑戰(zhàn)，作者又列舉了三個(gè)詳細(xì)的系統(tǒng)設(shè)計(jì)案例，以更深入的分析這些挑戰(zhàn)與其可行的解決策略。

Offsite-Tuning：主要解決微調(diào) LLM 時(shí)出現(xiàn)的數(shù)據(jù)隱私困境以及大量資源消耗的問題。

PetS：提供了一個(gè)統(tǒng)一的服務(wù)框架，針對(duì) PEFT 模塊提供統(tǒng)一的管理和調(diào)度機(jī)制。

讓大模型不再「巨無(wú)霸」，這是一份最新的大模型參數(shù)高效微調(diào)綜述-AI.x社區(qū)

PEFT 并行訓(xùn)練框架：介紹了兩種并行 PEFT 訓(xùn)練框架，包括 S-LoRA 和 Punica，以及他們?nèi)绾翁嵘?PEFT 的訓(xùn)練效率。

6、未來(lái)研究方向

作者認(rèn)為，盡管 PEFT 技術(shù)已經(jīng)在很多下游任務(wù)取得了成功，但仍有一些不足需要在未來(lái)的工作中加以解決。

建立統(tǒng)一的評(píng)測(cè)基準(zhǔn)：盡管已存在一些 PEFT 庫(kù)，但缺乏一個(gè)全面的基準(zhǔn)來(lái)公平比較不同 PEFT 方法的效果和效率。建立一個(gè)公認(rèn)的基準(zhǔn)將促進(jìn)社區(qū)內(nèi)的創(chuàng)新和合作。

增強(qiáng)訓(xùn)練效率：PEFT 在訓(xùn)練過程中，其可訓(xùn)練參數(shù)量并不總是與訓(xùn)練過程中的計(jì)算和內(nèi)存節(jié)省一致。如高效 PEFT 設(shè)計(jì)章節(jié)所述，未來(lái)的研究可以進(jìn)一步探索優(yōu)化內(nèi)存和計(jì)算效率的方法。

探索擴(kuò)展定律：許多 PEFT 技術(shù)都是在較小的 Transformer 模型上實(shí)現(xiàn)的，而其有效性不一定適用于如今的各種大參數(shù)量模型。未來(lái)的研究可以探索如何適應(yīng)大型模型的 PEFT 方法。

服務(wù)更多模型和任務(wù)：隨著更多大型模型的出現(xiàn)，如 Sora、Mamba 等，PEFT 技術(shù)可以解鎖新的應(yīng)用場(chǎng)景。未來(lái)的研究可以關(guān)注為特定模型和任務(wù)設(shè)計(jì) PEFT 方法。

增強(qiáng)數(shù)據(jù)隱私：在服務(wù)或微調(diào)個(gè)性化 PEFT 模塊時(shí)，中心化系統(tǒng)可能面臨數(shù)據(jù)隱私問題。未來(lái)的研究可以探索加密協(xié)議來(lái)保護(hù)個(gè)人數(shù)據(jù)和中間訓(xùn)練 / 推理結(jié)果。

PEFT 與模型壓縮：模型壓縮技術(shù)如剪枝和量化對(duì) PEFT 方法的影響尚未得到充分研究。未來(lái)的研究可以關(guān)注壓縮后的模型如何適應(yīng) PEFT 方法的性能。

本文轉(zhuǎn)自機(jī)器之心，作者：機(jī)器之心

原文鏈接:??https://mp.weixin.qq.com/s/b16EPZ3z-LpGapGy2Q7ZUg??

標(biāo)簽

贊

收藏 1

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

調(diào)研120+模型！騰訊AI Lab聯(lián)合京都大學(xué)發(fā)布多模態(tài)大語(yǔ)言模型最新綜述

laokugonggao ? 3719瀏覽 ? 0回復(fù)
讓Siri不再智障！蘋果定義新的端側(cè)模型，“大大優(yōu)于GPT-4，擺脫文本，可視化模擬屏幕信息，最小參數(shù)模型相

51CTO技術(shù)棧 ? 2487瀏覽 ? 0回復(fù)
谷歌最強(qiáng)大模型免費(fèi)開放了！長(zhǎng)音頻理解功能獨(dú)一份，100萬(wàn)上下文敞開用

Crystalcxt ? 2696瀏覽 ? 0回復(fù)
什么是超參數(shù)？大模型的超參數(shù)是做什么用的？超參數(shù)和大模型參數(shù)有什么關(guān)系？

AI探索時(shí)代 ? 5416瀏覽 ? 0回復(fù)
大語(yǔ)言模型知識(shí)沖突的綜述

sbf_2000 ? 4241瀏覽 ? 0回復(fù)
大模型高效微調(diào)Prompt Tuning論文解讀

AIRoobt ? 4450瀏覽 ? 0回復(fù)
你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

AI探索時(shí)代 ? 6025瀏覽 ? 0回復(fù)
一文看懂RAG的各種套路 | 綜述：當(dāng)RAG遇到大語(yǔ)言模型

大語(yǔ)言模型論文跟蹤 ? 4031瀏覽 ? 0回復(fù)
學(xué)會(huì)區(qū)分大模型——大模型的分類，讓你更清晰的認(rèn)識(shí)大模型

AI探索時(shí)代 ? 8275瀏覽 ? 0回復(fù)
一篇大模型NL2SQL全棧技術(shù)最新綜述

PaperAgent ? 5778瀏覽 ? 0回復(fù)
綜述 | 大模型的可控文本生成

NLP工作站 ? 3380瀏覽 ? 0回復(fù)
大模型微調(diào)終極指南

NLP工作站 ? 3437瀏覽 ? 0回復(fù)
一篇大模型Agent最新綜述

探索AGI ? 2924瀏覽 ? 0回復(fù)
多模態(tài)大模型最全綜述導(dǎo)讀

shizhi02 ? 2599瀏覽 ? 0回復(fù)
大模型也要"私人定制"？最新綜述帶你解鎖AI的個(gè)性化服務(wù) | 綜述！擴(kuò)散模型：AI藝術(shù)創(chuàng)作背后的"魔法引擎"

arnoldzhw ? 3351瀏覽 ? 0回復(fù)
一篇大模型RAG最新綜述

NLP前沿1 ? 2576瀏覽 ? 0回復(fù)
參數(shù)高效微調(diào)-Prefix Tuning、Adapter Tuning、LoRA

大模型自然語(yǔ)言處理 ? 3179瀏覽 ? 0回復(fù)
一篇大模型GraphRAG最新綜述

探索AGI ? 2344瀏覽 ? 0回復(fù)
掌握這5個(gè)技巧，讓你的大模型交互更高效！

Halo咯咯 ? 981瀏覽 ? 0回復(fù)

輕薄滴假象

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek一口氣開源3個(gè)項(xiàng)目，還有梁文鋒親自參與，昨晚API大降價(jià) 2025-02-27 12:40:06發(fā)布
全球首個(gè)AI CUDA工程師來(lái)了！將PyTorch原生實(shí)現(xiàn)提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：一鍵換裝，讓奧特曼、黃仁勛穿上機(jī)器之心的文化衫

下一篇： CVPR 2024 | 文本一鍵轉(zhuǎn)3D數(shù)字人骨骼動(dòng)畫，阿爾伯塔大學(xué)提出MoMask框架

社區(qū)精華內(nèi)容

目錄