自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

字節(jié)跳動開源大模型訓(xùn)練框架veGiantModel ，性能最高提升6.9倍

2022-03-21 17:56:59

新聞自然語言處理

自然語言處理是人工智能研究的一個重要領(lǐng)域，旨在幫助計算機(jī)理解、解釋和運(yùn)用人類語言。

近日，字節(jié)跳動應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊開源了一款名為 veGiantModel 的大模型訓(xùn)練框架，該訓(xùn)練框架主要應(yīng)用于自然語言處理領(lǐng)域的大模型訓(xùn)練，最高可將大模型訓(xùn)練的性能提升6.9倍，大幅降低訓(xùn)練系統(tǒng)的壓力。目前，字節(jié)跳動旗下的企業(yè)級技術(shù)服務(wù)平臺火山引擎已在其機(jī)器學(xué)習(xí)平臺上原生支持了 veGiantModel，該平臺正在公測中。

自然語言處理是人工智能研究的一個重要領(lǐng)域，旨在幫助計算機(jī)理解、解釋和運(yùn)用人類語言。近些年，自然語言處理在應(yīng)用方面取得了較為顯著的突破，主要是歸功于 Bert、GPT、GPT-3 等預(yù)訓(xùn)練語言模型的普及。可以說，預(yù)訓(xùn)練語言模型已經(jīng)成為人工智能領(lǐng)域的基礎(chǔ)設(shè)施。由于大模型的算法表現(xiàn)更加出眾，預(yù)訓(xùn)練語言模型在近幾年呈現(xiàn)出迅速向大模型發(fā)展的趨勢。然而，模型體積的快速增長也對現(xiàn)有的訓(xùn)練系統(tǒng)帶來了不小的挑戰(zhàn)，主要體現(xiàn)為顯存壓力、計算壓力和通信壓力。

針對現(xiàn)有訓(xùn)練系統(tǒng)在大模型訓(xùn)練場景下的上述挑戰(zhàn)，字節(jié)跳動應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊提出了大模型訓(xùn)練框架 veGiantModel。

veGiantModel的中文名稱叫做火山引擎大模型訓(xùn)練框架，是基于開源深度學(xué)習(xí)框架 PyTorch 、并在 Megatron 和 DeepSpeed 兩大開源主流訓(xùn)練框架的基礎(chǔ)之上構(gòu)建的高性能大模型訓(xùn)練框架。

veGiantModel 可同時支持?jǐn)?shù)據(jù)并行、算子切分、流水線并行 3 種分布式并行策略，并支持自動化和定制化的并行策略；基于字節(jié)自研的高性能異步通訊庫 ByteCCL，veGiantModel 的訓(xùn)練任務(wù)吞吐相比其他主流開源框架有 1.2 倍到 3.5倍的提升，并且提供了更友好、靈活的流水線支持，降低了模型開發(fā)迭代所需要的人力；另外，veGiantModel 可在 GPU 上高效地支持?jǐn)?shù)十億至上千億參數(shù)量的大模型，對網(wǎng)絡(luò)帶寬要求也更低，在私有化部署時無 RDMA 強(qiáng)依賴。

與 Megtraon 和 DeepSpeed 的對比測試顯示，veGiantModel 的性能表現(xiàn)最好、受網(wǎng)絡(luò)帶寬影響最小，在Tesla V100上較上述兩者有1.2 倍到3.5倍的提升，在 Ampere A100上最高可提升6.9倍。

veGiantModel開源地址：

????https://github.com/volcengine/veGiantModel????

火山引擎機(jī)器學(xué)習(xí)平臺公測地址：

??https://www.volcengine.com/product/ml-platform??

責(zé)任編輯：黃顯東來源： 51CTO

大模型訓(xùn)練訓(xùn)練框架

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="o91ai"></cite>

<blockquote id="o91ai"></blockquote>