自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="7s6ks"><rp id="7s6ks"></rp></cite>

<sub id="7s6ks"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

DeepSeek太給力了！自家的大模型秘方開源到底！國產(chǎn)大模型雄起原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2025-2-28 12:32

瀏覽

0收藏

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

DeepSeek “開源周”第五天，依舊保持了一如既往地“務(wù)實”風(fēng)，滿滿的誠意。

先來回憶下前四天，源神的慷慨發(fā)布——

第一天，2月24日，最為外界稱道的MLA技術(shù)率先開源，這項解碼加速器FlashMLA技術(shù)能夠讓英偉達(dá)Hopper架構(gòu)GPU跑得更快，效果更好！

緊接著，25日，直接亮出首個面向MoE模型的開源專家并行通信庫DeepEP，實現(xiàn)了MoE訓(xùn)練推理的全棧優(yōu)化；

第三天，則進(jìn)一步祭出一項跨時代的發(fā)布：FP8通用矩陣乘法加速庫，從底層讓模型訓(xùn)練、微調(diào)變得更加流暢絲滑；

第四天，也就是昨天的并行優(yōu)化“三劍客”：DeepSeek-V3和R1 模型背后的并行計算優(yōu)化技術(shù)——DualPipe（雙向流水線并行算法，讓計算和通信高效協(xié)同）、EPLB （專家并行負(fù)載均衡器，讓每個 GPU 都“雨露均沾”）、profile-data （性能分析數(shù)據(jù)，可以理解成V3/R1 的并行優(yōu)化的分析經(jīng)驗）

可以說前四天的發(fā)布聚焦在算力通信、模型架構(gòu)優(yōu)化，也就是算力和算法的層面，而接下來第五天的開源則補(bǔ)上了AI三駕馬車的最后一塊，也是用戶體驗感知更為明顯的一塊優(yōu)化動作：高性能分布式文件系統(tǒng)（數(shù)據(jù)存儲層面的改進(jìn)）。

五天整體看下來，可以說是把R1技術(shù)報告中沒來得及公開的“黑科技”一股腦的全部開源了！

第五天究竟開源了什么呢？

“開源周”活動中發(fā)布的第5天，DeepSeek主要Open他們開源的兩個項目：3FS（高性能分布式文件系統(tǒng)）和 Smallpond（基于3FS的數(shù)據(jù)處理框架）。

為了便于大家理解，這里為大家梳理一下。

首先，3FS 是什么？簡單來說，就是一個專為現(xiàn)代硬件設(shè)計的并行分布式文件系統(tǒng)，目標(biāo)是最大化利用SSD硬盤和高速網(wǎng)絡(luò)（RDMA，繞過CPU直接傳輸數(shù)據(jù)）的性能，解決海量數(shù)據(jù)（如AI訓(xùn)練、推理）的存儲和訪問速度問題。

那，為什么需要3FS？因為在AI訓(xùn)練、大數(shù)據(jù)分析等場景需要處理TB/PB級數(shù)據(jù)，傳統(tǒng)文件系統(tǒng)可能成為性能瓶頸。3FS厲害之處就在于，通過并行技術(shù)和硬件優(yōu)化（如SSD+RDMA），實現(xiàn)超高吞吐量和低延遲。

DS還給出了3FS 的三個性能亮點——

速度驚人
a.180臺機(jī)器集群：每秒讀取6.6 TiB（約等于同時傳輸10部4K電影）。
b.25臺機(jī)器：每分鐘排序3.66 TiB數(shù)據(jù)（GraySort基準(zhǔn)測試，體現(xiàn)大數(shù)據(jù)排序能力）。
c.單客戶端節(jié)點：每秒40+ GiB的鍵值緩存查詢（適合AI推理中的快速數(shù)據(jù)檢索）。
架構(gòu)優(yōu)勢
解耦架構(gòu) (Disaggregated)：計算和存儲資源分離，可按需擴(kuò)展。
強(qiáng)一致性：多節(jié)點讀寫時，數(shù)據(jù)始終保持一致（避免臟讀/臟寫）。
應(yīng)用場景
AI數(shù)據(jù)預(yù)處理、模型訓(xùn)練時的數(shù)據(jù)集加載
模型訓(xùn)練中快速保存/恢復(fù)檢查點（防止中斷丟失進(jìn)度）
向量搜索（如推薦系統(tǒng)、語義匹配）
推理時的鍵值緩存（加速實時查詢）

再來看Smallpond。它是DeepSeek基于3FS開發(fā)的一種數(shù)據(jù)處理框架，可理解為在3FS上高效管理數(shù)據(jù)的“工具箱”。

這種工具就非常容易上手了，值得各位大模型“煉丹”士擁有，因為它能夠簡化數(shù)據(jù)清洗、轉(zhuǎn)換、加載（ETL）等流程，適合大規(guī)模數(shù)據(jù)處理任務(wù)。

Github鏈接奉上——

3FS代碼倉庫：https://github.com/deepseek-ai/3FS
Smallpond代碼倉庫：https://github.com/deepseek-ai/smallpond

具體都用在哪兒？

AI/大數(shù)據(jù)團(tuán)隊：用3FS可加速訓(xùn)練和推理，減少數(shù)據(jù)讀寫等待時間。
需要高吞吐存儲的場景：如科學(xué)計算、實時分析、推薦系統(tǒng)等。?

整體上看，DeepSeek AI 通過開源3FS和Smallpond，提供了針對AI和大數(shù)據(jù)場景的高性能存儲與數(shù)據(jù)處理方案，解決海量數(shù)據(jù)下的速度瓶頸問題。

大佬點評：AI Infra的又一福音！

業(yè)內(nèi)對于今天DeepSeek開源的神器評價很高。知名大模型+AI芯片專家陳巍第一時間表達(dá)了驚嘆，稱“3F和smallpond是從1到10的優(yōu)化典范，從底層重構(gòu)AI Infra?！?/p>

陳巍認(rèn)為，3F和smallpond絕對是基層煉丹師的福音?！昂喕植际綉?yīng)用程序的開發(fā)，提供輕量級的數(shù)據(jù)庫整合系統(tǒng)，減少超大模型訓(xùn)練中的維護(hù)和斷點保存，將大模型IT拯救于水火。預(yù)計該框架會迅速整合到現(xiàn)有training framwork中，加速工業(yè)界和學(xué)術(shù)界牛馬的發(fā)paper tps?！?/p>

硅基流動創(chuàng)始人袁進(jìn)輝也稱今天的發(fā)布是：“DeepSeek可以用好硬盤緩存的秘密”。

DeepSeek：中國大模型的生態(tài)崛起的希望

去年大家還在糾結(jié)國產(chǎn)的萬卡系統(tǒng)很難建設(shè)，其中有各種問題。去年中國工程院院士鄭緯民就曾對此提出了擔(dān)憂：“現(xiàn)在用國產(chǎn)，我們的生態(tài)不太好，我們想辦法要做好十個軟件：并行系統(tǒng)、編程框架、通信庫、AI編譯器、算子庫、編程語言、調(diào)度器、容錯系統(tǒng)、內(nèi)存分配系統(tǒng)、存儲系統(tǒng)?！?/p>

鄭院士還舉了自研國產(chǎn)并行系統(tǒng)和通信庫、內(nèi)存分配系統(tǒng)、存儲系統(tǒng)的必要性。

比如，并行系統(tǒng)，現(xiàn)在不是1塊卡，而是1000塊卡、1萬塊卡，1塊卡訓(xùn)練一百天，我們買100塊卡，一天就訓(xùn)練完了。但中間要交換數(shù)據(jù)，交換一次是人家的90倍了，如果做得不好的話，100塊卡我們希望有100倍效能，只能做到3、4倍的效率。我們希望有70倍、80倍、90倍這就叫并行系統(tǒng)，想辦法接近100倍。做得不好，20倍。

再比如通信庫，1000塊卡、1萬塊卡要通信，怎么寫好？算子庫，寫一個矩陣軟件，最好不要寫，調(diào)用矩陣成本軟件，碰到什么就調(diào)用什么，這個庫要寫得多，寫得好。要有編譯器，國內(nèi)會做編譯系統(tǒng)的特別少，龍舟系統(tǒng)，一個小時就出錯了，怎么才能繼續(xù)做下去？

鄭院士還提出，“數(shù)據(jù)實地化，內(nèi)容主題化，算力國產(chǎn)化是目前的實際要求?！?/p>

但時鐘撥回到去年夏天，國產(chǎn)的大家還是不大愿意用，因為生態(tài)不好。

那DeepSeek這波的誠意十足的開源，可以說讓大家看到了國產(chǎn)學(xué)術(shù)界、產(chǎn)業(yè)界生態(tài)崛起的希望，這家了不起的公司一股腦把國產(chǎn)自研的大模型配套的技術(shù)全都搞出來了，并行、編譯、通信、內(nèi)存、存儲、算子……

可以預(yù)見的是，DeepSeek正在標(biāo)志著國產(chǎn)算力和國產(chǎn)模型正在成為新興的大模型勢力，中國也將迸發(fā)出性能強(qiáng)大、成本低廉、普惠全面的大模型應(yīng)用。

參考鏈接：??https://www.zhihu.com/question/13614300508/answer/112464472761??

本文轉(zhuǎn)載自??51CTO技術(shù)棧??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

社區(qū)頭條

回復(fù)

相關(guān)推薦

OpenAI首次展示音頻模型Voice Engine，生成的聲音太逼真了！

Aceryt ? 3047瀏覽 ? 0回復(fù)
開源大模型可能不香了！您在微調(diào)開源大模型的時候，很可能已經(jīng)泄露了您寶貴的數(shù)據(jù)！

AIGC最前線 ? 3344瀏覽 ? 0回復(fù)
AI大模型的“心臟”算力王者歸來

數(shù)字化助推器 ? 3305瀏覽 ? 0回復(fù)
國產(chǎn)開源Sora上新：全面支持國產(chǎn)AI算力，可用ReVideo視頻編輯，北大-兔展團(tuán)隊出品

Crystalcxt ? 2737瀏覽 ? 0回復(fù)
大模型所謂的參數(shù)是什么？大模型為什么需要訓(xùn)練？大模型訓(xùn)練到底干了什么？

AI探索時代 ? 6081瀏覽 ? 0回復(fù)
給 ?大模型初學(xué)者? 的 LLaMA 3 核心技術(shù)剖析

Baihai_IDP ? 2865瀏覽 ? 0回復(fù)
大模型愛好者的福音，有了它個人電腦也可以運(yùn)行大模型了

AI探索時代 ? 3401瀏覽 ? 0回復(fù)
英偉達(dá)開源新大模型：訓(xùn)練數(shù)據(jù)減少40倍，算力節(jié)省1.8倍

Aceryt ? 2724瀏覽 ? 0回復(fù)
Anthropic 公開了自家的模型“操作說明”，業(yè)界大贊：Nice，非常透明！

51CTO技術(shù)棧 ? 1978瀏覽 ? 0回復(fù)
將端側(cè)大模型進(jìn)行到底-MiniCPM3-4B開源

NLP工作站 ? 2548瀏覽 ? 0回復(fù)
現(xiàn)實再次給大模型帶來沉重打擊

NLP前沿1 ? 1982瀏覽 ? 0回復(fù)
開源大模型如何治理？斯坦?；A(chǔ)模型研究中心給您支招

AIGC最前線 ? 2642瀏覽 ? 0回復(fù)
大模型技術(shù)全面解析，從大模型的概念，技術(shù)，應(yīng)用和挑戰(zhàn)多個方面介紹大模型

AI探索時代 ? 1.4w瀏覽 ? 0回復(fù)
突破算力限制！Meta開源“記憶層”，重塑Transformer架構(gòu)大模型

Aceryt ? 1990瀏覽 ? 0回復(fù)
DeepSeek 爆了，普通人如何3小時完全從0訓(xùn)練自己的大模型

玄姐聊AGI ? 6084瀏覽 ? 0回復(fù)
機(jī)器學(xué)習(xí)|從0開發(fā)大模型之復(fù)現(xiàn)DeepSeek的aha moment

周末程序猿 ? 1630瀏覽 ? 0回復(fù)
用 MCP 讓大模型自動批量下載文獻(xiàn)，太香了！

機(jī)器學(xué)習(xí)與數(shù)學(xué) ? 3417瀏覽 ? 0回復(fù)
DeepSeek與Qwen組團(tuán)開源了模型，沖!

PaperAgent ? 970瀏覽 ? 0回復(fù)
部署一個大模型，到底需要多大機(jī)器？

hm673c38238a021 ? 1069瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

中國開源大模型新成員：小米推理大模型首秀！ 7h前發(fā)布
剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點贊！真實跑步水平曝光：2m/s接近天工！ 12h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：外網(wǎng)夸爆DeepSeek開源周！今天一口氣開源3個重磅！壓軸戲期待拉滿，R2、V4、被提名

下一篇： OpenAI自爆：GPT-4.5 并非前沿模型！奧特曼稱OpenAI的GPU已用光，還透露了一個“轉(zhuǎn)型”思路？

社區(qū)精華內(nèi)容

目錄

<sub id="u98ew"><i id="u98ew"></i></sub>

<sup id="u98ew"></sup>