DeepSeek太火爆了!在這個(gè)春節(jié)檔,直接成了全民熱議的話題。
DeepSeek也毫無懸念地干到了全球增速最快的AI應(yīng)用。這幾天,國內(nèi)的云計(jì)算廠家都在支持DeepSeek的API調(diào)用。
現(xiàn)在,國家隊(duì)也出手了!超算互聯(lián)網(wǎng)的官微一口氣發(fā)了兩條上新DeepSeek的公告——DeepSeek-R1、V3、Coder 等系列模型已陸續(xù)在國家超算互聯(lián)網(wǎng)平臺(tái)上線。目前,國家超算互聯(lián)網(wǎng)平臺(tái)已推出 DeepSeek – R1 模型的 1.5B、7B、8B、14B 版本,后續(xù)還會(huì)在近期更新 32B、70B 等版本。
地址:https://www.scnet.cn/ui/mall/
圖片
小編體驗(yàn)了一下超算互聯(lián)網(wǎng)平臺(tái),超算平臺(tái)接入這事真的是個(gè)福音:免注冊(cè)的模式勢(shì)必大幅度降低用AI的門檻,讓所有人都能感受一把AI推理的魅力!
圖片
從首頁點(diǎn)進(jìn)去就來到了對(duì)話界面,不用下載,也不用注冊(cè),真正的0門檻使用。
圖片
推理的效果如下,作為一個(gè)7B的小模型,效果還是相當(dāng)驚艷的。內(nèi)容輸出略有卡頓,但是在可以接受的范圍里~
圖片
1.國家隊(duì)的算力支持:超算互聯(lián)網(wǎng)出手了
可能有些人和小編一樣,對(duì)國家超算互聯(lián)網(wǎng)平臺(tái)感覺有些陌生。
但稍微了解下就知道這次支持的分量:國家超算互聯(lián)網(wǎng)平臺(tái)是一個(gè)由科技部指導(dǎo)發(fā)起的國家級(jí)平臺(tái)。
這個(gè)平臺(tái)就像是算力的“南水北調(diào)”:整合全國的超算資源,通過互聯(lián)網(wǎng)的思維運(yùn)營(yíng)超算中心,連接算力供給、應(yīng)用開發(fā)、運(yùn)營(yíng)服務(wù)和用戶等各方資源,構(gòu)建一體化的超算算力網(wǎng)絡(luò)和服務(wù)平臺(tái)。
不只是利好想嘗鮮DeepSeek的普通用戶,其實(shí)超算平臺(tái)想做的是打通企業(yè)部署大模型的最后幾公里。
對(duì)于有私有化部署需求,需引入專有數(shù)據(jù)進(jìn)行DeepSeek模型訓(xùn)練的用戶和企業(yè),超算互聯(lián)網(wǎng)平臺(tái)同樣提供了可靠的解決方案。
圖片
2.平臺(tái)紛紛官宣接入, DeepSeek全面開花
無論是云平臺(tái)還是國產(chǎn)GPU,大家都在接DeepSeek帶來的潑天富貴。從2月起,DeepSeek的支持官宣一直不斷!
順便說一句,大家應(yīng)該注意到了上文互聯(lián)網(wǎng)超算中心支持的是 DeepSeek基于通義千問模型的蒸餾模型。與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業(yè)內(nèi)部實(shí)施部署,可以極大地降低落地成本,目前本地部署也都是這個(gè)方案。而一眾云廠商提供的API,則一般是滿血版的DeepSeek-R1。
云平臺(tái)接入DeepSeek大模型
- 華為云:2月1日,華為云宣布與硅基流動(dòng)聯(lián)合首發(fā)并上線基于昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。該服務(wù)得益于自研推理加速引擎,部署的DeepSeek模型性能可與全球高端GPU部署模型相媲美。
- 騰訊云:2月2日,騰訊云宣布DeepSeek-R1大模型已一鍵部署至其“HAI”平臺(tái),開發(fā)者僅需3分鐘即可接入調(diào)用。該平臺(tái)省去了購買顯卡、安裝驅(qū)動(dòng)、配置網(wǎng)絡(luò)等繁瑣步驟。
- 百度智能云:2月3日晚間,百度智能云宣布其千帆平臺(tái)正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低價(jià)格方案及限時(shí)免費(fèi)服務(wù)。用戶登錄千帆ModelBuilder即可快速體驗(yàn)。
- 阿里云:2月3日,阿里云宣布其PAI Model Gallery支持云上一鍵部署DeepSeek-V3和DeepSeek-R1模型。用戶可在該平臺(tái)上零代碼實(shí)現(xiàn)從訓(xùn)練到部署再到推理的全過程
- 火山引擎:2月4日,火山引擎宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企業(yè)用戶可以通過以下兩種方式使用這些模型:在火山引擎機(jī)器學(xué)習(xí)平臺(tái)veMLP中部署;通過火山方舟平臺(tái)直接調(diào)用。
圖片
安全平臺(tái):
- 360數(shù)字安全:2月2日,360數(shù)字安全宣布其安全大模型正式接入DeepSeek,將發(fā)揮360安全大數(shù)據(jù)優(yōu)勢(shì),通過強(qiáng)化學(xué)習(xí)等技術(shù)手段,訓(xùn)練出“DeepSeek版”安全大模型。
國產(chǎn)GPU:
- 沐曦:2月2日,沐曦聯(lián)合中國開源大模型平臺(tái)Gitee AI發(fā)布了全套DeepSeek-R1千問蒸餾模型,首批上線的四個(gè)較小規(guī)模的模型(1.5B、7B、14B、32B)均部署在國產(chǎn)沐曦曦云GPU上。
- 天數(shù)智芯:2月4日,天數(shù)智芯宣布與Gitee AI合作,僅用時(shí)一天就完成了與DeepSeek-R1模型的適配工作,并已上線多個(gè)大模型服務(wù),包括1.5B、7B、14B等版本。
- 摩爾線程:2月4日,摩爾線程宣布已實(shí)現(xiàn)對(duì)DeepSeek蒸餾模型推理服務(wù)的部署,并即將開放自主設(shè)計(jì)的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。
- 海光信息:2月4日,海光信息宣布其技術(shù)團(tuán)隊(duì)已完成DeepSeek V3和R1模型與海光DCU的適配并上線。
3.寫在最后
DeepSeek火得太出圈。這波流量擠爆了服務(wù)器,讓響應(yīng)偶爾會(huì)變得卡頓。
圖片
但在各種平臺(tái)的算力支持下,相信很快更易用、更平穩(wěn)的DeepSeek就會(huì)與我們見面。
過年在家,幫家人下載和注冊(cè)了DeepSeek??粗麄儚膶?duì)話框中發(fā)送了與AI對(duì)話的第一個(gè)問題時(shí),我感覺到AI不只可以遙遠(yuǎn)而神秘,也可以親切而美好。