國家隊出手!DeepSeek上線國家超算互聯(lián)網(wǎng)平臺,免注冊開箱即用! 原創(chuàng)
DeepSeek太火爆了!在這個春節(jié)檔,直接成了全民熱議的話題。
DeepSeek也毫無懸念地干到了全球增速最快的AI應(yīng)用。這幾天,國內(nèi)的云計算廠家都在支持DeepSeek的API調(diào)用。
現(xiàn)在,國家隊也出手了!超算互聯(lián)網(wǎng)的官微一口氣發(fā)了兩條上新DeepSeek的公告——DeepSeek-R1、V3、Coder 等系列模型已陸續(xù)在國家超算互聯(lián)網(wǎng)平臺上線。目前,國家超算互聯(lián)網(wǎng)平臺已推出 DeepSeek – R1 模型的 1.5B、7B、8B、14B 版本,后續(xù)還會在近期更新 32B、70B 等版本。
地址:??https://www.scnet.cn/ui/mall/??
圖片
小編體驗了一下超算互聯(lián)網(wǎng)平臺,超算平臺接入這事真的是個福音:免注冊的模式勢必大幅度降低用AI的門檻,讓所有人都能感受一把AI推理的魅力!
圖片
從首頁點進去就來到了對話界面,不用下載,也不用注冊,真正的0門檻使用。
圖片
推理的效果如下,作為一個7B的小模型,效果還是相當驚艷的。內(nèi)容輸出略有卡頓,但是在可以接受的范圍里~
圖片
1.國家隊的算力支持:超算互聯(lián)網(wǎng)出手了
可能有些人和小編一樣,對國家超算互聯(lián)網(wǎng)平臺感覺有些陌生。
但稍微了解下就知道這次支持的分量:國家超算互聯(lián)網(wǎng)平臺是一個由科技部指導(dǎo)發(fā)起的國家級平臺。
這個平臺就像是算力的“南水北調(diào)”:整合全國的超算資源,通過互聯(lián)網(wǎng)的思維運營超算中心,連接算力供給、應(yīng)用開發(fā)、運營服務(wù)和用戶等各方資源,構(gòu)建一體化的超算算力網(wǎng)絡(luò)和服務(wù)平臺。
不只是利好想嘗鮮DeepSeek的普通用戶,其實超算平臺想做的是打通企業(yè)部署大模型的最后幾公里。
對于有私有化部署需求,需引入專有數(shù)據(jù)進行DeepSeek模型訓(xùn)練的用戶和企業(yè),超算互聯(lián)網(wǎng)平臺同樣提供了可靠的解決方案。
圖片
2.平臺紛紛官宣接入, DeepSeek全面開花
無論是云平臺還是國產(chǎn)GPU,大家都在接DeepSeek帶來的潑天富貴。從2月起,DeepSeek的支持官宣一直不斷!
順便說一句,大家應(yīng)該注意到了上文互聯(lián)網(wǎng)超算中心支持的是 DeepSeek基于通義千問模型的蒸餾模型。與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業(yè)內(nèi)部實施部署,可以極大地降低落地成本,目前本地部署也都是這個方案。而一眾云廠商提供的API,則一般是滿血版的DeepSeek-R1。
云平臺接入DeepSeek大模型
- 華為云:2月1日,華為云宣布與硅基流動聯(lián)合首發(fā)并上線基于昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。該服務(wù)得益于自研推理加速引擎,部署的DeepSeek模型性能可與全球高端GPU部署模型相媲美。
- 騰訊云:2月2日,騰訊云宣布DeepSeek-R1大模型已一鍵部署至其“HAI”平臺,開發(fā)者僅需3分鐘即可接入調(diào)用。該平臺省去了購買顯卡、安裝驅(qū)動、配置網(wǎng)絡(luò)等繁瑣步驟。
- 百度智能云:2月3日晚間,百度智能云宣布其千帆平臺正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低價格方案及限時免費服務(wù)。用戶登錄千帆ModelBuilder即可快速體驗。
- 阿里云:2月3日,阿里云宣布其PAI Model Gallery支持云上一鍵部署DeepSeek-V3和DeepSeek-R1模型。用戶可在該平臺上零代碼實現(xiàn)從訓(xùn)練到部署再到推理的全過程
- 火山引擎:2月4日,火山引擎宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企業(yè)用戶可以通過以下兩種方式使用這些模型:在火山引擎機器學(xué)習(xí)平臺veMLP中部署;通過火山方舟平臺直接調(diào)用。
圖片
安全平臺:
- 360數(shù)字安全:2月2日,360數(shù)字安全宣布其安全大模型正式接入DeepSeek,將發(fā)揮360安全大數(shù)據(jù)優(yōu)勢,通過強化學(xué)習(xí)等技術(shù)手段,訓(xùn)練出“DeepSeek版”安全大模型。
國產(chǎn)GPU:
- 沐曦:2月2日,沐曦聯(lián)合中國開源大模型平臺Gitee AI發(fā)布了全套DeepSeek-R1千問蒸餾模型,首批上線的四個較小規(guī)模的模型(1.5B、7B、14B、32B)均部署在國產(chǎn)沐曦曦云GPU上。
- 天數(shù)智芯:2月4日,天數(shù)智芯宣布與Gitee AI合作,僅用時一天就完成了與DeepSeek-R1模型的適配工作,并已上線多個大模型服務(wù),包括1.5B、7B、14B等版本。
- 摩爾線程:2月4日,摩爾線程宣布已實現(xiàn)對DeepSeek蒸餾模型推理服務(wù)的部署,并即將開放自主設(shè)計的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。
- 海光信息:2月4日,海光信息宣布其技術(shù)團隊已完成DeepSeek V3和R1模型與海光DCU的適配并上線。
3.寫在最后
DeepSeek火得太出圈。這波流量擠爆了服務(wù)器,讓響應(yīng)偶爾會變得卡頓。
圖片
但在各種平臺的算力支持下,相信很快更易用、更平穩(wěn)的DeepSeek就會與我們見面。
過年在家,幫家人下載和注冊了DeepSeek??粗麄儚膶υ捒蛑邪l(fā)送了與AI對話的第一個問題時,我感覺到AI不只可以遙遠而神秘,也可以親切而美好。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??
