自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Nature認(rèn)證DeepSeek成科研工具全能者,國內(nèi)高校如何借力大模型?

人工智能 新聞
Nature更是幾度發(fā)文,因?yàn)镈eepSeek開源低成本易部署等優(yōu)勢,科學(xué)家們紛紛涌向DeepSeek,這種模型已經(jīng)是科研AI工具中的全能者。

DeepSeek的風(fēng),也是飄到了科研領(lǐng)域——

最新消息,同濟(jì)大學(xué)通過百度智能云千帆大模型平臺接入并調(diào)用DeepSeek-R1/V3系列模型;

包括浙大、北大清華等知名高校也是紛紛出動,要么接入模型推出智能體,又或者出品干貨課程、使用手冊《從入門到精通》等等,幾度都登上熱搜。

Nature更是幾度發(fā)文,因?yàn)镈eepSeek開源低成本易部署等優(yōu)勢,科學(xué)家們紛紛涌向DeepSeek,這種模型已經(jīng)是科研AI工具中的全能者。

感知到的是,大模型在科研探索中發(fā)揮的價(jià)值遠(yuǎn)比以往任何時(shí)候都深入。

DeepSeek R1自推出以來,Hugging Face上相關(guān)版本的下載量已經(jīng)接近四百萬次,高居榜首。

但高的使用量,隨之而來的就是算力需求井噴。除了帶來模型本身的穩(wěn)定性、易用性等挑戰(zhàn),傳統(tǒng)的科研機(jī)構(gòu)還面臨算力資源碎片化、人才培育滯后等問題。

春節(jié)期間,我們看到,整個(gè)AI產(chǎn)業(yè)鏈都被積極調(diào)動起來,來支持模型穩(wěn)定運(yùn)行。

但因?yàn)榭蒲协h(huán)境中,對數(shù)據(jù)的準(zhǔn)確性、隱私安全方面的要求以及模型可靠性、穩(wěn)定性、易用性要求更高,像DeepSeek這樣的大模型能真正應(yīng)用到科研探索,其實(shí)難度不小。

像模型的易用性問題,科研人員并非都具備深厚的AI技術(shù)背景,也沒有那么多時(shí)間成本來學(xué)習(xí)大模型如何配置。他們可能需要花費(fèi)大量時(shí)間學(xué)習(xí)如何操作模型,而無法將精力集中在核心的科研問題上,嚴(yán)重影響科研效率。

而且這還只是模型本身的挑戰(zhàn),還存在一些系統(tǒng)性難題,其中以算力與人才最為突出。

算力「饑餓與浪費(fèi)并存」??蒲袡C(jī)構(gòu)無法像企業(yè)那樣投入大量資源來建設(shè)AI基礎(chǔ)設(shè)施。同時(shí)算力資源分散,不同機(jī)構(gòu)不同設(shè)備難以實(shí)現(xiàn)有效整合和協(xié)同使用,從而影響整個(gè)科研項(xiàng)目的進(jìn)程。所以我們經(jīng)常就會看到有科學(xué)家在線求算力,即便李飛飛也曾透露過斯坦福團(tuán)隊(duì)算力不夠的情況。

人才培養(yǎng)的滯后性。技術(shù)發(fā)展過快,產(chǎn)業(yè)界的AI人才稀缺甚至是靠高薪來搶人,而在科研這端,這種既懂科研專業(yè)知識又掌握大模型技術(shù)的復(fù)合型人才可能更是少之又少。

基礎(chǔ)設(shè)施是技術(shù)研究的基石,缺乏足夠的科研基礎(chǔ)設(shè)施,也就很難吸引到人才,同時(shí)也限制了技術(shù)的發(fā)展空間;而沒有足夠的人才來操作設(shè)備,基礎(chǔ)設(shè)施也無法發(fā)揮出它應(yīng)用的作用,還會影響到上層模型本身的發(fā)展。

如此循環(huán)往復(fù),那么大模型在科研環(huán)境中的應(yīng)用進(jìn)程也就更顯道阻且長了。

今時(shí)今日如何破局,也就顯得更為緊迫和艱巨。

AI科研新基建:算力為核心,全生命周期支持

這段時(shí)間,在一眾鋪天蓋地的新聞中,有這么一則AI算力產(chǎn)業(yè)界的進(jìn)展備受關(guān)注——

昆侖芯P800萬卡集群成功點(diǎn)亮,這是國內(nèi)首個(gè)正式點(diǎn)亮的自研萬卡集群,并且還計(jì)劃將這一數(shù)字?jǐn)U大到三萬。

大家一邊感嘆于它性能方面的顯著,其規(guī)格其顯存規(guī)格比同類主流GPU高出20%-50%。它對MoE架構(gòu)更友好,并且支持8bit推理,單機(jī)8卡就能運(yùn)行671B滿血版模型。

正因如此,昆侖芯相較同類產(chǎn)品更加易于部署,同時(shí)可顯著降低運(yùn)行成本,輕松完成DeepSeek-V3/R1全版本推理任務(wù)。同時(shí),昆侖芯P800在DeepSeek系列MoE模型大規(guī)模訓(xùn)練任務(wù)中也表現(xiàn)出色,全面支持MLA、多專家并行等特性,僅需32臺即可支持模型全參訓(xùn)練,高效助力模型的持續(xù)訓(xùn)練和微調(diào)。

而在另一邊,科研團(tuán)隊(duì)還關(guān)注的是,它在能效比上面的優(yōu)勢——

對比通用GPU,它單位算力功耗可以降低40%,幫助科研團(tuán)隊(duì)突破傳統(tǒng)GPU集群的電力瓶頸。

經(jīng)過清華智能產(chǎn)業(yè)研究院驗(yàn)證,他們搭載昆侖芯P800的算力集群成功將千億參數(shù)模型的訓(xùn)練周期從28天縮短至19天,電力成本節(jié)省超300萬元

而且因?yàn)樵撔酒瑩碛型耆灾髦R產(chǎn)權(quán)體系,從指令集架構(gòu)到編譯器工具鏈全棧可控,能夠保證科研應(yīng)用過程中的數(shù)據(jù)安全。

像北京前沿計(jì)算研究中心基于昆侖芯構(gòu)建的聯(lián)邦學(xué)習(xí)平臺已在醫(yī)療影像分析領(lǐng)域?qū)崿F(xiàn)多機(jī)構(gòu)數(shù)據(jù)協(xié)同訓(xùn)練,模型精度提升12%的同時(shí),完全滿足隱私合規(guī)要求。

能夠看到,自研芯片構(gòu)建算力集群也許是破局關(guān)鍵,它能解決訓(xùn)練成本、數(shù)據(jù)安全等方面的難題。

不過能夠吸引這么多高校Pick合作,不僅僅是因?yàn)榘俣戎悄茉撇渴鹆死鲂?,而是一整套AI For Science解決方案。

它憑借多年全棧技術(shù)布局,以及與多家頂尖高校生態(tài)合作,沉淀出這么一套方案——

包括昆侖芯P800芯片、百舸異構(gòu)算力平臺、飛槳深度學(xué)習(xí)框架以及千帆大模型平臺等。

在此之前,還不曾系統(tǒng)性梳理過,今天不妨就來一一拆解,看看背后有哪些值得學(xué)習(xí)與借鑒。

首先,昆侖芯P800集成的萬卡集群,它是AI基礎(chǔ)設(shè)施當(dāng)中的定海神針。只有自主可控的堅(jiān)實(shí)底座,才能推動大模型技術(shù)持續(xù)迭代與生態(tài)繁榮。

其次,百舸異構(gòu)算力平臺,可以理解為算力中樞,或者是統(tǒng)籌師,面對科研環(huán)境中復(fù)雜多樣的算力需求,這個(gè)中樞就顯得格外重要,通過預(yù)測調(diào)度等操作實(shí)現(xiàn)算力資源的高效統(tǒng)籌,它在提升算力利用效率、降低成本、加速科研進(jìn)程等方面成效顯著——

上海交通大學(xué)AI研究院部署百舸平臺后,GPU利用率從35%提升至72%,任務(wù)排隊(duì)時(shí)間減少60%,模型訓(xùn)練效率得以顯著提高。

如此解決科研中算力資源碎片化的痛點(diǎn),源于他在架構(gòu)算法以及服務(wù)模式化上面的創(chuàng)新。

架構(gòu)方面,它建立了一個(gè)靈活彈性的算力供給網(wǎng)絡(luò)。物理層兼容昆侖芯、英偉達(dá)、AMD等多元算力芯片,資源層提供容器化算力單元,服務(wù)層則支持Kubernetes、Slurm等多種調(diào)度系統(tǒng)。

算法層面,它的智能調(diào)度算法有三個(gè)方面的創(chuàng)新,比如基于強(qiáng)化學(xué)習(xí)的動態(tài)資源預(yù)測模型可提前24小時(shí)預(yù)判算力需求波動;跨集群任務(wù)遷移技術(shù)實(shí)現(xiàn)全局負(fù)載均衡;異構(gòu)資源感知調(diào)度器可將不同類型計(jì)算任務(wù)精準(zhǔn)分配到最優(yōu)硬件組合。

還有服務(wù)模式上,它創(chuàng)造了「科研算力銀行」這種范式。能讓機(jī)構(gòu)按需取用、彈性供給。像浙江大學(xué)某重點(diǎn)實(shí)驗(yàn)室,就通過這種方式提前3個(gè)月完成了氣象大模型的迭代。

并且隨著技術(shù)發(fā)展,百舸也在持續(xù)的更新與迭代,比如配合DeepSeek推理能力推出了一些功能,包括在線推理服務(wù)的全生命周期管理、彈性擴(kuò)縮容能力、自研框架推理加速技術(shù)以及完善的運(yùn)維監(jiān)控體系。

再者是飛槳深度學(xué)習(xí)框架,國內(nèi)首個(gè)開源開放的產(chǎn)業(yè)級深度學(xué)習(xí)平臺,工具鏈與社區(qū)屬性兼?zhèn)?/strong>。

它通過構(gòu)建起基礎(chǔ)模型、工具組件、應(yīng)用案例的三層資源體系,提高了諸多高校與開發(fā)者的科研效率。中國科學(xué)技術(shù)大學(xué)量子計(jì)算團(tuán)隊(duì)基于飛槳量子機(jī)器學(xué)習(xí)套件,成功實(shí)現(xiàn)量子化學(xué)模擬加速,計(jì)算效率超越傳統(tǒng)方法2個(gè)數(shù)量級。

不過能推出如此海量的資源套件,也與百度持續(xù)深耕積累Know-how有關(guān)。

百度飛槳持續(xù)深耕力學(xué)與數(shù)學(xué)、材料化學(xué)、氣象預(yù)測、生物醫(yī)藥等前沿領(lǐng)域,尤其是在生物計(jì)算領(lǐng)域尤為顯著。

截至目前,百度已打造完整的基于飛槳的生物計(jì)算平臺-螺旋槳PaddleHelix,涵蓋文心大模型-生物計(jì)算大模型,探索AI技術(shù)在小分子、蛋白/多肽、RNA等場景的應(yīng)用。

2023年5月2日,國際頂級學(xué)術(shù)期刊《Nature》正刊發(fā)表了百度與合作單位在生物計(jì)算領(lǐng)域的研究成果——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出mRNA序列優(yōu)化算法LinearDesign。這是中國科技企業(yè)首次以第一完成單位的身份在《Nature》雜志發(fā)表論文。

而隨著DeepSeek、文心越來越多的模型選擇開源,飛槳的價(jià)值其實(shí)也就愈加凸顯。

開源的方式保證了研究結(jié)果的可靠性,促進(jìn)了科研成果的廣泛傳播和共享。其他研究人員通過復(fù)現(xiàn)在已有基礎(chǔ)上改進(jìn)和拓展,技術(shù)創(chuàng)新與迭代也就在這個(gè)過程中加速流動。

像某高校基于飛槳框架研發(fā)的遙感圖像解譯系統(tǒng),結(jié)果通過社區(qū)協(xié)作持續(xù)優(yōu)化,在農(nóng)作物分類任務(wù)中的準(zhǔn)確率從89%提升至96%。

還有就是千帆大模型平臺,一站式AI服務(wù)平臺。它是資深的模型專家,從模型開發(fā)、訓(xùn)練、部署、監(jiān)控等的全流程管理系統(tǒng)。

此前我們比較熟悉的ModelBuilder就是在這一平臺體系下,按照自身需求來完成大模型的開發(fā)和部署。這其實(shí)是一個(gè)包含數(shù)據(jù)處理、模型精調(diào)、模型評估、量化等環(huán)節(jié)的系統(tǒng)性工程,對于企業(yè)而言就難度不小,對于缺乏產(chǎn)業(yè)實(shí)戰(zhàn)經(jīng)驗(yàn)的科研高校來說更是如此。

ModelBuilder提供了一整套完善的工具鏈,院校根據(jù)自身科研需求深度優(yōu)化模型性能?,F(xiàn)在該平臺的大模型矩陣已經(jīng)覆蓋了DeepSeek-R1、DeepSeek-V3、文心大模型等,同時(shí)支持vLLM、LMDeploy、TensorRT-LLM、SGLang等主流推理框架實(shí)現(xiàn)高性能模型托管,幫助高??梢造`活開發(fā)與部署。

而在開發(fā)與部署之前,它還能幫助科研團(tuán)隊(duì)選出適合自己的大模型。

它的智能評估板塊,集成了50多種量化指標(biāo)。在南京大學(xué)某分子動力學(xué)研究中,研究人員通過平臺的AB測試功能,快速篩選出最優(yōu)的力場預(yù)測模型,研發(fā)周期縮短40%。

可以這樣總結(jié),百度技術(shù)層面的部署:以算力為核心,整個(gè)全周期提供全棧技術(shù)支持。另外,在人才培養(yǎng)和科研創(chuàng)新上,百度也在發(fā)揮著自己在產(chǎn)業(yè)實(shí)踐方面的優(yōu)勢。

比如通過「松果計(jì)劃」培養(yǎng)出5000余名AI工程化人才,參與學(xué)生發(fā)表頂會論文300余篇,孵化出智能天文數(shù)據(jù)處理、古生物數(shù)字復(fù)原等20余個(gè)創(chuàng)新項(xiàng)目。

還有與多所高校包括清華北大、復(fù)旦、上海交大、蘭州大學(xué)等合作,開設(shè)了《飛槳Al for Science前沿系列講座課程》和《飛槳Alfor Science代碼入門與實(shí)操》兩門課程;

與清華共建「東方」智算中心,部署2000+卡規(guī)模昆侖芯集群;與上海交大建設(shè)國內(nèi)首個(gè)AI for Science科學(xué)數(shù)據(jù)開源開放平臺;與北大開發(fā)「小北學(xué)長」智能體等等。

……

可以看到,百度在AI For Science上面的賦能是全方面的,是從全棧技術(shù)到人才培養(yǎng),也是從底座、模型到應(yīng)用覆蓋整個(gè)模型全周期的。

放在整個(gè)行業(yè)中,百度這一案例代表著AI科研的一種新基建,其核心邏輯在于將算力從孤立資源升級為智能化生產(chǎn)力中樞,通過全棧技術(shù)鏈重構(gòu)科研工作流。

在這一過程中,企業(yè)與高校之間的合作展現(xiàn)出了一種新型的合作模式。

這種合作并非簡單的點(diǎn)對點(diǎn)式對接,即在某個(gè)具體項(xiàng)目上的短暫合作,而是呈現(xiàn)出立體的、動態(tài)的和多樣的特點(diǎn)。

他們發(fā)揮各自的優(yōu)勢,比如學(xué)校的人才積累和專業(yè)數(shù)據(jù),企業(yè)的算力底座和產(chǎn)業(yè)級別算法,來共同應(yīng)對大模型創(chuàng)新與應(yīng)用的各種挑戰(zhàn)。

就像同濟(jì)大學(xué)與百度智能云合作,就格外具有代表性。

同濟(jì)大學(xué)作為國家重點(diǎn)大學(xué),肩負(fù)了一系列重大的國家專項(xiàng)科研任務(wù)和工程科研攻關(guān)使命。

為了滿足同濟(jì)大學(xué)在多模態(tài)大模型、機(jī)器自主感知、多智能體和具身智能方向等前沿領(lǐng)域的深度探索需求,百度智能云提供了全面的技術(shù)支持。

以百昆侖芯P800、百度百舸AI異構(gòu)計(jì)算平臺、百度智能云千帆大模型平臺、百度智能云一見視覺大模型平臺為基礎(chǔ),打造全國產(chǎn)底座的具身智能大模型開發(fā)平臺,服務(wù)于同濟(jì)大學(xué)圍繞特色化示范性軟件學(xué)院建設(shè)、智慧城市感知與規(guī)劃重大工程軟件技術(shù)教育部工程研究中心建設(shè)。

百舸一體機(jī)搭載昆侖芯P800,可在單機(jī)環(huán)境下部署滿血版DeepSeek R1/V3全系列模型,滿足輕量化與極致效價(jià)比需求。這一方案支持8bit推理,并全面兼容DeepSeek全系列模型,提供一鍵部署、開箱即用的便捷體驗(yàn)。

合作對學(xué)校多智能體系統(tǒng)技術(shù)的突破具有重要作用,有效提升校方多智能體強(qiáng)化學(xué)習(xí)算法、領(lǐng)域定制大模型、協(xié)同學(xué)習(xí)算法、智能代理算法的訓(xùn)練效率,并將賦能給不同場景機(jī)器人、無人機(jī)、多智能體設(shè)備等智能終端。

AI科研新基建的構(gòu)建,本質(zhì)上是一場面向科研范式的底層革命。

AI For Science:從AlphaFold到DeepSeek

DeepSeek R1模型,憑借其低成本高表現(xiàn)的顯著優(yōu)勢,在全球科研領(lǐng)域迅速走紅,受到了科學(xué)家們的熱烈追捧。

比如用來探索新研究方向、日常數(shù)據(jù)處理、篩選整理科學(xué)文獻(xiàn)等等。

回顧AI For Science的發(fā)展歷程,上一次引發(fā)如此廣泛關(guān)注和熱議的是AlphaFold。

不過AlphaFold聚焦在提煉生物數(shù)據(jù)的價(jià)值,其核心貢獻(xiàn)在于極大地提高了蛋白質(zhì)以及大分子結(jié)構(gòu)預(yù)測的效率,對于藥物研發(fā)、基因編輯等諸多前沿方向帶來深刻的影響。

而現(xiàn)在是以模型通用能力的極大提升、低成本零門檻部署的特點(diǎn),帶來是整個(gè)全面科研范式的賦能。

它不再局限于某一特定領(lǐng)域的數(shù)據(jù)處理和研究,而是廣泛適用于多個(gè)學(xué)科領(lǐng)域。無論是物理學(xué)中的復(fù)雜模擬計(jì)算、化學(xué)中的分子反應(yīng)預(yù)測,還是社會科學(xué)中的數(shù)據(jù)分析和預(yù)測,大模型都能發(fā)揮其獨(dú)特的優(yōu)勢。

這種通用性使得不同學(xué)科的科研人員都能夠輕松借助其能力開展研究工作,打破了學(xué)科之間的技術(shù)壁壘,促進(jìn)了跨學(xué)科研究的發(fā)展。

同時(shí),低成本零門檻的特點(diǎn)讓更多科研團(tuán)隊(duì),尤其是資源相對有限的科研機(jī)構(gòu)和小型實(shí)驗(yàn)室,也能夠享受到先進(jìn)AI技術(shù)帶來的便利。

此次DeepSeek在AI For Science上的賦能,標(biāo)志著該領(lǐng)域來到了一個(gè)新的階段。這對模型能力乃至整個(gè)科研周期的服務(wù)都提出了新的挑戰(zhàn)。

比如穩(wěn)定的算力、比如高質(zhì)量專業(yè)數(shù)據(jù)。面對不同學(xué)科領(lǐng)域的海量數(shù)據(jù)和復(fù)雜問題,模型要能夠快速學(xué)習(xí)和適應(yīng),提供精準(zhǔn)有效的解決方案。在科研全周期中,從數(shù)據(jù)采集、處理、分析,到模型訓(xùn)練、驗(yàn)證和應(yīng)用,每個(gè)環(huán)節(jié)都需要更高的效率和質(zhì)量保障。

應(yīng)對這些挑戰(zhàn)方面,百度給出了一個(gè)參考答案。憑借其全棧的技術(shù)能力,為解決這些難題和關(guān)鍵瓶頸提供了有力支持,推動科研創(chuàng)新不斷向前。

從AlphaFold到DeepSeek,人工智能技術(shù)發(fā)展重塑科研的未來。AI For Science的競速才剛剛開始,需要更多國產(chǎn)玩家,呼喚更大的生態(tài),實(shí)現(xiàn)AI在前沿科技的全新里程碑。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-02-24 10:01:23

2025-02-28 12:32:42

2015-06-30 17:41:31

戰(zhàn)旗TV

2013-08-30 13:54:34

云平臺

2025-02-17 09:50:00

DeepSeekAI模型

2025-03-06 07:28:31

DeepSeek大模型人工智能

2022-11-06 11:42:29

語言模型Nature

2025-02-13 08:30:11

2023-08-10 15:35:33

論文指數(shù)

2025-02-20 09:27:46

2013-10-08 17:04:05

華為網(wǎng)絡(luò)平臺華為

2013-10-21 10:24:38

SDN實(shí)踐科研

2025-03-05 03:00:00

DeepSeek大模型調(diào)優(yōu)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號