自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="wax0n"><li id="wax0n"></li></p>

<p id="wax0n"><li id="wax0n"></li></p>

<sub id="wax0n"></sub><blockquote id="wax0n"><rt id="wax0n"></rt></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

后DeepSeek時(shí)代，大模型領(lǐng)域如何開(kāi)工大吉

發(fā)布于 2025-2-5 17:14

瀏覽

0收藏

這個(gè)春節(jié)是DeepSeek的狂歡節(jié)，從R1發(fā)布到席卷全球僅不到兩周，霸占140多個(gè)國(guó)家AppStore下載排行榜榜首。

今日節(jié)后第一天開(kāi)工，幾位朋友不約而同咨詢我大模型未來(lái)走向，這里簡(jiǎn)單分享一下我的看法，拋磚引玉。

總結(jié)一句話：

大模型全棧都應(yīng)圍繞DeepSeek做生態(tài)

重要的事情通常得說(shuō)三遍，但這件事只需說(shuō)一遍，卻無(wú)比重要，攸關(guān)資金、人力、時(shí)間等資源投入和業(yè)務(wù)創(chuàng)新與價(jià)值產(chǎn)出。

大模型全棧

這是筆者整理的大模型全棧：芯片 -> 編譯器 -> 設(shè)備 -> 大模型 -> Agent智能體。

后DeepSeek時(shí)代，大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

每個(gè)方面的基本概念這里不贅述，萬(wàn)事不決請(qǐng)DeepSeek，當(dāng)一家公司把自己的名字做成動(dòng)詞，都是神一樣的存在。

芯片與編譯器

這塊大部分讀者很陌生，我多說(shuō)幾句。

筆者從事過(guò)幾年DB2 SQL編譯器與優(yōu)化器的開(kāi)發(fā)，C++代碼跑在AIX、HPUX、Linux、Windows、Sun Solaris等系統(tǒng)之上。

接觸過(guò)這些系統(tǒng)的讀者都知道，這意味著SQL需要一次編譯，卻能夠適配不同的芯片PowerPC、X86、X64、Sun Sparc，和不同的操作系統(tǒng)。

IBM DB2 做了芯片和操作系統(tǒng)層面的抽象，類似一個(gè)統(tǒng)一的虛擬的操作系統(tǒng)；SQL 被表征為有向無(wú)環(huán)圖DAG，圖中每個(gè)節(jié)點(diǎn)對(duì)應(yīng)著不同的算子Operator。

SQL編譯器與優(yōu)化器就是將這些DAG和算子翻譯成對(duì)操作系統(tǒng)和芯片的調(diào)用，并想盡一切辦法讓這些算子和DAG充分利用芯片和操作系統(tǒng)的資源（進(jìn)程、線程調(diào)度，內(nèi)存、磁盤與網(wǎng)絡(luò)IO），即所謂的優(yōu)化。

后DeepSeek時(shí)代，大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū) 圖片

AI 的算法幾乎一回事，Pytorch、TF是封裝好了的DAG和算子，英偉達(dá)的CUDA作為編譯器優(yōu)化器以及芯片和操作系統(tǒng)層面的抽象。

后DeepSeek時(shí)代，大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

CPU 與 GPU有著不同的設(shè)計(jì)目標(biāo)，CPU側(cè)重復(fù)雜邏輯控制，GPU側(cè)重并行。PTX是CUDA中最接近芯片硬件的并行編程模型和指令集。

如果你能夠做PTX級(jí)別的控制，意味著你可以自己編譯和優(yōu)化你特定的DAG和算子，也就意味著你無(wú)需CUDA的編譯器和優(yōu)化器就能夠適配國(guó)產(chǎn)GPU或其他什么xPU。

這里是英偉達(dá)CUDA城墻咔咔碎裂的聲音，DeepSeek崛起暴露Nvidia軟肋。如果 DeekSeek成為開(kāi)源第一，芯片廠家都知道自己該干什么從而加入這個(gè)生態(tài)。

設(shè)備AIPC與AI手機(jī)

自從有了ChatGPT大模型，PC和手機(jī)大廠都在大張旗鼓的推銷自己的AIPC、AI手機(jī)。想法很好，可惜沒(méi)有能打的端側(cè)大模型。

量化縮小的大模型都損失了泛化能力，從而退化成了小模型，參考筆者的清熙其他文章。

而且沒(méi)有聯(lián)網(wǎng)的場(chǎng)景是如此的稀缺，以至于有人用南極科考站的隊(duì)員想在去往南極的科考船上，用端側(cè)大模型建議研究課題?？尚蓱z。

現(xiàn)在有了能打的DeekSeek，但端側(cè)仍然還是demo演示層面的能力。當(dāng)用戶可以隨時(shí)聯(lián)網(wǎng)用云端的全功能大模型能力的時(shí)候，端側(cè)不應(yīng)該聚焦無(wú)聯(lián)網(wǎng)場(chǎng)景。

端側(cè)的優(yōu)勢(shì)在于用戶設(shè)備上的隱私數(shù)據(jù)，得踏實(shí)想清楚用到隱私數(shù)據(jù)的端側(cè)功能，而且僅僅讓端側(cè)大模型充當(dāng)意圖理解的部分，這里可參考最賺錢的大模型應(yīng)用正呼嘯而來(lái)。

大模型本身

ChatGPT之后，國(guó)內(nèi)群雄并起，兩年廝殺的結(jié)果是 DeepSeek此次的異軍突起。

國(guó)之幸事，世界幸事，全球科學(xué)家涌向DeepSeek，可能誕生一個(gè)超級(jí)世界模型，甚至一個(gè)DeepSeek為主干的智能互聯(lián)網(wǎng)。

筆者可以感受到幾家歡樂(lè)幾家愁。不僅OpenAI、Cloude、Gemini迎來(lái)最強(qiáng)對(duì)手，如臨大敵，國(guó)內(nèi)的大模型公司同樣前途未卜。

每家都有存在的意義和價(jià)值，然而，后DeepSeek時(shí)代，他們似乎都錯(cuò)過(guò)了全部正確答案。

筆者覺(jué)得，如果你有足夠的資金、足夠的人才、足夠的耐心、足夠的不同技術(shù)路線的信仰，你可以繼續(xù)投入訓(xùn)練自己的大模型，但也要意識(shí)到，前路更崎嶇更陡峭。

上述因素只要有一項(xiàng)不足，筆者覺(jué)得，打不過(guò)就加入可能是個(gè)最現(xiàn)實(shí)的方向：把你原來(lái)模型的優(yōu)勢(shì)蒸餾出來(lái)，注入DeepSeek，做垂直，做智能應(yīng)用，做Model Store，做產(chǎn)業(yè)鏈服務(wù)。

后DeepSeek時(shí)代，大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

企業(yè)可以部署DeepSeek到企業(yè)數(shù)據(jù)中心，把內(nèi)部知識(shí)灌進(jìn)去，讓DeepSeek更懂企業(yè)自己，然后開(kāi)放賦能全員，注意不要考核降本增效。

還需關(guān)注，大模型時(shí)期的應(yīng)用，需要按照人類自然溝通方式的新范式重新思考和設(shè)計(jì)，注重文本、圖像、音視頻的可聊、可視、可聽(tīng)、可理解。

智能體Agent

做智能應(yīng)用，還有一個(gè)繞不開(kāi)的話題，智能體或Agent。著名的咨詢機(jī)構(gòu)都這么講，盡管筆者覺(jué)得在大模型領(lǐng)域，他們也沒(méi)有什么好的經(jīng)驗(yàn)和洞察。

智能體通常是指以大模型理解為基礎(chǔ)，提供附加記憶、規(guī)劃、使用工具等能力，即所謂System2的能力，圖解LLM-Agent大模型智能體。

然而，如果大模型的理解能力不足，所有這些都是在沙地上建塔。所以DeepSeek給了所有智能體生的希望。

下圖是筆者常用來(lái)介紹智能體的用例，以人類客服話務(wù)員處理客戶撥入的服務(wù)電話為場(chǎng)景。存在多個(gè)不同層次的需求處理和相應(yīng)的大模型智商要求。

后DeepSeek時(shí)代，大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

設(shè)計(jì)此類智能應(yīng)用的時(shí)候，還得考量目前大模型最最致命的缺陷，DeepSeek也不例外，就是無(wú)處不在、無(wú)時(shí)不有的幻覺(jué)。

幻覺(jué)某種意義上是大模型的高維度思維優(yōu)勢(shì)，但不適合缺少足夠判斷力的小白用戶，至少目前如此。

降低大模型幻覺(jué)的必由之路筆者曾經(jīng)理過(guò)思路，DeepSeek推理有了長(zhǎng)足進(jìn)步 GRPO 是DeepSeek魔法的源泉，然而幻覺(jué)并未消除，所以用戶得有足夠的判斷力，從代碼輔助到創(chuàng)意生成。

歸根結(jié)底一句話，大模型仍是一個(gè)師傅領(lǐng)進(jìn)門的技術(shù)，修行還要在個(gè)人，特別適合有經(jīng)驗(yàn)的、或者愛(ài)學(xué)習(xí)鉆研的用戶。

免責(zé)聲明disclaimer

上述粗鄙的判斷都來(lái)自本人過(guò)去對(duì)AI和大模型的數(shù)學(xué)物理原理的探索和技術(shù)能力邊界的推演，因而難免帶著個(gè)人認(rèn)知局限和偏見(jiàn)，有失偏頗。

關(guān)心大模型領(lǐng)域方向的讀者，請(qǐng)批判參考，謹(jǐn)慎制定符合自身資源稟賦的大模型戰(zhàn)略。戰(zhàn)略本質(zhì)上是把資源（資金、人才、時(shí)間）投到什么上去，不能不慎重。

后DeepSeek時(shí)代，大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū) 圖片

上面這張圖是筆者過(guò)去兩年多圍繞大模型思考的凝練，涉及到大模型的能力邊界、未來(lái)走向、應(yīng)用判斷都來(lái)自這個(gè)圖，目前為止還沒(méi)有大的誤判。

本文轉(zhuǎn)載自 ??清熙??，作者：王慶法

標(biāo)簽

數(shù)學(xué)

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

Google開(kāi)源大模型新成員CodeGemma、RecurrentGemma，繼Transformer后新架構(gòu)Griffin誕生

AIGC最前線 ? 3413瀏覽 ? 0回復(fù)
大語(yǔ)言模型強(qiáng)化的多智能體如何使教育等關(guān)鍵領(lǐng)域受益？

AIGC最前線 ? 3458瀏覽 ? 0回復(fù)
大模型開(kāi)始進(jìn)入收益遞減的時(shí)代？

lintoms ? 2341瀏覽 ? 0回復(fù)
剖析特定領(lǐng)域大模型

lintoms ? 2436瀏覽 ? 0回復(fù)
淺談—領(lǐng)域模型訓(xùn)練

NLP工作站 ? 2225瀏覽 ? 0回復(fù)
當(dāng)你研究過(guò)了900個(gè)開(kāi)源大模型項(xiàng)目后，你能學(xué)到什么？

魚(yú)蟲(chóng)子 ? 2015瀏覽 ? 0回復(fù)
撤出OpenAI后，蘋果繼續(xù)潑冷水：大模型不會(huì)推理。科技界炸鍋：大模型只會(huì)檢索拼湊答案

51CTO技術(shù)棧 ? 2173瀏覽 ? 0回復(fù)
對(duì)想從事大模型領(lǐng)域的技術(shù)開(kāi)發(fā)者的建議或看法

AI探索時(shí)代 ? 2155瀏覽 ? 0回復(fù)
DeepSeek-VL2開(kāi)源，VLM邁入MoE時(shí)代！

xuxiangda ? 2815瀏覽 ? 0回復(fù)
醫(yī)學(xué)領(lǐng)域大模型與多模態(tài)大模型的綜合調(diào)查

知識(shí)圖譜科技 ? 2085瀏覽 ? 0回復(fù)
大推理模型DeepSeek-R1深度解讀：成本降低95%，推動(dòng)語(yǔ)言模型推理效率新高度

風(fēng)云2002_1 ? 1.1w瀏覽 ? 0回復(fù)
Gemini 2.0：針對(duì)代理時(shí)代的新AI模型

Halo咯咯 ? 2172瀏覽 ? 0回復(fù)
DeepSeek 爆了，普通人如何3小時(shí)完全從0訓(xùn)練自己的大模型

玄姐聊AGI ? 6111瀏覽 ? 0回復(fù)
帶你一文讀懂爆火的 DeepSeek-R1 新模型技術(shù)，為何震動(dòng)了全球 AI 圈

玄姐聊AGI ? 6531瀏覽 ? 1回復(fù)
強(qiáng)化學(xué)習(xí)與大模型后訓(xùn)練：DeepSeek R1 如何獲得推理能力？

lintoms ? 3890瀏覽 ? 0回復(fù)
DeepSeek算力平權(quán)后端側(cè)AI和Agent智能體迎來(lái)爆發(fā)

數(shù)字化助推器 ? 1835瀏覽 ? 0回復(fù)
后 DeepSeek R1 時(shí)代：從資本壁壘到技術(shù)普惠

Baihai_IDP ? 1766瀏覽 ? 0回復(fù)
DeepSeek爆火后的新Scaling Law究竟是什么？

51CTO技術(shù)棧 ? 1667瀏覽 ? 0回復(fù)
大模型時(shí)代的知識(shí)工程：企業(yè)級(jí)智能知識(shí)庫(kù)構(gòu)建與增強(qiáng)指南

九歌AI大模型 ? 2132瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

d1：通過(guò)GRPO在擴(kuò)散LLM中縮放推理 17h前發(fā)布
語(yǔ)言與擴(kuò)散模型的精準(zhǔn)控制 2天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：從“Nature局部核重整化學(xué)習(xí)機(jī)制”說(shuō)開(kāi)去

下一篇： DeepSeek-R1-Zero激發(fā)了推理Scaling Law

社區(qū)精華內(nèi)容

目錄

<cite id="o1xcb"><track id="o1xcb"></track></cite>

<thead id="o1xcb"><rt id="o1xcb"></rt></thead>

<blockquote id="o1xcb"></blockquote>

<cite id="o1xcb"><track id="o1xcb"><sub id="o1xcb"></sub></track></cite>

<legend id="o1xcb"><abbr id="o1xcb"></abbr></legend>