自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

后DeepSeek時(shí)代,大模型領(lǐng)域如何開(kāi)工大吉

發(fā)布于 2025-2-5 17:14
瀏覽
0收藏

這個(gè)春節(jié)是DeepSeek的狂歡節(jié),從R1發(fā)布到席卷全球僅不到兩周,霸占140多個(gè)國(guó)家AppStore下載排行榜榜首。

今日節(jié)后第一天開(kāi)工,幾位朋友不約而同咨詢我大模型未來(lái)走向,這里簡(jiǎn)單分享一下我的看法,拋磚引玉。

總結(jié)一句話:

大模型全棧都應(yīng)圍繞DeepSeek做生態(tài)

重要的事情通常得說(shuō)三遍,但這件事只需說(shuō)一遍,卻無(wú)比重要,攸關(guān)資金、人力、時(shí)間等資源投入和業(yè)務(wù)創(chuàng)新與價(jià)值產(chǎn)出。

大模型全棧

這是筆者整理的大模型全棧:芯片 -> 編譯器 -> 設(shè)備 -> 大模型 -> Agent智能體。

后DeepSeek時(shí)代,大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

每個(gè)方面的基本概念這里不贅述,萬(wàn)事不決請(qǐng)DeepSeek,當(dāng)一家公司把自己的名字做成動(dòng)詞,都是神一樣的存在。

芯片與編譯器

這塊大部分讀者很陌生,我多說(shuō)幾句。

筆者從事過(guò)幾年DB2 SQL編譯器與優(yōu)化器的開(kāi)發(fā),C++代碼跑在AIX、HPUX、Linux、Windows、Sun Solaris等系統(tǒng)之上。

接觸過(guò)這些系統(tǒng)的讀者都知道,這意味著SQL需要一次編譯,卻能夠適配不同的芯片PowerPC、X86、X64、Sun Sparc,和不同的操作系統(tǒng)。

IBM DB2 做了芯片和操作系統(tǒng)層面的抽象,類似一個(gè)統(tǒng)一的虛擬的操作系統(tǒng);SQL 被表征為有向無(wú)環(huán)圖DAG,圖中每個(gè)節(jié)點(diǎn)對(duì)應(yīng)著不同的算子Operator。

SQL編譯器與優(yōu)化器就是將這些DAG和算子翻譯成對(duì)操作系統(tǒng)和芯片的調(diào)用,并想盡一切辦法讓這些算子和DAG充分利用芯片和操作系統(tǒng)的資源(進(jìn)程、線程調(diào)度,內(nèi)存、磁盤與網(wǎng)絡(luò)IO),即所謂的優(yōu)化。

后DeepSeek時(shí)代,大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)圖片

AI 的算法幾乎一回事,Pytorch、TF是封裝好了的DAG和算子,英偉達(dá)的CUDA作為編譯器優(yōu)化器以及芯片和操作系統(tǒng)層面的抽象。

后DeepSeek時(shí)代,大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

CPU 與 GPU有著不同的設(shè)計(jì)目標(biāo),CPU側(cè)重復(fù)雜邏輯控制,GPU側(cè)重并行。PTX是CUDA中最接近芯片硬件的并行編程模型和指令集。

如果你能夠做PTX級(jí)別的控制,意味著你可以自己編譯和優(yōu)化你特定的DAG和算子,也就意味著你無(wú)需CUDA的編譯器和優(yōu)化器就能夠適配國(guó)產(chǎn)GPU或其他什么xPU。

這里是英偉達(dá)CUDA城墻咔咔碎裂的聲音,DeepSeek崛起暴露Nvidia軟肋。如果 DeekSeek成為開(kāi)源第一,芯片廠家都知道自己該干什么從而加入這個(gè)生態(tài)。

設(shè)備AIPC與AI手機(jī)

自從有了ChatGPT大模型,PC和手機(jī)大廠都在大張旗鼓的推銷自己的AIPC、AI手機(jī)。想法很好,可惜沒(méi)有能打的端側(cè)大模型。

量化縮小的大模型都損失了泛化能力,從而退化成了小模型,參考筆者的清熙其他文章。

而且沒(méi)有聯(lián)網(wǎng)的場(chǎng)景是如此的稀缺,以至于有人用南極科考站的隊(duì)員想在去往南極的科考船上,用端側(cè)大模型建議研究課題??尚蓱z。

現(xiàn)在有了能打的DeekSeek,但端側(cè)仍然還是demo演示層面的能力。當(dāng)用戶可以隨時(shí)聯(lián)網(wǎng)用云端的全功能大模型能力的時(shí)候,端側(cè)不應(yīng)該聚焦無(wú)聯(lián)網(wǎng)場(chǎng)景。

端側(cè)的優(yōu)勢(shì)在于用戶設(shè)備上的隱私數(shù)據(jù),得踏實(shí)想清楚用到隱私數(shù)據(jù)的端側(cè)功能,而且僅僅讓端側(cè)大模型充當(dāng)意圖理解的部分,這里可參考最賺錢的大模型應(yīng)用正呼嘯而來(lái)。

大模型本身

ChatGPT之后,國(guó)內(nèi)群雄并起,兩年廝殺的結(jié)果是 DeepSeek此次的異軍突起。

國(guó)之幸事,世界幸事,全球科學(xué)家涌向DeepSeek,可能誕生一個(gè)超級(jí)世界模型,甚至一個(gè)DeepSeek為主干的智能互聯(lián)網(wǎng)。

筆者可以感受到幾家歡樂(lè)幾家愁。不僅OpenAI、Cloude、Gemini迎來(lái)最強(qiáng)對(duì)手,如臨大敵,國(guó)內(nèi)的大模型公司同樣前途未卜。

每家都有存在的意義和價(jià)值,然而,后DeepSeek時(shí)代,他們似乎都錯(cuò)過(guò)了全部正確答案。

筆者覺(jué)得,如果你有足夠的資金、足夠的人才、足夠的耐心、足夠的不同技術(shù)路線的信仰,你可以繼續(xù)投入訓(xùn)練自己的大模型,但也要意識(shí)到,前路更崎嶇更陡峭。

上述因素只要有一項(xiàng)不足,筆者覺(jué)得,打不過(guò)就加入可能是個(gè)最現(xiàn)實(shí)的方向:把你原來(lái)模型的優(yōu)勢(shì)蒸餾出來(lái),注入DeepSeek,做垂直,做智能應(yīng)用,做Model Store,做產(chǎn)業(yè)鏈服務(wù)。

后DeepSeek時(shí)代,大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

企業(yè)可以部署DeepSeek到企業(yè)數(shù)據(jù)中心,把內(nèi)部知識(shí)灌進(jìn)去,讓DeepSeek更懂企業(yè)自己,然后開(kāi)放賦能全員,注意不要考核降本增效。

還需關(guān)注,大模型時(shí)期的應(yīng)用,需要按照人類自然溝通方式的新范式重新思考和設(shè)計(jì),注重文本、圖像、音視頻的可聊、可視、可聽(tīng)、可理解。

智能體Agent

做智能應(yīng)用,還有一個(gè)繞不開(kāi)的話題,智能體或Agent。著名的咨詢機(jī)構(gòu)都這么講,盡管筆者覺(jué)得在大模型領(lǐng)域,他們也沒(méi)有什么好的經(jīng)驗(yàn)和洞察。

智能體通常是指以大模型理解為基礎(chǔ),提供附加記憶、規(guī)劃、使用工具等能力,即所謂System2的能力,圖解LLM-Agent大模型智能體。

然而,如果大模型的理解能力不足,所有這些都是在沙地上建塔。所以DeepSeek給了所有智能體生的希望。

下圖是筆者常用來(lái)介紹智能體的用例,以人類客服話務(wù)員處理客戶撥入的服務(wù)電話為場(chǎng)景。存在多個(gè)不同層次的需求處理和相應(yīng)的大模型智商要求。

后DeepSeek時(shí)代,大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)

設(shè)計(jì)此類智能應(yīng)用的時(shí)候,還得考量目前大模型最最致命的缺陷,DeepSeek也不例外,就是無(wú)處不在、無(wú)時(shí)不有的幻覺(jué)。

幻覺(jué)某種意義上是大模型的高維度思維優(yōu)勢(shì),但不適合缺少足夠判斷力的小白用戶,至少目前如此。

降低大模型幻覺(jué)的必由之路 筆者曾經(jīng)理過(guò)思路,DeepSeek推理有了長(zhǎng)足進(jìn)步 GRPO 是DeepSeek魔法的源泉,然而幻覺(jué)并未消除,所以用戶得有足夠的判斷力,從代碼輔助到創(chuàng)意生成。

歸根結(jié)底一句話,大模型仍是一個(gè)師傅領(lǐng)進(jìn)門的技術(shù),修行還要在個(gè)人,特別適合有經(jīng)驗(yàn)的、或者愛(ài)學(xué)習(xí)鉆研的用戶。

免責(zé)聲明disclaimer

上述粗鄙的判斷都來(lái)自本人過(guò)去對(duì)AI和大模型的數(shù)學(xué)物理原理的探索和技術(shù)能力邊界的推演,因而難免帶著個(gè)人認(rèn)知局限和偏見(jiàn),有失偏頗。

關(guān)心大模型領(lǐng)域方向的讀者,請(qǐng)批判參考,謹(jǐn)慎制定符合自身資源稟賦的大模型戰(zhàn)略。戰(zhàn)略本質(zhì)上是把資源(資金、人才、時(shí)間)投到什么上去,不能不慎重。

后DeepSeek時(shí)代,大模型領(lǐng)域如何開(kāi)工大吉-AI.x社區(qū)圖片

上面這張圖是筆者過(guò)去兩年多圍繞大模型思考的凝練,涉及到大模型的能力邊界、未來(lái)走向、應(yīng)用判斷都來(lái)自這個(gè)圖,目前為止還沒(méi)有大的誤判。

本文轉(zhuǎn)載自 ??清熙??,作者: 王慶法

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦