DeepSeek的爆火,背后是這些啟發(fā) ...
關注AI大模型技術的朋友們,在歡度春節(jié)的這些天,一定有被國產(chǎn)大模型底座DeepSeek的”橫空出圈"霸屏了。
國產(chǎn)化大模型在算力更加“節(jié)約”的情況下,研發(fā)出了近乎和OpenAI GPT-4o同等“聰明”的大模型底座,極大地激勵了國人對于AI技術研發(fā)的信心,同時也給國內(nèi)外同行們帶來了不少“焦慮”與“反思”。
與其他主流大模型相比,正如DeepSeek的中文名“深度求索”想表達的,它在解決具體回答任務時,不僅關注“端到端”的一問一答結(jié)果,更加關注這個答案是怎么得到的。
這個AI模型會像人一樣思考,把任務分解,給出分析框架,然后逐步完善創(chuàng)作類答案的內(nèi)容細節(jié)或計算任務的解體過程。
因為過程合理,所以結(jié)果更加make sense,仿佛真的是很深思熟慮給出的結(jié)論,而不僅僅是從資料庫里找一些相關的答案隨便拼湊應付個結(jié)果。
下面主要從兩個方面來聊聊DeepSeek對我們的影響。
其一是,對于AI技術研發(fā)企業(yè)或團隊的影響;其二是,對于普通人的影響。我想這兩個問題都是大家非常關心的。
眾所周知,如果想構(gòu)建一個新的AI模型,主要有三個關鍵的影響變量:算法、算力、數(shù)據(jù)。DeepSeek之前出現(xiàn)的一些“頂級”大模型,多數(shù)對算力有很大資源要求。
這就導致ai大模型底座的研發(fā)成本“居高不下”,成為少數(shù)“大廠”的專利。同時,ai大模型產(chǎn)業(yè),對gpu等芯片廠商也產(chǎn)生了極強的“供應鏈"依賴。
值得注意的是,算力只是ai成功的因素之一,算法和數(shù)據(jù)同樣重要。而DeepSeek,就是從算法尋得突破的!
DeepSeek在訓練大模型底座時,巧妙地運用強化學習技術,讓模型本身在解決問題的思維過程上不斷得到提升。
DeepSeek在有限的數(shù)據(jù)樣本中,得到更多的關于思考方面的啟發(fā),從而讓ai技術回歸本質(zhì) —— 對人的思考方式和解決問題的邏輯的模擬,而不僅僅是追求“正確答案”。
DeepSeek的成功讓國內(nèi)外都為之震驚的是,該模型打破了所謂的Scale Law魔咒,讓人工智能技術研發(fā)重新開始關注算法策略的重要性!
與此同時,DeepSeek的模型訓練對于數(shù)據(jù)質(zhì)量的要求也是非常高的。其采用了很多高質(zhì)量的COT(思維鏈)數(shù)據(jù)。
這類樣本數(shù)據(jù)不僅記錄了問題輸入和答案輸出,還詳細地描述了每一步的“解題”過程。
這也是ai技術的魅力所在,“暗示”ai廠商不要過度迷戀粗放式的數(shù)據(jù)投喂,而是關注如何讓機器更好地學挖掘數(shù)據(jù)的深層次價值。
從另一方面看,隨著ai算法的不斷優(yōu)化,大模型底座訓練和推理成本同步降低!
這讓更多有技術能力的廠商和研發(fā)團隊有機會參與到“百模大戰(zhàn)”,突破算力資源匱乏的技術瓶頸,在未來5-10年將會不斷出現(xiàn)更多“令人振奮”的底層能力創(chuàng)新和應用場景創(chuàng)新!
對于普通人來說,相信不少人都已經(jīng)試用了DeepSeek的創(chuàng)意作詩、寫文案、實事點評這些熱門功能。發(fā)現(xiàn)ai技術的產(chǎn)出確實“文采橫溢”,甚至達到“以假亂真”的效果,很多ai文稿的質(zhì)量已經(jīng)超過了大多數(shù)普通文字工作者的水平。
與此同時,DeepSeek在寫代碼方面的能力,也幾乎可以替代一般的程序員——只需要把產(chǎn)品需求描述清晰,立刻就能生成可以直接運行的穩(wěn)定代碼案例。
難得一個ai產(chǎn)品一經(jīng)發(fā)布,同時讓文科生、理科生都同時焦慮了!似乎未來大多數(shù)的職業(yè)都在逐漸被ai替代。
有人說,ai降低了一個行業(yè)的門檻,因為誰都可以用大模型創(chuàng)作;也有人覺得,其實是提高了門檻,因為如果無法證明人比ai強,企業(yè)就沒有動力去雇傭所謂“資質(zhì)平平”的員工。
智能化技術的進步,讓人們開始反思什么才是真正的職場競爭力 —— 是業(yè)務經(jīng)驗、是創(chuàng)新能力,是溝通能力,是情緒價值,而不是循規(guī)蹈矩、墨守成規(guī)。
幾乎所有標準化的工作,都可以用大模型復現(xiàn)。以前是規(guī)章條例、文案模板、技術公式,現(xiàn)在還包括解決問題的方式方法。
當試用DeepSeek時,你會發(fā)現(xiàn)在提出一個開放式任務時,它會很快地告訴你如何科學地、有條不紊地對這個任務進行分解,然后逐步給出細節(jié)步驟指導。
然而,這是基于大數(shù)據(jù)提煉總結(jié)得到的常規(guī)性手段和策略,盡管做到這一點已經(jīng)超越了80%的行業(yè)從業(yè)者。這也就是為什么所謂萬金油的咨詢行業(yè),開始面臨市場寒冬 ...
ai對于垂直行業(yè)的替代過程仍然是漫長的。因為光有標準化的“解題思路”還不夠,還缺少業(yè)務內(nèi)容 ...
這需要更多的業(yè)務數(shù)據(jù)投喂,以及不同領域?qū)<以诰唧wai應用場景中通過與機器交互產(chǎn)生的增量信息對模型能力進行矯正。
需要注意的是,在一個動態(tài)、多變、復雜的市場環(huán)境中,絕大多數(shù)業(yè)務問題是非標準化、隨機性強、無先驗案例的(少樣本或零樣本) ...
這也就是為什么很多ai工具看起來輸出形式很爽,業(yè)務方卻覺得隔靴搔癢 ...
ai很有用,但人不能完全依賴于ai —— 使用ai的人的認知和業(yè)務能力,決定ai工具的效果上限。
即便在業(yè)務決策過程中能使用類似DeepSeek一類的大模型工具輔助完成,也是需要根據(jù)具體情況來適配,加入專家的行業(yè)洞察與經(jīng)驗預判。
這個過程就像炒菜一樣,機器只能搞定前面食材準備的工作,至于最后烹飪的火候、調(diào)料配比,也只有“主廚”(人)才能心領神會。
這也是人難以被替代的環(huán)節(jié)!大模型技術會讓普通人更普通,強者更強 ...
當機器變得越來越像人,那么對于絕大多數(shù)普通人來說,只有不斷學習和成長,努力讓自己的能力體系盡可能地與機器產(chǎn)生差異,才能證明自己的職場稀缺性與獨特的社會價值!