DeepSeek 火爆了,主打高性能低價(jià)格!
大家好,我是君哥。春節(jié)快樂!
春節(jié)這幾天,DeepSeek 可以說是火爆了,鋪天蓋地都是 DeepSeek 的報(bào)道。今天,我們一起學(xué)習(xí)一下 DeepSeek。
1.DeepSeek 是什么?
下面是 DeepSeek 給出的回答:
圖片
可以看到,DeepSeek 成立時(shí)間并不長(zhǎng),但是成績(jī)真的很好。
2.DeepSeek 為什么牛?
DeepSeek 橫空出世,一下子受到全球關(guān)注,1 月 27 日美股閃崩,AI 第一股英偉達(dá)最高跌幅達(dá) 17%,國(guó)內(nèi) AI 用戶這個(gè)春節(jié)都在體驗(yàn) DeepSeek,DeepSeek 服務(wù)器甚至卡到宕機(jī)。這到底是什么力量在推動(dòng)呢?
2.1 國(guó)產(chǎn)
國(guó)內(nèi)的 AI 用戶群體非常大,但我們使用 ChatGPT 并不方便,購(gòu)買賬號(hào),翻墻,經(jīng)常有被封號(hào)的危險(xiǎn)。
有了 DeepSeek,我們使用非常便捷,手機(jī)上下載一個(gè) APP,我們就可以使用 DeepSeek 的 AI 服務(wù)了。
2.2 便宜
ChatGPT o1 完成一次訓(xùn)練,成本要上億美刀,而 DeepSeek 完成一次訓(xùn)練只要不到 600 萬美刀。這真的太便宜了,成本低就是一個(gè)巨大的優(yōu)勢(shì)。
DeepSeek 成本優(yōu)勢(shì)大大超過了硅谷科技巨頭,所以英偉達(dá)股價(jià)大跌是可以理解的。
那 DeepSeek 給用戶的價(jià)格怎么樣呢?官網(wǎng)價(jià)格見下圖:
deepseek-chat 百萬 tokens 緩存命中的情況下,輸入價(jià)格只要 0.1 元人民幣,而知名的 Claude 3.5 百萬 tokens 輸入價(jià)格則需要 3 美元。這差距太大了。
2.3 技術(shù)優(yōu)勢(shì)
其實(shí),在 2022 年,中國(guó)已經(jīng)被美過禁止高端 GPU 的出口,這對(duì)國(guó)內(nèi)訓(xùn)練大模型是非常不利的。
DeepSeek 只能靠自主創(chuàng)新,研發(fā)出 DeepSeek-R1(智能助手,擅長(zhǎng)復(fù)雜推理與多輪對(duì)話)和 DeepSeek-V2(MoE混合專家模型,兼顧高性能與低成本)。
DeepSeek 大模型架構(gòu)則采用 MoE 技術(shù),較同類模型推理成本降低 80%,而且支持長(zhǎng)上下文。那什么是 MoE 架構(gòu)呢?我們看一下 DeepSeek 的回答:
圖片
總結(jié)一下,就是多個(gè)專家共同來回答一個(gè)問題,這個(gè)問題會(huì)根據(jù)領(lǐng)域知識(shí)分配不同的權(quán)重給各個(gè)專家,然后把每個(gè)專家的答案進(jìn)行匯總后輸出。
2.4 性能優(yōu)勢(shì)
DeepSeek 發(fā)布的 DeepSeek-R1 性能對(duì)標(biāo) OpenAI o1 正式版,這的確是一個(gè)了不起的成績(jī)。
圖片
2.5 開源
我們平時(shí)做 Java 應(yīng)用開發(fā),使用的框架多數(shù)是開源的,都很好用,生態(tài)也很完備。開源對(duì)生態(tài)的發(fā)展作用太大了。
一方面,開源可以讓更多優(yōu)秀的開發(fā)者加入進(jìn)來,貢獻(xiàn)自己的力量。另一方面,可以讓自己的開發(fā)人員釋放出來,更多地關(guān)注創(chuàng)新、方向等重要的事情,降低開發(fā)成本。
諷刺的是,從 ChatGPT 3.0 開始,“OpenAI” 變?yōu)榱?“CloseAI”,從開源變成閉源了。主要原因應(yīng)該還是訓(xùn)練模型的成本太高了,如果開源,自己付出的這些成本都免費(fèi)給了別人,要我自己負(fù)責(zé)這件事,可能也不太愿意開源。
但是 DeepSeek 不一樣,它的成本低了很多,選擇開源,正好可以彌補(bǔ)公司內(nèi)部研發(fā)資源有限的問題。相信 DeepSeek 的生態(tài)會(huì)很快發(fā)展起來,而且會(huì)發(fā)展很好。
當(dāng)然,可能有人會(huì)覺得 DeepSeek 如果開源了自己的大模型,怎么賺錢?
如果在公司用過阿里云的服務(wù),就會(huì)發(fā)現(xiàn),雖然好多技術(shù)是開源的,比如 Nacos,RocketMQ,但企業(yè)交的維護(hù)費(fèi)用并不低。比如定制化開發(fā)、技術(shù)問題支持等。只要 DeepSeek 把生態(tài)建立起來,提供企業(yè)級(jí)應(yīng)用,賺錢的途徑還是很多的。
3.是國(guó)運(yùn)級(jí)嗎?
《黑神話:悟空》制作人馮驥點(diǎn)評(píng) DeepSeek 是一款國(guó)運(yùn)級(jí)的科技成果,當(dāng)然 DeepSeek 官方還找到馮驥,建議對(duì)博文的措辭做一些修改。
看下 DeepSeek 的回答:
圖片
我覺得說 DeepSeek 是一款國(guó)運(yùn)級(jí)的科技成果,并不浮夸。當(dāng)下各個(gè)國(guó)家都在發(fā)力 AI,能早先實(shí)現(xiàn) AGI(通用人工智能),對(duì)國(guó)家各個(gè)領(lǐng)域都會(huì)有大的幫助,比如軍事、醫(yī)療、生物等
4.美國(guó)控訴?
1 月 27 日,Deepseek 應(yīng)用登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi) APP 下載排行榜,甚至在美區(qū)下載榜上超越了 ChatGPT。
這樣大的一個(gè)動(dòng)靜,美國(guó)肯定關(guān)注到了,何況他們都不過春節(jié)。
據(jù)參考消息援引美媒報(bào)道,美國(guó)海軍基于“潛在安全和道德問題”,已要求人員避免以任何形式使用 DeepSeek 模型。
美國(guó)多名官員回應(yīng) DeepSeek 對(duì)美國(guó)的影響,蔑稱 DeepSeek 是“偷竊”,正對(duì)其影響開展國(guó)家安全調(diào)查。
1月27日、1月28日,DeepSeek 官網(wǎng)顯示,其線上服務(wù)受到大規(guī)模惡意攻擊,奇安信安全專家透露攻擊 IP 均來自美國(guó)。
5.總結(jié)
無論如何,DeepSeek 在春節(jié)假期火爆了,它的發(fā)展值得更大期待。