自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<big id="6vwbb"></big>

<cite id="6vwbb"><rp id="6vwbb"></rp></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一

發(fā)布于 2024-5-7 13:32

瀏覽

0收藏

最新國(guó)產(chǎn)開源MoE大模型，剛剛亮相就火了。

DeepSeek-V2性能達(dá)GPT-4級(jí)別，但開源、可免費(fèi)商用、API價(jià)格僅為GPT-4-Turbo的百分之一。

因此一經(jīng)發(fā)布，立馬引發(fā)不小討論。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

從公布的性能指標(biāo)來看，DeepSeek-V2的中文綜合能力超越一眾開源模型，并和GPT-4-Turbo、文心4.0等閉源模型同處第一梯隊(duì)。

英文綜合能力也和LLaMA3-70B同處第一梯隊(duì)，并且超過了同是MoE的Mixtral 8x22B。

在知識(shí)、數(shù)學(xué)、推理、編程等方面也表現(xiàn)出不錯(cuò)性能。并支持128K上下文。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

這些能力，普通用戶都能直接免費(fèi)使用?，F(xiàn)在內(nèi)測(cè)已開啟，注冊(cè)后立馬就能體驗(yàn)。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

API更是是骨折價(jià)：每百萬tokens輸入1元、輸出2元（32K上下文）。價(jià)格僅為GPT-4-Turbo的近百分之一。

同時(shí)在模型架構(gòu)也進(jìn)行創(chuàng)新，采用了自研的MLA（Multi-head Latent Attention）和Sparse結(jié)構(gòu)，可大幅減少模型計(jì)算量、推理顯存。

網(wǎng)友感嘆：DeepSeek總是給人帶來驚喜！

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

具體效果如何，我們已搶先體驗(yàn)！

實(shí)測(cè)一下

目前V2內(nèi)測(cè)版可以體驗(yàn)通用對(duì)話和代碼助手。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

在通用對(duì)話中可以測(cè)試大模型的邏輯、知識(shí)、生成、數(shù)學(xué)等能力。

比如可以要求它模仿《甄嬛傳》的文風(fēng)寫口紅種草文案。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

還可以通俗解釋什么是量子糾纏。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

數(shù)學(xué)方面，能回答高數(shù)微積分問題，比如：

使用微積分證明自然對(duì)數(shù)的底e 的無窮級(jí)數(shù)表示。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

也能規(guī)避掉一些語言邏輯陷阱。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

測(cè)試顯示，DeepSeek-V2的知識(shí)內(nèi)容更新到2023年。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

代碼方面，內(nèi)測(cè)頁面顯示是使用DeepSeek-Coder-33B回答問題。

在生成較簡(jiǎn)單代碼上，實(shí)測(cè)幾次都沒有出錯(cuò)。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

也能針對(duì)給出的代碼做出解釋和分析。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

不過測(cè)試中也有回答錯(cuò)誤的情況。

如下邏輯題目，DeepSeek-V2在計(jì)算過程中，錯(cuò)誤將一支蠟燭從兩端同時(shí)點(diǎn)燃、燃燒完的時(shí)間，計(jì)算成了從一端點(diǎn)燃燒完的四分之一。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

帶來哪些升級(jí)？

據(jù)官方介紹，DeepSeek-V2以236B總參數(shù)、21B激活，大致達(dá)到70B~110B Dense的模型能力。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

和此前的DeepSeek 67B相比，它的性能更強(qiáng)，同時(shí)訓(xùn)練成本更低，可節(jié)省42.5%訓(xùn)練成本，減少93.3%的KV緩存，最大吞吐量提高到5.76倍。

官方表示這意味著DeepSeek-V2消耗的顯存（KV Cache）只有同級(jí)別Dense模型的1/5~1/100，每token成本大幅降低。

專門針對(duì)H800規(guī)格做了大量通訊優(yōu)化，實(shí)際部署在8卡H800機(jī)器上，輸入吞吐量超過每秒10萬tokens，輸出超過每秒5萬tokens。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

在一些基礎(chǔ)Benchmark上，DeepSeek-V2基礎(chǔ)模型表現(xiàn)如下：

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

DeepSeek-V2 采用了創(chuàng)新的架構(gòu)。

提出MLA（Multi-head Latent Attention）架構(gòu)，大幅減少計(jì)算量和推理顯存。

同時(shí)自研了Sparse結(jié)構(gòu)，使其計(jì)算量進(jìn)一步降低。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

有人就表示，這些升級(jí)對(duì)于數(shù)據(jù)中心大型計(jì)算可能非常有幫助。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

而且在API定價(jià)上，DeepSeek-V2幾乎低于市面上所有明星大模型。

國(guó)產(chǎn)開源MoE指標(biāo)炸裂：GPT-4級(jí)別能力，API價(jià)格僅百分之一-AI.x社區(qū)

團(tuán)隊(duì)表示，DeepSeek-V2模型和論文也將完全開源。模型權(quán)重、技術(shù)報(bào)告都給出。

現(xiàn)在登錄DeepSeek API開放平臺(tái)，注冊(cè)即贈(zèng)送1000萬輸入/500萬輸出Tokens。普通試玩則完全免費(fèi)。

感興趣的童鞋，可以來薅羊毛了~

體驗(yàn)地址：??https://chat.deepseek.com???
API平臺(tái)：
platform.deepseek.com

GitHub：???https://github.com/deepseek-ai/DeepSeek-V2?tab=readme-ov-file??

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/UIZEjY908gP7B4osWoOLgw??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

港中文深圳提出ALLaVA-4V：百萬級(jí)別的開源多模態(tài)GPT-4V數(shù)據(jù)集

kcoufee ? 2252瀏覽 ? 0回復(fù)
開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star

輕薄滴假象 ? 3639瀏覽 ? 0回復(fù)
首個(gè)開源世界模型！百萬級(jí)上下文，長(zhǎng)視頻理解吊打GPT-4，UC伯克利華人一作

duhorse ? 2943瀏覽 ? 0回復(fù)
超越GPT-4！最強(qiáng)大模型 Claude 3 完全解讀

開發(fā)者阿橙 ? 5733瀏覽 ? 0回復(fù)
GPT-4 Turbo更新：視覺能力+無限制使用

echo_ning ? 3770瀏覽 ? 0回復(fù)
開源社區(qū)再次沸騰：GPT-4級(jí)別模型可以自由訪問的時(shí)代到來

Crystalcxt ? 2882瀏覽 ? 0回復(fù)
Meta 發(fā)布Llama 3，能力直逼GPT-4,一己之力拉高開源大模型水位

51CTO技術(shù)棧 ? 3904瀏覽 ? 0回復(fù)
6成企業(yè)擬采用AI，投入生產(chǎn)的僅占其中三分之一；OpenAI穩(wěn)坐王位；

51CTO技術(shù)棧 ? 2199瀏覽 ? 0回復(fù)
GPT-4（o）免費(fèi)試用體驗(yàn)，看看它的設(shè)計(jì)方案能力—關(guān)于ROCE網(wǎng)卡方案

parson2000 ? 2782瀏覽 ? 0回復(fù)
OpenAI開源GPT-4 SAE，提供1600萬個(gè)解釋模式

Aceryt ? 3758瀏覽 ? 0回復(fù)
誰是OpenAI API最佳“平替”？國(guó)產(chǎn)大模型八仙過海，拼價(jià)格拼速度拼服務(wù)，誰能贏得用戶選擇？

51CTO技術(shù)棧 ? 3363瀏覽 ? 0回復(fù)
8B尺寸達(dá)到GPT-4級(jí)性能！北大等提出醫(yī)療專家模型訓(xùn)練方法

duhorse ? 2027瀏覽 ? 0回復(fù)
OpenAI正式打響海外價(jià)格戰(zhàn)，GPT-4o mini成地表最強(qiáng)小模型，百萬tokens僅需60美分

InfonityAI智推星 ? 2734瀏覽 ? 0回復(fù)
長(zhǎng)上下文能力只是吹牛？最強(qiáng)GPT-4o正確率僅55.8%，開源模型不如瞎蒙

duhorse ? 2756瀏覽 ? 0回復(fù)
清華大學(xué)最新發(fā)布：統(tǒng)一時(shí)序預(yù)測(cè)模型，上下文長(zhǎng)度首次擴(kuò)展至千級(jí)別，適用各類數(shù)據(jù)集

海因斯DK ? 3153瀏覽 ? 0回復(fù)
GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理

lintoms ? 1659瀏覽 ? 0回復(fù)
關(guān)于大模型的幻覺問題，大模型有可能做到百分之百的準(zhǔn)確率嗎？

AI探索時(shí)代 ? 1977瀏覽 ? 0回復(fù)
GPT-4價(jià)格已被砍成1/150 !OpenAI副總裁回應(yīng)DeepSeek的競(jìng)爭(zhēng)，揭秘內(nèi)部員工花式使用自家產(chǎn)品，有很多工程難題

51CTO技術(shù)棧 ? 1601瀏覽 ? 0回復(fù)
智譜AI開源6款模型，推理速度200 tokens/秒碾壓競(jìng)品，價(jià)格僅1/30！

AI博物院 ? 1615瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開辟分形圖像生成新范式！計(jì)算效率提高4000倍，首次實(shí)現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達(dá)摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：全新神經(jīng)網(wǎng)絡(luò)架構(gòu)KAN一夜爆火！200參數(shù)頂30萬，MIT華人一作，輕松復(fù)現(xiàn)Nature封面AI數(shù)學(xué)研究

下一篇： OpenAI神秘gpt2正在A/B測(cè)試，奧特曼搶先劇透，網(wǎng)友已玩嗨

社區(qū)精華內(nèi)容

目錄

<cite id="kxaoe"></cite><blockquote id="kxaoe"><i id="kxaoe"></i></blockquote>