自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！

發(fā)布于 2024-7-26 13:14

瀏覽

0收藏

Meta的Llama-3.1再經(jīng)歷過泄露、再泄露事件，醞釀了幾天，終于在2024.7.23最后十幾分鐘發(fā)布了，包括8B、70B、405B三個尺寸：

Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！-AI.x社區(qū)

Llama-3.1系列模型特點

Llama 3.1 是一個自回歸語言模型，使用優(yōu)化的變換器架構(gòu)。調(diào)整版本使用監(jiān)督式微調(diào)（SFT）和基于人類反饋的強化學習（RLHF）以符合人類對有用性和安全性的偏好。
提供 8B、70B 和 405B 三種大小的模型。
預(yù)訓(xùn)練數(shù)據(jù)來自公開可用的在線數(shù)據(jù)，微調(diào)數(shù)據(jù)包括公開可用的指令數(shù)據(jù)集以及超過 2500 萬個合成生成的示例。
支持英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。
支持多語言文本輸入和輸出，以及代碼。
上下文長度為 128k。
知識截止日期為 2023 年 12 月。

Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！-AI.x社區(qū)

Llama-3.1-405B模型效果評測，整體效果是超過GPT-4與GPT-4 Omni，效果媲美Claude 3.5 Sonnet。

Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！-AI.x社區(qū)

Llama-3.1垂直場景的效果展示：推理、編碼、數(shù)學、工具使用（Tool Use）。

Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！-AI.x社區(qū)

此次發(fā)布，大家最關(guān)系當屬405B，這是此前Llama-3中未發(fā)布的尺寸，那么這么大參數(shù)模型，需要多大的機器能run起來尼？

Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！-AI.x社區(qū)

FP16大概需要8*H200 GPUs（1053G）
FP8大概需要8*H100 GPUs （526G）
FP4大概需要263G

Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！-AI.x社區(qū)

下載地址：https://hf-mirror.com/collections/meta-llama/llama-31-669fc079a0c406a149a5738f

本文轉(zhuǎn)載自 ??PaperAgent?? ，作者： PaperAgent

標簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

Llama 3超大杯有何驚喜？Meta會一直開源嗎？當初為何篤信元宇宙？扎克伯格新訪談回應(yīng)一切

輕薄滴假象 ? 2231瀏覽 ? 0回復(fù)
最強模型Llama 3.1 405B正式發(fā)布，扎克伯格：開源引領(lǐng)新時代

輕薄滴假象 ? 2199瀏覽 ? 0回復(fù)
Meta 開源最強大模型Llama 3.1，參數(shù)多達 405B，超16000塊H100訓(xùn)練，燃燒數(shù)億經(jīng)費！小扎：堅定開源不動搖！

51CTO技術(shù)棧 ? 3735瀏覽 ? 0回復(fù)
最強大模型 Llama 3.1-405B 架構(gòu)設(shè)計剖析

玄姐聊AGI ? 2847瀏覽 ? 0回復(fù)
解析Llama 3.1 與Meta 的 AI 戰(zhàn)略，以及新的開放前沿模型生態(tài)系統(tǒng)

lintoms ? 2234瀏覽 ? 0回復(fù)
Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時代將迎來結(jié)束？

NLP工作站 ? 2218瀏覽 ? 0回復(fù)
ViT篇外：NVIDIA Llama-3.1-Minitron 4B

魯班模錘1 ? 2253瀏覽 ? 0回復(fù)
阿里史上最大規(guī)模開源發(fā)布，超GPT-4o 、Llama-3.1！

Aceryt ? 2083瀏覽 ? 0回復(fù)
Llama3.2開源：Meta發(fā)布1B和3B端側(cè)模型、11B和90B多模態(tài)模型

NLP工作站 ? 4052瀏覽 ? 0回復(fù)
開源通用、編碼、數(shù)學模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 4802瀏覽 ? 0回復(fù)
開源通用、編碼、數(shù)學模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 4022瀏覽 ? 0回復(fù)
從 Llama 1 到 3.1：Llama 模型架構(gòu)演進詳解

Baihai_IDP ? 3902瀏覽 ? 0回復(fù)
Llama 3.1 70B AQLM-PV版發(fā)布！大模型壓縮后可在24GB顯存GPU上本地運行??！

老蛀蟲 ? 2431瀏覽 ? 0回復(fù)
Dolphin 3.0 發(fā)布（Llama 3.1 + 3.2 + Qwen 2.5）：本地優(yōu)先、可操縱的 AI 模型

Halo咯咯 ? 2031瀏覽 ? 0回復(fù)
Good Fire AI 針對 Llama 3.1 8B 和 Llama 3.3 70B 的開源稀疏自動編碼器 (SAE)

Halo咯咯 ? 1581瀏覽 ? 0回復(fù)
1B模型如何通過測試時優(yōu)化逆襲405B LLM？

arnoldzhw ? 1645瀏覽 ? 0回復(fù)
Llama 4 凌晨震撼發(fā)布：Meta開源最強MoE多模態(tài)模型，1000萬上下文碾壓行業(yè)！

AI博物院 ? 1180瀏覽 ? 0回復(fù)
LLaMA 4來了 | 千呼萬喚始出來，猶抱琵琶半遮面 | 不盡如人意

后向傳播 ? 1080瀏覽 ? 0回復(fù)
NVIDIA開源Llama-3.1-Nemotron-Ultra-253B-v1，性能直逼DeepSeek

Halo咯咯 ? 956瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？ 9天前發(fā)布
CPU推理僅29ms，微軟開源第一個原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15 9天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： GraphRAG項目雨后春筍般涌現(xiàn)！

下一篇：百度也來卷RAG了，Self-Reasoning比Self-RAG最高提升11.8%

社區(qū)精華內(nèi)容

目錄