自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="jt09y"></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-9-26 14:07

瀏覽

0收藏

起猛了！小扎又又又帶著他的開源大模型走來了！

Meta Connect 上，擁有視覺能力的 Llama 3.2推出！這是該大模型家族首個開源的多模態(tài)模型。

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū) 圖片

Llama 3.2 包括小型和中型模型（參數(shù)為 11B 億和 90B 億），以及更輕量化的僅文本模型（參數(shù)為 1B和 3B），扎克伯格稱其為“能運(yùn)行在設(shè)備上的最佳模型”，并透露未來將在眼鏡設(shè)備上使用。

與其前身一樣，Llama 3.2 的 1B 和 3B 模型支持 128K 的上下文長度，在端側(cè)模型中可謂遙遙領(lǐng)先。根據(jù)Meta透露，這些模型在發(fā)布當(dāng)天就已支持高通（Qualcomm）和聯(lián)發(fā)科（MediaTek）硬件，并針對 Arm 處理器進(jìn)行了優(yōu)化。

Meta 還首次分享了官方的 Llama stack 發(fā)行版本，以便開發(fā)者可以在各種環(huán)境中使用這些模型，包括本地、設(shè)備端、云端和單節(jié)點(diǎn)。

Llama 3.2 模型可以在 llama.com 和 Hugging Face 上以及 Meta 的合作平臺上下載。還能通過智能助手Meta AI，試用模型的多模態(tài)能力。

Hugging Face 地址：

??https://huggingface.co/meta-llama??

最后扎克伯格再次秀了一把開源情懷，他提到，閉源模型們試圖降低價格以保持與Llama的競爭優(yōu)勢。然而，“開源已經(jīng)是、并將繼續(xù)是最具成本效益、可定制、可信且高性能的選擇。我們已經(jīng)到達(dá)了行業(yè)的一個拐點(diǎn)，它開始成為行業(yè)標(biāo)準(zhǔn)，可以稱其為 AI 領(lǐng)域的 Linux?！?/p>

1.媲美GPT4o-mini，開源視覺模型火力十足

Meta 在兩個月前發(fā)布了 Llama 3.1，至今該模型已實(shí)現(xiàn) 10 倍的增長。

扎克伯格表示：“Llama 繼續(xù)快速進(jìn)步，它正在實(shí)現(xiàn)越來越多的功能?！?/p>

現(xiàn)在，最大的兩個 Llama 3.2 模型（110 億和 900 億參數(shù)）有了視覺能力，能夠理解圖表和圖形、為圖像生成標(biāo)題以及識別周圍的環(huán)境。例如，用戶可以詢問他們的公司在哪個月取得了最佳銷售成績，模型將基于現(xiàn)有的圖表推理出答案。

根據(jù)Meta的評估，Llama 3.2 視覺模型在圖像識別和一系列視覺理解任務(wù)上與領(lǐng)先的基礎(chǔ)模型 Claude 3 Haiku 和 GPT4o-mini 相媲美。

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū) 圖片

AI大神 Jim Fan 帶來了一手的新鮮實(shí)測，“我剛剛調(diào)出了 Llama-3.2-11B (vision) 的視覺語言基準(zhǔn)測試數(shù)據(jù)。令人驚訝的是，整個開源社區(qū)在輕量級模型方面并不落后！”

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū) 圖片

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū) 圖片

Llama 3.2的超強(qiáng)能力也讓許多大神自覺“手癢”。已經(jīng)有人連夜搓了基于其視覺能力的開源工具出來，效果驚艷，草圖也能秒變APP。

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū) 圖片

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū)

2.Llama 3.2：視覺模型背后的技術(shù)細(xì)節(jié)

作為首批支持視覺任務(wù)的 Llama 模型，11B 和 90B 模型采用了全新的模型架構(gòu)，以支持圖像推理任務(wù)。

Meta技術(shù)報告中提到，為了支持圖像輸入，他們訓(xùn)練了一組適配器權(quán)重，將預(yù)訓(xùn)練的圖像編碼器與預(yù)訓(xùn)練的語言模型集成。

該適配器由一系列交叉注意力層組成，將圖像編碼器的表示傳遞給語言模型。在適配器訓(xùn)練過程中，我們在圖文配對數(shù)據(jù)上訓(xùn)練，以對齊圖像表示和語言表示。適配器訓(xùn)練期間，我們更新了圖像編碼器的參數(shù)，但故意不更新語言模型的參數(shù)，這樣可以保留語言模型的文本處理能力，方便開發(fā)者將其作為 Llama 3.1 模型的替代品。

Llama 3.2的訓(xùn)練流程包括多個階段，從預(yù)訓(xùn)練的 Llama 3.1 文本模型開始。首先，Llama添加了圖像適配器和編碼器，然后在大規(guī)模噪聲圖文配對數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練。接著在中等規(guī)模、高質(zhì)量的領(lǐng)域內(nèi)及知識增強(qiáng)的圖文配對數(shù)據(jù)上進(jìn)行訓(xùn)練。

在后續(xù)訓(xùn)練中，Llama團(tuán)隊(duì)采用了與文本模型類似的方式，進(jìn)行多輪對齊，包括監(jiān)督微調(diào)、拒絕采樣和直接偏好優(yōu)化。

使用 Llama 3.1 模型對領(lǐng)域內(nèi)的圖像生成和擴(kuò)展問答，并利用獎勵模型對所有候選答案進(jìn)行排序，以提供高質(zhì)量的微調(diào)數(shù)據(jù)。此外，Llama 3.2還加入了安全防護(hù)數(shù)據(jù)，確保模型在安全性高的同時保持有用性。

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū)

3.小扎：Meta AI 將成為全球第一的智能助手

Llama 3.2 的橫空出世，使得 Meta AI 擁有了“聲音”。

該模型將在 WhatsApp、Messenger、Facebook 和 Instagram 上以明星語音響應(yīng)語音或文本命令。Meta AI 還可以對聊天中分享的照片做出回復(fù)，并添加、刪除或更改圖像以及添加新的背景。Meta 表示，它還在嘗試為 Meta AI 開發(fā)新的翻譯、視頻配音和唇同步工具。

小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！-AI.x社區(qū) 圖片

扎克伯格在演講中表示：“我認(rèn)為語音將比文本更自然地與 AI 進(jìn)行交互，它確實(shí)要好得多?！?/p>

扎克伯格開源的底氣，就在于他們的商業(yè)模式并不依靠獲得模型訪問權(quán)而營利，但是他已經(jīng)將應(yīng)用視為 Meta 的護(hù)城河。

現(xiàn)在，Meta AI 月活躍用戶接近5億，日活用戶也以突破4000萬大關(guān)。

扎克伯格吹噓說，Meta AI 正在成為全球使用最廣泛的助手——“可能已經(jīng)做到了?！?/p>

參考鏈接：https://venturebeat.com/ai/meta-llama-3-2-vision-models-to-rival-anthropic-openai/

本文轉(zhuǎn)載自??51CTO技術(shù)棧??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

Meta 發(fā)布Llama 3，能力直逼GPT-4,一己之力拉高開源大模型水位

51CTO技術(shù)棧 ? 3904瀏覽 ? 0回復(fù)
首個多模態(tài)視頻競技場Video-MME來了！Gemini全面超越GPT-4o，Jeff Dean連轉(zhuǎn)三次

duhorse ? 2427瀏覽 ? 0回復(fù)
OpenAI正式打響海外價格戰(zhàn)，GPT-4o mini成地表最強(qiáng)小模型，百萬tokens僅需60美分

InfonityAI智推星 ? 2734瀏覽 ? 0回復(fù)
最強(qiáng)模型Llama 3.1 405B正式發(fā)布，扎克伯格：開源引領(lǐng)新時代

輕薄滴假象 ? 2199瀏覽 ? 0回復(fù)
Meta 開源最強(qiáng)大模型Llama 3.1，參數(shù)多達(dá) 405B，超16000塊H100訓(xùn)練，燃燒數(shù)億經(jīng)費(fèi)！小扎：堅定開源不動搖！

51CTO技術(shù)棧 ? 3735瀏覽 ? 0回復(fù)
Llama-4使用10萬塊GPU訓(xùn)練、更好開源，扎克伯格親口確認(rèn)！

Aceryt ? 3149瀏覽 ? 0回復(fù)
Meta剛開源llama 3.2多模態(tài)，就被打敗了！

NLP前沿1 ? 2595瀏覽 ? 0回復(fù)
Meta開源多模態(tài)模型——Llama 3.2

Aceryt ? 2627瀏覽 ? 0回復(fù)
Llama 3.2 Vision & Molmo：多模態(tài)開源生態(tài)系統(tǒng)基礎(chǔ)

Baihai_IDP ? 2473瀏覽 ? 0回復(fù)
o1的風(fēng)又吹到多模態(tài)，直接吹翻了GPT-4o-mini

PaperAgent ? 2072瀏覽 ? 0回復(fù)
一夜小模型王座易主！英偉達(dá)發(fā)布超強(qiáng)小模型，性能、速率、緩存全面超越Llama3.2！

51CTO技術(shù)棧 ? 1744瀏覽 ? 0回復(fù)
微軟發(fā)布Phi-4，最強(qiáng)小模型！參數(shù)極小、超GPT-4o

Aceryt ? 1779瀏覽 ? 0回復(fù)
微軟開源最強(qiáng)小模型Phi-4，超GPT-4o、可商用

Aceryt ? 1915瀏覽 ? 0回復(fù)
Meta裁員5%，按績效末位淘汰！小扎：今年，AI開始干掉年薪百萬工程師

51CTO技術(shù)棧 ? 1930瀏覽 ? 0回復(fù)
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來

小虎哦哦 ? 1.4w瀏覽 ? 0回復(fù)
微軟Phi-4-Mini技術(shù)報告：Phi-4-Mini如何以小博大

sbf_2000 ? 2444瀏覽 ? 0回復(fù)
Manus橫空出世，AI自主Agent時代來了？

草臺AI ? 1842瀏覽 ? 0回復(fù)
Llama 4 凌晨震撼發(fā)布：Meta開源最強(qiáng)MoE多模態(tài)模型，1000萬上下文碾壓行業(yè)！

AI博物院 ? 1180瀏覽 ? 0回復(fù)
GPT-4.1深夜炸場！API專供的“開發(fā)者福音”，價格打下來了！小而強(qiáng)大，百萬token上下文，GPT-4.5尷尬了

51CTO技術(shù)棧 ? 911瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：字節(jié)憋大招，中國版Sora該有的樣子！

下一篇：兩款中國AI產(chǎn)品的“領(lǐng)跑”秘籍！

社區(qū)精華內(nèi)容

目錄

<cite id="wbtsr"></cite>

<cite id="wbtsr"></cite>

<wbr id="wbtsr"><strike id="wbtsr"><form id="wbtsr"></form></strike></wbr>