自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線(xiàn)教育平臺(tái)

Grok多模態(tài)大模型Grok-1.5V來(lái)了！原創(chuàng)

AIGC最前線(xiàn)

發(fā)布于 2024-4-15 14:55

瀏覽

0收藏

Grok-1.5V是下xAI第一代多模態(tài)大模型，除了其強(qiáng)大的文本能力外，Grok現(xiàn)在還可以處理各種各樣的視覺(jué)信息，包括文檔、圖表、示意圖、截圖和照片。Grok-1.5V即將提供給早期測(cè)試人員和現(xiàn)有的Grok用戶(hù)使用。

能力

Grok-1.5V在多個(gè)領(lǐng)域與現(xiàn)有多模態(tài)大模型具有競(jìng)爭(zhēng)力，從多學(xué)科推理到理解文檔、科學(xué)圖表、截圖和照片。Grok在新RealWorldQA基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，該測(cè)試衡量了對(duì)現(xiàn)實(shí)世界空間理解的能力。對(duì)于下面的所有數(shù)據(jù)集，在零提示的情況下評(píng)估Grok，不使用思維鏈的提示。

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

示例1：看圖表寫(xiě)代碼

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

示例2：計(jì)算卡路里

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

示例3：從一幅圖畫(huà)到一個(gè)睡前故事

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

示例4：解釋一個(gè)網(wǎng)絡(luò)迷因

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

示例5：將表格轉(zhuǎn)換為 CSV 格式

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

示例6：幫助處理露臺(tái)上腐爛的木材

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

示例7：解決編程問(wèn)題

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

實(shí)現(xiàn)真實(shí)世界理解

為了開(kāi)發(fā)出有用的真實(shí)世界人工智能助手，提升模型對(duì)物理世界的理解至關(guān)重要。為了實(shí)現(xiàn)這一目標(biāo)，研究人員引入了一個(gè)新的基準(zhǔn)測(cè)試，RealWorldQA。該基準(zhǔn)旨在評(píng)估多模式模型的基本真實(shí)世界空間理解能力。盡管當(dāng)前基準(zhǔn)測(cè)試中的許多示例對(duì)人類(lèi)來(lái)說(shuō)相對(duì)容易，但它們常常對(duì)前沿模型構(gòu)成挑戰(zhàn)。

Grok多模態(tài)大模型Grok-1.5V來(lái)了！-AI.x社區(qū)

RealWorldQA的初始發(fā)布包含超過(guò)700張圖像，每張圖像都附帶一個(gè)問(wèn)題和易于驗(yàn)證的答案。該數(shù)據(jù)集包含了從車(chē)輛中獲取的匿名圖像，以及其他真實(shí)世界的圖像。后續(xù)xAI將隨著多模態(tài)模型的改進(jìn)而擴(kuò)展它。RealWorldQA在CC BY-ND 4.0下發(fā)布。

譯自(有刪改)：https://x.ai/blog/grok-1.5v

什么是Grok？

Grok是由xAI開(kāi)發(fā)的生成式人工智能聊天機(jī)器人，基于大語(yǔ)言模型（LLM）。它是由埃隆·馬斯克發(fā)起的一項(xiàng)倡議，作為對(duì)OpenAI的ChatGPT的直接回應(yīng)而開(kāi)發(fā)的，而馬斯克是ChatGPT的聯(lián)合創(chuàng)始人之一。該聊天機(jī)器人被宣傳為“具有幽默感”，并直接接入Twitter（X）。

時(shí)間線(xiàn)

2024年3月11日，馬斯克在X上發(fā)布消息稱(chēng)語(yǔ)言模型將在一周內(nèi)開(kāi)源，六天后，即3月17日，Grok開(kāi)始開(kāi)源。
2024年3月17日，Grok-1以Apache-2.0許可證的形式開(kāi)源。
2024年3月26日，馬斯克宣布Grok將對(duì)所有高級(jí)訂閱用戶(hù)開(kāi)放，而不僅僅是高端層級(jí)的Premium+。
3月29日，Grok-1.5發(fā)布，具有“改進(jìn)的推理能力”和128,000個(gè)token的上下文長(zhǎng)度。

本文轉(zhuǎn)載自公眾號(hào)AIGC最前線(xiàn)

原文鏈接：??https://mp.weixin.qq.com/s/-EAuLUPqWVjbyaKgizL7vA??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

多模態(tài)大模型

已于2024-4-16 10:14:44修改

贊 1

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

馬斯克的 Grok AI 開(kāi)源

jiecho ? 5921瀏覽 ? 0回復(fù)
最強(qiáng)開(kāi)源大模型易主，號(hào)稱(chēng)超過(guò)Llama 2、Mixtral、Grok-1的DBRX是什么？

liutao988 ? 3277瀏覽 ? 0回復(fù)
超越GPT-4V，蘋(píng)果多模態(tài)大模型上新！

duhorse ? 2314瀏覽 ? 0回復(fù)
革新GUI自動(dòng)化：V-Zen模型引領(lǐng)多模態(tài)語(yǔ)言模型新紀(jì)元

AI論文解讀 ? 2850瀏覽 ? 0回復(fù)
多模態(tài)CoT思維鏈架構(gòu)來(lái)了，現(xiàn)已開(kāi)源｜來(lái)自廈大&騰訊優(yōu)圖

Crystalcxt ? 3004瀏覽 ? 0回復(fù)
什么是多模態(tài)大模型？為什么需要多模態(tài)大模型？

AI探索時(shí)代 ? 4439瀏覽 ? 0回復(fù)
馬斯克突發(fā)新版大模型，犧牲特斯拉資源叫板OpenAI，Grok-2一手實(shí)測(cè)來(lái)了

Crystalcxt ? 1806瀏覽 ? 0回復(fù)
多模態(tài)與偽多模態(tài)大模型

AI探索時(shí)代 ? 2159瀏覽 ? 0回復(fù)
多模態(tài)大模型最全綜述導(dǎo)讀

shizhi02 ? 2587瀏覽 ? 0回復(fù)
多模態(tài)大模型：基礎(chǔ)架構(gòu)

魯班模錘1 ? 2103瀏覽 ? 0回復(fù)
什么是多模態(tài)大模型

AI探索時(shí)代 ? 2726瀏覽 ? 0回復(fù)
多模態(tài)大模型數(shù)據(jù)構(gòu)造方法

shizhi02 ? 2436瀏覽 ? 0回復(fù)
Jina CLIP v2：為多模態(tài)RAG設(shè)計(jì)的向量模型

kede96 ? 2986瀏覽 ? 0回復(fù)
說(shuō)好年底推出的“重大飛躍”的Grok 3，遲遲未現(xiàn)身！

51CTO技術(shù)棧 ? 1823瀏覽 ? 0回復(fù)
大語(yǔ)言模型都有哪些特質(zhì)？區(qū)分度達(dá)97%！DeepSeek&ChatGPT&Claude&Grok&Gemini

angel ? 1910瀏覽 ? 0回復(fù)
xAI 發(fā)布地表最強(qiáng)大模型Grok 3，同時(shí)宣布將開(kāi)源Grok2

Syrupup ? 1537瀏覽 ? 0回復(fù)
Grok 3 與 DeepSeek-R1 是怎么學(xué)會(huì)思考的？

機(jī)器學(xué)習(xí)與數(shù)學(xué) ? 2865瀏覽 ? 0回復(fù)
2025年最值得關(guān)注的十大多模態(tài)大語(yǔ)言模型！

Halo咯咯 ? 1669瀏覽 ? 0回復(fù)
字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.5

Aceryt ? 970瀏覽 ? 0回復(fù)

AIGC最前線(xiàn)

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

預(yù)測(cè)未來(lái)模型能力！微調(diào)揭示LLM涌現(xiàn)能力的關(guān)鍵 2024-12-09 09:10:30發(fā)布
預(yù)測(cè)未來(lái)模型能力！微調(diào)揭示LLM涌現(xiàn)能力的關(guān)鍵 2024-12-03 15:46:55發(fā)布

熱門(mén)推薦

大半精銳盡出！o1下線(xiàn)！滿(mǎn)血o3之后，模型本身就是Manus，最大賣(mài)點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門(mén)到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專(zhuān)屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： Meta推出開(kāi)放世界具身問(wèn)答數(shù)據(jù)集OpenEQA：視覺(jué)大模型在具身智能上還有很長(zhǎng)的路要走！

下一篇：好奇心驅(qū)使的自動(dòng)紅隊(duì)測(cè)試：MIT學(xué)者教你如何讓大模型避免產(chǎn)生仇恨或有害的輸出

社區(qū)精華內(nèi)容

目錄

<cite id="yrbo6"><rp id="yrbo6"></rp></cite>

<style id="yrbo6"><rp id="yrbo6"></rp></style>