自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="subjp"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

卷瘋了！開源社區(qū)離Openai o1越來越近~

發(fā)布于 2024-10-9 13:05

瀏覽

0收藏

小長假結(jié)束了~ 本來打算梳理一下假期的信息的，但是內(nèi)容有點多，放棄了~

今天這個標題對應假期的2個新聞。

思科的大佬，假期發(fā)了一篇medium博客，使用2個復雜數(shù)據(jù)集，進行了一系列模型的基準測試。
Blog: https://medium.com/@harishhacker3010/can-we-make-any-smaller-opensource-ai-models-smarter-than-human-1ea507e644a0
Prompt: https://gist.github.com/philschmid/34747bf5bc8280f3a5f10f5fd8d1cd4b
Github: https://github.com/harishsg993010/LLM-Research-Scripts

簡單總結(jié)

?? 結(jié)合動態(tài)思維鏈+反思+語言強化promp，以嚴格的學術(shù)測試為基準（JEE Advanced、UPSC、IMO、Putnam）
?? Claude 3.5 Sonnet 的性能優(yōu)于 GPT-4 和匹配的 O1 型號
?? LLMs可以創(chuàng)建內(nèi)部模擬并對復雜問題采取 50 多達推理步驟
?? 適用于較小的開源模型，如 Llama 3.1 8B +10%（Llama 3.1 8B 33/48 與 GPT-4o 36/48）
? 由于計算和預算限制，沒有像 MMLU、MMLU pro 或 GPQA 那樣進行基準測試
?? 高token使用量 - Claude Sonnet 3.5 僅 7 個問題就使用了大約 100 萬個令牌

open o1 項目

github: https://github.com/OpenSource-O1/Open-O1
space: https://huggingface.co/spaces/happzy2633/open-o1
hf: https://huggingface.co/O1-OPEN

Open-O1 項目，主要是期望對齊閉源 OpenAI O1 模型的強大功能，為社區(qū)提供先進的開源替代方案。通過精心篩選一組 O1 風格的思考數(shù)據(jù)來開發(fā)訓練，這些數(shù)據(jù)用于訓練 LLaMA 和 Qwen 模型。這種訓練方法賦予了較小的模型長期推理和解決問題的能力。

有一些初步的微調(diào)成果，但是看起來不太顯著，readme上有挺多不錯的輸出樣例。開源模型：https://huggingface.co/happzy2633/qwen2.5-7b-ins-v3/tree/main

卷瘋了！開源社區(qū)離Openai o1越來越近~-AI.x社區(qū)

本文轉(zhuǎn)載自 ??NLP前沿??，作者：熱愛AI的

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

2024年的百度大模型，離「錢」越來越近

liutao988 ? 2586瀏覽 ? 0回復
Open LLM集中爆發(fā)的一周，卷瘋了！

PaperAgent ? 2129瀏覽 ? 0回復
剛剛，OpenAI發(fā)布史上最強模型-o1，推理能力超人類博士！

Aceryt ? 2280瀏覽 ? 0回復
OpenAI o1很強，也能被玩壞！

PaperAgent ? 2200瀏覽 ? 0回復
OpenAI發(fā)布新模型：o1系列模型，更像理科生的模型

大語言模型論文跟蹤 ? 3858瀏覽 ? 0回復
使用 OpenAI o1 的五種方法「詳細指南」

51CTO技術(shù)棧 ? 5164瀏覽 ? 0回復
OpenAI o1推理模型基礎(chǔ)入門

51CTO內(nèi)容精選 ? 2148瀏覽 ? 0回復
草莓OpenAI o1的規(guī)劃能力怎么樣？泰斗Subbarao Kambhampati給你答案！

AIGC最前線 ? 2362瀏覽 ? 0回復
OpenAI o1：用內(nèi)部思維鏈進行復雜推理

shizhi02 ? 2282瀏覽 ? 0回復
擊敗GPT-4o、僅次于o1！英偉達重磅開源超強大模型--Nemotron

Aceryt ? 2989瀏覽 ? 0回復
向o1看齊，Google開源RAG推理擴展，提升近60%

NLP前沿1 ? 1816瀏覽 ? 0回復
OpenAI o1 模型到來后，談談提示詞工程的未來

Baihai_IDP ? 1955瀏覽 ? 0回復
Nature: LLM變得越來越像大腦

ceesoft ? 1892瀏覽 ? 0回復
開源版o1！中國大模型讓國外陷入瘋狂，成本猛降90%

Aceryt ? 2789瀏覽 ? 0回復
Kimi深夜炸場：滿血版多模態(tài)o1級推理模型！OpenAI外全球首次！Jim Fan：同天兩款國產(chǎn)o1絕對不是巧合！

51CTO技術(shù)棧 ? 1674瀏覽 ? 0回復
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來

小虎哦哦 ? 1.4w瀏覽 ? 0回復
DeepSeek R1 Vs OpenAI o1！全球頂級推理模型訓練技術(shù)對比大解密！

51CTO技術(shù)棧 ? 4693瀏覽 ? 0回復
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 1703瀏覽 ? 0回復
阿里扔出王炸：全球首個開源全模態(tài)大模型Qwen2.5-Omni：7B搞定看聽說寫，AI越來越像人了

算家計算 ? 1330瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

推理大模型并非一定要推理 7天前發(fā)布
llama 4，開源！ 2025-04-10 07:06:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇： Meta剛開源llama 3.2多模態(tài)，就被打敗了！

下一篇：現(xiàn)實再次給大模型帶來沉重打擊

社區(qū)精華內(nèi)容

目錄

<sup id="3byoy"><rt id="3byoy"></rt></sup><cite id="3byoy"></cite>