自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

推理模型+Multi-Agent,可能就是Deep Research的全貌!

發(fā)布于 2025-2-25 13:17
瀏覽
0收藏

繼谷歌、OpenAI和Perplexity相繼發(fā)布各自的Deep Research后,牛津大學(xué)發(fā)布了一個(gè) “Agentic Reasoning: Reasoning LLMs with Tools for the Deep Research”的工作,并且代碼開源了,今天咱們來詳細(xì)看看他們的 deepresearch 的玩法!

這個(gè)框架,不僅在PhD級(jí)別的科學(xué)推理測(cè)試(GPQA)上超越了現(xiàn)有的RAG系統(tǒng)和閉源大模型, 而且在金融、醫(yī)療和法律等領(lǐng)域的深度研究任務(wù)中,擊敗了谷歌的Gemini Deep Research!

為什么能做到這一點(diǎn)?

普通的推理模型只能依賴自身知識(shí),或者聯(lián)網(wǎng)的上下文知識(shí),進(jìn)行長(zhǎng)時(shí)間思考推理,最后做出回應(yīng)。而推理模型的思考過程,如果能調(diào)用工具來輔助推理,那必須是事半功倍。

Agentic Reasoning來了,它模仿了人解決復(fù)雜問題的方式。 通過互聯(lián)網(wǎng)收集信息、用計(jì)算工具進(jìn)行定量分析、在白板上組織思路。

所以他們定制了3個(gè)核心智能體:

  • Web搜索智能體:負(fù)責(zé)從互聯(lián)網(wǎng)獲取信息
  • 代碼智能體:使用Python進(jìn)行計(jì)算分析
  • "思維導(dǎo)圖"記憶智能體:構(gòu)建基于推理上下文的知識(shí)圖譜 (trick,后面細(xì)說)

對(duì)復(fù)雜問題的工具調(diào)用推理過程,本身可以很好的跟推理大模型的思考過程融合到一起!

推理模型+Multi-Agent,可能就是Deep Research的全貌!-AI.x社區(qū)

推理大模型進(jìn)行正常的推理,根據(jù)任務(wù)需求自行實(shí)時(shí)決定是否需要其他信息。(生成相應(yīng)的token即可,工具調(diào)用完成,可以把結(jié)果整合回推理鏈中)。

經(jīng)過過長(zhǎng)的思維鏈+外部知識(shí)(web,code),思維鏈可能會(huì)變得很混亂,所以這個(gè)框架引入了一個(gè)MindMap智能體。這個(gè)智能體可以將原始的推理鏈轉(zhuǎn)換為一個(gè)結(jié)構(gòu)化的知識(shí)圖譜(這個(gè)工作直接把graphrag搬過來了,實(shí)體抽取->構(gòu)建社區(qū)->抽象社區(qū)摘要)。

推理模型+Multi-Agent,可能就是Deep Research的全貌!-AI.x社區(qū)

一些發(fā)現(xiàn)!

分工的重要性

讓不同的LLM專注于各自擅長(zhǎng)的任務(wù)(如DeepSeek-R1負(fù)責(zé)推理,Claude-Sonnet負(fù)責(zé)編程),能顯著提升整體表現(xiàn)。

推理模型+Multi-Agent,可能就是Deep Research的全貌!-AI.x社區(qū)

少即是多

僅使用少量智能體工具反而能獲得最佳效果。增加更多工具反而會(huì)增加選擇錯(cuò)誤的風(fēng)險(xiǎn)。

推理模型+Multi-Agent,可能就是Deep Research的全貌!-AI.x社區(qū)

工具使用與準(zhǔn)確性

對(duì)單個(gè)問題而言,使用更多工具通常能帶來更好的推理結(jié)果。但是如果跨問題都需要頻繁調(diào)用工具,可能意味著初始推理軌跡存在缺陷。

推理模型+Multi-Agent,可能就是Deep Research的全貌!-AI.x社區(qū)

項(xiàng)目開源地址:https://github.com/theworldofagents/Agentic-Reasoning

框架的表現(xiàn),在幾個(gè)領(lǐng)域大幅超越 Google DeepResearch效果。甚至超越了各個(gè)領(lǐng)域的人類專家。在一些需要20分鐘以上的深度研究問題上,也表現(xiàn)優(yōu)異。

推理模型+Multi-Agent,可能就是Deep Research的全貌!-AI.x社區(qū)

本文轉(zhuǎn)載自 ??探索AGI??,作者: 獼猴桃

標(biāo)簽
已于2025-2-25 13:44:19修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦