自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Meta開源用于數(shù)學(xué)等復(fù)雜推理AI Agent—HUSKY

發(fā)布于 2024-7-29 08:59
瀏覽
0收藏

Meta、華盛頓大學(xué)和阿倫AI實驗室的研究人員聯(lián)合開源了,專用于數(shù)學(xué)、表格等復(fù)雜推理的AI Agent—HUSKY。


與傳統(tǒng)AI Agent不同的是,HUSKY采用了一個統(tǒng)一的行動空間,無論是數(shù)值計算、表格分析還是基于知識的推理,都能夠通過一系列預(yù)定義的自動化行動來完成。這種統(tǒng)一性極大提升了AI Agent的泛化能力,使其能夠跨領(lǐng)域解決多種難題。


此外,HUSKY還使用了一種迭代推理的方法,通過在行動生成和執(zhí)行之間不斷迭代,可以像人類那樣分層次地拆解、解決難題,在處理超復(fù)雜任務(wù)時非常高效。


開源地址:https://github.com/agent-husky/Husky-v1

論文地址:https://arxiv.org/abs/2406.06469

Meta開源用于數(shù)學(xué)等復(fù)雜推理AI Agent—HUSKY-AI.x社區(qū)

行動生成相當(dāng)于HUSKY的“大腦”。在這一階段,行動生成器作為核心組件,承擔(dān)著預(yù)測任務(wù)解決過程中下一步行動的部署計劃。它接收輸入的問題和已有的解決方案歷史,通過精準(zhǔn)的預(yù)測,確定接下來需要采取的步驟和相應(yīng)的工具。


在預(yù)測過程中主要借鑒了GPT-4使用的"few-shot prompting"技術(shù),無需額外訓(xùn)練就能幫助HUSKY能夠通過少量示例快速學(xué)習(xí)并適應(yīng)新任務(wù)。

Meta開源用于數(shù)學(xué)等復(fù)雜推理AI Agent—HUSKY-AI.x社區(qū)

完成行動部署后,HUSKY便開始進入執(zhí)行階段,通過一些特定的專家模型來執(zhí)行具體任務(wù)。這些專家模型,包括代碼生成器、數(shù)學(xué)推理器、查詢生成器和常識推理器,分別對應(yīng)不同的業(yè)務(wù)需求,相當(dāng)于HUSKY的工具箱。


例如,當(dāng)面臨數(shù)值計算任務(wù)時,代碼生成器將生成代碼片段,由代碼解釋器執(zhí)行;而在需要檢索信息時,查詢生成器則生成搜索查詢,由搜索引擎執(zhí)行來獲取所需知識;需要執(zhí)行復(fù)雜的微積分、幾何、代數(shù)等復(fù)雜難題時,數(shù)學(xué)推理器便開始執(zhí)行。

Meta開源用于數(shù)學(xué)等復(fù)雜推理AI Agent—HUSKY-AI.x社區(qū)

HUSKY不僅體現(xiàn)在單個模塊的能力上,更在于模塊間的協(xié)調(diào)與合作。行動生成器需要理解問題需求,預(yù)測出合理的行動和工具使用順序;而專家模型則需精確執(zhí)行這些行動,并將結(jié)果反饋給行動生成器。這種緊密的協(xié)作是HUSKY解決復(fù)雜問題的關(guān)鍵。


也就是說,HUSKY的行動生成與執(zhí)行是一個不斷迭代、反饋的閉環(huán),在執(zhí)行的過程中協(xié)同工作,不斷生成和執(zhí)行行動,同時更新解決方案狀態(tài)。

Meta開源用于數(shù)學(xué)等復(fù)雜推理AI Agent—HUSKY-AI.x社區(qū)

這一迭代過程持續(xù)進行,直到行動生成器在解決方案歷史中識別出最終答案,HUSKY便達(dá)到終端狀態(tài)并返回最終結(jié)果。


研究人員對HUSKY在不同類型推理任務(wù)上的進行綜合測試,包括數(shù)值推理、表格推理、知識基礎(chǔ)推理以及混合工具推理任務(wù)等。


結(jié)果顯示,在數(shù)值推理任務(wù)中,HUSKY展現(xiàn)出了卓越的推理和泛化能力,成功處理了從基礎(chǔ)數(shù)學(xué)問題到高難度的競賽數(shù)學(xué)題,涵蓋了GSM-8K、MATH、Google DeepMind Mathematics和MathQA等數(shù)據(jù)集。

Meta開源用于數(shù)學(xué)等復(fù)雜推理AI Agent—HUSKY-AI.x社區(qū)

在表格推理任務(wù)中,HUSKY同樣表現(xiàn)出色。成功處理了TabMWP、FinQA、TAT-QA和MultimodalQA等數(shù)據(jù)集。在HotpotQA、CWQ、Musique、Bamboolge和StrategyQA等數(shù)據(jù)集上,HUSKY同樣展現(xiàn)了卓越的數(shù)據(jù)檢索和查詢能力。


本文轉(zhuǎn)自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)


原文鏈接:??https://mp.weixin.qq.com/s/5JFaIPLXhCfbih_Fj4Y5Ug?poc_token=HCXppmajfgH3au-3iiBhjHJE_d24l_yGJqI87sdK??

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦