自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MetaGPT開源自動(dòng)生成智能體工作流,4.55%成本超GPT-4o

開源 人工智能
MetaGPT 開源了 AFLOW,它使用 MCTS 進(jìn)行 Agentic Workflow 的自動(dòng)搜索,可以完全自動(dòng)地構(gòu)建與優(yōu)化 Agentic Workflow 問題,讓我們不再需要手寫代碼、調(diào)試提示詞。

AFLOW 作者團(tuán)隊(duì)來(lái)自于 MetaGPT 開源社區(qū)。AFLOW 論文共同第一作者為香港科技大學(xué)(廣州)的博士生張佳釔和 DeepWisdom 研究員向勁宇,共同通訊作者為 DeepWisdom 創(chuàng)始人兼 CEO 吳承霖(MetaGPT 代碼作者、論文通訊作者)和香港科技大學(xué)(廣州)的助理教授駱昱宇。作者還包括中國(guó)人民大學(xué)的于兆洋、滕楓蔚和程信,南京大學(xué) LAMDA 實(shí)驗(yàn)室博士生陳雄輝,復(fù)旦大學(xué)的陳家祺和鄭炳南,阿卜杜拉國(guó)王科技大學(xué)的博士生諸葛鳴晨(MetaGPT 論文共同一作),DeepWisdom 研究員洪思睿(MetaGPT 論文共同一作)和王金淋,蒙特利爾大學(xué)與 MILA 實(shí)驗(yàn)室的助理教授劉邦。

對(duì)于 LLM 從業(yè)者來(lái)說(shuō),讓 LLM 落地應(yīng)用并發(fā)揮作用需要手動(dòng)構(gòu)建并反復(fù)調(diào)試 Agentic Workflow,這無(wú)疑是個(gè)繁瑣過程,一遍遍修改相似的代碼,調(diào)試 prompt,手動(dòng)執(zhí)行測(cè)試并觀察效果,并且換個(gè) LLM 可能就會(huì)失效,有高昂的人力成本。許多公司甚至專職招聘 Prompt Engineer 來(lái)完成這一工作。

現(xiàn)在,Agentic Workflow 也有自己的自動(dòng)優(yōu)化工具了。

MetaGPT 開源了 AFLOW,它使用 MCTS 進(jìn)行 Agentic Workflow 的自動(dòng)搜索,可以完全自動(dòng)地構(gòu)建與優(yōu)化 Agentic Workflow 問題,讓我們不再需要手寫代碼、調(diào)試提示詞。

圖片

AFLOW 通過蒙特卡洛樹搜索優(yōu)化工作流,極低成本實(shí)現(xiàn) GPT-4o 級(jí)能力

這是對(duì)提示詞自動(dòng)優(yōu)化的進(jìn)一步探索,通過蒙特卡洛樹搜索,完全接管了 Agentic Workflow 的生成與優(yōu)化過程,表現(xiàn)遠(yuǎn)超其他工作流自動(dòng)優(yōu)化工作,甚至超越了對(duì)比的所有手工工作流基線。

圖片

  • 論文標(biāo)題:AFlow: Automating Agentic Workflow Generation
  • 論文地址:https://arxiv.org/abs/2410.10762
  • 項(xiàng)目地址:https://github.com/geekan/MetaGPT/tree/main/examples/aflow

什么是自動(dòng)工作流優(yōu)化問題?

現(xiàn)有的 Agentic Workflow 自動(dòng)生成工作難以生成有效的工作流,它們往往需要人工介入初始設(shè)置,且無(wú)法全面捕捉到完成任務(wù)所需的工作流多樣性。為了克服這些挑戰(zhàn),研究人員提出了 AFLOW 框架。利用蒙特卡洛樹搜索(MCTS)技術(shù)來(lái)系統(tǒng)地探索和優(yōu)化 LLM 的工作流。AFLOW 通過將工作流定義為代碼可表示的節(jié)點(diǎn)和邊,從而有效地捕捉 LLMs 調(diào)用之間的復(fù)雜交互。通過引入操作符的概念,AFLOW 進(jìn)一步簡(jiǎn)化了搜索空間,提高了搜索效率。在多個(gè)基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,AFLOW 能夠自動(dòng)發(fā)現(xiàn)和優(yōu)化工作流,顯著提高了任務(wù)執(zhí)行的性能,同時(shí)減少了對(duì)人工干預(yù)的依賴。

圖片

AFLOW 的動(dòng)態(tài)演示。通過不斷迭代的選擇、擴(kuò)展、評(píng)估和反向傳播實(shí)現(xiàn)工作流的自動(dòng)化生成和優(yōu)化

AFLOW 首先將工作流優(yōu)化問題重新構(gòu)建為一個(gè)搜索問題,其中工作流被表示為代碼化的節(jié)點(diǎn)序列,每個(gè)節(jié)點(diǎn)代表 LLM 的一個(gè)具體操作,節(jié)點(diǎn)之間的邊定義了操作的邏輯、依賴關(guān)系和執(zhí)行流程。這種表示方法將工作流轉(zhuǎn)化為一個(gè)可以搜索和優(yōu)化的圖結(jié)構(gòu)。具體來(lái)說(shuō),工作流 W 被定義為一個(gè) LLM 調(diào)用節(jié)點(diǎn)序列圖片,其中每個(gè)節(jié)點(diǎn)圖片包含模型 M,提示 P,溫度,輸出格式 F(如 xml、json、markdown、raw)四個(gè)參數(shù)。節(jié)點(diǎn)通過邊連接,邊可以由各種結(jié)構(gòu)表示,如圖,神經(jīng)網(wǎng)絡(luò),代碼。

自動(dòng)化工作流優(yōu)化的目標(biāo)是在給定任務(wù) T 和評(píng)估函數(shù) G 的情況下,發(fā)現(xiàn)一個(gè)工作流 W ,使得 G(W,T) 最大化。這可以被表述為一個(gè)搜索過程,其中算法 A 探索搜索空間 S 來(lái)確定最優(yōu)的工作流配置。搜索空間 S 包括所有可能的節(jié)點(diǎn)參數(shù)和邊結(jié)構(gòu)的配置。

圖片

Node、Operator 和 Edge 示例。此處展示 Node 的可選參數(shù)、Operator 常見結(jié)構(gòu)和 Edge 的常見表示

AFLOW 如何自動(dòng)優(yōu)化工作流?

AFLOW 利用蒙特卡洛樹搜索(MCTS)來(lái)自動(dòng)化地生成和優(yōu)化 Agentic Workflow。在 AFLOW 框架中,Operator 扮演著至關(guān)重要的角色,它們是預(yù)定義的、可重用的節(jié)點(diǎn)組合,代表常見的智能體操作(比如審查,投票,生成)。這些 Operator 作為構(gòu)建工作流的基礎(chǔ)構(gòu)件,被集成到搜索空間中,確保探索過程可以利用已知的有效智能體操作模式。引入 Operator 能夠顯著提升 AFLOW 框架的搜索效率和工作流的優(yōu)化效果,減少在龐大搜索空間中的盲目探索。

AFLOW 的目標(biāo)是在給定任務(wù)和評(píng)估函數(shù)的情況下,發(fā)現(xiàn)一個(gè)能夠最大化任務(wù)性能的工作流。AFLOW 算法開始于初始化模板工作流,這個(gè)模板提供了一個(gè)基本的工作流框架,包括 LLM 節(jié)點(diǎn)的調(diào)用和 Operator 的使用。然后,算法通過 MCTS 的四個(gè)主要步驟進(jìn)行迭代:選擇(Selection)、擴(kuò)展(Expansion)、評(píng)估(Evaluation)和反向傳播(Backpropagation)。

圖片

AFLOW 整體框架:通過設(shè)置一個(gè)由僅具有靈活 prompt 參數(shù)的節(jié)點(diǎn)、給定的運(yùn)算符集和表示邊的代碼組成的搜索空間,AFLOW 在此空間內(nèi)執(zhí)行基于 MCTS 的搜索。通過為工作流優(yōu)化而設(shè)計(jì)的 MCTS 變體,AFLOW 迭代執(zhí)行軟混合概率選擇、基于 LLM 的擴(kuò)展、執(zhí)行評(píng)估和經(jīng)驗(yàn)反向傳播的循環(huán),直到達(dá)到最大迭代次數(shù)或滿足收斂標(biāo)準(zhǔn)

選擇階段 AFLOW 使用軟混合概率選擇機(jī)制來(lái)選擇一個(gè)節(jié)點(diǎn)進(jìn)行擴(kuò)展。這種機(jī)制結(jié)合了均勻概率分布和基于分?jǐn)?shù)的加權(quán)概率分布,以平衡探索和利用,避免陷入局部最優(yōu)解。選擇過程中,AFLOW 會(huì)考慮候選節(jié)點(diǎn)的得分和探索的需要,從而選擇一個(gè)既有可能帶來(lái)性能提升又具有探索價(jià)值的節(jié)點(diǎn)。

擴(kuò)展階段 AFLOW 使用 LLM 作為優(yōu)化器來(lái)生成新的工作流。優(yōu)化器利用選定工作流的經(jīng)驗(yàn)來(lái)生成新的提示或通過修改代碼來(lái)改變節(jié)點(diǎn)連接,從而產(chǎn)生新的工作流變體。這些新的工作流變體是通過對(duì)現(xiàn)有工作流的微小調(diào)整來(lái)實(shí)現(xiàn)的,例如添加、修改或刪除節(jié)點(diǎn)和邊。

評(píng)估階段 AFLOW 直接執(zhí)行生成的工作流以獲得反饋。由于推理任務(wù)具有明確的評(píng)估函數(shù),AFLOW 可以通過在驗(yàn)證集上多次運(yùn)行工作流來(lái)計(jì)算平均分和標(biāo)準(zhǔn)差,從而獲得更準(zhǔn)確的優(yōu)化器反饋。

反向傳播階段 工作流的性能信息被反向傳播到 MCTS 的樹結(jié)構(gòu)中,用于更新節(jié)點(diǎn)的得分,并指導(dǎo)未來(lái)的搜索迭代。這些信息包括工作流的執(zhí)行結(jié)果和相對(duì)于其父工作流的優(yōu)化成功與否。通過這種方式,AFLOW 能夠從每次迭代中學(xué)習(xí),并逐漸改進(jìn)工作流的性能。

為了避免在優(yōu)化達(dá)到極限后繼續(xù)執(zhí)行的不必要成本,當(dāng)連續(xù)幾輪中分?jǐn)?shù)優(yōu)先的前 k 個(gè)工作流沒有改進(jìn)時(shí),AFLOW 將停止上述迭代過程。

AFLOW 帶來(lái)的 Agentic Workflow 變革

顯著的性能優(yōu)勢(shì) AFLOW 選取了六個(gè)文本推理的任務(wù),覆蓋了代碼(HumanEval, MBPP),數(shù)學(xué)(GSM8K, MATH),知識(shí)問答(HotpotQA, DROP)三個(gè)場(chǎng)景。相比現(xiàn)有手動(dòng)方法平均提升 5.7%,較其他自動(dòng)化方法更是提升了 19.5%。在所有六個(gè)任務(wù)中,AFLOW 展現(xiàn)出全面的領(lǐng)先優(yōu)勢(shì),證明了其在不同任務(wù)類型上的穩(wěn)定性和適應(yīng)性。

圖片

與其他方法的性能比較。為了評(píng)估該方法的性能,我們?cè)诓煌臄?shù)據(jù)集中采用了各種指標(biāo):Math 和 GSM8K 的求解率、HotpotQA 和 DROP 的 F1 分?jǐn)?shù)以及 HumanEval 和 MBPP 的 pass@1。我們的 AFLOW(以黃色突出顯示)在所有六個(gè)基準(zhǔn)測(cè)試中始終優(yōu)于所有自動(dòng)工作流程優(yōu)化和手動(dòng)設(shè)計(jì)的方法

顯著成本降低 AFLOW 為 Agent 領(lǐng)域帶來(lái)的最大變革在于其顯著的成本降低。較小尺寸的模型通過 AFLOW 找出的工作流,僅需 GPT-4o 推理成本的 4.55% 就能實(shí)現(xiàn)同等性能。這一突破意味著企業(yè)可以用更小的模型實(shí)現(xiàn)大模型的效果,為 AI 應(yīng)用的規(guī)?;渴鹛峁┝私?jīng)濟(jì)可行的解決方案。

圖片

成本(Cost)指執(zhí)行分割后 HumanEval 測(cè)試集的總費(fèi)用。AFLOW(模型)指 AFLOW 使用該模型執(zhí)行工作流,獲得反饋。圖例中的顏色代表在測(cè)試數(shù)據(jù)集中執(zhí)行工作流所使用的不同 LLM

自動(dòng)化的效率提升 AFLOW 徹底改變了傳統(tǒng)的人工調(diào)試模式。通過自動(dòng)化的工作流生成與優(yōu)化機(jī)制,顯著減少了人工參與的需求。開發(fā)者不再需要花費(fèi)大量時(shí)間進(jìn)行反復(fù)調(diào)試和優(yōu)化,系統(tǒng)能夠自動(dòng)發(fā)現(xiàn)最優(yōu)的工作流組合,大幅縮短了開發(fā)周期。

廣泛的適用性 實(shí)驗(yàn)結(jié)果表明,AFLOW 展現(xiàn)出優(yōu)秀的遷移能力。它不僅支持多種主流 LLM 模型,還能適應(yīng)不同類型的任務(wù)需求。在問答、代碼生成、數(shù)學(xué)問題求解等多個(gè)領(lǐng)域的測(cè)試中,AFLOW 都表現(xiàn)出色,證明了其作為通用優(yōu)化框架的價(jià)值。此外,用戶可以通過簡(jiǎn)單的提供數(shù)據(jù)集與 Evaluation Function 來(lái)將 AFLOW 使用在自己的任務(wù)上。

展望

AFLOW 提出了一種有效生成 Agentic Workflow 的方法,并全面展示了其在降低人力與推理成本上的驚人能力。這一研究成果有望加速 Agent 在各個(gè)領(lǐng)域落地的速度,將 Agentic Workflow 的構(gòu)建過程從專家手工構(gòu)建轉(zhuǎn)變?yōu)樾“鬃詣?dòng)構(gòu)建。

使用

目前,作者已在 GitHub 上開源了完整代碼。用戶可通過自定義 Benchmark 與數(shù)據(jù)集,快速為個(gè)性化任務(wù)搜索最佳性能或性能成本平衡的工作流方案,幫助個(gè)人和企業(yè)節(jié)省大量時(shí)間。

圖片

AFLOW 的 Github 指南??梢詤⒄辗植街改吓渲煤瓦\(yùn)行 AFLOW,高效生成和優(yōu)化工作流

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-12-04 15:57:56

2025-04-15 08:01:12

2025-04-08 02:26:00

2024-05-17 09:35:55

GPT-4o模型OpenAI

2024-06-27 12:45:30

2024-08-14 14:30:00

AI訓(xùn)練

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-11-22 14:10:00

AI智能體

2024-09-06 13:00:29

2025-03-31 08:50:00

AI生成模型

2025-02-17 12:24:43

2024-05-24 14:04:04

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2024-11-26 14:30:00

模型數(shù)據(jù)

2025-04-07 00:00:00

OpenAIGPT-4o圖像

2025-04-16 09:15:00

AI模型數(shù)據(jù)

2025-04-29 08:00:00

Rowboat多智能體人工智能

2024-07-04 15:30:07

2025-03-31 08:44:00

GPT-4o模型技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)