Agent不是被卡住了,其實在思考
在與用戶進行自然對話時,智能體承擔著兩大核心任務:一是流暢的對話交流,二是精準的推理與規(guī)劃。智能體必須整合所有可用信息以作出回應,同時確保其行為始終圍繞既定目標展開。
基于人類“快速思考”和“慢速思考”的認知系統(tǒng)靈感,丹尼爾·卡尼曼提出了一個全新的架構Talker-Reasoner,旨在模擬人類的這兩種思維模式。
論文地址:
paper: https://arxiv.org/pdf/2410.08328
title: Agents Thinking Fast and Slow: A Talker-Reasoner Architecture Google DeepMind
代理被分為兩個部分:一個快速直觀的“Talker”代理(系統(tǒng)1)和一個慢速、深思熟慮的“Reasoner” 代理(系統(tǒng)2)。Talker代理負責與用戶進行自然語言對話,而Reasoner代理負責復雜的問題解決、信念形成和決策。兩者通過記憶進行交互。
圖片
- 快速響應型的Talker組件(第一系統(tǒng)):它的主要職責是處理用戶的自然語言交互并生成相應回復。這一組件類似于人類的本能反應,能夠快速從存儲系統(tǒng)中提取所需信息來支持對話。每當用戶發(fā)起互動時,Talker組件就會被觸發(fā),并通過訪問存儲系統(tǒng)來指導其回應過程。
- 深度思考型的Reasoner組件(第二系統(tǒng)):它專注于執(zhí)行需要深入思考的多步推理和規(guī)劃任務。該組件不僅負責調(diào)用各種工具和執(zhí)行具體操作,還要更新系統(tǒng)狀態(tài)。同時,它也承擔著構建和更新用戶信念狀態(tài)的任務,這些信息會以結構化的語言形式保存在存儲系統(tǒng)中。
論文在睡眠輔導的現(xiàn)實世界場景中實例化并驗證了Talker-Reasoner雙代理架構。這個案例研究允許定性測試Reasoner的規(guī)劃和推理能力以及Talker的互動性。
睡眠輔導智能系統(tǒng)案例分析
睡眠輔導智能系統(tǒng)的構建:
- Talker智能體:利用專家提供的指導原則,編碼睡眠領域的專業(yè)知識。這些原則描述了智能體的特性(如表現(xiàn)同理心、進行對話交流、提供準確建議)和睡眠輔導的各個階段(包括理解、目標設定和輔導計劃)。Talker智能體基于強大的語言模型實現(xiàn),能夠理解復雜模式并生成深思熟慮的對話回應。
- Reasoner智能體:專門對用戶信念進行建模。研究者與臨床專家合作,設計了一個JSON/XML格式的信念模式,涵蓋睡眠問題、目標、習慣、障礙和睡眠環(huán)境等方面。在執(zhí)行多步推理/規(guī)劃時,Reasoner智能體推斷并更新這些模式字段,從而創(chuàng)建或修改其信念狀態(tài)。
- Talker和Reasoner的協(xié)作:Talker智能體是否等待Reasoner智能體完成操作,取決于當前的信念狀態(tài)。在制定輔導計劃階段,Talker智能體會等待Reasoner智能體;其他情況下則不會等待。
定性分析結果:
- 對話示例:Talker和Reasoner智能體之間的互動過程,包括如何根據(jù)用戶需求生成回應和制定計劃,以及如何根據(jù)用戶反饋調(diào)整方案。
- 基于反饋的計劃調(diào)整:Reasoner智能體如何根據(jù)Talker智能體從用戶處收集的反饋來優(yōu)化其計劃。
以下是一段示例對話,展示了Reasoner和Talker之間的互動:
用戶:嘿,我需要你的幫助來規(guī)劃如何營造一個放松的睡前環(huán)境。(記憶中的信念更新為:{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING})
Talker:太好了,我們開始為你打造一個放松的睡前環(huán)境吧:-) 你的臥室里有沒有什么可能會干擾你睡眠的東西?
用戶:我覺得噪音和光線太分散注意力了。你能幫我制定一個消除這些干擾的計劃嗎?(記憶中的信念保持不變)
Talker:當然可以!這里有一個消除臥室干擾的計劃:噪音:確定噪音源,隔絕外界噪音,使用遮光窗簾來阻擋光線和減少噪音;考慮使用降噪窗簾或隔音板;試試耳塞或白噪音機。光線:...記住,一致性是關鍵。每晚都堅持這個計劃,以營造一個平靜而黑暗的睡眠環(huán)境。還有什么我可以幫助你的嗎?
用戶:當然,這很有用。不過,我希望步驟能更詳細一些。還想看看如何在我的臥室里營造一個寧靜放松的氛圍的資源。(記憶中的信念更新為:{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)})
Reasoner的計劃:當然!讓我們更深入地看看你的計劃的第一步:步驟:選擇一個平靜的色彩調(diào)色板。描述:在選擇臥室顏色時,選擇柔和的中性色調(diào),如柔和的藍色、綠色或灰色。這些色調(diào)已被科學證明可以促進放松和寧靜。1. YouTube視頻:(鏈接)標題:創(chuàng)造放松和無壓力臥室的墻面顏色創(chuàng)意。頻道:roomdsignTV。推理:這個來自roomdsignTV的視頻提供了平靜臥室色彩調(diào)色板的視覺示例。它展示了舒緩色彩對營造寧靜氛圍的影響。2. YouTube播放列表:(鏈接)標題:Berger油漆色彩組合。頻道:Hresun Interiors。推理:這個來自Hresun Interiors的播放列表提供了一系列的臥室色彩組合創(chuàng)意。它涵蓋了從傳統(tǒng)到現(xiàn)代的多種風格,幫助你找到適合臥室的完美色彩方案。
Talker:復制Reasoner的回應
如果對內(nèi)容有什么疑問和建議可以私信和留言,也可以添加我加入大模型交流群,一起討論大模型在創(chuàng)作、RAG和agent中的應用。