自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Agent也有快慢腦了!這次真的不一樣

發(fā)布于 2024-11-8 15:02
瀏覽
0收藏

在與用戶進行自然對話交互時,智能體需要完成兩個核心任務(wù):一是進行對話交流,二是執(zhí)行推理與規(guī)劃。智能體在對話過程中,需要綜合利用所有可獲取的信息來做出回應(yīng),同時其行為要始終圍繞目標展開。這種對話交互與多步推理規(guī)劃的雙重模式,與卡尼曼所描述的人類快速和緩慢思維系統(tǒng)頗為相似。

基于這一理念,DeepMind團隊開發(fā)了一個雙系統(tǒng)框架,稱為Talker-Reasoner,旨在模仿人類的這兩種思維模式。

Agent也有快慢腦了!這次真的不一樣-AI.x社區(qū)

為了實現(xiàn)智能體與用戶之間的自然對話交互,研究者提出了Talker-Reasoner雙重系統(tǒng)架構(gòu)。該架構(gòu)的設(shè)計靈感來源于人類的思維模式,將智能體劃分為兩個獨立但相互配合的模塊:一個是能夠快速反應(yīng)、直觀應(yīng)對的"Talker"模塊(對應(yīng)系統(tǒng)1),另一個則是深入思考、縝密推理的"Reasoner"模塊(對應(yīng)系統(tǒng)2)。

Agent也有快慢腦了!這次真的不一樣-AI.x社區(qū)

該研究提出的Talker-Reasoner雙系統(tǒng)模型架構(gòu)圖詳細展示了整個系統(tǒng)的運作機制。這一智能體模型的設(shè)計理念源自人類大腦中的快速反應(yīng)機制(第一系統(tǒng))和深度思考機制(第二系統(tǒng))。在此框架下,整個智能系統(tǒng)被劃分為兩個既能獨立運作又能密切配合的核心部分:

Agent也有快慢腦了!這次真的不一樣-AI.x社區(qū)

  1. 快速響應(yīng)型的Talker組件(第一系統(tǒng)),它的主要職責是處理用戶的自然語言交互并生成相應(yīng)回復。這一組件類似于人類的本能反應(yīng),能夠快速從存儲系統(tǒng)中提取所需信息來支持對話。每當用戶發(fā)起互動時,Talker組件就會被觸發(fā),并通過訪問存儲系統(tǒng)來指導其回應(yīng)過程。
  2. 深度思考型的Reasoner組件(第二系統(tǒng)),它專注于執(zhí)行需要深入思考的多步推理和規(guī)劃任務(wù)。該組件不僅負責調(diào)用各種工具和執(zhí)行具體操作,還要更新系統(tǒng)狀態(tài)。同時,它也承擔著構(gòu)建和更新用戶信念狀態(tài)的任務(wù),這些信息會以結(jié)構(gòu)化的語言形式保存在存儲系統(tǒng)中。

這兩個組件主要通過共享存儲系統(tǒng)來實現(xiàn)信息交換。Reasoner負責產(chǎn)生新的信念狀態(tài)和推理結(jié)果,并將其存入存儲系統(tǒng);而Talker則通過檢索最新狀態(tài)來獲取所需信息。這種機制可能導致Talker使用的信息出現(xiàn)短暫滯后,因為Reasoner可能仍在處理新的信念更新。

系統(tǒng)設(shè)計允許Talker在需要時等待Reasoner完成推理過程后再做出回應(yīng)。這種協(xié)作模式使得擅長快速反應(yīng)的Talker能夠為Reasoner提供初步判斷和行動建議。這種分工機制在實踐中表現(xiàn)良好,主要是因為Talker在其職責范圍內(nèi)表現(xiàn)出色:它能夠自動檢索信息,并有效引導底層模型應(yīng)對常見情況。

睡眠輔導智能系統(tǒng)案例分析

最后通過探討一個睡眠輔導智能系統(tǒng),對Talker-Reasoner雙智能體架構(gòu)進行評估和具體化。在實際應(yīng)用場景中,該架構(gòu)展現(xiàn)出顯著效果,尤其是在處理復雜任務(wù)時,如用戶建模、運用專業(yè)知識提供科學建議、制定多步驟輔導方案以及進行富有同理心的對話交流。

睡眠輔導智能系統(tǒng)的構(gòu)建

  1. Talker智能體:利用專家提供的指導原則,編碼睡眠領(lǐng)域的專業(yè)知識。這些原則描述了智能體的特性(如表現(xiàn)同理心、進行對話交流、提供準確建議)和睡眠輔導的各個階段(包括理解、目標設(shè)定和輔導計劃)。Talker智能體基于強大的語言模型實現(xiàn),能夠理解復雜模式并生成深思熟慮的對話回應(yīng)。
  2. Reasoner智能體:專門對用戶信念進行建模。研究者與臨床專家合作,設(shè)計了一個JSON/XML格式的信念模式,涵蓋睡眠問題、目標、習慣、障礙和睡眠環(huán)境等方面。在執(zhí)行多步推理/規(guī)劃時,Reasoner智能體推斷并更新這些模式字段,從而創(chuàng)建或修改其信念狀態(tài)。
  3. Talker和Reasoner的協(xié)作:Talker智能體是否等待Reasoner智能體完成操作,取決于當前的信念狀態(tài)。在制定輔導計劃階段,Talker智能體會等待Reasoner智能體;其他情況下則不會等待。

定性分析結(jié)果

  1. 對話示例:Talker和Reasoner智能體之間的互動過程,包括如何根據(jù)用戶需求生成回應(yīng)和制定計劃,以及如何根據(jù)用戶反饋調(diào)整方案。
  2. 基于反饋的計劃調(diào)整:Reasoner智能體如何根據(jù)Talker智能體從用戶處收集的反饋來優(yōu)化其計劃。

以下是一段示例對話,展示了Reasoner和Talker之間的互動

用戶:嘿,我需要你的幫助來規(guī)劃如何營造一個放松的睡前環(huán)境。(記憶中的信念更新為:{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING})
Talker:太好了,我們開始為你打造一個放松的睡前環(huán)境吧:-) 你的臥室里有沒有什么可能會干擾你睡眠的東西?
用戶:我覺得噪音和光線太分散注意力了。你能幫我制定一個消除這些干擾的計劃嗎?(記憶中的信念保持不變)
Talker:當然可以!這里有一個消除臥室干擾的計劃:噪音:
確定噪音源:列出臥室中所有的噪音源隔絕外界噪音:使用遮光窗簾來阻擋光線和減少噪音;考慮使用降噪窗簾或隔音板;試試耳塞或白噪音機。光線:...記住,一致性是關(guān)鍵。每晚都堅持這個計劃,以營造一個平靜而黑暗的睡眠環(huán)境。還有什么我可以幫助你的嗎?
用戶:當然,這很有用。不過,我希望步驟能更詳細一些。還想看看如何在我的臥室里營造一個寧靜放松的氛圍的資源。(記憶中的信念更新為:{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)})
Reasoner的計劃:當然!讓我們更深入地看看你的計劃的第一步:
步驟:選擇一個平靜的色彩調(diào)色板。描述:在選擇臥室顏色時,選擇柔和的中性色調(diào),如柔和的藍色、綠色或灰色。這些色調(diào)已被科學證明可以促進放松和寧靜。1. YouTube視頻:(鏈接)標題:創(chuàng)造放松和無壓力臥室的墻面顏色創(chuàng)意。頻道:roomdsignTV。推理:這個來自roomdsignTV的視頻提供了平靜臥室色彩調(diào)色板的視覺示例。它展示了舒緩色彩對營造寧靜氛圍的影響。2. YouTube播放列表:(鏈接)標題:Berger油漆色彩組合。頻道:Hresun Interiors。推理:這個來自Hresun Interiors的播放列表提供了一系列的臥室色彩組合創(chuàng)意。它涵蓋了從傳統(tǒng)到現(xiàn)代的多種風格,幫助你找到適合臥室的完美色彩方案。
Talker:復制Reasoner的回應(yīng)
##### 根據(jù)反饋調(diào)整計劃
以下是Reasoner智能體如何根據(jù)Talker智能體從用戶那里收集的反饋來調(diào)整其計劃的示例:
用戶:謝謝你,這非常有用。你能在我的計劃中加入更多關(guān)于我應(yīng)該在空間中添加哪些放松聲音的步驟嗎?(記憶中的信念保持不變)
Reasoner的計劃:當然可以!這是你的計劃中的“探索自然聲音”部分,以及一些相關(guān)的YouTube內(nèi)容:
探索自然聲音:這個部分旨在幫助你使用自然聲音在空間中創(chuàng)造一個平靜和寧靜的氛圍。通過加入這些聲音,你可以促進放松和減輕壓力。推薦YouTube視頻:...
發(fā)現(xiàn)治療頻率:在這個計劃的部分,我們將探索治療頻率的世界,這些頻率被認為對放松和情緒健康有深遠的影響。...YouTube推薦:

paper: https://arxiv.org/pdf/2410.08328
title: Agents Thinking Fast and Slow: A Talker-Reasoner ArchitectureGoogle DeepMind

本文轉(zhuǎn)載自 ??探索AGI??,作者: 獼猴桃

收藏
回復
舉報
回復
相關(guān)推薦