自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="dsrzd"><track id="dsrzd"></track></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

o1快慢思考的風(fēng)又吹到了Agent！

發(fā)布于 2024-10-18 15:28

瀏覽

0收藏

智能體（Agent）通過(guò)自然對(duì)話與用戶互動(dòng)有兩個(gè)任務(wù)：交談和規(guī)劃/推理。對(duì)話回應(yīng)必須基于所有可用信息，行動(dòng)必須有助于實(shí)現(xiàn)目標(biāo)。與用戶交談和進(jìn)行多步推理和規(guī)劃之間的二分法，類似卡尼曼引入的人類快速思考和慢速思考系統(tǒng)。

為此，Google DeepMind提出了一個(gè)名為T(mén)alker-Reasoner的雙系統(tǒng)架構(gòu)，以模擬人類的兩種思考系統(tǒng)。

o1快慢思考的風(fēng)又吹到了Agent！-AI.x社區(qū)

Talker-Reasoner的雙系統(tǒng)架構(gòu)，用于構(gòu)建能夠通過(guò)自然對(duì)話與用戶互動(dòng)的智能代理。這種架構(gòu)受到人類“快速思考”和“慢速思考”系統(tǒng)的啟發(fā)，將Agent分為兩個(gè)部分：快速直觀的“Talker”（系統(tǒng)1）和慢速、深思熟慮的“Reasoner”（系統(tǒng)2）。

雙系統(tǒng)Talker-Reasoner方法的示意圖

o1快慢思考的風(fēng)又吹到了Agent！-AI.x社區(qū)

Talker-Reasoner智能體模型

詳細(xì)介紹了提出的雙系統(tǒng)Talker-Reasoner智能體模型，該模型受到人類快速思考（System 1）和慢速思考（System 2）的啟發(fā)。這個(gè)模型將智能體分為兩個(gè)獨(dú)立的但相互協(xié)作的組件：

Talker-Reasoner架構(gòu)的圖表

o1快慢思考的風(fēng)又吹到了Agent！-AI.x社區(qū)

Talker智能體（System 1）：這個(gè)智能體是快速、直觀的，負(fù)責(zé)與用戶進(jìn)行自然語(yǔ)言交流，生成對(duì)話回應(yīng)。它類似于人類的直覺(jué)反應(yīng)，能夠迅速地從記憶中獲取信息，以支持其回應(yīng)。Talker智能體在每次與用戶互動(dòng)時(shí)都會(huì)激活，并且可以訪問(wèn)記憶來(lái)引導(dǎo)其回應(yīng)，類似于System 1的持續(xù)激活。
Reasoner智能體（System 2）：這個(gè)智能體是慢速、深思熟慮且邏輯性強(qiáng)的，負(fù)責(zé)執(zhí)行復(fù)雜的多步推理和規(guī)劃。它調(diào)用工具、執(zhí)行動(dòng)作，并更新智能體的狀態(tài)。Reasoner智能體還負(fù)責(zé)形成和更新關(guān)于用戶的信念狀態(tài)，這些信念狀態(tài)以結(jié)構(gòu)化的語(yǔ)言對(duì)象形式存儲(chǔ)在記憶中。

這兩個(gè)智能體之間的主要交互方式是通過(guò)記憶。Reasoner智能體負(fù)責(zé)生成新的信念狀態(tài)和推導(dǎo)多步推理和規(guī)劃，并將它們存儲(chǔ)在記憶中。Talker智能體在需要信念時(shí)，會(huì)從記憶中檢索最新的狀態(tài)。因此，Talker智能體可能會(huì)使用延遲的世界視圖進(jìn)行操作，因?yàn)镽easoner智能體可能還沒(méi)有時(shí)間生成新的信念并將其存儲(chǔ)在記憶中。

此外，Talker智能體還可以選擇等待Reasoner智能體完成其推理過(guò)程，然后再生成回應(yīng)。這種設(shè)計(jì)允許快速印象和回應(yīng)的Talker智能體成為Reasoner智能體明確信念和選擇（計(jì)劃）的來(lái)源。這種分工方式在大多數(shù)情況下都能很好地工作，因?yàn)門(mén)alker智能體通常非常擅長(zhǎng)其任務(wù)：它可以自動(dòng)從記憶中獲取信息，有效地引導(dǎo)其底層模型以很好地應(yīng)對(duì)熟悉情況。

睡眠輔導(dǎo)智能體案例研究

通過(guò)一個(gè)睡眠輔導(dǎo)智能體的案例研究來(lái)評(píng)估和實(shí)例化Talker-Reasoner雙智能體架構(gòu)。在一個(gè)現(xiàn)實(shí)世界的應(yīng)用場(chǎng)景中展示該架構(gòu)的有效性，特別是在處理需要用戶建模、使用專家知識(shí)提供科學(xué)支持的建議、提供多步驟輔導(dǎo)計(jì)劃以及進(jìn)行對(duì)話和同理心交流的復(fù)雜任務(wù)時(shí)。

睡眠輔導(dǎo)智能體的實(shí)現(xiàn)：

Talker智能體：通過(guò)一組專家提供的指導(dǎo)原則來(lái)編碼睡眠領(lǐng)域的專業(yè)知識(shí)，這些原則描述了智能體的構(gòu)成（例如，表現(xiàn)出同理心、進(jìn)行對(duì)話交流、提供準(zhǔn)確的建議）以及睡眠輔導(dǎo)的不同階段（理解、目標(biāo)設(shè)定和輔導(dǎo)計(jì)劃）。Talker智能體通過(guò)一個(gè)強(qiáng)大的語(yǔ)言模型實(shí)現(xiàn)，能夠理解復(fù)雜的模式并提供深思熟慮的對(duì)話回應(yīng)。
Reasoner智能體：明確地對(duì)用戶的信念進(jìn)行建模。通過(guò)與臨床專家的合作，作者編碼了一個(gè)JSON/XML模式的信念，包括睡眠問(wèn)題、目標(biāo)、習(xí)慣、障礙和睡眠環(huán)境等字段。Reasoner智能體在執(zhí)行多步推理/規(guī)劃時(shí)，推斷并更新這些模式字段，從而創(chuàng)建或更新其信念狀態(tài)。
Talker和Reasoner的協(xié)調(diào)：Talker智能體是否等待Reasoner智能體完成，取決于信念狀態(tài)。在規(guī)劃輔導(dǎo)階段，Talker智能體會(huì)等待Reasoner智能體完成；否則，它不會(huì)等待。

定性結(jié)果：

示例對(duì)話：展示了Talker和Reasoner智能體之間的互動(dòng)，包括如何根據(jù)用戶的需求生成回應(yīng)和計(jì)劃，以及如何根據(jù)用戶的反饋調(diào)整計(jì)劃。
根據(jù)反饋調(diào)整計(jì)劃：展示了Reasoner智能體如何根據(jù)Talker智能體從用戶那里收集的反饋來(lái)調(diào)整其計(jì)劃。

以下是一段示例對(duì)話，展示了Reasoner和Talker之間的互動(dòng)：

用戶：嘿，我需要你的幫助來(lái)規(guī)劃如何營(yíng)造一個(gè)放松的睡前環(huán)境。（記憶中的信念更新為：{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING}）


Talker：太好了，我們開(kāi)始為你打造一個(gè)放松的睡前環(huán)境吧:-) 你的臥室里有沒(méi)有什么可能會(huì)干擾你睡眠的東西？


用戶：我覺(jué)得噪音和光線太分散注意力了。你能幫我制定一個(gè)消除這些干擾的計(jì)劃嗎？（記憶中的信念保持不變）


Talker：當(dāng)然可以！這里有一個(gè)消除臥室干擾的計(jì)劃：噪音：


確定噪音源：列出臥室中所有的噪音源
隔絕外界噪音：使用遮光窗簾來(lái)阻擋光線和減少噪音；考慮使用降噪窗簾或隔音板；試試耳塞或白噪音機(jī)。光線：...記住，一致性是關(guān)鍵。每晚都堅(jiān)持這個(gè)計(jì)劃，以營(yíng)造一個(gè)平靜而黑暗的睡眠環(huán)境。還有什么我可以幫助你的嗎？


用戶：當(dāng)然，這很有用。不過(guò)，我希望步驟能更詳細(xì)一些。還想看看如何在我的臥室里營(yíng)造一個(gè)寧?kù)o放松的氛圍的資源。
（記憶中的信念更新為：{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)}）


Reasoner的計(jì)劃：當(dāng)然！讓我們更深入地看看你的計(jì)劃的第一步：


步驟：選擇一個(gè)平靜的色彩調(diào)色板。描述：在選擇臥室顏色時(shí)，選擇柔和的中性色調(diào)，如柔和的藍(lán)色、綠色或灰色。這些色調(diào)已被科學(xué)證明可以促進(jìn)放松和寧?kù)o。
1. YouTube視頻：（鏈接）標(biāo)題：創(chuàng)造放松和無(wú)壓力臥室的墻面顏色創(chuàng)意。
頻道：roomdsignTV。
推理：這個(gè)來(lái)自roomdsignTV的視頻提供了平靜臥室色彩調(diào)色板的視覺(jué)示例。它展示了舒緩色彩對(duì)營(yíng)造寧?kù)o氛圍的影響。
2. YouTube播放列表：（鏈接）標(biāo)題：Berger油漆色彩組合。
頻道：Hresun Interiors。
推理：這個(gè)來(lái)自Hresun Interiors的播放列表提供了一系列的臥室色彩組合創(chuàng)意。它涵蓋了從傳統(tǒng)到現(xiàn)代的多種風(fēng)格，幫助你找到適合臥室的完美色彩方案。


Talker：復(fù)制Reasoner的回應(yīng)


##### 根據(jù)反饋調(diào)整計(jì)劃


以下是Reasoner智能體如何根據(jù)Talker智能體從用戶那里收集的反饋來(lái)調(diào)整其計(jì)劃的示例：


用戶：謝謝你，這非常有用。你能在我的計(jì)劃中加入更多關(guān)于我應(yīng)該在空間中添加哪些放松聲音的步驟嗎？（記憶中的信念保持不變）


Reasoner的計(jì)劃：當(dāng)然可以！這是你的計(jì)劃中的“探索自然聲音”部分，以及一些相關(guān)的YouTube內(nèi)容：


探索自然聲音：這個(gè)部分旨在幫助你使用自然聲音在空間中創(chuàng)造一個(gè)平靜和寧?kù)o的氛圍。通過(guò)加入這些聲音，你可以促進(jìn)放松和減輕壓力。推薦YouTube視頻：...


發(fā)現(xiàn)治療頻率：在這個(gè)計(jì)劃的部分，我們將探索治療頻率的世界，這些頻率被認(rèn)為對(duì)放松和情緒健康有深遠(yuǎn)的影響。...YouTube推薦：

https://arxiv.org/pdf/2410.08328
Agents Thinking Fast and Slow: A Talker-Reasoner Architecture
Google DeepMind

本文轉(zhuǎn)載自??PaperAgent??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

OpenAI o1很強(qiáng)，也能被玩壞！

PaperAgent ? 2200瀏覽 ? 0回復(fù)
OpenAI發(fā)布新模型：o1系列模型，更像理科生的模型

大語(yǔ)言模型論文跟蹤 ? 3866瀏覽 ? 0回復(fù)
OpenAI o1引發(fā)的思維鏈思考：思維鏈提示啟發(fā)大模型推理

angel ? 3257瀏覽 ? 0回復(fù)
使用 OpenAI o1 的五種方法「詳細(xì)指南」

51CTO技術(shù)棧 ? 5171瀏覽 ? 0回復(fù)
OpenAI o1推理模型基礎(chǔ)入門(mén)

51CTO內(nèi)容精選 ? 2148瀏覽 ? 0回復(fù)
被神化的o1模型，規(guī)劃能力到底如何？

大語(yǔ)言模型論文跟蹤 ? 2627瀏覽 ? 0回復(fù)
o1推理擴(kuò)展的風(fēng)吹到了RAG，性能飆升58.9%！

PaperAgent ? 2331瀏覽 ? 0回復(fù)
o1蒙特卡洛樹(shù)的風(fēng)又吹到了Agentic工作流！

PaperAgent ? 2621瀏覽 ? 0回復(fù)
o1的風(fēng)又吹到多模態(tài)，直接吹翻了GPT-4o-mini

PaperAgent ? 2072瀏覽 ? 0回復(fù)
解密o1推理過(guò)程！DeepSeek-R1-Lite預(yù)覽版上線

kede96 ? 2731瀏覽 ? 0回復(fù)
阿里重磅開(kāi)源QwQ-32B：自我思考、糾正，數(shù)學(xué)能力擊敗o1模型

Aceryt ? 7260瀏覽 ? 0回復(fù)
o1的規(guī)劃能力如何？LRM是未來(lái)嗎？

探索AGI ? 1752瀏覽 ? 0回復(fù)
阿里發(fā)布類o1模型QWQ，可自我反思糾錯(cuò)，實(shí)測(cè)數(shù)學(xué)推理遠(yuǎn)超o1、DS-R1，人人免費(fèi)

51CTO技術(shù)棧 ? 2475瀏覽 ? 0回復(fù)
OpenAI o1 模型到來(lái)后，談?wù)勌崾驹~工程的未來(lái)

Baihai_IDP ? 1961瀏覽 ? 0回復(fù)
大語(yǔ)言模型o1慢思考推理系統(tǒng)的破局之路：模仿、探索與自我提升的深度揭秘！

十一月雨_55 ? 3459瀏覽 ? 0回復(fù)
最簡(jiǎn)單的推理擴(kuò)展方案，效果媲美o1！

NLP前沿1 ? 1454瀏覽 ? 0回復(fù)
o1模型醫(yī)學(xué)推理驚人，超過(guò)人類醫(yī)生

Aceryt ? 1522瀏覽 ? 0回復(fù)
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 1709瀏覽 ? 0回復(fù)
DeepSeek-R1的風(fēng)吹到了多模態(tài)，Visual-RFT發(fā)布，視覺(jué)任務(wù)性能飆升20%

PaperAgent ? 1611瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenAI大佬：AI上半場(chǎng)忙著開(kāi)發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場(chǎng)呢？ 2025-04-21 00:48:19發(fā)布
CPU推理僅29ms，微軟開(kāi)源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15 2025-04-21 00:47:17發(fā)布

熱門(mén)推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門(mén)到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：忘記Tool檢索，擁抱全新Agent ToolGen！

下一篇：超級(jí)Agent：像人一樣操控電腦！

社區(qū)精華內(nèi)容

目錄

<cite id="dou0a"></cite>