2024駕馭人工智能前沿:AI智能體的演進和影響白皮書
報告引言
人工智能智能體正變得日益先進,這對決策、問責(zé)和監(jiān)督產(chǎn)生了重大影響。
隨著人工智能不斷發(fā)展并融入經(jīng)濟和社會的各個領(lǐng)域,對于企業(yè)領(lǐng)導(dǎo)者、政策制定者和其他參與塑造人工智能發(fā)展、實施和治理未來的利益相關(guān)者來說,理解人工智能智能體的作用、能力和可能產(chǎn)生的影響至關(guān)重要。
自任務(wù)自動化開始以來,智能體的概念 —— 即通過傳感器感知環(huán)境并通過效應(yīng)器對其采取行動的實體 —— 一直在不斷演變。隨著大型語言模型(處理自然語言的人工智能模型)和大型多模態(tài)模型(處理自然語言、圖像、視頻和 / 或音頻的人工智能模型)的最新進展,人工智能智能體的概念正進入一個快速發(fā)展和試驗的新階段。在這一階段,從編碼助手到工作流自動化、個人助手等一系列新的應(yīng)用案例不斷涌現(xiàn)。
隨著人工智能智能體的持續(xù)發(fā)展,社會正逐漸邁向開發(fā)具有更高自主性的創(chuàng)新系統(tǒng),這些系統(tǒng)能夠在最少的人類參與或指導(dǎo)下完成任務(wù)。這預(yù)示著一個由人工智能驅(qū)動的創(chuàng)新和效率新時代的到來,其有可能影響全球經(jīng)濟的各個領(lǐng)域。鑒于這一深遠(yuǎn)前景,考慮安全和治理措施以指導(dǎo)先進人工智能智能體的負(fù)責(zé)任開發(fā)和實施至關(guān)重要。
本文首先定義了人工智能智能體的概念,然后概述了不同類型的智能體及其隨時間的演變。最后一部分展望未來,總結(jié)了部署人工智能智能體所帶來的新興技術(shù)和社會經(jīng)濟影響的示例,以及降低風(fēng)險的可能措施。
人工智能智能體的定義
人工智能智能體能夠自主響應(yīng)輸入和對環(huán)境的感知,做出復(fù)雜決策并改變環(huán)境。
根據(jù)國際標(biāo)準(zhǔn)化組織的定義,人工智能智能體可廣義地定義為使用傳感器感知(聲音、文本、圖像、壓力等)并(使用效應(yīng)器)對環(huán)境做出響應(yīng)的實體。人工智能智能體通常具有自主性(定義為在無需持續(xù)人工干預(yù)的情況下獨立運行和決策的能力)和權(quán)限(定義為在規(guī)定范圍內(nèi)執(zhí)行特定行動的授予權(quán)限和訪問權(quán)利),以采取行動實現(xiàn)一組特定目標(biāo),從而改變其環(huán)境。
圖 1 展示了人工智能智能體的核心組件:
- 用戶輸入:人工智能智能體接收的外部(如人類、其他智能體)輸入。這可能是通過基于聊天的界面輸入的指令、語音命令或預(yù)先錄制的數(shù)據(jù)。
- 環(huán)境:人工智能智能體運行的邊界。它是智能體應(yīng)用其傳感器和效應(yīng)器根據(jù)接收到的輸入和控制中心決定的行動來感知和改變周圍環(huán)境的區(qū)域。環(huán)境可以是物理基礎(chǔ)設(shè)施,如自動駕駛汽車的映射區(qū)域,也可以是數(shù)字基礎(chǔ)設(shè)施,如編碼智能體的企業(yè)內(nèi)部網(wǎng)。
- 傳感器:智能體感知環(huán)境的機制。傳感器可以是物理設(shè)備(如相機或麥克風(fēng)),也可以是數(shù)字設(shè)備(如對數(shù)據(jù)庫或網(wǎng)絡(luò)服務(wù)的查詢)。
- 控制中心:通常與模型(如大型語言模型)一起構(gòu)成人工智能智能體的核心。控制中心幫助處理信息、做出決策和規(guī)劃行動。根據(jù)人工智能智能體的能力,控制中心涉及復(fù)雜的算法和模型,使智能體能夠評估不同選項并選擇最佳行動方案。
- 感知:人工智能智能體接收到的關(guān)于其環(huán)境的數(shù)據(jù)輸入,可能來自各種傳感器或其他數(shù)據(jù)源。它們代表智能體對其環(huán)境的感知或理解。
- 效應(yīng)器:智能體用于對環(huán)境采取行動的工具。在物理環(huán)境中,效應(yīng)器可能包括機械臂或輪子,而在數(shù)字環(huán)境中,它們可能是發(fā)送給其他軟件系統(tǒng)的命令,如生成數(shù)據(jù)可視化或執(zhí)行工作流。
- 行動:代表效應(yīng)器所做的改變。在物理環(huán)境中,行動可能是推動一個物體,而在數(shù)字環(huán)境中,它們可能與更新數(shù)據(jù)庫相關(guān)。
人工智能智能體的演進
開發(fā)人員已經(jīng)將人工智能從基于規(guī)則的系統(tǒng)轉(zhuǎn)變?yōu)槟軌蛟趫?zhí)行任務(wù)時學(xué)習(xí)和適應(yīng)的主動智能體。
人工智能智能體的發(fā)展始于 20 世紀(jì) 50 年代,從那時起,它們已經(jīng)從簡單的基于規(guī)則的系統(tǒng)演變?yōu)槟軌蜻M行復(fù)雜決策的復(fù)雜自主實體。早期的人工智能具有確定性的行為特征,依賴固定規(guī)則和邏輯,這使得這些系統(tǒng)可預(yù)測,但無法從新經(jīng)驗中學(xué)習(xí)或適應(yīng)。
人工智能研究的進展引入了能夠處理更大數(shù)據(jù)集和管理不確定性的系統(tǒng),從而產(chǎn)生了概率性結(jié)果和非確定性行為。這一轉(zhuǎn)變使得決策更加靈活和動態(tài),超越了僵化的框架。
20 世紀(jì) 90 年代是一個重要的轉(zhuǎn)折點,機器學(xué)習(xí)應(yīng)用變得更加廣泛。人工智能系統(tǒng)開始從數(shù)據(jù)中學(xué)習(xí),隨時間適應(yīng)并提高性能。在此期間神經(jīng)網(wǎng)絡(luò)的引入為深度學(xué)習(xí)奠定了基礎(chǔ),深度學(xué)習(xí)自此成為現(xiàn)代人工智能的核心。
自 2017 年以來,大型語言模型的興起改變了人工智能在自然語言理解和生成方面的能力。這些模型使用大量數(shù)據(jù)生成類似人類的文本并參與復(fù)雜的基于語言的任務(wù)。
如今的人工智能智能體使用各種學(xué)習(xí)技術(shù),包括強化學(xué)習(xí)或遷移學(xué)習(xí),使其能夠不斷提升能力、適應(yīng)新環(huán)境并做出更明智的決策。
關(guān)鍵技術(shù)趨勢
在過去 25 年中,計算能力的提升、互聯(lián)網(wǎng)上大量數(shù)據(jù)的可用性以及新的算法突破推動了人工智能智能體能力基礎(chǔ)技術(shù)的顯著發(fā)展。以下是對這些技術(shù)的簡要描述:
- 大型模型:大型語言模型和大型多模態(tài)模型徹底改變了人工智能智能體的能力,特別是在自然語言處理以及文本、圖像、音頻和視頻的生成方面。大型模型的出現(xiàn)得益于多項技術(shù)進步和 Transformer 架構(gòu),該架構(gòu)為更深入地理解上下文和單詞關(guān)系鋪平了道路,極大地提高了自然語言處理任務(wù)的效率和性能??傊?,先進的人工智能模型實現(xiàn)了對自然語言更好的理解、生成和交互。
- 機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù):一系列技術(shù)通過提高效率和增強專業(yè)性極大地改進了人工智能模型。一些機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的示例包括:
a.監(jiān)督學(xué)習(xí):有助于從標(biāo)記數(shù)據(jù)集中學(xué)習(xí),使模型能夠準(zhǔn)確預(yù)測或分類新的、以前未見過的數(shù)據(jù)。
b.強化學(xué)習(xí):使智能體能夠通過在動態(tài)環(huán)境中試錯來學(xué)習(xí)最優(yōu)行為。智能體可以不斷更新其知識庫,而無需定期重新訓(xùn)練。
c.基于人類反饋的強化學(xué)習(xí):使智能體能夠通過人類反饋進行適應(yīng)和改進,特別關(guān)注使人工智能行為與人類價值觀和偏好保持一致。
d.遷移學(xué)習(xí):涉及采用預(yù)先訓(xùn)練的模型(通常在大型數(shù)據(jù)集上進行訓(xùn)練,如識別汽車)并將其適應(yīng)于新的但相關(guān)的問題(如識別卡車)。
e.微調(diào):涉及采用預(yù)先訓(xùn)練的模型并在較小的、特定任務(wù)的數(shù)據(jù)集上進一步訓(xùn)練。這個過程使模型能夠保留其基礎(chǔ)知識,同時提高其在特定任務(wù)上的性能。
這些以及其他學(xué)習(xí)范式經(jīng)常結(jié)合使用,極大地擴展了人工智能智能體在各個應(yīng)用領(lǐng)域的問題解決能力。人工智能智能體能力的演變?nèi)鐖D 2 所示,智能體類型將在下一節(jié)進一步展開。
人工智能智能體的類型
本節(jié)概述了不同類型的人工智能智能體,并追溯了它們的演變,強調(diào)了支持其發(fā)展的關(guān)鍵技術(shù)進步。根據(jù)其定義特征,人工智能智能體可分為確定性或非確定性,如下所述:
確定性人工智能智能體 | 非確定性人工智能智能體 |
基于規(guī)則:按照固定規(guī)則和邏輯運行,意味著相同的輸入將始終產(chǎn)生相同的輸出。 | 數(shù)據(jù)驅(qū)動和概率性:基于數(shù)據(jù)中的統(tǒng)計模式進行決策,結(jié)果不是固定的,而是概率性的。 |
可預(yù)測行為:決策過程透明且一致,使得結(jié)果可預(yù)測。 | 靈活且自適應(yīng):能夠從數(shù)據(jù)中學(xué)習(xí),適應(yīng)新情況并處理不確定性,通常對于類似輸入會產(chǎn)生不同結(jié)果。 |
有限適應(yīng)性:這些系統(tǒng)無法從新數(shù)據(jù)中學(xué)習(xí)或適應(yīng)變化;它們僅遵循預(yù)定義路徑。 | 復(fù)雜決策:使用考慮概率、隨機性或其他非確定性元素的算法,允許更細(xì)微和復(fù)雜的行為。 |
類型 | 定義 | 示例 |
簡單反射智能體 | 簡單反射智能體基于對環(huán)境的感知運行,不考慮過去的經(jīng)驗。相反,它們遵循預(yù)定義規(guī)則將特定輸入映射到特定行動。條件 - 行動規(guī)則的實施允許對環(huán)境刺激快速響應(yīng)。這些早期智能體是簡單的基于規(guī)則的機器或算法,旨在提供靜態(tài)信息,無法適應(yīng)或改變行動方向。 | 使用關(guān)鍵字匹配的基本垃圾郵件過濾器、具有預(yù)定義響應(yīng)的簡單聊天機器人、在特定觸發(fā)條件下發(fā)送預(yù)寫回復(fù)的自動電子郵件回復(fù)器 |
基于模型的反射智能體 | 基于模型的反射智能體旨在跟蹤其環(huán)境中當(dāng)前不可見的部分。它們通過使用先前觀察的存儲信息來實現(xiàn)這一點,從而能夠基于當(dāng)前輸入和過去經(jīng)驗做出決策。由于它們的行動基于當(dāng)前感知和內(nèi)部模型,這些智能體比簡單反射智能體更具適應(yīng)性,盡管它們也受條件 - 行動規(guī)則的約束。 | 通過調(diào)整當(dāng)前和歷史溫度數(shù)據(jù)以及用戶偏好來優(yōu)化能源使用的智能恒溫器、使用傳感器和地圖高效導(dǎo)航并避免障礙物和優(yōu)化清潔路徑的智能機器人吸塵器、使用傳感器收集土壤、濕度、溫度和降水等環(huán)境因素實時數(shù)據(jù)以優(yōu)化水分配的現(xiàn)代灌溉系統(tǒng) |
基于目標(biāo)的智能體 | 基于目標(biāo)的智能體能夠考慮未來場景。這種類型的智能體考慮行動結(jié)果的可取性并計劃實現(xiàn)特定目標(biāo)。目標(biāo)導(dǎo)向規(guī)劃算法的集成使智能體能夠基于未來結(jié)果做出決策,使其適用于復(fù)雜決策任務(wù)。 | 具有贏得比賽目標(biāo)的高級國際象棋人工智能引擎,規(guī)劃能最大程度提高獲勝概率的走法并考慮長期策略、為物流設(shè)置高效交付目標(biāo)并通過設(shè)定明確優(yōu)先級規(guī)劃最優(yōu)路線的路線優(yōu)化系統(tǒng)、設(shè)定解決客戶問題目標(biāo)并規(guī)劃對話流程以高效實現(xiàn)目標(biāo)的客戶服務(wù)聊天機器人 |
基于效用的智能體 | 基于效用的智能體采用搜索和規(guī)劃算法來處理沒有直接結(jié)果的復(fù)雜任務(wù),從而超越了簡單的目標(biāo)實現(xiàn)。它們使用效用函數(shù)為每個潛在狀態(tài)分配加權(quán)分?jǐn)?shù),以便在目標(biāo)沖突或不確定的情況下促進最優(yōu)決策?;跊Q策理論,這種方法允許在復(fù)雜環(huán)境中進行更高級的決策。這些智能體可以根據(jù)其相對重要性平衡多個可能相互沖突的目標(biāo)。 | 在評估速度、燃油效率和乘客舒適度等權(quán)衡的同時優(yōu)化安全、效率和舒適度的自動駕駛系統(tǒng)、根據(jù)權(quán)衡風(fēng)險、回報和客戶偏好的效用函數(shù)做出財務(wù)決策的機器人顧問等投資組合管理系統(tǒng)、分析患者病歷、標(biāo)記患者數(shù)據(jù)(如腫瘤檢測)并與醫(yī)生合作優(yōu)化治療策略建議的醫(yī)療診斷助手 |
高級人工智能智能體
許多當(dāng)前的人工智能智能體架構(gòu)通?;诨蚺c大型語言模型相關(guān)聯(lián),其配置方式復(fù)雜。圖 3 展示了導(dǎo)致當(dāng)前人工智能智能體突破及其不斷擴展的能力的關(guān)鍵組件的簡化概述。
人工智能智能體從用戶輸入開始,用戶輸入被導(dǎo)向智能體的控制中心。用戶輸入可以是執(zhí)行指令的提示。控制中心將用戶輸入導(dǎo)向模型,模型構(gòu)成了人工智能智能體的核心算法基礎(chǔ)。根據(jù)應(yīng)用需求,該模型可以是大型語言模型或大型多模態(tài)模型。然后,模型處理來自用戶指令的輸入數(shù)據(jù)以生成期望的結(jié)果。
架構(gòu)的核心是控制中心,它是管理整個系統(tǒng)信息和命令流的關(guān)鍵組件。它充當(dāng)編排層,將輸入導(dǎo)向模型,并將輸出路由到適當(dāng)?shù)墓ぞ呋蛐?yīng)器。簡單來說,該層協(xié)調(diào)以下之間的信息流動:1)用戶輸入,2)決策和規(guī)劃,3)內(nèi)存管理,4)工具訪問和 5)系統(tǒng)的效應(yīng)器,以在數(shù)字或物理環(huán)境中采取行動。
人工智能智能體的決策和規(guī)劃組件使用模型的輸出來輔助多步驟過程的決策和規(guī)劃。在這部分中,實現(xiàn)了諸如思維鏈(CoT)推理等高級功能,這使人工智能智能體能夠進行多步驟推理和規(guī)劃。思維鏈?zhǔn)且环N技術(shù),人工智能智能體通過系統(tǒng)地處理和闡述中間步驟來得出結(jié)論,這增強了智能體以透明方式解決復(fù)雜問題的能力,因為模型底層推理的每個步驟都以自然語言再現(xiàn)。
內(nèi)存管理對于操作的連續(xù)性和相關(guān)性至關(guān)重要。該組件確保人工智能智能體記住先前的互動并保持上下文。這對于需要歷史數(shù)據(jù)來做出決策或在聊天機器人中保持對話上下文的任務(wù)至關(guān)重要。
工具使人工智能智能體能夠訪問和與多種功能或模態(tài)進行交互。例如,在在線環(huán)境中,人工智能智能體可以訪問外部工具,如網(wǎng)絡(luò)搜索以收集實時信息和日程安排工具以管理約會和發(fā)送提醒,以及項目管理軟件以跟蹤任務(wù)和截止日期。在模態(tài)方面,人工智能智能體可以使用自然語言處理工具以及圖像識別能力來執(zhí)行需要理解文本和視覺數(shù)據(jù)源的任務(wù)。
一旦做出決策或制定計劃,人工智能智能體的效應(yīng)器組件就會執(zhí)行所需的行動。這可能涉及與物理世界交互(在機器人技術(shù)中)、執(zhí)行軟件功能或向人類用戶提供建議和決策。
學(xué)習(xí)組件是模型的內(nèi)在組成部分,使人工智能智能體能夠隨著模型收集更多輸入,使用第 2.1 節(jié)中提到的機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù),隨著時間的推移提高其性能。
應(yīng)用層圍繞控制中心、模型和其他組件,充當(dāng)人工智能智能體與其環(huán)境之間的接口。它解釋控制中心的輸出并使其適應(yīng)特定任務(wù)或領(lǐng)域。例如,在醫(yī)療人工智能智能體中,應(yīng)用層將通過適當(dāng)?shù)挠脩艚缑鎸⒛P洼敵鲛D(zhuǎn)換為診斷、治療建議或醫(yī)療警報。
總之,當(dāng)先進人工智能智能體的各個組件協(xié)同工作時,它們代表了智能體對環(huán)境進行建模、維護帶有信念和偏好的內(nèi)存或知識存儲以及學(xué)習(xí)、規(guī)劃、決策、感知(感知)、行動(交互)和與周圍環(huán)境通信的能力。
示例:汽車信息娛樂系統(tǒng)中的人工智能智能體
汽車信息娛樂系統(tǒng)中的人工智能智能體充當(dāng)智能助手,通過語音命令激活,用于管理導(dǎo)航、娛樂、氣候控制和其他車輛設(shè)置。它處理實時交通、天氣和駕駛員偏好以優(yōu)化路線,在遇到延誤或危險時建議替代路線。該智能體根據(jù)用戶習(xí)慣個性化娛樂,推薦附近的停靠點,如餐廳或加油站,并主動提供更新,如低燃油警報或電動汽車的最佳充電點 —— 所有這些都確保駕駛員始終專注于道路。
人工智能智能體系統(tǒng)
人工智能智能體系統(tǒng)是一種將多個異構(gòu)(如基于規(guī)則和基于目標(biāo)的智能體)或同構(gòu)(如僅基于目標(biāo)的智能體)人工智能智能體集成的組織結(jié)構(gòu)。每個智能體通常是專門化的,擁有自己的能力、知識和決策過程,同時共享數(shù)據(jù)以協(xié)同實現(xiàn)系統(tǒng)目標(biāo)。
有幾種可能的設(shè)計,例如:
- 智能體混合:其中每個智能體按順序被調(diào)用,智能體處理來自前一個智能體的輸出。
- 中央編排:協(xié)調(diào)智能體的調(diào)用并相應(yīng)地管理輸入和輸出。
人工智能智能體系統(tǒng)旨在確保每個智能體都為總體目標(biāo)做出貢獻,無論是涉及管理復(fù)雜的實時過程,如自動駕駛、優(yōu)化工業(yè)過程還是協(xié)調(diào)活動;例如,在智慧城市基礎(chǔ)設(shè)施中。通過在專門的智能體之間分配工作量,系統(tǒng)可以處理動態(tài)環(huán)境并適應(yīng)變化的條件,確保最佳性能。
示例:自動駕駛汽車人工智能智能體系統(tǒng)
一個人進入自動駕駛汽車(AV)。該自動駕駛汽車由一個人工智能智能體系統(tǒng)組成,包括用于感知、路徑規(guī)劃、定位(確定其在道路上的特定位置)和控制(轉(zhuǎn)向和剎車)的智能體。
感知和定位智能體致力于通過傳感器、全球定位系統(tǒng)(GPS)和攝像頭持續(xù)繪制環(huán)境地圖。規(guī)劃智能體根據(jù)實時交通、天氣和道路狀況計算最優(yōu)軌跡??刂浦悄荏w處理車輛的核心機械操作,如剎車、加速和轉(zhuǎn)向。人工智能信息娛樂系統(tǒng)作為與乘客的接口,根據(jù)用戶偏好處理語音命令、調(diào)整路線、氣候、娛樂或其他車內(nèi)設(shè)置。
所有智能體以協(xié)調(diào)和集中的方式協(xié)同工作,確保車輛安全、高效地到達目的地,同時優(yōu)先考慮乘客的舒適和安全。
人工智能智能體的未來:邁向多智能體系統(tǒng)
多智能體系統(tǒng)(MAS)由多個獨立的人工智能智能體以及人工智能智能體系統(tǒng)組成,它們通過協(xié)作、競爭或協(xié)商來實現(xiàn)共同的任務(wù)和目標(biāo)。這些智能體可以是自主實體,如軟件程序或機器人,每個通常都具有特定的能力、知識和決策過程。這使得智能體能夠并行執(zhí)行任務(wù)、相互通信并適應(yīng)復(fù)雜環(huán)境的變化。
多智能體系統(tǒng)的架構(gòu)由每個參與智能體或系統(tǒng)的期望結(jié)果和目標(biāo)決定。有幾種架構(gòu)類型,例如:
- 網(wǎng)絡(luò)架構(gòu):在這種設(shè)置中,所有智能體或系統(tǒng)可以相互通信以達成符合多智能體系統(tǒng)目標(biāo)的共識。例如,當(dāng)自動駕駛汽車在狹窄空間停車時,它們會進行通信以避免碰撞。在這種情況下,多智能體系統(tǒng)防止事故的目標(biāo)與每個自動駕駛汽車的安全導(dǎo)航目標(biāo)一致,使它們能夠有效協(xié)調(diào)并達成共識。
- 監(jiān)督架構(gòu):在這種模型中,一個 “監(jiān)督者” 智能體協(xié)調(diào)其他智能體之間的交互。當(dāng)智能體的目標(biāo)存在分歧且無法達成共識時,這種架構(gòu)很有用。監(jiān)督者可以在考慮每個智能體的獨特目標(biāo)的同時,調(diào)解和確定多智能體系統(tǒng)目標(biāo)的優(yōu)先級,從而找到折衷方案。例如,當(dāng)買家和賣家智能體無法就交易達成一致時,可由人工智能智能體監(jiān)督者進行調(diào)解。
雖然目前的努力主要集中在封閉環(huán)境或特定軟件生態(tài)系統(tǒng)中開發(fā)人工智能智能體,但未來可能會看到多個智能體在不同領(lǐng)域和應(yīng)用中進行協(xié)作。在多智能體系統(tǒng)中,不同類型的智能體可以共同處理日益復(fù)雜的任務(wù),這些任務(wù)需要多步驟流程,并整合來自各個領(lǐng)域的專業(yè)知識以實現(xiàn)更復(fù)雜的結(jié)果。
這些智能體可以在更廣泛的自適應(yīng)系統(tǒng)中進行通信和交互,使它們能夠比單個智能體甚至人工智能智能體系統(tǒng)更有效地處理特定任務(wù)和復(fù)雜情況。
在某些情況下,多智能體系統(tǒng)解決了單智能體系統(tǒng)的局限性,如可擴展性問題、在出現(xiàn)故障或錯誤時缺乏彈性以及技能集有限。通過在多個智能體之間分配任務(wù),多智能體系統(tǒng)可以提高效率和能力。
從理論上講,多智能體系統(tǒng)具有高度的適應(yīng)性,因為智能體可以動態(tài)地添加或刪除,使系統(tǒng)能夠響應(yīng)不斷變化的環(huán)境和要求。這種可擴展性對于需要隨時間增長或演變而無需大量重新設(shè)計的應(yīng)用至關(guān)重要。
在許多方面,多智能體系統(tǒng)可以被視為一種未來的系統(tǒng)類型,它可以通過人類可理解的語言或有待確定的人工智能智能體協(xié)議在多個用戶或組織之間協(xié)調(diào)智能體行動。
示例:使用車對萬物(V2X)通信的智慧城市交通管理
在智慧城市中,一個多智能體系統(tǒng)(MAS)使用車對萬物(V2X)通信實時管理交通流量,使車輛能夠與其他車輛、行人和道路基礎(chǔ)設(shè)施進行交互。每個交通信號燈由一個人工智能智能體系統(tǒng)控制,該系統(tǒng)與附近的信號燈、公共交通系統(tǒng)、緊急服務(wù)和停車服務(wù)進行通信以檢查可用性。配備自己的人工智能智能體系統(tǒng)的車輛共享速度、位置和道路狀況等數(shù)據(jù),以便進行協(xié)調(diào)行動,提高道路安全、交通效率和能源使用效率。例如,如果發(fā)生事故,人工智能智能體可以重新規(guī)劃交通路線、調(diào)整信號燈時間、通知緊急服務(wù),并與車輛和行人進行通信以避開事故區(qū)域,所有這些都只需最少的人工干預(yù)。這個系統(tǒng)通過動態(tài)適應(yīng)實時情況優(yōu)化交通流量、提高道路安全并降低能源消耗。例如,如果一個停車場已滿,系統(tǒng)可以引導(dǎo)車輛前往更遠(yuǎn)的可用停車場,即使這與司機和車載人工智能智能體對近距離的偏好相沖突。
多智能體系統(tǒng)的互操作性
多智能體系統(tǒng)中的一個技術(shù)挑戰(zhàn)是實現(xiàn)不同人工智能智能體和人工智能智能體系統(tǒng)之間的有效通信。在某些情況下,交互受到本地應(yīng)用環(huán)境邊界的限制,將人工智能智能體的潛力限制在更窄和更專業(yè)化的子領(lǐng)域,在這些子領(lǐng)域中更容易保持控制。
人工智能智能體的互操作性依賴于通用通信協(xié)議,這些協(xié)議是管理人工智能智能體如何交換信息的規(guī)則和標(biāo)準(zhǔn)。這些協(xié)議通常可分為兩類:
- 預(yù)定義協(xié)議:基于已建立的智能體通信語言和本體。由于它們是預(yù)定義的,通信模式是可預(yù)測和一致的;然而,它們可能無法很好地適應(yīng)出現(xiàn)新通信需求的動態(tài)環(huán)境。
- 涌現(xiàn)協(xié)議:允許智能體根據(jù)自己的經(jīng)驗學(xué)習(xí)如何有效通信,通常使用強化學(xué)習(xí)技術(shù)。這使智能體能夠根據(jù)變化的環(huán)境和任務(wù)調(diào)整其通信策略。然而,解碼和理解涌現(xiàn)通信仍然是一個持續(xù)的研究挑戰(zhàn)。
很好地理解人工智能智能體之間交換的消息至關(guān)重要,否則可能會影響多智能體系統(tǒng)的整體可靠性。這種不一致可能會導(dǎo)致智能體協(xié)作時出現(xiàn)誤解或行動不一致,特別是在需要精確協(xié)調(diào)的復(fù)雜環(huán)境中。為了提高多智能體交互的透明度,交換的信息需要易于人類訪問和解釋。
本文轉(zhuǎn)載自??歐米伽未來研究所??,作者: 歐米伽未來研究所 ????
