西工大提出全新「群聊式」無人機控制框架!類人對話交互、主動環(huán)境感知、自主實體控制
超強的泛化能力,讓大模型成為「通用人工智能」的一縷曙光。
然而,讀萬卷書,不如行萬里路,在開放環(huán)境中,大模型需要真正地「走」進物理世界,才能切實地理解復(fù)雜任務(wù)、解決實際問題。
近日,李學(xué)龍教授團隊在開放環(huán)境中的自主無人機集群方面開展了創(chuàng)新研究,基于國產(chǎn)大模型,實現(xiàn)了開放環(huán)境下「人機」和「多機」的對話交互,打破人類和機器的交互壁壘,進一步拓展了臨地安防的應(yīng)用場景,讓大模型插上翅膀,飛入我們的現(xiàn)實生活中。
受人類的認知模式啟發(fā),團隊將認知形成的高度自主性凝練為「思維計算—實體控制—環(huán)境感知」的三元交互,建立了「書生·浦語」開源大模型驅(qū)動的自主無人機「群聊式」控制框架,給每架無人機裝上了大腦,讓無人機集群在語言溝通中動態(tài)協(xié)同,實現(xiàn)了開放環(huán)境和復(fù)雜任務(wù)中的智能交互、主動感知和自主控制,提高了無人機任務(wù)執(zhí)行的自主性。
總體而言,類人對話交互、主動環(huán)境感知、自主實體控制,是自主無人機集群的主要能力。
類人對話交互
圖1 無人機群聊溝通
探索人類用戶與無人機的交互方式,讓無人機理解復(fù)雜任務(wù)中的用戶需求,是實現(xiàn)自主無人機的前提條件。
針對此,團隊提出「群聊式」對話交互方法,將聲音、圖像和無人機自身狀態(tài)等多種信息,通過大模型轉(zhuǎn)換為自然語言的對話形式,實現(xiàn)了用戶與無人機,以及無人機與無人機之間自主和直觀的交互方式。
同時,團隊設(shè)計了一套高效的實時反饋機制,使得無人機能夠在任務(wù)執(zhí)行的關(guān)鍵節(jié)點通過對話報告自身狀態(tài)、尋求用戶確認,大大提高了復(fù)雜任務(wù)執(zhí)行的穩(wěn)定性和安全性。
主動環(huán)境感知
圖2 主動發(fā)現(xiàn)并靠近目標
圖3 動態(tài)環(huán)境避障
在飛行過程中,無人機主動感知外部環(huán)境,實時調(diào)整任務(wù)規(guī)劃,是完成復(fù)雜任務(wù)的關(guān)鍵環(huán)節(jié)。
針對此,團隊設(shè)計了任務(wù)引導(dǎo)的主動感知機制,提出了多傳感器融合的低空搜索、動態(tài)避障和視覺定位算法。
在實際任務(wù)執(zhí)行中,根據(jù)感知信息和任務(wù)目標,動態(tài)調(diào)整無人機飛行路徑和觀測位姿,嘗試從不同角度和位置感知周圍世界,逐漸降低環(huán)境中的不確定性,實現(xiàn)高效的信息采集和任務(wù)執(zhí)行。
自主控制
圖4 自主目標抓取
圖5 異構(gòu)無人機集群協(xié)同控制
探索復(fù)合智能體形態(tài),增強復(fù)雜任務(wù)處理能力,是大模型時代新型智能體的研究重點。
針對此,團隊依托無人機平臺設(shè)計了夾爪等末端執(zhí)行器,將傳統(tǒng)無人機拓展為「飛行機器人」,長出「手」來,具備抓取能力。
同時,構(gòu)建了異構(gòu)無人機集群協(xié)同控制機制,結(jié)合環(huán)境感知反饋,實時調(diào)整無人機編隊的飛行狀態(tài),使集群分工執(zhí)行區(qū)域搜索、目標定位和抓取等任務(wù)。
大模型自主無人機集群是團隊將生物智能「思維計算—實體控制—環(huán)境感知」的三元交互模式應(yīng)用于自主智能體的一次成功嘗試,依托大語言模型、無人機平臺和多種傳感器,實現(xiàn)對話交互、主動感知和自主控制,對安防巡檢、災(zāi)害救援、空中物流等臨地安防場景下的應(yīng)用具有重要意義。
參考資料:李學(xué)龍, 臨地安防(Vicinagearth security), 中國計算機學(xué)會通訊, 18(11), 44-52, 2022.