自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="gzk8b"><track id="gzk8b"><sub id="gzk8b"></sub></track></cite>

<sub id="gzk8b"><p id="gzk8b"><li id="gzk8b"></li></p></sub>

<sub id="gzk8b"></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

大模型驅(qū)動(dòng)空間智能綜述：具身智能體、智慧城市與地球科學(xué)的進(jìn)展

歐米伽未來(lái)研究所

發(fā)布于 2025-4-25 06:36

瀏覽

0收藏

我們生活在一個(gè)由空間構(gòu)成的世界中。從每天在家居、辦公環(huán)境或城市街道中的移動(dòng)，到規(guī)劃一次跨越山海的旅行，乃至科學(xué)家們研究氣候變遷的地理模式、城市擴(kuò)張的復(fù)雜格局，這一切都深刻地依賴于我們對(duì)空間的感知、理解和運(yùn)用能力。這種核心能力，我們稱之為“空間智能”。

長(zhǎng)久以來(lái)，人類憑借自身的感官系統(tǒng)和發(fā)達(dá)的大腦，不斷地探索、適應(yīng)并改造著周遭的空間環(huán)境，演化出了獨(dú)特的空間認(rèn)知機(jī)制。而今，隨著人工智能（AI）技術(shù)的日新月異，特別是大語(yǔ)言模型（LLMs）的橫空出世，機(jī)器也開始顯露出令人矚目的空間智能潛力。這場(chǎng)由大模型引領(lǐng)的技術(shù)浪潮，正以前所未有的深度和廣度，滲透到從微觀尺度的機(jī)器人導(dǎo)航，到中觀尺度的城市規(guī)劃管理，再到宏觀尺度的地球科學(xué)研究等諸多領(lǐng)域。

這部報(bào)告由清華大學(xué)和芬蘭赫爾辛基大學(xué)共同發(fā)布，將帶領(lǐng)讀者一同深入探究，大模型是如何被賦予“空間感”的？它們?cè)诳缭讲煌叨鹊目臻g智能任務(wù)中扮演著怎樣日益重要的角色？以及在邁向更高級(jí)空間智能的征途上，我們還面臨哪些挑戰(zhàn)與無(wú)限可能？

第一節(jié)：空間智能的基石——大模型如何“理解”空間？

要讓機(jī)器具備真正意義上的空間智能，首要任務(wù)是讓它們能夠像人類一樣去“理解”空間。這并非易事，其核心在于構(gòu)建兩大基礎(chǔ)能力：有效的空間記憶與知識(shí)儲(chǔ)備，以及靈活的抽象空間推理能力。

空間記憶與知識(shí)：大模型腦中的“世界地圖”

我們每個(gè)人在探索環(huán)境的過(guò)程中，都會(huì)在腦海中構(gòu)建一幅內(nèi)在的“認(rèn)知地圖”。這幅地圖并非嚴(yán)格精確的物理復(fù)制品，而是我們對(duì)環(huán)境空間布局、地標(biāo)、路徑等信息的個(gè)性化、有時(shí)甚至是略帶主觀扭曲的內(nèi)部表征。正是這幅認(rèn)知地圖，引導(dǎo)著我們的日常導(dǎo)航行為，幫助我們回憶起曾經(jīng)走過(guò)的路。神經(jīng)科學(xué)的研究揭示了其生物學(xué)基礎(chǔ)，大腦中的海馬體和內(nèi)嗅皮層等區(qū)域，特別是其中的“位置細(xì)胞”（當(dāng)我們處于特定地點(diǎn)時(shí)激活）和“網(wǎng)格細(xì)胞”（提供類似坐標(biāo)系的度量信息），在構(gòu)建和維護(hù)這幅內(nèi)在地圖中發(fā)揮著至關(guān)重要的作用。

更進(jìn)一步，人類還能超越具體環(huán)境，形成更為抽象的“空間圖式”。這是一種從大量相似經(jīng)驗(yàn)中提煉出來(lái)的、關(guān)于空間組織方式的通用知識(shí)結(jié)構(gòu)，比如我們對(duì)“典型現(xiàn)代城市街道網(wǎng)絡(luò)”或“標(biāo)準(zhǔn)公寓房間布局”會(huì)有一種大致的預(yù)期和理解。

那么，計(jì)算模型，尤其是大語(yǔ)言模型，是如何學(xué)習(xí)和存儲(chǔ)類似的空間記憶與知識(shí)的呢？它們獲取空間信息的方式主要有兩種。其一，通過(guò)“內(nèi)化吸收”。在預(yù)訓(xùn)練階段，大模型會(huì)接觸并處理包含海量文本和（對(duì)于多模態(tài)模型而言還包括）圖像的數(shù)據(jù)。這些數(shù)據(jù)中蘊(yùn)藏著豐富的地理名稱、地點(diǎn)描述、空間關(guān)系（如“A在B旁邊”）、物體外觀、地圖圖片等等。模型在學(xué)習(xí)語(yǔ)言模式的同時(shí)，也將這些空間相關(guān)的信息以某種復(fù)雜的方式編碼、壓縮并存儲(chǔ)在其龐大的內(nèi)部參數(shù)網(wǎng)絡(luò)中，形成了一個(gè)隱性的、內(nèi)化的空間知識(shí)庫(kù)。

例如，模型通過(guò)閱讀大量文章可能“知道”了倫敦是英國(guó)的首都，泰晤士河流經(jīng)倫敦，并通過(guò)觀看圖片“認(rèn)識(shí)”了大本鐘的樣貌。研究證實(shí)，現(xiàn)有的大模型確實(shí)能夠回憶起這些空間實(shí)體、屬性及其相互關(guān)系。其二，是“外部調(diào)用”。當(dāng)模型自身的內(nèi)部知識(shí)不足、過(guò)時(shí)或需要處理非常具體、實(shí)時(shí)的空間信息（如某條道路當(dāng)前的擁堵狀況）時(shí)，它們可以通過(guò)設(shè)計(jì)的接口，主動(dòng)查詢外部的專業(yè)數(shù)據(jù)庫(kù)、地理信息系統(tǒng)（GIS）、知識(shí)圖譜或者實(shí)時(shí)傳感器數(shù)據(jù)流，從而獲取所需的、外化的空間知識(shí)。

然而，必須承認(rèn)，大模型在空間記憶和知識(shí)方面遠(yuǎn)非完美。一個(gè)突出的問(wèn)題是“幻覺”現(xiàn)象，即模型可能會(huì)生成看似合理但實(shí)際上不符合事實(shí)的空間信息，比如憑空捏造一個(gè)地點(diǎn)，或者錯(cuò)誤地描述兩個(gè)地點(diǎn)的相對(duì)位置。這無(wú)疑會(huì)影響其在實(shí)際應(yīng)用中的可靠性。另一個(gè)嚴(yán)峻的挑戰(zhàn)是知識(shí)的動(dòng)態(tài)更新。真實(shí)世界的空間環(huán)境是不斷變化的：新的建筑拔地而起，舊的商鋪關(guān)門歇業(yè)，交通網(wǎng)絡(luò)持續(xù)調(diào)整。如何讓模型內(nèi)部存儲(chǔ)的知識(shí)能夠及時(shí)、高效、準(zhǔn)確地反映這些變化，即進(jìn)行有效的“知識(shí)編輯”，是一個(gè)亟待解決的技術(shù)難題。

抽象空間推理：超越“死記硬背”的邏輯能力

僅僅記住關(guān)于空間的事實(shí)是遠(yuǎn)遠(yuǎn)不夠的。真正的空間智能核心在于推理能力——基于已知信息推導(dǎo)出新知識(shí)、解決新問(wèn)題的能力。抽象空間推理特指將紛繁復(fù)雜的現(xiàn)實(shí)空間環(huán)境簡(jiǎn)化為易于操作的心智模型，并在此模型上進(jìn)行邏輯思考、規(guī)劃和決策的能力。這就像我們不僅能在地圖上找到目的地，還能規(guī)劃出一條最佳路線；不僅認(rèn)識(shí)一個(gè)物體，還能想象它從不同角度觀察或旋轉(zhuǎn)后的樣子。

當(dāng)前，研究人員對(duì)大模型抽象空間推理能力的評(píng)估和提升，主要圍繞幾個(gè)關(guān)鍵方向展開。其一是定性空間推理，這考察模型理解和運(yùn)用基于語(yǔ)言描述的空間關(guān)系（如“在…上方”、“朝…方向”、“介于…之間”）進(jìn)行邏輯推斷的能力。實(shí)驗(yàn)表明，雖然大模型能處理簡(jiǎn)單的單步關(guān)系判斷，但在涉及多步驟、傳遞性的復(fù)雜推理鏈條時(shí)（例如，“A在B北面，B在C西面，問(wèn)A在C的哪個(gè)方向？”），其準(zhǔn)確率會(huì)顯著下降。不過(guò)，研究也發(fā)現(xiàn)，引導(dǎo)模型采用結(jié)構(gòu)化的思考方式，比如逐步分析問(wèn)題，有助于改善其表現(xiàn)。

其二是幾何推理，這聚焦于模型對(duì)基礎(chǔ)數(shù)學(xué)幾何概念（例如形狀、大小、角度、距離、對(duì)稱性、拓?fù)潢P(guān)系等）的理解程度，以及運(yùn)用這些概念解決空間問(wèn)題的能力。相關(guān)的基準(zhǔn)測(cè)試顯示，大模型和視覺語(yǔ)言模型在處理需要深度幾何邏輯推演的問(wèn)題時(shí)，相比于簡(jiǎn)單檢索存儲(chǔ)的幾何知識(shí)，表現(xiàn)要遜色得多，尤其是在需要從結(jié)果反推條件的逆向推理任務(wù)上。

其三是圖論推理。現(xiàn)實(shí)世界中的許多空間關(guān)系，特別是網(wǎng)絡(luò)結(jié)構(gòu)（如道路網(wǎng)、地鐵線路、社交網(wǎng)絡(luò)中的地理分布），可以很自然地抽象為圖的形式，其中節(jié)點(diǎn)代表地點(diǎn)或?qū)嶓w，邊代表它們之間的連接或關(guān)系。圖論推理評(píng)估模型理解和操作這種圖結(jié)構(gòu)的能力，例如尋找兩個(gè)節(jié)點(diǎn)間的最短路徑、判斷網(wǎng)絡(luò)的連通性、識(shí)別特定的子圖模式等。評(píng)測(cè)結(jié)果指出，大模型在執(zhí)行復(fù)雜的圖算法（如計(jì)算最小生成樹、尋找哈密頓回路）方面仍存在明顯不足，但通過(guò)設(shè)計(jì)針對(duì)性的訓(xùn)練方法，例如強(qiáng)調(diào)中間計(jì)算步驟的學(xué)習(xí)，可以一定程度上彌補(bǔ)這些缺陷。

總體來(lái)看，一個(gè)普遍的認(rèn)識(shí)是，當(dāng)前的大語(yǔ)言模型在處理抽象空間問(wèn)題時(shí)，很大程度上仍然是利用其強(qiáng)大的語(yǔ)言建模能力來(lái)“模仿”或“轉(zhuǎn)譯”空間任務(wù)，而非真正擁有了與人類相似的、基于非語(yǔ)言表征的深層空間認(rèn)知與推理機(jī)制。如何彌合語(yǔ)言理解與真正空間認(rèn)知之間的鴻溝，讓模型不僅僅是“說(shuō)”得像，更能“想”得對(duì)，是該領(lǐng)域面臨的核心挑戰(zhàn)和未來(lái)研究的關(guān)鍵方向。結(jié)構(gòu)化推理框架的設(shè)計(jì)、引入外部知識(shí)的引導(dǎo)、以及對(duì)模型內(nèi)部推理過(guò)程的監(jiān)督學(xué)習(xí)，都被認(rèn)為是具有潛力的改進(jìn)途徑。

第二節(jié)：從微觀到宏觀——大模型驅(qū)動(dòng)的多尺度空間智能應(yīng)用

當(dāng)大模型具備了初步的空間記憶、知識(shí)和推理能力后，它們便開始在真實(shí)世界的各種空間智能任務(wù)中扮演起越來(lái)越重要的角色。這些應(yīng)用場(chǎng)景跨越了巨大的尺度范圍：從個(gè)體機(jī)器人所處的幾米見方的微觀環(huán)境，到人類社會(huì)活動(dòng)密集展開的城市空間，再到覆蓋整個(gè)地球、關(guān)乎全球生態(tài)與發(fā)展的宏觀系統(tǒng)。在每一個(gè)尺度上，大模型都帶來(lái)了新的視角和強(qiáng)大的賦能。

具身智能（Embodied Intelligence）：讓機(jī)器人更懂空間、更會(huì)行動(dòng)

具身智能研究的核心，是如何讓智能體（通常是機(jī)器人）能夠在物理世界中有效地感知環(huán)境、理解指令、與物體交互并自主導(dǎo)航。這與空間智能的概念密不可分。想象一下未來(lái)的家庭服務(wù)機(jī)器人，它需要精確理解家中的三維布局，識(shí)別沙發(fā)、桌子、杯子等物品的位置和狀態(tài)，聽懂主人“去客廳茶幾上幫我拿一下遙控器”這樣的自然語(yǔ)言指令，然后自主規(guī)劃出一條安全高效的路徑，靈巧地避開障礙物，最終完成任務(wù)。整個(gè)過(guò)程可以看作是空間智能在微觀尺度上的集中體現(xiàn)，大致包含兩個(gè)相互關(guān)聯(lián)的關(guān)鍵階段。

首先是空間感知與理解。這是智能體通過(guò)其傳感器（如攝像頭、激光雷達(dá)、觸覺傳感器等）收集環(huán)境信息，并將其處理、融合成對(duì)周圍空間狀態(tài)的內(nèi)部表征的過(guò)程。近年來(lái)，多模態(tài)大語(yǔ)言模型（MLLMs）的發(fā)展極大地推動(dòng)了這一領(lǐng)域。研究者們致力于讓模型能夠融合來(lái)自不同模態(tài)的數(shù)據(jù)流，例如結(jié)合視覺圖像（RGB）、深度信息（提供距離感）以及自然語(yǔ)言描述，來(lái)實(shí)現(xiàn)更精準(zhǔn)的三維物體定位、空間關(guān)系判斷（例如，“杯子在桌子上面靠近邊緣的地方”）以及場(chǎng)景語(yǔ)義理解（例如，識(shí)別出這是一個(gè)廚房環(huán)境）。

進(jìn)一步地，模型還需要具備處理動(dòng)態(tài)場(chǎng)景的能力，能夠整合來(lái)自不同時(shí)間點(diǎn)、不同視角的觀測(cè)信息，形成對(duì)環(huán)境（如一個(gè)房間或一個(gè)樓層）隨時(shí)間變化的連貫認(rèn)知。為了支持機(jī)器人在未知環(huán)境中進(jìn)行長(zhǎng)期探索或執(zhí)行復(fù)雜任務(wù)，研究者還借鑒了人類的記憶機(jī)制，開發(fā)了讓智能體能夠記錄已探索區(qū)域地圖、識(shí)別未知邊界、并基于記憶進(jìn)行高效探索規(guī)劃的系統(tǒng)。

其次是空間交互與導(dǎo)航。在對(duì)環(huán)境有了充分理解之后，智能體需要基于任務(wù)目標(biāo)和當(dāng)前狀態(tài)，做出決策并執(zhí)行相應(yīng)的物理動(dòng)作。這可以小到控制機(jī)械臂以合適的姿態(tài)和力度抓取一個(gè)特定物體，也可以大到規(guī)劃?rùn)C(jī)器人在復(fù)雜環(huán)境中的移動(dòng)路徑。

一些研究工作嘗試?yán)妙A(yù)訓(xùn)練好的大模型（特別是視覺語(yǔ)言模型）直接輸出動(dòng)作指令，將高級(jí)任務(wù)分解為底層的控制信號(hào)。而在更具挑戰(zhàn)性的、開放式的環(huán)境中，僅僅依靠感知和簡(jiǎn)單映射是不夠的，模型還需要展現(xiàn)出更強(qiáng)的推理和規(guī)劃能力。

例如，有工作利用大模型生成環(huán)境的三維空間表征，并在此基礎(chǔ)上規(guī)劃出復(fù)雜的、多步驟的操作序列來(lái)完成任務(wù)。另一些工作則利用圖神經(jīng)網(wǎng)絡(luò)等結(jié)構(gòu)來(lái)顯式地建模環(huán)境中的障礙物布局和物體間關(guān)系，以輔助機(jī)器人做出更安全、更合理的動(dòng)作決策。在導(dǎo)航任務(wù)方面，大模型同樣發(fā)揮著核心作用。一種思路是將環(huán)境的視覺或其他傳感信息實(shí)時(shí)地轉(zhuǎn)化為文本描述，然后輸入給大語(yǔ)言模型，利用其強(qiáng)大的常識(shí)推理和規(guī)劃能力來(lái)決定下一步的行動(dòng)方向。另一種思路則更直接地利用多模態(tài)大模型，讓其同時(shí)處理視覺輸入（如第一人稱視角的圖像或鳥瞰圖）和任務(wù)指令，并結(jié)合對(duì)空間布局的理解，直接輸出導(dǎo)航?jīng)Q策或路徑規(guī)劃。

盡管進(jìn)展令人興奮，但要讓機(jī)器人達(dá)到真正流暢、魯棒、智能的空間交互水平，仍有許多難題待解。例如，如何更高效地融合異構(gòu)的多模態(tài)信息？如何提升模型在復(fù)雜、動(dòng)態(tài)、非結(jié)構(gòu)化環(huán)境下的細(xì)粒度空間推理能力？如何讓機(jī)器人的空間認(rèn)知和行為模式更接近人類的直覺，更具可解釋性？這些都是具身智能領(lǐng)域持續(xù)探索的重要方向。

城市空間智能（Urban Spatial Intelligence）：賦能更智慧、更宜居的城市

當(dāng)我們將研究的視野從機(jī)器人所處的室內(nèi)或局部環(huán)境，擴(kuò)展到廣闊而復(fù)雜的城市空間時(shí)，空間智能的內(nèi)涵和挑戰(zhàn)也隨之發(fā)生了深刻的變化。在城市這個(gè)宏大的尺度下，單個(gè)智能體（無(wú)論是人類個(gè)體還是自動(dòng)駕駛汽車）的物理尺寸相對(duì)于整個(gè)環(huán)境來(lái)說(shuō)變得微不足道。智能系統(tǒng)需要處理的是遠(yuǎn)超個(gè)體直接感知范圍的、更加抽象和符號(hào)化的空間信息。

這要求模型具備構(gòu)建大規(guī)模認(rèn)知地圖、進(jìn)行高效路徑規(guī)劃與交通流優(yōu)化、理解城市功能分區(qū)與土地利用模式、模擬人群活動(dòng)規(guī)律、甚至輔助進(jìn)行空間規(guī)劃與設(shè)計(jì)等一系列高級(jí)能力。城市，作為人類社會(huì)活動(dòng)最集中、空間結(jié)構(gòu)最復(fù)雜的人造系統(tǒng)，天然地成為了檢驗(yàn)和發(fā)展宏觀尺度空間智能的最佳試驗(yàn)場(chǎng)。它融合了物理的基礎(chǔ)設(shè)施網(wǎng)絡(luò)（道路、建筑、管線）、功能性的區(qū)域劃分（商業(yè)區(qū)、住宅區(qū)、工業(yè)區(qū)）、以及動(dòng)態(tài)的社會(huì)經(jīng)濟(jì)活動(dòng)流（人流、車流、信息流），為空間智能研究提供了豐富的數(shù)據(jù)和極具價(jià)值的應(yīng)用場(chǎng)景。

大模型在城市空間智能領(lǐng)域的應(yīng)用探索，正呈現(xiàn)出蓬勃發(fā)展的態(tài)勢(shì)，可以大致歸納為以下幾個(gè)關(guān)鍵方面。

其一是空間理解與記憶。這關(guān)乎模型如何編碼、存儲(chǔ)、檢索和理解關(guān)于城市的海量空間信息。大模型在預(yù)訓(xùn)練過(guò)程中，已經(jīng)從文本數(shù)據(jù)中學(xué)習(xí)到了大量的地理先驗(yàn)知識(shí)，例如城市名稱、地標(biāo)建筑、行政區(qū)劃邊界等。

研究者們進(jìn)一步探索如何結(jié)合更多元的城市數(shù)據(jù)源，如高分辨率的衛(wèi)星影像、覆蓋全城的街景圖片、包含各類場(chǎng)所信息的興趣點(diǎn)（POI）數(shù)據(jù)、甚至是社交媒體上用戶分享的帶有地理標(biāo)簽的內(nèi)容，來(lái)讓模型更深入地理解城市區(qū)域的功能特征（例如，判斷一個(gè)街區(qū)是繁華的商業(yè)中心還是寧?kù)o的居民區(qū)）、評(píng)估其建成環(huán)境質(zhì)量、甚至預(yù)測(cè)其社會(huì)經(jīng)濟(jì)發(fā)展水平。

同時(shí)，利用大模型輔助構(gòu)建結(jié)構(gòu)化的“城市知識(shí)圖譜”，能夠系統(tǒng)地存儲(chǔ)城市中各種空間實(shí)體（如道路、建筑、區(qū)域）及其之間的復(fù)雜關(guān)系（如鄰近、包含、連通、功能相似性等），為后續(xù)更復(fù)雜的空間推理和應(yīng)用奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。實(shí)現(xiàn)這些目標(biāo)的技術(shù)路徑多種多樣，包括通過(guò)精心設(shè)計(jì)的提示語(yǔ)（Prompt Engineering）來(lái)有效激發(fā)和提取模型內(nèi)部蘊(yùn)含的先驗(yàn)知識(shí)、發(fā)展多模態(tài)融合技術(shù)來(lái)對(duì)齊和關(guān)聯(lián)來(lái)自不同數(shù)據(jù)源的區(qū)域特征信息、以及利用大模型自動(dòng)生成標(biāo)注數(shù)據(jù)或提供指導(dǎo)信號(hào)來(lái)輔助訓(xùn)練下游的城市分析任務(wù)模型等。

其二是空間推理與智能。這更側(cè)重于利用已有的城市空間數(shù)據(jù)和知識(shí)，通過(guò)邏輯推理來(lái)挖掘隱含信息、預(yù)測(cè)未來(lái)發(fā)展趨勢(shì)、并最終支持更優(yōu)的城市管理和決策。例如，有研究利用大模型結(jié)合街景圖像進(jìn)行高精度的地理定位推理。在理解和預(yù)測(cè)人類在城市空間中的移動(dòng)行為方面，大模型被用來(lái)學(xué)習(xí)和模擬個(gè)體的出行習(xí)慣與模式，分析人群的時(shí)空聚集特征，這對(duì)于優(yōu)化交通系統(tǒng)、規(guī)劃公共服務(wù)設(shè)施、進(jìn)行商業(yè)智能分析等都具有重要的應(yīng)用價(jià)值。

在更宏觀的城市管理和規(guī)劃決策層面，大模型也開始展現(xiàn)出其潛力。例如，有研究探索利用大模型構(gòu)建多智能體系統(tǒng)，來(lái)模擬不同利益相關(guān)方（如居民、規(guī)劃師、開發(fā)者）在城市規(guī)劃過(guò)程中的互動(dòng)與協(xié)商。還有工作嘗試?yán)么竽Ｐ偷膶?shí)時(shí)推理能力，根據(jù)動(dòng)態(tài)變化的交通流量數(shù)據(jù)，來(lái)智能地調(diào)整交叉口的信號(hào)燈配時(shí)方案，以提升整個(gè)路網(wǎng)的通行效率。在與我們?nèi)粘Ｉ钕⑾⑾嚓P(guān)的城市導(dǎo)航任務(wù)中，模型需要整合地圖信息、實(shí)時(shí)路況、用戶偏好等多方面因素，進(jìn)行端到端的路徑規(guī)劃和導(dǎo)航?jīng)Q策，確保用戶能夠安全、高效、舒適地抵達(dá)目的地。

當(dāng)然，將大模型應(yīng)用于復(fù)雜的城市空間智能任務(wù)，也面臨著獨(dú)特的挑戰(zhàn)。城市數(shù)據(jù)的來(lái)源極其多樣化（傳感器、文本、圖像、矢量地圖等），如何有效地融合這些異構(gòu)數(shù)據(jù)，形成統(tǒng)一而全面的空間表征，是一個(gè)基礎(chǔ)性難題。城市環(huán)境本身是高度動(dòng)態(tài)變化的（交通擁堵、天氣變化、突發(fā)事件等），如何讓模型能夠?qū)崟r(shí)捕捉這些變化并做出快速適應(yīng)性的響應(yīng)，而非僅僅依賴于靜態(tài)的訓(xùn)練數(shù)據(jù)，是提升模型實(shí)用性的關(guān)鍵。

此外，大模型在進(jìn)行空間推理和決策時(shí)的“黑箱”特性，也帶來(lái)了可解釋性和可信度的問(wèn)題。如何確保模型的決策過(guò)程符合空間邏輯和因果關(guān)系，而非僅僅基于數(shù)據(jù)中的統(tǒng)計(jì)關(guān)聯(lián)？如何避免模型因?yàn)橛?xùn)練數(shù)據(jù)中存在的偏見而產(chǎn)生不公平的規(guī)劃建議或資源分配方案？這些問(wèn)題都需要在未來(lái)的研究中得到重點(diǎn)關(guān)注和解決。發(fā)展更強(qiáng)大的動(dòng)態(tài)空間建模能力、構(gòu)建具備因果推理能力的空間智能框架、以及建立完善的算法偏見審計(jì)與緩解機(jī)制，將是推動(dòng)城市空間智能走向成熟和負(fù)責(zé)任應(yīng)用的重要方向。

地球空間智能（Earth Spatial Intelligence, ESI）：以AI之眼洞察我們的藍(lán)色星球

當(dāng)我們將空間智能的尺度再次放大，直至覆蓋我們賴以生存的整個(gè)地球時(shí)，便進(jìn)入了地球空間智能（ESI）的范疇。這是一個(gè)新興的交叉學(xué)科領(lǐng)域，旨在利用人工智能，特別是大模型的能力，來(lái)處理和分析源自地球觀測(cè)（如衛(wèi)星遙感、地面?zhèn)鞲衅骶W(wǎng)絡(luò)）、模擬計(jì)算以及其他途徑的海量、多模態(tài)、時(shí)空關(guān)聯(lián)的地球科學(xué)數(shù)據(jù)。其目標(biāo)是應(yīng)對(duì)諸如氣候變化預(yù)測(cè)與適應(yīng)、自然資源可持續(xù)管理、生態(tài)環(huán)境保護(hù)、地質(zhì)災(zāi)害防治等一系列關(guān)乎人類命運(yùn)和地球健康的全球性重大挑戰(zhàn)。

大語(yǔ)言模型（LLMs）和多模態(tài)大語(yǔ)言模型（MLLMs）憑借其強(qiáng)大的信息處理、模式識(shí)別和知識(shí)整合能力，正在為地球空間智能注入新的活力。

首先，在全球尺度的空間編碼方面，如何讓模型有效地理解和表征地球表面上的任意位置，是一個(gè)基礎(chǔ)且關(guān)鍵的問(wèn)題。雖然在許多基于LLM的應(yīng)用中，簡(jiǎn)單地使用經(jīng)緯度坐標(biāo)作為位置輸入是常見的做法，但在更專業(yè)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)應(yīng)用中，研究者們已經(jīng)開發(fā)并評(píng)估了多種更精密的地理空間表示方法。這些方法包括基于離散網(wǎng)格瓦片ID的編碼、利用周期性函數(shù)（如正弦和余弦）來(lái)編碼連續(xù)地理坐標(biāo)的方案、基于核函數(shù)的技術(shù)，以及能夠更好保留地球球面幾何特性和點(diǎn)對(duì)之間相對(duì)順序關(guān)系的三維球面嵌入方法（例如Sphere2Vec）。

雖然一些基準(zhǔn)測(cè)試表明，針對(duì)特定空間任務(wù)設(shè)計(jì)的專門編碼方法，其性能可能優(yōu)于直接將位置信息輸入給通用的大型視覺語(yǔ)言模型，但這并不意味著大模型在此領(lǐng)域無(wú)用武之地。恰恰相反，大模型在融合多源異構(gòu)信息（例如結(jié)合位置坐標(biāo)、地名、衛(wèi)星圖像、地形數(shù)據(jù)等）、進(jìn)行零樣本或少樣本學(xué)習(xí)（即在缺乏大量標(biāo)注數(shù)據(jù)的情況下進(jìn)行預(yù)測(cè)）以及理解自然語(yǔ)言形式的地理空間指令等方面，展現(xiàn)出了獨(dú)特的優(yōu)勢(shì)和靈活性。

其次，在氣候科學(xué)領(lǐng)域，氣候現(xiàn)象（如溫度、降水、氣壓、風(fēng)場(chǎng)等）本身就具有強(qiáng)烈的時(shí)空依賴性和復(fù)雜的相互作用關(guān)系，這恰好是大模型（尤其是基于Transformer架構(gòu)的模型）擅長(zhǎng)捕捉和建模的模式類型。因此，研究者們開始嘗試?yán)么竽Ｐ蛠?lái)提升天氣預(yù)報(bào)（特別是中長(zhǎng)期預(yù)報(bào)和極端天氣事件，如強(qiáng)降雨、干旱、熱浪的預(yù)警）的精度和時(shí)效性。例如，有工作將預(yù)訓(xùn)練大語(yǔ)言模型中的Transformer模塊“凍結(jié)”并嵌入到氣象預(yù)測(cè)模型（如降水臨近預(yù)報(bào)的擴(kuò)散模型）中，希望借助其強(qiáng)大的序列建模能力來(lái)更好地捕捉長(zhǎng)期的時(shí)間依賴關(guān)系和動(dòng)態(tài)演變趨勢(shì)。

還有研究利用大模型和多模態(tài)模型來(lái)對(duì)齊和理解氣象雷達(dá)/衛(wèi)星觀測(cè)的柵格數(shù)據(jù)與對(duì)應(yīng)的天氣事件描述信息，通過(guò)在這種聯(lián)合數(shù)據(jù)上進(jìn)行訓(xùn)練，使模型能夠基于輸入的觀測(cè)數(shù)據(jù)更準(zhǔn)確地預(yù)測(cè)未來(lái)的氣候事件。值得注意的是，在氣候科學(xué)領(lǐng)域，除了直接應(yīng)用通用LLM之外，一些專門為天氣預(yù)報(bào)設(shè)計(jì)的大型AI模型（如盤古氣象、風(fēng)烏、羲和、NowcastNet等）也取得了突破性進(jìn)展。它們通過(guò)在海量歷史氣象再分析數(shù)據(jù)上進(jìn)行大規(guī)模訓(xùn)練，學(xué)習(xí)地球大氣系統(tǒng)的復(fù)雜動(dòng)力學(xué)規(guī)律，已經(jīng)在全球中期天氣預(yù)報(bào)等任務(wù)上展現(xiàn)出超越傳統(tǒng)數(shù)值預(yù)報(bào)模型的潛力，這進(jìn)一步驗(yàn)證了利用大規(guī)模數(shù)據(jù)驅(qū)動(dòng)方法來(lái)提升地球系統(tǒng)預(yù)測(cè)能力的巨大前景。

再次，在地理學(xué)領(lǐng)域，大模型所蘊(yùn)含的豐富的世界知識(shí)中，天然包含了大量的地理信息。這使得它們可以直接被應(yīng)用于各種與地理相關(guān)的任務(wù)，例如回答關(guān)于特定地點(diǎn)的問(wèn)題（“某某山脈的最高峰是什么？”）、從文本描述或圖像中識(shí)別出地點(diǎn)（地理定位）、分析區(qū)域的社會(huì)經(jīng)濟(jì)特征等。然而，簡(jiǎn)單的直接查詢或應(yīng)用也暴露出一些局限性。

評(píng)測(cè)發(fā)現(xiàn)，雖然大模型在基于記憶的任務(wù)（如識(shí)別著名地標(biāo)）上表現(xiàn)不錯(cuò)，但在需要更深層次推理的任務(wù)（如基于復(fù)雜上下文的地理推斷、進(jìn)行專業(yè)的地理空間分析）上則面臨顯著挑戰(zhàn)。為了克服這些限制，研究者們提出了一些創(chuàng)新的解決方案。

一種思路是構(gòu)建框架，將大模型的自然語(yǔ)言理解和任務(wù)規(guī)劃能力，與成熟的傳統(tǒng)地理信息系統(tǒng)（GIS）工具的專業(yè)空間分析能力相結(jié)合，讓大模型扮演“指揮官”的角色，自動(dòng)調(diào)用合適的GIS工具來(lái)完成用戶提出的地理空間任務(wù)。另一種思路則是通過(guò)改進(jìn)模型本身或其訓(xùn)練方式來(lái)增強(qiáng)其地理空間推理能力，例如，引入能夠感知地理鄰近性的對(duì)比學(xué)習(xí)損失函數(shù)，使得模型學(xué)習(xí)到的地理實(shí)體表征能夠反映其空間關(guān)系；或者設(shè)計(jì)能夠根據(jù)具體任務(wù)自動(dòng)選擇和整合多種信息源（如地圖、人口統(tǒng)計(jì)數(shù)據(jù)、經(jīng)濟(jì)指標(biāo)等）的智能信息收集模塊。

最后，大模型的空間智能潛力也正被積極探索應(yīng)用于其他地球科學(xué)相關(guān)學(xué)科，如海洋學(xué)、地質(zhì)學(xué)、生態(tài)學(xué)等。這些領(lǐng)域往往面臨數(shù)據(jù)稀疏性（例如深海觀測(cè)數(shù)據(jù)遠(yuǎn)少于陸地）、環(huán)境復(fù)雜性以及決策過(guò)程高度依賴專家知識(shí)等挑戰(zhàn)，而大模型的自然語(yǔ)言理解、知識(shí)整合、泛化學(xué)習(xí)和推理能力，恰好為應(yīng)對(duì)這些挑戰(zhàn)提供了新的可能性。例如，在海洋科學(xué)中，有研究利用大模型通過(guò)自然語(yǔ)言指令來(lái)控制水下自治機(jī)器人（AUV）執(zhí)行復(fù)雜的科學(xué)考察任務(wù)，模型需要理解指令、規(guī)劃路徑、應(yīng)對(duì)未知環(huán)境并實(shí)時(shí)做出調(diào)整。還有工作利用大模型來(lái)處理稀疏的海洋觀測(cè)數(shù)據(jù)（如浮標(biāo)測(cè)量的波浪高度），結(jié)合其對(duì)時(shí)空模式的理解能力來(lái)進(jìn)行更準(zhǔn)確的預(yù)測(cè)。

在地質(zhì)學(xué)中，大模型被用來(lái)融合地質(zhì)勘探報(bào)告、鉆孔數(shù)據(jù)、遙感影像等多源信息，預(yù)測(cè)隧道開挖前方的地質(zhì)狀況，以降低工程風(fēng)險(xiǎn)。還有研究構(gòu)建了基于多智能體協(xié)作的框架，讓不同的模型Agent負(fù)責(zé)從不同的遙感數(shù)據(jù)（如高光譜、磁異常）中識(shí)別與礦產(chǎn)相關(guān)的特征，并通過(guò)協(xié)作推理來(lái)輔助礦產(chǎn)資源的勘探。

總的來(lái)說(shuō)，將大模型應(yīng)用于這些地球科學(xué)子領(lǐng)域的通用范式通?？梢詺w納為兩類：一類是將從領(lǐng)域數(shù)據(jù)中提取的關(guān)鍵空間（或時(shí)空）特征，通過(guò)專門設(shè)計(jì)的編碼器或?qū)R模塊，與自然語(yǔ)言提示（prompt）相結(jié)合，然后輸入給大模型，利用其強(qiáng)大的表示和推理能力來(lái)完成特定的預(yù)測(cè)或分類任務(wù)；另一類則是設(shè)計(jì)基于大模型Agent的復(fù)雜工作流，讓模型能夠自主規(guī)劃、執(zhí)行、反思并與其他模型或工具交互，以完成需要多步驟推理和決策的復(fù)雜空間分析任務(wù)。

當(dāng)然，將大模型應(yīng)用于地球空間智能領(lǐng)域，同樣面臨著獨(dú)特的挑戰(zhàn)。如何進(jìn)一步提升模型在處理具有強(qiáng)物理約束和復(fù)雜因果關(guān)系的地球系統(tǒng)問(wèn)題時(shí)的推理能力？如何有效融合具有不同時(shí)空分辨率、不同模態(tài)、不同不確定性的地球科學(xué)數(shù)據(jù)？如何確保模型在數(shù)據(jù)稀疏或存在偏差情況下的泛化性和可靠性？如何讓模型的預(yù)測(cè)結(jié)果和決策過(guò)程對(duì)于領(lǐng)域?qū)＜襾?lái)說(shuō)是可解釋、可信賴的？這些都是未來(lái)研究需要重點(diǎn)攻克的方向。

發(fā)展跨領(lǐng)域的遷移學(xué)習(xí)方法以共享知識(shí)、構(gòu)建標(biāo)準(zhǔn)化的基準(zhǔn)測(cè)試平臺(tái)以促進(jìn)模型比較、利用人機(jī)協(xié)同和可解釋AI（XAI）技術(shù)以增強(qiáng)透明度、探索因果推斷方法以捕捉真實(shí)的地球過(guò)程機(jī)制，以及加強(qiáng)跨學(xué)科合作，將是推動(dòng)地球空間智能取得更大突破、更好地服務(wù)于全球可持續(xù)發(fā)展目標(biāo)的關(guān)鍵所在。

第三節(jié)：挑戰(zhàn)與展望——空間智能的星辰大海

盡管由大模型驅(qū)動(dòng)的空間智能研究與應(yīng)用已經(jīng)取得了令人矚目的成就，描繪出了一幅激動(dòng)人心的未來(lái)圖景，但我們必須清醒地認(rèn)識(shí)到，前方的道路依然充滿挑戰(zhàn)，同時(shí)也蘊(yùn)藏著巨大的發(fā)展機(jī)遇。

在基礎(chǔ)能力層面，關(guān)于空間智能的核心問(wèn)題仍有待深入探索。例如，空間推理的最佳表征形式究竟是什么？是繼續(xù)深化基于自然語(yǔ)言的符號(hào)推理，還是需要發(fā)展更通用的、超越語(yǔ)言的表征方式，比如基于圖結(jié)構(gòu)、幾何約束或多模態(tài)融合的框架？此外，目前我們還缺乏一個(gè)能夠跨領(lǐng)域、跨尺度、全面評(píng)估通用空間智能能力的統(tǒng)一基準(zhǔn)和理論框架。建立這樣的框架，對(duì)于理解不同空間任務(wù)之間的關(guān)聯(lián)、衡量模型進(jìn)步以及指導(dǎo)未來(lái)研究方向至關(guān)重要。我們需要厘清，像心理旋轉(zhuǎn)、空間記憶、路徑整合這些在人類認(rèn)知中被認(rèn)為是基礎(chǔ)的空間能力，在人工智能模型中是如何體現(xiàn)的，以及它們?nèi)绾沃纹鹪谔囟I(lǐng)域（如機(jī)器人導(dǎo)航或城市規(guī)劃）中的高級(jí)應(yīng)用表現(xiàn)。

在具身智能領(lǐng)域，一個(gè)關(guān)鍵挑戰(zhàn)在于如何將我們從認(rèn)知科學(xué)和神經(jīng)科學(xué)中獲得的關(guān)于人類空間認(rèn)知的深刻洞見，不僅僅作為一種表面的靈感來(lái)源，而是系統(tǒng)性地、深度地融入到智能體的模型設(shè)計(jì)、學(xué)習(xí)算法和行為控制中去，從而真正提升機(jī)器人在真實(shí)物理世界中的魯棒性、適應(yīng)性和泛化能力。這需要跨越認(rèn)知科學(xué)、人工智能和機(jī)器人學(xué)之間的鴻溝。同時(shí)，具身智能所涵蓋的任務(wù)范圍極廣，從需要毫米級(jí)精度和復(fù)雜物理推理的精細(xì)操作（例如，靈巧地使用工具），到需要在廣闊、動(dòng)態(tài)、未知環(huán)境中進(jìn)行長(zhǎng)期自主導(dǎo)航的大尺度運(yùn)動(dòng)規(guī)劃（例如，無(wú)人機(jī)在城市上空?qǐng)?zhí)行任務(wù)）。是否有可能，以及如何構(gòu)建一個(gè)統(tǒng)一的、能夠自適應(yīng)地處理這種多層次、多粒度空間智能需求的通用模型或架構(gòu)，仍然是一個(gè)懸而未決的開放性問(wèn)題。

在城市空間智能領(lǐng)域，挑戰(zhàn)同樣嚴(yán)峻。首先是城市數(shù)據(jù)的極端異構(gòu)性問(wèn)題：如何將來(lái)自傳感器網(wǎng)絡(luò)、移動(dòng)設(shè)備、社交媒體、政府開放平臺(tái)等不同來(lái)源，具有不同格式、不同精度、不同時(shí)空分辨率的數(shù)據(jù)（包括文本、圖像、視頻、矢量地圖、時(shí)間序列等）有效融合，形成一個(gè)統(tǒng)一而全面的城市空間表征，是進(jìn)行后續(xù)分析和應(yīng)用的基礎(chǔ)，但目前仍缺乏完美的解決方案。

其次，城市是一個(gè)高度動(dòng)態(tài)的復(fù)雜系統(tǒng)，充滿了實(shí)時(shí)變化（如交通流、人群聚集、空氣質(zhì)量、突發(fā)事件等）和長(zhǎng)期演化（如土地利用變化、人口遷移、基礎(chǔ)設(shè)施老化等）。當(dāng)前主要依賴靜態(tài)數(shù)據(jù)訓(xùn)練的大模型，在捕捉、理解和適應(yīng)這些動(dòng)態(tài)現(xiàn)象方面能力有限，這限制了它們?cè)谛枰獙?shí)時(shí)響應(yīng)和預(yù)測(cè)的城市場(chǎng)景中的應(yīng)用潛力。

再次，大模型決策過(guò)程的不透明性，在城市規(guī)劃、交通管理、應(yīng)急響應(yīng)等高風(fēng)險(xiǎn)、高影響力的應(yīng)用場(chǎng)景中，引發(fā)了關(guān)于可解釋性、可信賴性和公平性的擔(dān)憂。我們需要確保模型的推理過(guò)程不僅僅是擬合數(shù)據(jù)中的統(tǒng)計(jì)模式，而是真正理解了空間布局、功能聯(lián)系和因果關(guān)系。未來(lái)的研究重心可能需要放在：發(fā)展能夠整合實(shí)時(shí)數(shù)據(jù)流、具備動(dòng)態(tài)演化模擬能力的城市空間模型；構(gòu)建強(qiáng)調(diào)因果關(guān)系發(fā)現(xiàn)與推理的空間智能框架，以提升決策的魯棒性和洞察力；以及設(shè)計(jì)和部署有效的算法審計(jì)與偏見緩解技術(shù)，確保城市空間智能應(yīng)用的公平性、包容性和倫理性。

在地球空間智能領(lǐng)域，挑戰(zhàn)與機(jī)遇并存。一方面，如何進(jìn)一步提升大模型在處理涉及復(fù)雜物理過(guò)程、多尺度耦合、長(zhǎng)時(shí)序依賴的地球科學(xué)問(wèn)題時(shí)的深度推理能力，特別是在數(shù)據(jù)稀疏或存在噪聲的情況下，仍然是一個(gè)核心的技術(shù)瓶頸。

另一方面，如何更有效地整合各個(gè)地球科學(xué)子領(lǐng)域（如大氣、海洋、陸地、冰凍圈、生物圈等）的專業(yè)知識(shí)、物理約束和獨(dú)特的觀測(cè)數(shù)據(jù)特點(diǎn)（例如，遙感數(shù)據(jù)的多光譜/高光譜特性、地震波數(shù)據(jù)的復(fù)雜性、生物多樣性調(diào)查數(shù)據(jù)的非結(jié)構(gòu)化等）到大模型框架中，實(shí)現(xiàn)知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)的深度融合，是提升模型性能和實(shí)用性的關(guān)鍵。

未來(lái)的發(fā)展方向可能包括：利用遷移學(xué)習(xí)和領(lǐng)域自適應(yīng)技術(shù)，將在數(shù)據(jù)豐富的領(lǐng)域訓(xùn)練的模型能力遷移到數(shù)據(jù)稀疏的相關(guān)領(lǐng)域；構(gòu)建標(biāo)準(zhǔn)化的地球科學(xué)基準(zhǔn)數(shù)據(jù)集和評(píng)測(cè)平臺(tái)，以促進(jìn)不同模型和方法的公平比較和協(xié)同發(fā)展；加強(qiáng)人機(jī)協(xié)同系統(tǒng)和可解釋AI（XAI）方法的研究與應(yīng)用，以增強(qiáng)領(lǐng)域?qū)＜覍?duì)模型結(jié)果的理解、信任和有效利用；探索將因果推斷方法引入地球系統(tǒng)建模，以期更好地理解地球過(guò)程的驅(qū)動(dòng)機(jī)制和反饋回路；以及大力推動(dòng)跨學(xué)科研究團(tuán)隊(duì)的緊密合作，將AI技術(shù)的最新進(jìn)展與地球科學(xué)的實(shí)際需求相結(jié)合，共同開發(fā)出能夠?yàn)閼?yīng)對(duì)全球環(huán)境挑戰(zhàn)提供有力支撐的智能解決方案。

最后，值得一提的是，空間智能的研究與近年來(lái)同樣備受關(guān)注的“世界模型”（World Model）概念有著緊密的聯(lián)系。世界模型旨在構(gòu)建能夠模擬世界（包括物理和社會(huì)環(huán)境）運(yùn)行的基本規(guī)律、預(yù)測(cè)未來(lái)狀態(tài)并支持智能體進(jìn)行規(guī)劃決策的內(nèi)部表征。

我們?cè)谶@里討論的空間智能，特別是其對(duì)空間環(huán)境的理解、表征和記憶方面，可以看作是構(gòu)建世界模型的一個(gè)重要組成部分，尤其側(cè)重于“理解世界”這一功能。未來(lái)的空間智能研究，有望與世界模型的預(yù)測(cè)和生成能力（例如，模擬不同城市規(guī)劃方案的長(zhǎng)期影響、預(yù)測(cè)氣候變化下極端天氣事件的發(fā)生概率和強(qiáng)度）更緊密地結(jié)合起來(lái)，從而構(gòu)建出更加強(qiáng)大、全面的人工智能系統(tǒng)，不僅能夠理解我們所處的空間世界，更能有效地預(yù)測(cè)其變化、適應(yīng)其復(fù)雜性，并最終幫助我們更好地管理和塑造我們的未來(lái)。

結(jié)語(yǔ)

從深入解析人類自身獨(dú)特的空間認(rèn)知機(jī)制，到努力賦予冰冷的機(jī)器以空間記憶、知識(shí)和推理的能力，再到將這些新興的AI能力廣泛應(yīng)用于從微觀的機(jī)器人交互到宏觀的地球系統(tǒng)模擬等跨越巨大尺度的真實(shí)世界場(chǎng)景——大語(yǔ)言模型，正以前所未有的力量，深刻地重塑著我們對(duì)“空間智能”這一古老而又常新概念的理解和實(shí)踐。毫無(wú)疑問(wèn)，跨領(lǐng)域、多尺度的空間智能研究，將成為未來(lái)人工智能發(fā)展版圖中的一個(gè)極其重要的、充滿活力的前沿領(lǐng)域。我們有理由相信，在這條道路上的持續(xù)探索和突破，不僅將催生出眾多具有巨大科學(xué)價(jià)值和社會(huì)經(jīng)濟(jì)效益的創(chuàng)新應(yīng)用，深刻改變?nèi)祟愓J(rèn)識(shí)和改造世界的方式，而且對(duì)于推動(dòng)通用人工智能（AGI）這一終極目標(biāo)的實(shí)現(xiàn)，也將貢獻(xiàn)不可或缺的基礎(chǔ)性力量。這片由大模型開啟的、充滿無(wú)限可能的空間智能新大陸，正以其獨(dú)特的魅力，吸引著全球的研究者去探索、去開拓、去創(chuàng)造一個(gè)更加智能、更加美好的未來(lái)。

本文轉(zhuǎn)載自????歐米伽未來(lái)研究所????，作者：歐米伽未來(lái)研究所

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

回復(fù)

相關(guān)推薦

造完“大模型”，“具身智能”將引領(lǐng)AI下一個(gè)浪潮？

kekenai ? 2992瀏覽 ? 0回復(fù)
Meta推出開放世界具身問(wèn)答數(shù)據(jù)集OpenEQA：視覺大模型在具身智能上還有很長(zhǎng)的路要走！

AIGC最前線 ? 3295瀏覽 ? 0回復(fù)
具身智能體三維感知新鏈條，TeleAI &上海AI Lab提出多視角融合具身模型「SAM-E」

輕薄滴假象 ? 3174瀏覽 ? 0回復(fù)
大模型思維鏈推理的綜述：進(jìn)展、前沿和未來(lái)

AIRoobt ? 5848瀏覽 ? 0回復(fù)
加速AI應(yīng)用落地，大模型與智能體何以成為“雙驕”

51CTO技術(shù)棧 ? 2903瀏覽 ? 0回復(fù)
具身智能成敗之關(guān)鍵！干貨長(zhǎng)文首次全面回顧具身智能領(lǐng)域中的視覺-語(yǔ)言-動(dòng)作模型！

angel ? 5541瀏覽 ? 0回復(fù)
麻省理工研究團(tuán)隊(duì)革新科學(xué)研究方式,通過(guò)多智能體智能圖推理實(shí)現(xiàn)科學(xué)發(fā)現(xiàn)自動(dòng)化

xuxiangda ? 3382瀏覽 ? 0回復(fù)
讓具身智能更快更強(qiáng)！華東師大&上大提出TinyVLA：高效視覺-語(yǔ)言-動(dòng)作模型，遙遙領(lǐng)先

angel ? 2616瀏覽 ? 0回復(fù)
什么是具身智能模型，它和普通大模型有什么區(qū)別？

AI探索時(shí)代 ? 2826瀏覽 ? 0回復(fù)
多模態(tài)大模型在具身智能領(lǐng)域里程碑工作！清華&字節(jié)開源DeeR-VLA：讓算力內(nèi)存雙降

angel ? 2339瀏覽 ? 0回復(fù)
突破空間限制！從2D到3D：北大等開源Lift3D，助力精準(zhǔn)具身智能操作！

angel ? 2389瀏覽 ? 0回復(fù)
多模態(tài)大語(yǔ)言模型的空間智能探秘：突破與挑戰(zhàn)

十一月雨_55 ? 1985瀏覽 ? 0回復(fù)
人工智能智能體(AI Agent)發(fā)展趨勢(shì)2024年總結(jié)與2025年展望

十一月雨_55 ? 8299瀏覽 ? 0回復(fù)
華為諾亞方舟實(shí)驗(yàn)室突破具身AI瓶頸， SpatialCoT通過(guò)坐標(biāo)對(duì)齊和思路鏈推進(jìn)空間推理

xuxiangda ? 2403瀏覽 ? 0回復(fù)
探索基于大型語(yǔ)言模型的智能體：定義、方法與前景

AIRoobt ? 4045瀏覽 ? 0回復(fù)
人工智能驅(qū)動(dòng)的科學(xué)研究創(chuàng)新，邁向AI協(xié)同科學(xué)家

xuxiangda ? 1514瀏覽 ? 0回復(fù)
API智能體與GUI智能體：差異與融合，誰(shuí)才是未來(lái)？

十一月雨_55 ? 1047瀏覽 ? 0回復(fù)
基礎(chǔ)智能體的進(jìn)展與挑戰(zhàn)：智能體的七個(gè)核心組件構(gòu)建認(rèn)知基石

數(shù)字化助推器 ? 122瀏覽 ? 0回復(fù)
基礎(chǔ)智能體的進(jìn)展與挑戰(zhàn)：自進(jìn)化機(jī)制和構(gòu)建群體MAS系統(tǒng)

數(shù)字化助推器 ? 92瀏覽 ? 0回復(fù)

歐米伽未來(lái)研究所

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

麥肯錫 & Mozilla：2025 人工智能時(shí)代下的開源技術(shù)研究報(bào)告 5天前發(fā)布
依隆大學(xué)暢想數(shù)字未來(lái)中心：2035年人類未來(lái)，AI時(shí)代下的人類變革研究報(bào)告 2025-04-14 09:52:18發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：麥肯錫 & Mozilla：2025 人工智能時(shí)代下的開源技術(shù)研究報(bào)告

社區(qū)精華內(nèi)容

目錄

<sub id="radyn"><p id="radyn"></p></sub>

<style id="radyn"><kbd id="radyn"></kbd></style><legend id="radyn"><track id="radyn"><dfn id="radyn"></dfn></track></legend>