自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

微軟亞洲研究院鄭宇:用人工智能進行城市人流預測

開發(fā) 開發(fā)工具
在鄭宇看來,從技術層面講,此前還沒有真正意義上為時空數(shù)據(jù)設計的深度學習算法,而未來這個方向的研究還會有更深遠的發(fā)展。這個發(fā)展不是簡單的拿來 CNN、RNN 就用,一定是基于對時空數(shù)據(jù)深刻的理解,充分利用時空數(shù)據(jù)本身的特性。

在貴陽「塊數(shù)據(jù)」實驗室的一塊大屏幕上,每一分每一秒都在進入新的數(shù)據(jù),不停地預測每個區(qū)域有多少輛出租車進和出,這是微軟亞洲研究院一個基于云計算和大數(shù)據(jù)的系統(tǒng)正實時運轉(zhuǎn),貴陽出租車的數(shù)據(jù)實時上傳作為測試樣本,驗證模型的準確性和有效性。每點一個格子會跳出一個圖表,都能清楚知道整個城市某區(qū)域人群流動接下來十幾個小時會呈現(xiàn)什么狀態(tài),黑色的是已經(jīng)發(fā)生過的出租車進出情況,綠色預測未來部分,藍色是昨天同一時間的情況。而同樣,任何人流預測數(shù)據(jù)來源,比如手機信號、地鐵刷卡記錄等,都可以通過該系統(tǒng)模型進行運算得到某地將有多少人進和出的結(jié)果,并預測到未來十幾個小時的城市人流情況。

[[183032]]

「這個系統(tǒng)背后的模型研究,其目標是預測整個城市里每個區(qū)域在未來時刻有多少人進、有多少人出,從而使得管理者能迅速了解每個區(qū)域的公共安全狀況,及時采取預警措施?!刮④泚喼扪芯吭褐鞴苎芯繂T鄭宇說,直接促使他下決心開展研究的是,2014 年新年夜那場發(fā)生在上海的踩踏事件,當時,鄭宇曾在微博上呼吁通過基于手機數(shù)據(jù)的城市異常檢測來避免踩踏悲劇?!溉绻谏虾J胁忍な录?,我們應用了這樣的系統(tǒng),就可以提前給民眾發(fā)信息,告知他們這里會有多少人進來,提醒注意是否需要提前離開?!灌嵱钫f。

目前,該研究論文《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》已經(jīng)發(fā)表在 AAAI 2017,在鄭宇看來,除了具有推廣應用的社會價值,從技術層面講,「此前還沒有真正意義上為時空數(shù)據(jù)設計的深度學習算法,這是***篇論述文章,而未來這個方向的研究還會有更深遠的發(fā)展。這個發(fā)展不是簡單的拿來 CNN、RNN 就用,一定是基于對時空數(shù)據(jù)深刻的理解,充分利用時空數(shù)據(jù)本身的特性?!乖诒本?,鄭宇向《機器之心》解讀了這篇論文的研究方法、過程以及正在積極推進的應用方向。

「傳統(tǒng)的深度學習方法不能直接拿來用」

以往提及人流預測,通常會采取預測個人行為的方法,理想狀態(tài)下,只要統(tǒng)計某個區(qū)域每個人去哪里就能測算出該區(qū)域有多少人進、多少人出。但這樣的統(tǒng)計本身有很大的障礙,準確性很難保證,并且涉及隱私。除此之外,傳統(tǒng)方法還有一些基于物理學模型、動力學模型或是土木工程的經(jīng)典模型等,但這些始終難以應對大規(guī)模的人流預測。

我們這套方法首先不涉及隱私,只要進和出的數(shù)據(jù)并不需要知道哪個人進和出,然后把整個城市,比如北京劃分成兩千個格子同時預測,并不是一個個進行,它是一種整體性的預測。整體性預測的必要性在于,區(qū)域和區(qū)域之間具有相關性,不能單獨預測,在預測 A 的時候,其實預測 B 和 C 區(qū)域同樣可能產(chǎn)生影響,反之亦然。因此,把深度學習引入進來進行整體預測,與使用傳統(tǒng)方法有很大區(qū)別。

但同樣,我們在研究過程中面臨很多困難。首先,會影響人流的因素非常多,與區(qū)域里前一個小時有多少人進和出,周邊區(qū)域甚至是很遠的地方有多少人進和出都有關系,比如上海的踩踏事件里,不少人是從外地搭乘高鐵、地鐵或通過高速公路前往,并不通過周圍區(qū)域就直接到達了外灘。還有很多外部因素,包括天氣、事件都會導致區(qū)域人流發(fā)生變化。更重要的是,在做預測時,人流具有時空屬性,即時間屬性和空間屬性,這種屬性很特別,它會導致其他傳統(tǒng)的深度學習方法不能直接拿來用到預測上。

人流作為一種時空屬性數(shù)據(jù)有特定的屬性。一個城市有很多區(qū)組成,一個區(qū)有很多街道和社區(qū),天然有層次感,這是空間的差別,在時間維度上,相鄰兩個時間點之間,交通量和人流量是一個平滑變化的趨勢,但周期性有明顯的差別,車流量、人流量是有一個往復的周期性,今天早晨 8 點和昨天早晨 8 點的車流量和人流量趨勢看起來很類似,但今天早晨 8 點和今天中午 12 點的流量差別就會很大,雖然它們之間只隔了 4 個小時,而兩天早晨之間相隔了 24 小時,時間差更大卻更相似。這都是傳統(tǒng)視頻、圖像中不存在的特性,一般情況下,人不會看了五分鐘視頻又回去看第二分鐘的視頻,這種周期性是在時空數(shù)據(jù)也就是人流數(shù)據(jù)中特有的屬性,周期性也不是固定化的而是隨著時間的變化呈現(xiàn)趨勢性上揚或下降,比如,天越來越冷,天亮的時間越來越晚,人出門的時間也越來越晚,因此早高峰也會越來越晚,所以周期和趨勢加在一起,使得時空數(shù)據(jù)和以前的圖像、視頻等數(shù)據(jù)完全不同,以往使用的方法就會失效。

如果我們直接使用傳統(tǒng) RNN,要考慮周期性和趨勢性,輸入的數(shù)據(jù)必須很長,如果只使用最近兩三個小時的數(shù)據(jù),就無法體現(xiàn)周期性,也不可能體現(xiàn)趨勢性。要體現(xiàn)周期性至少需要 24 小時以上,而趨勢性甚至需要幾個月的數(shù)據(jù),如果把 RNN 作為模型,這么長的數(shù)據(jù)作為輸入,那么 RNN 模型會變的非常大、非常復雜,***很難訓練,效果也不會好。我們也和 LSTM 做了比較發(fā)現(xiàn),我們數(shù)據(jù)用的幀數(shù)更少,結(jié)果反而更好。

「我們設計出一個特殊的網(wǎng)絡模型」

我們在北京市的出租車 GPS 軌跡上面做了驗證,大概用了約 3 萬多輛出租車長達 5 年的數(shù)據(jù),同時我們也利用紐約公開的自行車租賃數(shù)據(jù)做了驗證。一方面,我們通過政府合作項目來獲取開放給我們的數(shù)據(jù),另一方面,我們也要好好利用公開數(shù)據(jù)。再將這些瑣碎的數(shù)據(jù)轉(zhuǎn)變成有規(guī)律的、能夠?qū)ι疃葘W習作為輸入的格式,通過空間的劃分和折射,變成一個二維矩陣,使它能夠作為深度學習模型的輸入。這個轉(zhuǎn)換過程很重要,涉及到不同數(shù)據(jù)之間的多元化融合,這里需要一些時空數(shù)據(jù)經(jīng)驗。

基于對時空數(shù)據(jù)深刻的理解,我們設計出一個特殊的網(wǎng)絡模型。在這個結(jié)構(gòu)里,我們只需要抽取一些關鍵幀,比如說昨天同一時刻,前天同一時刻,其他時間我們可以不做輸入,大概只要用幾十幀的關鍵幀作為輸入,就可以體現(xiàn)出我們幾個月里所包含的周期性和趨勢性,使得我們的網(wǎng)絡結(jié)構(gòu)大大簡化,但訓練的質(zhì)量和效果卻大大提高,這是很關鍵的一點。

具體而言,我們把城市劃分成均勻且不相交的網(wǎng)格,比如劃分成一個個一平方公里的網(wǎng)格,然后輸入人流數(shù)據(jù)(包括手機、出租車軌跡等)投射在網(wǎng)格里面,計算出每個格子里有多少人進和出。紅色越亮的地方就表示人越多,一幀的圖像比如說是二維圖像,如果有很多時間點就可以持續(xù)生成圖片,同時我們有對應的事件和天氣信息,這就構(gòu)成了數(shù)據(jù)的輸入,把時空數(shù)據(jù)轉(zhuǎn)換成這樣一個模式。

時空數(shù)據(jù)轉(zhuǎn)換成這樣一個模式

有了這樣的數(shù)據(jù)之后,再對時間特性進行模擬。我們把最近幾個小時、幾幀的數(shù)據(jù),輸入到時空殘差網(wǎng)絡里面,模擬相鄰時刻變化的平滑過程,然后把對應時間點昨天、前天的數(shù)據(jù)輸入來模擬周期性,再把更遠的時間點對應的讀數(shù)拿進來,模擬一個趨勢性,分別模擬了三個時間屬性。這三個殘差網(wǎng)絡結(jié)構(gòu)都是深度殘差網(wǎng)絡,然后做***次融合,再把外部事件、天氣等因素拿進來進行二次融合,得到一個結(jié)果。

接著,再進行空間屬性模擬。深度卷積神經(jīng)網(wǎng)絡的過程就是把區(qū)域劃成格子之后,對相關區(qū)域進行卷積運算得到一個值,你可以認為,通過一次卷積之后把周圍區(qū)域人流的相關性抓住了,卷積多次后把更遠地方的區(qū)域?qū)傩远季矸e到一起,如果你想捕捉很遠的地方,意味著你的卷積網(wǎng)絡層次必須要比較深,只有一層抓不到很遠地方的相關性。之所以要這樣做,是因為之前有提到,很多人可能從外地很遠的地方通過高鐵或高速公路直接抵達,不會經(jīng)過你所覆蓋到的周邊區(qū)域。

一旦網(wǎng)絡層次比較深,訓練會變得非常復雜,基于卷積神經(jīng)網(wǎng)絡,我們引入了深度殘差網(wǎng)絡結(jié)構(gòu)來做人流預測,用來幫助深度卷積網(wǎng)絡提高訓練精度,使用這種方法的靈感也來源于我們的前同事孫劍此前的研究。從目前的驗證結(jié)果來看,這項研究效果***的是 24 層,但這與不同應用和數(shù)據(jù)規(guī)模都有關系。

深度殘差網(wǎng)絡結(jié)構(gòu)來做人流預測

此外,在融合相似性、周期性和趨勢性這三個模塊時,相比于直接的融合,我們提出的基于參數(shù)矩陣的融合方法考慮到了每個區(qū)域的時間特性的強度不同,因此取得了更好的結(jié)果。在最近的研究中,我們已經(jīng)考慮了門限機制去調(diào)控,而非簡單的相加,很期待會有更好的實驗結(jié)果。而 XExt 這部分的輸入,已經(jīng)做過歸一化或 one-hot coding,之后經(jīng)過 FC(或加 embedding)后可以緩解「numerical scales」的問題。事實上,融合依然是一個富有挑戰(zhàn)性的難題,異構(gòu)時空數(shù)據(jù)的融合仍值得深入研究。

接下來,對于這個模型本身,我們會繼續(xù)提升,現(xiàn)在只是做到了預測每個區(qū)域有多少人進和出,體現(xiàn)出不同區(qū)域之間的關系,下個階段,我們需要同時把每個區(qū)域的進和出以及區(qū)域和區(qū)域之間的進出轉(zhuǎn)移數(shù)量都算出來。

而深度學習在時空數(shù)據(jù)方面的應用,已經(jīng)是我們組的重點研究方向。人工智能也有它的局限性,并不是像大家想象的那樣無所不能,目前看來,我認為利用深度學習來解決大規(guī)模物流調(diào)度問題的時機已經(jīng)比較成熟,同時它也會對一系列調(diào)度問題產(chǎn)生影響,比如共享單車、外賣、快遞等等。

【本文是51CTO專欄機構(gòu)機器之心的原創(chuàng)文章,微信公眾號“機器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2023-12-01 13:54:00

訓練AI

2009-04-21 14:36:44

微軟女性職場

2018-04-24 14:39:07

微軟航運人工智能

2022-01-24 17:47:10

微軟AIOps智能運維

2018-01-31 16:06:36

培生微軟人工智能

2019-05-14 10:33:35

人工智能教育部微軟

2018-09-17 11:00:05

AWS人工智能亞馬遜

2009-02-17 11:52:44

2009-02-24 10:07:58

開發(fā)微軟蓋茨

2023-11-13 10:17:56

2015-12-18 11:54:20

微軟亞洲研究院圖數(shù)據(jù)庫

2023-06-06 11:22:23

2017-11-23 08:24:31

人工智能網(wǎng)頁設計

2017-04-26 14:11:46

大數(shù)據(jù)人工智能零售

2021-06-25 09:47:06

KDD Cup Graphormer

2016-09-28 01:05:14

工智能視頻分析漏洞

2015-11-11 14:01:26

微軟開源分布式

2023-06-25 14:33:10

人工智能AI
點贊
收藏

51CTO技術棧公眾號