港大黃凱斌:6G時代的邊緣智能,香農與圖靈的相遇
本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。
5G時代剛開始沒多久,現在科研人員已經開始攻關6G。科研真是生產一代、研發(fā)一代。在6G場景下,新的通訊技術會給人工智能(AI)帶來什么?有哪些創(chuàng)新的想法?
4月8日,在AI TIME青年科學家——AI 2000學者專場論壇上,香港大學電子電機工程系教授、副系主任黃凱斌做了《6G時代的邊緣智能:香農與圖靈的相遇》的報告,從無線電通訊的角度解讀了6G優(yōu)勢,以及對AI的啟示。例如他提到:
“在香農無線電通訊理論里“數據位生來平等”。而以圖靈為先驅的機器學習領域里數據有“輕重”之分。其實,只有有機結合兩者的思想,才能實現最高效的應用?!?/span>
此外,他還提出空中計算的想法,目的是將“空氣”變成計算機,具體“手法”是讓用戶以相同的頻譜上傳信息,從而利用無線疊加計算相關權重、模型,此舉是將無線干擾這一令人頭疼的麻煩事“變廢為寶”。
以下是演講全文,AI科技評論做了不改變原意的整理:
6G是指第六代無線通訊網絡,會比5G有更大的性能提升。如下圖所示,灰色代表5G,6G無論是從速度還是空中傳輸時延,亦或是能源效率都會大幅度提升。
為什么會需要6G?關鍵是它可以支持一些“未知”的應用。例如處理超實感擴展現實、高保真移動全息顯示、數字復制都需要6G網絡支持下的高速率、低延遲。
在計算領域也會有一些革命性的改變,十年前,我們將大量計算放在了云端,放在了“數據中心”里面,現在計算更加側重于網絡邊緣。主要因為物聯網的規(guī)模越來越大,其包含的“小設備”,例如手機、筆記本電腦,已經達到了百億的級別,因此為了服務這些小設備,計算也逐漸從“中心”轉向了“邊緣”。
此舉一方面給用戶帶來快速的體驗,另一方面也會更加保障數據安全。畢竟,邊緣計算不需要用戶上傳數據到云端。
數據的重要性不言而喻,過去最值錢的公司當屬石油、銀行。而現在谷歌、Facebook以及特斯拉這些占據榜首的巨頭,都是數據擁有“大戶”。數據越多,AI所能學習的知識也越多,據福布斯估計,到2025年,大約有150萬億GB的數據需要分析。
因此,在網絡邊緣的語境下,AI如何處理如此巨量的數據?數據傳輸的過程可以簡單理解為通訊。
網絡通訊不僅要滿足AI需求,還有機器之機器之間的通訊(mMTC),網絡游戲和自動駕駛(URLLC)、高清晰流媒體(eMBB)等。因此,目前網絡現狀,正如上圖“胖子”所示,它已經不堪重負。所以,研究如何消除計算瓶頸,才能提高邊緣學習的效率。
從1G到5G,計算、感知、控制、通訊等幾個模塊都是分開設計,這種相互隔離的模式無法解決計算瓶頸問題;6G的設計模式是融合,將幾個模塊有機連接,這種連接的過程就是“香農”和“圖靈”思維的碰撞。
1 聯邦邊緣學習
在過去,信息和通訊是兩個毫不相干的領域,以平行的道路發(fā)展,而當前的邊緣學習需要這兩個領域的結合。
傳統(tǒng)的無線電通信就像一條管道,通過速率最大化的設計,讓管道里有很多數據進行傳輸,換句話說,就是在高保真的情況下,盡可能多地傳輸數據。但,這種設計已經無法解決現在的問題了。6G時代,并不是數據傳輸的越多越好,而是越快的訓練模型越好。即在對學習精度有限制的情況下,盡可能快地訓練機器。
因此,如果考慮“快速智能獲取”,無線電設計發(fā)生革命性的改變。傳統(tǒng)方式是聯邦邊緣學習,網聯汽車、物聯網等密集終端場景下,訓練數據通常以分布式的形式產生和存儲在不同用戶設備中。例如我們每天淘寶、京東的購物數據都存在自己的手機上,如何在保證自己數據隱私的情況下,幫助訓練網絡更高效?
在網絡邊緣利用聯邦學習,可以充分利用終端節(jié)點的計算資源,并能夠在保護用戶個人信息的前提下,進行更廣泛和高效的機器學習。
具體做法是:用戶的每臺手機利用自己的數據進行模型訓練,然后中心系統(tǒng)將這種本地模型收集起來,然后進行平均處理,如此就可以得到比較準確的模型。
但,將每一個小模型上傳到中心系統(tǒng),也需要大量的數據傳輸,而且有些傳輸并不是一次就完成,有的需要幾十上百次的傳輸。
2 通訊與AI的碰撞
無線電通訊如何解決這一問題?我舉兩個例子:空中計算和數據重要性感知通訊。
第一個例子是空中計算,目的是將“空氣”變成計算機。傳統(tǒng)的無線電通信面對的問題是“過載”。例如所有的用戶都會發(fā)射信號,以求通過“管道”達到基站,但無線電在空中的疊加,會造成無線電干擾。因此,需要采取分布計算的思維進行重新設計系統(tǒng)。
回到聯邦邊緣計算。正如剛才提到,聯邦系統(tǒng)其實是想進行“平均”計算每個用戶的模型,用戶需要將小模型上傳到系統(tǒng)中才能進行此步驟。其實,我們可以利用無線電波在空中疊加的狀態(tài)進行計算。其實,用戶如果以同樣的頻譜將模型傳到“空中”,速率會非常快,而且在空中會自然疊加。因此,這就有效將無線干擾變成了“好東西”。
空中計算的最大好處是會將延遲大幅度減少。如上圖,和傳統(tǒng)無線電傳輸技術相比,在保證準確率相似的情況下,延遲能減少上百倍。
第二個例子是數據重要性感知通訊。香農無線電通訊理論基于“Data bits were born equal”,翻譯成中文“數據生來平等”。而在以圖靈為代表的機器學習領域,“Data samples are certainly not equally important!”,數據有“輕重”之分。
數據重要性,可以用未知度進行衡量,舉個例子:給機器人一本書,機器人看過之后表示非常簡單,什么都理解,那么這就不是一本好書。換句話說,這本書的未知度很低,無法教給機器新東西,無法解答疑惑,知識無法擴展。
因此,結合兩者的哲學,我們需要重新設計無線電系統(tǒng)。如上圖所示,需要選擇一些用戶數據傳輸到基站中去。從圖靈的角度,優(yōu)先選擇未知度高的數據,也就是最重要的數據;從香農的角度,信道是首先考慮的因素,忽略了數據的重要性。這這兩種思路,一種叫數據多樣性,一種叫信道多樣性。
有效結合數據多樣性和信道多樣性是6G系統(tǒng)的重點。我們對此進行了相關工作,實驗結果非常滿意。如上圖所示,如果只考慮數據重要性,所得出的效果會比信道選擇更佳,但如果結合兩種,那么準確率會超過“只考慮數據重要性”。所以這種思路的改變,會給我們產生很多的機會。
3 愿景:太空、機器人
6G的愿景之一是用衛(wèi)星往地面發(fā)射 AI的服務,即把空中幾千幾萬個衛(wèi)星,和地面的基站連接成空地網絡,然后和數據中心連接在一起。從而賦能自動駕駛、遠程實時通訊、應急通訊等等。
我們的西安電子科技大學合作團隊,最近發(fā)射了一顆衛(wèi)星。我們將一起合作用下來陸續(xù)發(fā)射的多顆衛(wèi)星形成的星座實現“用衛(wèi)星往地面?zhèn)鬏擜I應用”服務。
6G時代,通訊已經超越傳統(tǒng),不僅是針對人的通訊,還涉及到了機器對機器的通訊、機器和人的通訊?,F在模擬通訊也開始重新發(fā)力,雖然不怎么可靠,但速度特別快。畢竟它不需要編碼、模塊等復雜的流程。
以上的內容希望能給大家?guī)硪恍┫敕ā?/span>