自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

自動(dòng)駕駛獨(dú)角獸如此造假,LeCun都服了

人工智能
技術(shù)路線上,和特斯拉一樣,Wayve主張利用攝像頭的純視覺方案,很早就拋棄高精地圖,堅(jiān)定的走“即時(shí)感知”路線。

你以為這是個(gè)平平無奇的自動(dòng)駕駛視頻?

圖片圖片

NO、NO、NO……這其實(shí)是完全由AI從頭生成的。

沒有一幀是“真的”。

圖片圖片

不同路況、各種天氣,20多種情況都能模擬,效果以假亂真。

圖片圖片

世界模型再次立大功了!這不LeCun看了都激情轉(zhuǎn)發(fā)。

圖片圖片

如上效果,由GAIA-1的最新版本帶來。

它規(guī)模達(dá)90億參數(shù),用4700小時(shí)駕駛視頻訓(xùn)練,實(shí)現(xiàn)了輸入視頻、文本或操作生成自動(dòng)駕駛視頻的效果。

帶來的最直接好處就是——能更好預(yù)測未來事件,20多種場景都能模擬,從而進(jìn)一步提升了自動(dòng)駕駛的安全性、還降低了成本。

圖片圖片

其主創(chuàng)團(tuán)隊(duì)直言,這能夠改變自動(dòng)駕駛的游戲規(guī)則!

所以GAIA-1是如何實(shí)現(xiàn)的?

規(guī)模越大效果越好

GAIA-1是一個(gè)多模態(tài)生成式世界模型。

它利用視頻、文本和動(dòng)作作為輸入,生成逼真的駕駛場景視頻,同時(shí)可以對自主車輛的行為以及場景特征進(jìn)行細(xì)粒度控制。

而且可以僅通過文本提示來生成視頻。

圖片圖片

其模型原理有點(diǎn)像大語言模型的原理,就是預(yù)測下一個(gè)token。

模型可以利用向量量化表示將視頻幀離散,然后預(yù)測未來場景,就轉(zhuǎn)換成了預(yù)測序列中的下一個(gè)token。然后再利用擴(kuò)散模型從世界模型的語言空間里生成高質(zhì)量視頻。

具體步驟如下:

圖片圖片

第一步簡單理解,就是對各種輸入進(jìn)行重新編碼和排列組合。

利用一個(gè)專門的編碼器對各種輸入進(jìn)行編碼,不同輸入投射到共用表示里。文本和視頻編碼器對輸入分離、嵌入,操作(action)表示則被單獨(dú)投射到共用表示里。

這些編碼的表示具有時(shí)間一致性。

在進(jìn)行排列之后,關(guān)鍵部分世界模型登場。

作為一個(gè)自回歸Transformer,它能預(yù)測序列中的下一組圖像token。而且它不僅考慮了之前的圖像token,還要兼顧文本和操作的上下文信息。

這就使得模型生成內(nèi)容,不僅保持了圖像一致性,而且和預(yù)測文本、動(dòng)作也能保持一致。

團(tuán)隊(duì)介紹,GAIA-1中的世界模型規(guī)模為65億參數(shù),在64塊A100上訓(xùn)練15天而成。

最后再利用視頻解碼器、視頻擴(kuò)散模型,將這些token轉(zhuǎn)換回視頻。

這一步關(guān)乎視頻的語義質(zhì)量、圖像準(zhǔn)確性和時(shí)間一致性。

GAIA-1的視頻解碼器規(guī)模達(dá)26億參數(shù)規(guī)模,利用32臺A100訓(xùn)練15天而來。

值得一提的是,GAIA-1不僅和大語言模型原理相似,同時(shí)也呈現(xiàn)出了隨著模型規(guī)模擴(kuò)大、生成質(zhì)量提升的特點(diǎn)。

圖片圖片

團(tuán)隊(duì)將此前6月發(fā)布早期版本和最新效果進(jìn)行了對比。

后者規(guī)模為前者的480倍。

可以直觀看到視頻在細(xì)節(jié)、分辨率等方面都有明顯提升。

圖片圖片

而從實(shí)際應(yīng)用方面出發(fā),GAIA-1也帶來了影響,其主創(chuàng)團(tuán)隊(duì)表示,這會改變自動(dòng)駕駛的規(guī)則。

圖片圖片

原因來自三方面:

  • 安全
  • 綜合訓(xùn)練數(shù)據(jù)
  • 長尾場景

首先安全方面,世界模型能夠通過模擬未來,讓AI有能力意識到自己的決定,這對自動(dòng)駕駛的安全性來說很關(guān)鍵。

其次,訓(xùn)練數(shù)據(jù)對于自動(dòng)駕駛來說也非常關(guān)鍵。生成的數(shù)據(jù)更加安全、便宜,而且還能無限擴(kuò)展。

最后,它還能解決目前自動(dòng)駕駛面臨的最大挑戰(zhàn)之一——長尾場景。生成式AI可以兼顧更多邊緣場景,比如在大霧天氣行駛遇到了橫穿馬路的路人。這能更進(jìn)一步提升自動(dòng)駕駛的能力。

Wayve是誰?

GAIA-1來自英國自動(dòng)駕駛初創(chuàng)公司W(wǎng)ayve。

Wayve成立于2017年,投資方有微軟等,估值已經(jīng)達(dá)到了獨(dú)角獸。

創(chuàng)始人為現(xiàn)任CEO亞歷克斯·肯德爾和艾瑪爾·沙(公司官網(wǎng)領(lǐng)導(dǎo)層頁已無其信息) ,兩人都是來自劍橋大學(xué)的機(jī)器學(xué)習(xí)博士。

圖片圖片

技術(shù)路線上,和特斯拉一樣,Wayve主張利用攝像頭的純視覺方案,很早就拋棄高精地圖,堅(jiān)定的走“即時(shí)感知”路線。

前不久,該團(tuán)隊(duì)發(fā)布的另一個(gè)大模型LINGO-1也引發(fā)轟動(dòng)。

這個(gè)自動(dòng)駕駛模型能夠在行車過程中,實(shí)時(shí)生成解說,更進(jìn)一步提高了模型可解釋性。

今年3月,比爾·蓋茨還曾試乘過過Wayve的自動(dòng)駕駛汽車。

圖片圖片

論文地址:https://arxiv.org/abs/2309.17080

參考鏈接:
[1]https://twitter.com/ylecun/status/1709810114340024400[2]https://wayve.ai/thinking/scaling-gaia-1/

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2022-03-28 19:23:18

自動(dòng)駕駛芯片供應(yīng)鏈

2024-03-07 13:02:16

SaaS獨(dú)角獸效率

2019-11-15 17:57:59

容聯(lián)

2018-10-15 15:38:19

物聯(lián)網(wǎng)獨(dú)角獸IOT

2015-08-27 13:36:43

企業(yè)市場獨(dú)角獸

2022-12-30 16:09:31

自動(dòng)駕駛智能汽車

2019-05-14 13:05:47

創(chuàng)業(yè)公司獨(dú)角獸公司云計(jì)算

2015-11-19 16:38:53

移動(dòng)WiFiWiFi

2018-11-17 14:07:32

新能源制造業(yè)動(dòng)力電池

2021-06-17 13:59:00

芯片半導(dǎo)體

2017-04-06 12:43:48

2017-12-19 10:34:46

AR游戲互聯(lián)網(wǎng)AR技術(shù)

2017-06-22 14:53:34

2019-08-07 17:34:59

2024-11-20 13:41:34

獨(dú)角獸破產(chǎn)清算

2015-07-31 11:23:56

騰訊云e袋洗
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號