阿里斬獲AI領(lǐng)域“奧斯卡”四項(xiàng)冠軍,AI可精準(zhǔn)預(yù)測(cè)視頻目標(biāo)位置
近日,全球計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2020公布了各大挑戰(zhàn)賽結(jié)果,阿里巴巴獲得四項(xiàng)比賽的世界冠軍,其中,在難度最高的DAVIS挑戰(zhàn)賽中,阿里提出了可以精準(zhǔn)預(yù)測(cè)視頻目標(biāo)位置的方法,并且首次以超過(guò)80分的成績(jī)奪得第一名。
CVPR是AI領(lǐng)域規(guī)模最大的會(huì)議,被譽(yù)為計(jì)算機(jī)視覺(jué)領(lǐng)域“奧斯卡”,其覆蓋范圍涵蓋計(jì)算機(jī)視覺(jué)領(lǐng)域的前瞻學(xué)術(shù)研究和工業(yè)應(yīng)用,會(huì)議的研究成果體現(xiàn)了視覺(jué)AI領(lǐng)域研究的趨勢(shì)。由于視頻會(huì)議、直播等應(yīng)用逐漸普及,今年頂級(jí)科技公司的研究成果逐步從圖像延伸到了視頻領(lǐng)域,涵蓋視頻壓縮、視頻分割、三維視覺(jué)等領(lǐng)域。
和圖像識(shí)別不同,AI分析理解視頻的技術(shù)門(mén)檻更高,長(zhǎng)期以來(lái),業(yè)界在視頻AI技術(shù)的研究上鮮有重大突破。以CVPR會(huì)議難度最高的比賽之一DAVIS( Densely Annotated Video Segmentation)為例,該比賽需要參賽團(tuán)隊(duì)精準(zhǔn)處理復(fù)雜視頻中物體快速運(yùn)動(dòng)、外觀變化、遮擋等信息,過(guò)去幾年,全球頂級(jí)科技在該比賽中的成績(jī)從未突破80分。
據(jù)介紹,阿里參加的四項(xiàng)比賽均為視頻技術(shù)領(lǐng)域。在DAVIS挑戰(zhàn)賽中,阿里率先實(shí)現(xiàn)了突破,以 84.1 的分?jǐn)?shù)獲得了第一名,比去年的第一名提高了7.4分。
阿里AI以84.1分的成績(jī)獲得DAVIS比賽第一名
公開(kāi)資料顯示,阿里提供了一種全新的空間約束方法,打破了傳統(tǒng)STM方法缺乏時(shí)序性的瓶頸,可以讓系統(tǒng)基于視頻前一幀畫(huà)面預(yù)測(cè)目標(biāo)物體下一幀的位置;此外,阿里還引入了語(yǔ)義分割中的精細(xì)化分割微調(diào)模塊,大幅提高了分割的精細(xì)程度。最終,精準(zhǔn)識(shí)別動(dòng)態(tài)目標(biāo)的輪廓邊界,并且與背景進(jìn)行分離,實(shí)現(xiàn)像素級(jí)目標(biāo)分割。
阿里AI可以基于視頻前一幀畫(huà)面精準(zhǔn)預(yù)測(cè)目標(biāo)物體下一幀的位置
業(yè)內(nèi)人士普遍認(rèn)為,視頻分割技術(shù)將成為線上會(huì)議、直播、自動(dòng)駕駛、影視制作等場(chǎng)景的標(biāo)配。例如直播場(chǎng)景使用阿里AI算法,可以實(shí)現(xiàn)一秒鐘替換背景;在自動(dòng)駕駛中,視頻分割也是自動(dòng)駕駛系統(tǒng)識(shí)別障礙物的關(guān)鍵技術(shù)。
據(jù)介紹,除了獲得四項(xiàng)比賽冠軍,阿里巴巴還有17篇論文入選CVPR 2020,其中涵蓋一篇自動(dòng)駕駛領(lǐng)域的研究成果,該論文提出了一個(gè)通用、高性能的自動(dòng)駕駛檢測(cè)器,首次實(shí)現(xiàn) 3D 物體檢測(cè)精度與速度的兼得,有效提升自動(dòng)駕駛系統(tǒng)安全性能。
目前,阿里巴巴視覺(jué)AI技術(shù)已在全球率先實(shí)現(xiàn)大規(guī)模落地。例如,城市大腦、拍立淘、優(yōu)酷視頻等阿里巴巴集團(tuán)內(nèi)部業(yè)務(wù)場(chǎng)景均已大規(guī)模使用該技術(shù);阿里巴巴CT影像AI已經(jīng)服務(wù)全球600多家醫(yī)療機(jī)構(gòu),疫情期間已完成50余萬(wàn)例病例臨床診斷。