助力AI創(chuàng)新眾智生態(tài),全球首個(gè)十億像素級(jí)CV挑戰(zhàn)賽GigaVision圓滿落幕
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
圍繞十億像素級(jí)計(jì)算機(jī)視覺(jué)技術(shù)的2022 GigaVision 挑戰(zhàn)賽,在經(jīng)歷四個(gè)月的激烈角逐后,于近日落下帷幕。
2022 GigaVision挑戰(zhàn)賽開放百萬(wàn)元獎(jiǎng)金池,面向全球高等院校、研究機(jī)構(gòu)、高新企業(yè)及個(gè)人愛(ài)好者征集原創(chuàng)算法。
不同于其它視覺(jué)算法挑戰(zhàn)賽,GigaVision挑戰(zhàn)賽是全球首個(gè)針對(duì)大場(chǎng)景、多對(duì)象及復(fù)雜關(guān)系問(wèn)題的智能算法比賽,是新一代人工智能算法的試金石。
依托自研的億像素光場(chǎng)成像設(shè)備,大賽構(gòu)建了具有寬視場(chǎng)、高分辨率的GigaVision平臺(tái),延展出當(dāng)下若干人工智能技術(shù)發(fā)展的關(guān)鍵問(wèn)題。平臺(tái)目前包括兩個(gè)“世界首個(gè)”級(jí)別的子項(xiàng)目:
- PANDA:世界首個(gè)十億像素級(jí)以人類為中心的視頻數(shù)據(jù)集,具有大場(chǎng)景、多對(duì)象、長(zhǎng)時(shí)程及復(fù)雜關(guān)系等特點(diǎn);
- GigaMVS:世界首個(gè)十億像素級(jí)超大規(guī)模場(chǎng)景三維重建基準(zhǔn),具有規(guī)模大、細(xì)節(jié)分辨率高、遮擋復(fù)雜等特點(diǎn),可使多視角三維重建與渲染問(wèn)題發(fā)生質(zhì)變。
值得一提的是,這已是GigaVision挑戰(zhàn)賽連續(xù)第四年舉辦,且一直與CVPR、ACM MM、ECCV等頂會(huì)有著緊密合作。
那么本屆GigaVision挑戰(zhàn)賽又帶了怎樣的驚喜?
賽事升級(jí) 聚力創(chuàng)新
在GigaVision挑戰(zhàn)賽中,每一張圖片、視頻的每一幀都是十億像素級(jí)別。比如GigaMOT賽道,參賽者需要評(píng)估MOT模型在十億像素視頻中對(duì)多個(gè)目標(biāo)跟蹤任務(wù)的準(zhǔn)確性,既要解決單目標(biāo)跟蹤任務(wù)的互相遮擋、運(yùn)動(dòng)模糊、擁擠場(chǎng)景、尺度變化等難點(diǎn),又要處理目標(biāo)軌跡的起始與終止、相似目標(biāo)間的相互干擾等問(wèn)題。特別是該賽道所使用的PANDA-Video大場(chǎng)景數(shù)據(jù)集,其可視范圍大、擁擠行人的復(fù)雜場(chǎng)景等特點(diǎn)也為傳統(tǒng)數(shù)據(jù)集上的MOT算法帶來(lái)了新的挑戰(zhàn)。
△基于十億像素視頻的多目標(biāo)跟蹤示例
又比如在GigaRendering賽道中,參賽者需要在給定的不同場(chǎng)景經(jīng)過(guò)校準(zhǔn)的十億像素圖像中,面對(duì)稀疏視角下的高分辨率、寬視場(chǎng)、細(xì)節(jié)豐富的難點(diǎn),渲染生成新的RGB視圖并盡可能提升其準(zhǔn)確性。十億像素級(jí)別的圖像渲染任務(wù),對(duì)神經(jīng)輻射場(chǎng)的表達(dá)、規(guī)模和效率提出了更高的挑戰(zhàn)。
△十億像素圖像渲染新視圖示例
此外,偏好原始創(chuàng)新的測(cè)評(píng)方式亦是GigaVision挑戰(zhàn)賽的一大亮點(diǎn)。傳統(tǒng)的人工智能挑戰(zhàn)賽任務(wù)普適性強(qiáng)、辦賽周期短,大部分參賽隊(duì)伍傾向利用成熟的理論框架和工程套路,實(shí)現(xiàn)系統(tǒng)集成和參數(shù)調(diào)優(yōu),反復(fù)刷榜。完全以分?jǐn)?shù)導(dǎo)向的測(cè)評(píng)方式,阻礙了技術(shù)的原始創(chuàng)新。相比之下,GigaVision挑戰(zhàn)賽形成了固定的舉辦周期,并將方法的前沿性、原創(chuàng)性作為排名的重要依據(jù)之一,更能鼓勵(lì)參賽隊(duì)伍進(jìn)行原始創(chuàng)新。
可以看到,GigaVision挑戰(zhàn)賽看似仍在比拼視覺(jué)智能領(lǐng)域的幾大經(jīng)典研究問(wèn)題,但面向「十億像素」級(jí)圖像視頻數(shù)據(jù),賽題的前沿性、挑戰(zhàn)性、創(chuàng)新性和開拓性大幅提升,與經(jīng)典問(wèn)題截然不同。以往將整個(gè)圖像或視頻放進(jìn)網(wǎng)絡(luò)中直接處理的傳統(tǒng)方法不再奏效,僅僅使用單個(gè)模型或幾個(gè)模型也很難完成這種級(jí)別的任務(wù)。因此,參賽團(tuán)隊(duì)會(huì)更加專注于「卷」模型架構(gòu)的設(shè)計(jì),致力于探索模型能力的上限,開展更多理論層面的創(chuàng)新嘗試。
經(jīng)過(guò)多輪比拼、線上評(píng)測(cè)、結(jié)果復(fù)現(xiàn)和視頻答辯,本屆大賽獲得了多目標(biāo)檢測(cè)、多目標(biāo)跟蹤、多目標(biāo)軌跡預(yù)測(cè)、3D重建、3D渲染、密集人群三維重建等方面的多個(gè)創(chuàng)新性解決方案,這些作品均具有很高的準(zhǔn)確性和領(lǐng)先性,為十億像素計(jì)算機(jī)視覺(jué)的發(fā)展帶來(lái)了啟發(fā)。
幾年來(lái),GigaVision數(shù)據(jù)平臺(tái)以賽為媒,已經(jīng)與CVPR、ICCV、ECCV、ACM MM等國(guó)際頂會(huì)聯(lián)合舉辦了多屆Workshops和Challenges。系列賽事的舉辦水平不斷提升,參賽規(guī)模不斷增長(zhǎng),關(guān)注度和影響力越來(lái)越高。
以賽為媒 推進(jìn)發(fā)展
對(duì)于本屆賽事的舉辦以及參賽選手們的優(yōu)異表現(xiàn),組委會(huì)專家們表達(dá)了積極的肯定和最為真實(shí)的感受。
不同賽道上涌現(xiàn)出多個(gè)原創(chuàng)算法模型,大賽專家表示對(duì)十億像素計(jì)算機(jī)視覺(jué)的發(fā)展帶來(lái)了深遠(yuǎn)的啟發(fā):“經(jīng)過(guò)嚴(yán)謹(jǐn)?shù)木€上評(píng)測(cè)、結(jié)果復(fù)現(xiàn)和視頻答辯,本屆賽事共獲得了多個(gè)原創(chuàng)算法模型,這些作品均具有很高的原創(chuàng)性和領(lǐng)先性,為十億像素計(jì)算機(jī)視覺(jué)的發(fā)展帶來(lái)了啟發(fā)?!?/p>
對(duì)于3D賽道相關(guān)作品,大賽專家給予了高度評(píng)價(jià):“3D賽道相關(guān)作品結(jié)合了數(shù)字人、元宇宙熱點(diǎn),具有很高應(yīng)用潛力,且作品完成度較高,融合了基于人工智能的神經(jīng)表征、可微渲染優(yōu)化方法和基于多視圖幾何的立體匹配等經(jīng)典方法,在算法設(shè)計(jì)和工程化實(shí)現(xiàn)上都頗具亮點(diǎn),對(duì)大場(chǎng)景高精度三維重建任務(wù)具有較大的啟發(fā)性,展示出了巨大的落地應(yīng)用潛力?!?/p>
隨著數(shù)字人、元宇宙概念的持續(xù)爆發(fā),超高分辨率人體三維重建和新視點(diǎn)合成已經(jīng)成為計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形學(xué)領(lǐng)域的研究熱點(diǎn),未來(lái)可針對(duì)十億像素級(jí)別的人體三維重建或新視點(diǎn)合成任務(wù)開展新的賽道,更好地支撐相關(guān)領(lǐng)域的發(fā)展,同時(shí)進(jìn)一步擴(kuò)大GigaVision挑戰(zhàn)賽的影響力。
同時(shí),參賽選手的“創(chuàng)新”和“大膽”,也被評(píng)價(jià)為推動(dòng)領(lǐng)域發(fā)展的關(guān)鍵:在目標(biāo)檢測(cè)賽道中,參賽選手全面分析了寬視場(chǎng)高分辨視覺(jué)數(shù)據(jù)中場(chǎng)景大、對(duì)象多等新特點(diǎn)所帶來(lái)的新問(wèn)題,圍繞著場(chǎng)景全局稀疏局部稠密、對(duì)象尺度多變形態(tài)復(fù)雜、數(shù)據(jù)通量大等挑戰(zhàn),提出了一系列目標(biāo)檢測(cè)新算法與新模型,相較現(xiàn)有前沿算法,實(shí)現(xiàn)了精度與效率的顯著提升。參賽選手們的奇思妙想與大膽創(chuàng)新為目標(biāo)檢測(cè)領(lǐng)域提供了有效且有趣的新思路,對(duì)推動(dòng)本領(lǐng)域的發(fā)展有重要作用。
未來(lái),GigaVision挑戰(zhàn)賽將不斷努力,提高評(píng)價(jià)標(biāo)準(zhǔn),提供更多的技術(shù)評(píng)價(jià)機(jī)會(huì),邀請(qǐng)更多的國(guó)內(nèi)外知名高校、人工智能企業(yè)以及專家學(xué)者參與評(píng)價(jià)工作,以增強(qiáng)評(píng)價(jià)的公正性和權(quán)威性。同時(shí),GigaVision挑戰(zhàn)賽將不斷拓展與其他相關(guān)領(lǐng)域的合作,以提高競(jìng)賽的國(guó)際影響力,為人工智能領(lǐng)域的發(fā)展提供更多的技術(shù)支持和潛在應(yīng)用。