自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<li id="468gk"><menu id="468gk"></menu></li>

<pre id="468gk"><td id="468gk"></td></pre>

<sub id="468gk"><p id="468gk"></p></sub>

<cite id="468gk"><track id="468gk"></track></cite>

<style id="468gk"></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

李飛飛：World Labs這樣實(shí)現(xiàn)「空間智能」

作者：機(jī)器之心 2024-12-13 14:20:00

人工智能新聞

李飛飛昨天在人工智能頂會(huì) NeurIPS 上發(fā)表了主題演講，講述了她對(duì)機(jī)器視覺的愿景。她表示，非常榮幸第一次在 NeurIPS 上演講，50 分鐘講 180 頁 PPT 是個(gè)很有趣的經(jīng)歷。

說到斯坦福大學(xué)教授李飛飛（Fei-Fei Li），她提倡的「空間智能」最近正在引領(lǐng) AI 發(fā)展方向。

李飛飛已經(jīng)在人工智能歷史上贏得了一席之地，她多年來一直致力于創(chuàng)建 ImageNet 數(shù)據(jù)集和競(jìng)賽，在深度學(xué)習(xí)革命中發(fā)揮了重要作用。

2012 年，一個(gè)名為 AlexNet 的神經(jīng)網(wǎng)絡(luò)引爆了 AI 研究界，它的表現(xiàn)遠(yuǎn)遠(yuǎn)超過所有其他類型的模型，并贏得了當(dāng)年的 ImageNet 競(jìng)賽。自那時(shí)起，神經(jīng)網(wǎng)絡(luò)開始騰飛，其動(dòng)力來自互聯(lián)網(wǎng)上可用的大量免費(fèi)訓(xùn)練數(shù)據(jù)和提供空前計(jì)算能力的 GPU。

自 ImageNet 以來的 13 年里，計(jì)算機(jī)視覺研究者們掌握了物體識(shí)別，并轉(zhuǎn)向圖像和視頻生成。李飛飛與他人共同創(chuàng)辦了斯坦福大學(xué)以人為本人工智能研究所 (HAI)，并繼續(xù)突破計(jì)算機(jī)視覺的界限。

就在今年，她創(chuàng)辦了一家初創(chuàng)公司 World Labs，旨在生成用戶可以探索的 3D 場(chǎng)景。World Labs 致力于為人工智能提供「空間智能」，即生成、推理和與三維世界互動(dòng)的能力。

李飛飛昨天在人工智能頂會(huì) NeurIPS 上發(fā)表了主題演講，講述了她對(duì)機(jī)器視覺的愿景。她表示，非常榮幸第一次在 NeurIPS 上演講，50 分鐘講 180 頁 PPT 是個(gè)很有趣的經(jīng)歷。

在演講之前，李飛飛接受了 IEEE Spectrum 的獨(dú)家采訪，讓我們看看她對(duì)空間智能有哪些新的見解：

Eliza Strickland：你為什么把你的演講命名為「提升視覺智能的階梯（Ascending the Ladder of Visual Intelligence）？」

李飛飛：智能具有不同層次的復(fù)雜性和精細(xì)度。在這次演講中我想傳達(dá)的是，在過去幾十年，尤其是深度學(xué)習(xí)發(fā)生變革的十多年里，我們?cè)谝曈X智能方面學(xué)會(huì)做的事情簡(jiǎn)直令人嘆為觀止。我們正在變得越來越擅長(zhǎng)使用這項(xiàng)技術(shù)。同時(shí)，我也受到了 Judea Pearl 因果階梯理論的啟發(fā)，這一理論出自他 2020 年出版的書《The Book of Why》。

演講還有一個(gè)副標(biāo)題，即「從看到做到（From Seeing to Doing）」。這是人們沒有足夠重視的一點(diǎn)：從看到與交互和做事緊密相關(guān)，無論是對(duì)于動(dòng)物還是對(duì)于 AI 智能體來說都是如此。這與語言背道而馳。語言從根本上來說是一種用來傳達(dá)思想的交流工具。在我看來，它們是非?；パa(bǔ)但同樣深刻的智能模式。

Eliza Strickland：你的意思是我們對(duì)某些視覺刺激有本能的反應(yīng)嗎？

李飛飛：我不僅僅是在談?wù)摫灸堋?strong>如果你觀察感知的演變和動(dòng)物智能的演變，你會(huì)發(fā)現(xiàn)它們是深深交織在一起的。每當(dāng)我們能夠從環(huán)境中獲取更多信息時(shí)，進(jìn)化的力量就會(huì)推動(dòng)事物能力和智能向前發(fā)展。如果你不能感知環(huán)境，你與世界的關(guān)系就非常被動(dòng)；無論你是捕食者還是被捕食者，都是一個(gè)非常被動(dòng)的行為。

但是一旦你能夠通過感知從環(huán)境中獲取線索，進(jìn)化的壓迫感就會(huì)增加，這推動(dòng)了智能的發(fā)展。

Eliza Strickland：你認(rèn)為這就是我們創(chuàng)造越來越深層次的機(jī)器智能的方式嗎？通過讓機(jī)器更多地感知環(huán)境？

李飛飛：我不確定「深度」這個(gè)詞是不是我該用的形容詞。我認(rèn)為我們正在創(chuàng)造更多的能力。我認(rèn)為它將變得更加復(fù)雜，更有能力。解決空間智能問題確實(shí)是朝著全面智能（full-scale intelligence）邁出的一個(gè)基本且關(guān)鍵的步驟，這是絕對(duì)正確的。

Eliza Strickland：我看到過 World Labs 的演示。你為什么想研究空間智能并構(gòu)建這些 3D 世界。

李飛飛：我認(rèn)為空間智能是視覺智能的發(fā)展方向。如果我們真的想要解決視覺問題，并且將其與行動(dòng)聯(lián)系起來，有一個(gè)非常簡(jiǎn)單、顯而易見的事實(shí)：世界是三維的。我們不是生活在一個(gè)平面世界中。我們的物理智能體，無論是機(jī)器人還是設(shè)備，都將生活在三維世界中。即使是虛擬世界也越來越變得三維化。

如果你和藝術(shù)家、游戲開發(fā)者、設(shè)計(jì)師、建筑師、醫(yī)生交談，即使他們?cè)谔摂M世界中工作，很多內(nèi)容也是三維的。如果你花一點(diǎn)時(shí)間認(rèn)識(shí)到這個(gè)簡(jiǎn)單但深刻的事實(shí)，毫無疑問，解決 3D 智能的問題是根本性的。

Eliza Strickland：我很好奇 World Labs 中的場(chǎng)景是如何保持物體永久性并遵守物理定律的。這感覺像是一個(gè)令人興奮的進(jìn)步，因?yàn)橄?Sora 這樣的視頻生成工具仍然在處理這些事情。

李飛飛：一旦你遵循世界的 3D 特性，很多事情就會(huì)變得自然而然。例如，在我們發(fā)布的一段視頻中，有一個(gè)關(guān)于籃球的視頻。由于場(chǎng)景是 3D 的，籃球會(huì)根據(jù)重力或其他物理規(guī)則正確落地并與環(huán)境交互。如果場(chǎng)景只是由 2D 像素生成的，籃球不會(huì)有任何物理反應(yīng)，無法表現(xiàn)出落地或運(yùn)動(dòng)的效果。

Eliza Strickland：就像 Sora，球可能會(huì)去某個(gè)地方，然后消失。在推動(dòng)這項(xiàng)技術(shù)發(fā)展的過程中，你面臨的最大技術(shù)挑戰(zhàn)是什么？

李飛飛：沒有人解決了這個(gè)問題，對(duì)吧？這非常非常困難。在一個(gè) demo 中，我們?nèi)×艘环蟾叩漠嬜鳎@它生成了整個(gè)場(chǎng)景，風(fēng)格一致：藝術(shù)風(fēng)格、光線，甚至是那個(gè)街區(qū)會(huì)有什么樣的建筑。如果你轉(zhuǎn)過身來看到的是摩天大樓，那將完全不可信，對(duì)吧？而且它必須是三維的。你必須能夠進(jìn)入其中。所以它不僅僅是像素。

Eliza Strickland：你能說說你用來訓(xùn)練它的數(shù)據(jù)嗎？

李飛飛：非常多。

Eliza Strickland：在算力方面是否存在很多挑戰(zhàn)？

李飛飛：這需要大量的算力。是公共部門無法承擔(dān)的那種計(jì)算能力。這也是我需要通過休學(xué)術(shù)假，以私營(yíng)部門的方式來做這件事的部分原因。同時(shí)，這也是我一直倡導(dǎo)公共部門獲得計(jì)算資源訪問權(quán)的部分原因，我自己的經(jīng)歷強(qiáng)調(diào)了在足夠資源支持下進(jìn)行創(chuàng)新的重要性。

Eliza Strickland：賦予公共部門權(quán)力是一件好事，因?yàn)楣膊块T通常更愿意通過獲取知識(shí)，為人類謀福利。

李飛飛：知識(shí)發(fā)現(xiàn)需要資源支持，對(duì)吧？在伽利略時(shí)代，最好的望遠(yuǎn)鏡是讓天文學(xué)家觀察新天體的望遠(yuǎn)鏡。Hooke 意識(shí)到放大鏡可以變成顯微鏡，并發(fā)現(xiàn)了細(xì)胞。

每當(dāng)有新的技術(shù)工具出現(xiàn)時(shí)，它都會(huì)幫助人們尋求知識(shí)?，F(xiàn)在，在人工智能時(shí)代，技術(shù)工具涉及計(jì)算和數(shù)據(jù)。對(duì)于公共部門，我們必須認(rèn)識(shí)到這一點(diǎn)。

Eliza Strickland：你希望聯(lián)邦政府提供哪些資源？

李飛飛：過去五年來，斯坦福大學(xué) HAI 一直在做這項(xiàng)工作。我們一直在與國會(huì)、參議院、白宮、行業(yè)和其他大學(xué)合作，創(chuàng)建國家人工智能研究資源中心 (NAIRR)。

Eliza Strickland：假設(shè)我們能讓人工智能系統(tǒng)真正理解 3D 世界，這會(huì)給我們帶來什么？

李飛飛：它將為人們釋放大量創(chuàng)造力和生產(chǎn)力。我希望以更高效的方式設(shè)計(jì)我的房子。我知道許多醫(yī)療用途都涉及理解一個(gè)非常特殊的 3D 世界，即人體。我們總是談?wù)撐磥砣祟悓?chuàng)造機(jī)器人來幫助我們，但機(jī)器人在 3D 世界中導(dǎo)航，它們需要空間智能作為大腦的一部分。

我們還談?wù)撎摂M世界，它將允許人們參觀很多地方、學(xué)習(xí)概念或娛樂。這些都要使用 3D 技術(shù)，尤其是混合現(xiàn)實(shí)技術(shù)，我們稱之為 AR [增強(qiáng)現(xiàn)實(shí)]。我很想戴著一副眼鏡穿過國家公園，它能讓我了解樹木、道路、云朵的信息。我也想借助空間智能學(xué)習(xí)不同的技能。

Eliza Strickland：會(huì)是什么樣的技能？

李飛飛：我舉個(gè)蹩腳的例子，如果我在高速公路上爆胎了，我該怎么辦？現(xiàn)在，我打開一個(gè)「如何換輪胎」的視頻。但如果我能戴上眼鏡，看看我的車發(fā)生了什么，然后得到指導(dǎo)，那就太酷了。但這是一個(gè)蹩腳的例子。你可以考慮烹飪，你可以考慮雕刻 —— 有趣的事情。

Eliza Strickland：你認(rèn)為（這個(gè)方向）在我們這一代能走多遠(yuǎn)？

李飛飛：我認(rèn)為這會(huì)是我們有生之年的事，因?yàn)榧夹g(shù)進(jìn)步的速度非?？臁Ｄ阋呀?jīng)看到了過去 10 年帶來的變化。這肯定預(yù)示著接下來會(huì)發(fā)生什么。

責(zé)任編輯：張燕妮來源：機(jī)器之心

AI 模型訓(xùn)練

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<style id="9oduy"></style>

<abbr id="9oduy"></abbr>