自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

手機1秒生成3D全息圖,MIT團隊新作

新聞 機器學(xué)習(xí)
來自MIT的團隊開發(fā)了一種新算法,不需要復(fù)雜儀器、也不需要等幾個小時,生成這樣一張全息圖,只需要在智能手機上耗費不到1秒的時間。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

一張圖片的焦距,能在老鼠玩具和日歷尺之間自由切換:

甚至能完成圖片上任一物體的對焦,呈現(xiàn)出不同物體在不同深度時的照片:

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

這張具有神奇魔力的圖片,就是集成了“全部物體信息”的全息圖。

生成這類全息圖,往往需要大量計算才能完成。

然而,來自MIT的團隊開發(fā)了一種新算法,不需要復(fù)雜儀器、也不需要等幾個小時,生成這樣一張全息圖,只需要在智能手機上耗費不到1秒的時間。

要知道,就在去年11月份,三星的科學(xué)家們生成3D全息視頻所用的處理器,尺寸還是太大,沒能整合到手機上:

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

那么,這種快速生成3D全息圖的方法,究竟是怎么做到的?

用神經(jīng)網(wǎng)絡(luò)快速“切蛋糕”

首先,全息圖是什么?

舉個例子,visa信用卡上的鴿子,就利用了全息圖來做防偽標(biāo)志。

[[387030]]

全息圖即“全部的信息”,這種圖片包含物體的幅度相位信息。

普通照相機,拍攝出來的照片只包含物體的幅度信息(亮暗),相位信息(遠(yuǎn)近)卻無法直接保存。

這也是為什么,我們平時看見的2D照片“沒有立體感”

此前,計算機要想360°全方位生成全息圖,通常得從多個角度進(jìn)行干涉、衍射,再將相位信息拼合起來,與振幅信息疊加后生成圖片。

多角度生成相位信息,就像是在一個球形蛋糕上精準(zhǔn)地切割8刀,將之分成8塊,對每塊進(jìn)行相位重現(xiàn):

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

然而,這種方法所需要的計算量往往巨大,耗時很久,完全無法在智能手機上運行。

因此,MIT團隊思考,能不能采用深度學(xué)習(xí)的方法,只通過3個角度,就把“蛋糕”分成8塊,來生成全息圖?

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

他們精挑細(xì)選出了4000張包含幅度、相位信息的圖像,以及這些圖像對應(yīng)的3D全息圖,用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

整體思路大致如下:獲取物體的相位信息后,生成點云,再結(jié)合殘差神經(jīng)網(wǎng)絡(luò),生成整體的全息圖。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

那么,這種全息圖的效果如何呢?

可對焦任意物體,內(nèi)存占用不到1MB

事實證明,利用神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,只需要不到640KB的內(nèi)存就能生成全息圖。

如果在消費級GPU上,這種神經(jīng)網(wǎng)絡(luò)模型,每秒能生成60張分辨率為1080p的彩色3D全息圖。

而在智能手機如iPhone 11 Pro上,每秒能生成1.1張全息圖;至于Google Edge TPU上,每秒則能生成2張全息圖。

以動畫角色大雄兔(Big Buck Bunny)為例,右下角是它的深度圖。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

從圖中可見,利用神經(jīng)網(wǎng)絡(luò)(右)生成的全息圖像,幾乎和用原有方法(左)生成的全息圖像一模一樣。

而且,無論是遠(yuǎn)處的小黃花,還是近處的兔子眼睛,都能完美對焦。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

表面上看起來是一樣的話,具體到幅度和相位信息上如何呢?

從圖中可見,利用神經(jīng)網(wǎng)絡(luò)預(yù)測的幅度和相位信息,也與真實值非常接近。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

即使是現(xiàn)實中的照片,也與實際生成目標(biāo)非常接近了。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

當(dāng)然,從細(xì)節(jié)來看的話,還是略微有一點差距。

手機1秒生成3D全息圖,MIT團隊新作,索尼投錢支持

相比于現(xiàn)有的VR和AR方案,3D全息圖是3D可視化的另一個實現(xiàn)方案。

但在使用VR的時候,用戶實際上是盯著2D顯示屏,產(chǎn)生3D錯覺,因此可能會產(chǎn)生視覺疲勞、頭暈等癥狀。

而3D全息圖則允許眼睛調(diào)整焦距,即交替地對前景和背景進(jìn)行聚焦,能有效緩解這種癥狀。

下一步,團隊計劃添加眼球追蹤技術(shù),讓用戶的眼睛看向哪里,哪里就生成部分高清全息圖。

[[387036]]

在這種方案下,計算機只需要部分生成全息圖,實時運用下,效果也能更快更好。

以及,索尼贊助了這項研究,所以……

[[387037]]

作者介紹

[[387038]]

論文一作史亮,2014年畢業(yè)于北航,碩士畢業(yè)于斯坦福,目前于MIT就讀博士,研究方向包括VR/AR,以及機器學(xué)習(xí)和計算機圖形學(xué)。

[[387039]]

論文二作李北辰,2018年畢業(yè)于清華大學(xué),目前于MIT就讀博士,研究方向是機器學(xué)習(xí)在計算機圖形學(xué)中的應(yīng)用。

論文地址:
https://www.nature.com/articles/s41586-020-03152-0.pdf

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2022-02-11 15:30:55

量子科學(xué)技術(shù)

2024-03-05 11:31:00

AI數(shù)據(jù)

2024-07-16 12:02:11

2024-07-04 09:26:16

2025-01-16 10:05:00

3D模型代碼

2024-09-20 16:20:00

2023-07-14 09:41:01

3DAI

2014-07-31 10:10:53

全息影像手機數(shù)碼

2023-12-14 12:57:00

模型數(shù)據(jù)

2025-01-10 14:00:00

3D模型生成

2024-10-28 07:40:00

2024-12-10 15:17:11

2023-11-27 13:43:00

AI模型

2024-03-20 15:51:00

AI數(shù)據(jù)

2025-01-09 12:32:18

2011-05-26 10:55:39

2020-08-26 10:37:21

阿里3D

2024-07-03 14:29:38

2011-09-22 10:07:52

奧圖碼投影儀

2011-12-21 12:46:43

點贊
收藏

51CTO技術(shù)棧公眾號