自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

讓電影動漫統(tǒng)統(tǒng)變絲滑,480幀毫無卡頓,交大博士生開源插幀軟件

新聞 開源
連手機都開始用上120幀的顯示屏,但是網(wǎng)上大部分的視頻居然還是30幀。

 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

連手機都開始用上120幀的顯示屏,但是網(wǎng)上大部分的視頻居然還是30幀。

視頻的幀率已經(jīng)遠遠趕不上人民群眾的需求了,所以有不少人都在研究如何把普通視頻變成高幀率視頻。

去年,英偉達開源了Super SloMo,從普通的視頻“腦補”出高幀率的畫面,從30fps插幀到240fps,即使放慢8倍也不會感到卡頓。

最近,來自上海交大的一個新的插幀算法DAIN開源。它比英偉達的算法效果更清晰、幀率更高,可以把30fps的進一步插幀到480fps,這已經(jīng)超過了很多手機的慢動作錄像幀率。

更重要的是,英偉達的Super SloMo只用在了真實拍攝的視頻上,而這項研究卻可以擴展到常見的任何類型視頻:電影、定格動畫、動漫卡通等等。

 連埼玉老師的披風(fēng)都變得絲滑流暢了

如果你覺得上面效果還不夠明顯,可以再看一張。

羽毛的擺動是不是變得更流暢自然了?

可以想象,如果未來把DAIN用于動漫的制作,只要用低幀的動畫就可以生成絲滑的效果,或許能大大減少插畫師的工作。

DAIN的代碼已經(jīng)開源,甚至研究人員還打包了一份Windows安裝程序,即使沒有任何AI基礎(chǔ)的用戶也可以直接拿來用。

安裝

Windows系統(tǒng)的用戶有現(xiàn)成的exe文件安裝(地址見文末),不過現(xiàn)在仍處于Alpha階段,軟件可能存在一定的不穩(wěn)定性。

其他平臺的用戶安裝起來也不復(fù)雜。

首先確保你的PyTorch版本不低于1.0.0,將項目克隆到本地:

  1. gitclonehttps://github.com/baowenbo/DAIN.git 

安裝PyTorch的各個擴展包:

  1. cdDAINcdmy_package./build.sh 

還要安裝英偉達預(yù)測光流網(wǎng)絡(luò)PWCNet的軟件包:

  1. cd../PWCNet/correlation_package_pytorch1_0./build.sh 

由于作者已經(jīng)提供了預(yù)訓(xùn)練模型,我們不必再花費大量精力去訓(xùn)練。創(chuàng)建目錄model_weights,并且將預(yù)訓(xùn)練模型的權(quán)重下載到相應(yīng)的文件夾中:

  1. cdmodel_weightswgethttp://vllab1.ucmerced.edu/~wenbobao/DAIN/best.pth 

運行命令以下命令,就可以開始給視頻插幀啦!

  1. CUDA_VISIBLE_DEVICES=0pythondemo_MiddleBury_slowmotion.py—netNameDAIN_slowmotion—time_step0.25 

—time_step之后的參數(shù)就是視頻的放慢倍數(shù),0.25代表視頻幀率擴展為原來的4倍。如果要生成8x和10x慢動作,參數(shù)就改成0.125和0.1,依此類推。

深度加光流,圖像更清晰

之前已經(jīng)有很多給視頻插幀的算法,DAIN和它們有什么不同呢?

DAIN的全稱是Depth-Aware Video Frame Interpolation,即深度感知視頻幀插值。

視頻幀插值的目的是在原始幀之間合成不存在的幀。但是由于大的物體運動或遮擋,插幀的質(zhì)量通常會比較低。

在這篇研究中,研究人員提出了一種通過探索深度信息來檢測遮擋的方法。

具體來說,作者開發(fā)了一個深度感知光流投影層來合成中間流,中間流對較遠的對象進行采樣。此外,學(xué)習(xí)分層功能以從相鄰像素收集上下文信息。

上圖是DAIN的體系架構(gòu):給定兩個時刻的輸入幀,先估計光流和深度圖,然后使用建議的深度感知流投影層生成中間流。

然后,模型基于光流和局部插值內(nèi)核對輸入幀、深度圖和上下文特征進行扭曲,合成輸出幀。

這種模型緊湊、高效且完全可微分。定量和定性的結(jié)果表明,DAIN在各種數(shù)據(jù)集上均優(yōu)于最新的幀插值方法。

作者

這篇文章的第一作者Bao Wenbo,是上海交通大學(xué)電子信息與電氣工程學(xué)院的博士生。

[[313599]]

他目前的研究領(lǐng)域集中在圖像/視頻處理,計算機視覺和機器學(xué)習(xí)。另外在硬件設(shè)計、嵌入式系統(tǒng)和并行編程方面也很有經(jīng)驗。

傳送門

論文地址:https://sites.google.com/view/wenbobao/dain

項目地址:https://github.com/baowenbo/DAIN

Windows版軟件下載:https://drive.google.com/file/d/1uuDkF4j4H1AI1ot88XdqzwMdvAPhxKN8/view

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2022-08-16 08:37:09

視頻插幀深度學(xué)習(xí)

2023-04-26 07:16:25

游戲掉幀CPU

2024-09-12 14:51:27

2024-03-11 16:33:26

機器狗訓(xùn)練

2021-05-03 06:35:17

Windows 10Windows操作系統(tǒng)

2021-09-17 12:34:18

AI 數(shù)據(jù)人工智能

2021-11-26 21:32:58

電腦卡頓硬件

2025-03-03 12:00:00

JavaScriptfor 循環(huán)語言

2022-04-08 07:54:40

人工智能核算結(jié)果Python

2017-11-21 09:25:23

2020-09-07 07:00:09

AI 數(shù)據(jù)人工智能

2025-02-17 10:30:00

AI數(shù)據(jù)研究

2021-11-17 08:16:03

內(nèi)存控制Go

2021-07-14 13:46:28

KubeVela阿里云容器

2020-07-22 15:15:28

Vue前端代碼

2025-03-10 08:44:17

2023-10-12 16:34:20

Firefox計時器應(yīng)用

2022-05-26 15:03:54

芯片技術(shù)

2023-09-27 07:49:23

點贊
收藏

51CTO技術(shù)棧公眾號