你講故事,它剪視頻:AI視頻剪輯自動(dòng)化解放熊貓眼剪輯師
視頻剪輯是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作,需要剪輯者自己去找合適的幀并將其拼接在一起。如果能將這一過(guò)程自動(dòng)化,部分剪輯師可能就不用熬夜剪片子了。來(lái)自清華、北航、哈佛大學(xué)和以色列赫茲利亞跨學(xué)科研究中心的研究者開(kāi)發(fā)了一種全新的視頻剪輯方法,可以通過(guò)編輯視頻對(duì)應(yīng)的文本完成鏡頭選取和拼接,生成符合文字描述的連貫視頻。
研究者提出的這一工具名為「Write-A-Video」,它可以根據(jù)文本來(lái)決定選取庫(kù)中的哪些鏡頭或場(chǎng)景,以此來(lái)組成剪輯者所需的故事情節(jié)。該工具對(duì)新手非常友好,即使不具備專業(yè)的視頻剪輯技巧也能得到高質(zhì)量的視頻蒙太奇。
研究者還提出了一個(gè)全新的視頻剪輯界面,用戶可以直接在文本上進(jìn)行操作,而無(wú)需對(duì)視頻幀進(jìn)行操作。
他們?cè)诓煌闹黝}文本和視頻資料庫(kù)中進(jìn)行了測(cè)試,并進(jìn)行了定量評(píng)估和用戶研究。結(jié)果表明,這一結(jié)合了人類和算法能力的智能數(shù)字化工具可以在創(chuàng)意創(chuàng)造過(guò)程中給予用戶幫助。借助于 Write-A-Video 工具,沒(méi)有任何視頻剪輯經(jīng)驗(yàn)的用戶也可以剪出令人滿意的視頻,有時(shí)候剪輯速度甚至比那些使用幀剪輯工具的專業(yè)人士還要快。
該團(tuán)隊(duì)準(zhǔn)備在本月 17-20 號(hào)舉辦的 ACM SIGGRAPH Asia 大會(huì)上展示這一成果。ACM SIGGRAPH Asia 是一個(gè)由國(guó)際圖形圖像協(xié)會(huì)舉辦的電腦圖像和互動(dòng)技術(shù)展覽及會(huì)議,是計(jì)算機(jī)圖形學(xué)的頂級(jí)國(guó)際會(huì)議。
研究者表示,「Write-A-Video」允許剪輯者創(chuàng)通過(guò)簡(jiǎn)單地編輯視頻附帶的文本來(lái)創(chuàng)建視頻蒙太奇。他們可以添加或刪除文本、移動(dòng)句子轉(zhuǎn)換成視頻剪輯操作,如找到相應(yīng)的鏡頭、剪輯或重置鏡頭等。
剪輯過(guò)程分為三個(gè)步驟:(1)用戶提供輸入,大部分時(shí)候是編輯文本;(2)系統(tǒng)自動(dòng)搜尋視頻庫(kù)中語(yǔ)義匹配的鏡頭;(3)拼接視頻。分割文本和鏡頭之間的視覺(jué)-語(yǔ)義匹配是通過(guò)級(jí)聯(lián)關(guān)鍵詞匹配和視覺(jué)-語(yǔ)義嵌入來(lái)實(shí)現(xiàn)的,比其他解決方案準(zhǔn)確率要高??紤]到時(shí)間限制,視頻重組被定義為對(duì)鏡頭、攝像機(jī)運(yùn)動(dòng)和色調(diào)等電影技術(shù)指標(biāo)以及用戶指定的電影技術(shù)習(xí)慣用法(cinematographic idiom)的混合優(yōu)化。
「Write-A-Video 利用了當(dāng)前自動(dòng)視頻理解的先進(jìn)技術(shù)和獨(dú)特的用戶界面,可以生成更加自然、簡(jiǎn)單的視頻剪輯效果,」赫茲利亞跨學(xué)科研究中心的教授 Ariel Shamir 表示?!甘褂梦覀兊墓ぞ?,用戶能夠以文本編輯的方式提供輸入。該工具可以從視頻庫(kù)中自動(dòng)搜索語(yǔ)義匹配的候選鏡頭,然后使用優(yōu)化方法,通過(guò)自動(dòng)裁剪和鏡頭重排來(lái)組合視頻蒙太奇?!?/p>
現(xiàn)為北航虛擬現(xiàn)實(shí)技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室助理研究員及碩士生導(dǎo)師的王淼博士說(shuō)道:「Write-A-Video 可以使用戶通過(guò)電影技術(shù)習(xí)慣用法探索每個(gè)場(chǎng)景的視覺(jué)風(fēng)格,以此來(lái)加快或減緩視頻節(jié)奏、增加或減少動(dòng)作內(nèi)容等?!?/p>
此外,當(dāng)從視頻庫(kù)中選取候選鏡頭時(shí),Write-A-Video 會(huì)兼顧鏡頭的美學(xué)效果,自動(dòng)選擇那些燈光、聚焦良好以及清晰穩(wěn)定的鏡頭。來(lái)自清華大學(xué)的胡事民教授說(shuō)道:「在任何時(shí)間點(diǎn)上,用戶都可以借助旁白敘事來(lái)渲染視頻和預(yù)覽視頻剪輯效果」。
在眾多視頻網(wǎng)站中,「觀看某位明星鏡頭」的選項(xiàng)已經(jīng)出現(xiàn)一段時(shí)間了,最近有關(guān)自動(dòng)剪輯的研究看起來(lái)又將自動(dòng)化提高了一大步。這樣的技術(shù),什么時(shí)候會(huì)進(jìn)入實(shí)用階段呢?
項(xiàng)目鏈接:http://www.faculty.idc.ac.il/arik/site/writeVideo.asp
參考鏈接:http://siggraphasia.mystrikingly.com/blog/lights-camera-and-text-novel-video-editing-tool-for-user-friendly?categoryId=129388