自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="8uizk"><s id="8uizk"></s></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

事件相機(jī)+AI視頻生成，港大CUBE框架入選ICIP，無需訓(xùn)練實(shí)現(xiàn)可控視頻生成

作者：量子位 2024-10-28 07:30:00

人工智能新聞

CUBE不僅是一項(xiàng)技術(shù)，更是一次在事件相機(jī)與AI生成視頻領(lǐng)域的新探索。

在這個(gè)信息爆炸的時(shí)代，如何讓AI生成的視頻更具創(chuàng)意，又符合特定需求？

來自香港大學(xué)的最新研究《基于事件、無需訓(xùn)練的可控視頻生成框架 CUBE》帶來一個(gè)全新的解決方案。

這一框架利用了事件相機(jī)捕捉動(dòng)態(tài)邊緣的能力，將AI生成的視頻帶入了一個(gè)新的維度，精準(zhǔn)又高效。論文原標(biāo)題是“Controllable Unsupervised Event-based Video Generation”，

發(fā)表于圖像處理盛會(huì)ICIP并被選為Oral（口頭報(bào)告），并受邀在WACV workshop演講。

什么是事件相機(jī)？

在深入了解CUBE框架之前，先來認(rèn)識(shí)一下事件相機(jī)。

不同于傳統(tǒng)相機(jī)的定時(shí)捕捉，事件相機(jī)模仿生物的視覺系統(tǒng)，只捕捉像素點(diǎn)亮度變化的“事件”，就像是只記錄畫面的精華部分。

這樣不僅可以有效減少冗余數(shù)據(jù)，還可以顯著降低耗能。

尤其是在高速動(dòng)態(tài)或光線變化大的場(chǎng)景下，事件相機(jī)比傳統(tǒng)相機(jī)更有優(yōu)勢(shì)。而這些獨(dú)特的“事件數(shù)據(jù)”正是CUBE框架的核心。

△左：普通相機(jī)拍的；右：事件相機(jī)拍的

簡(jiǎn)單說，事件相機(jī)和普通相機(jī)不同，捕捉的是物體邊緣的動(dòng)態(tài)細(xì)節(jié)，就像你腦中一閃而過的靈感，節(jié)省了大量帶寬還能省電。

CUBE框架結(jié)合了這些“閃現(xiàn)”的邊緣數(shù)據(jù)和文字描述，無需訓(xùn)練就能合成符合需求的視頻！這不僅能讓你生成的場(chǎng)景更“合胃口”，還能讓視頻質(zhì)量、時(shí)間一致性和文本匹配度都蹭蹭上漲。

為什么要用CUBE？

其他方法或是需要大量訓(xùn)練數(shù)據(jù)，或是生成效果欠佳。CUBE框架不僅解決了這些問題，還在多項(xiàng)指標(biāo)上表現(xiàn)出色。

無論是視覺效果、文本匹配度還是幀間一致性，CUBE都表現(xiàn)優(yōu)異。

可以這樣想：CUBE就像給事件相機(jī)配上了智能“濾鏡”，讓生成的視頻不僅生動(dòng)還符合描述，比如讓鐵人也能在馬路上跳起月球舞步！

CUBE框架是如何工作的？

CUBE的全稱是“Controllable, Unsupervised, Based on Events”，直譯過來就是“可控的、無需訓(xùn)練的、基于事件的”視頻生成框架。

它通過提取事件中的邊緣信息，再結(jié)合用戶提供的文字描述生成視頻。在方法上，CUBE主要依賴擴(kuò)散模型生成技術(shù)。

擴(kuò)散模型通過向圖像添加隨機(jī)噪聲并逐步還原來生成圖片，但團(tuán)隊(duì)進(jìn)一步優(yōu)化了這個(gè)過程，能讓它根據(jù)“事件”提供的邊緣數(shù)據(jù)生成視頻。

CUBE的核心方法

1. 邊緣提?。?/strong>事件流記錄了物體運(yùn)動(dòng)的軌跡，而CUBE的首要任務(wù)就是將這些事件轉(zhuǎn)換成邊緣信息。團(tuán)隊(duì)設(shè)計(jì)了一個(gè)邊緣提取模塊，把事件數(shù)據(jù)分成多個(gè)時(shí)間段，提取出關(guān)鍵的空間位置，從而形成精確的邊緣圖。這些邊緣圖不僅保留了運(yùn)動(dòng)物體的輪廓，還能讓視頻生成更流暢。

2. 視頻生成：有了邊緣數(shù)據(jù)之后，CUBE結(jié)合了文字描述生成視頻。通過擴(kuò)散模型的逐步還原過程，可以生成多個(gè)與描述相匹配的圖像幀，并用插幀技術(shù)讓視頻更加平滑一致。這個(gè)過程不需要大量的訓(xùn)練數(shù)據(jù)，因?yàn)镃UBE直接調(diào)用了預(yù)訓(xùn)練的擴(kuò)散模型來實(shí)現(xiàn)高質(zhì)量生成。

3. 控制性與一致性：采用了ControlVideo框架，這一框架具有優(yōu)秀的可控性，通過文字描述來控制生成的視頻內(nèi)容，使每幀的生成都符合特定的要求。ControlVideo和CUBE的組合解決了傳統(tǒng)方法中視頻生成一致性不足的問題，讓內(nèi)容更生動(dòng)、更貼合描述。

CUBE的性能表現(xiàn)

在實(shí)驗(yàn)中，CUBE的表現(xiàn)遠(yuǎn)超現(xiàn)有方法。在視頻質(zhì)量、文本匹配度和時(shí)間一致性等多個(gè)指標(biāo)上，CUBE都取得了優(yōu)異的成績(jī)。

定量實(shí)驗(yàn)顯示，CUBE生成的幀間一致性和文本匹配度都比ControlNet、ControlVideo等方法更優(yōu)。此外，團(tuán)隊(duì)還做了用戶偏好測(cè)試，結(jié)果顯示參與者普遍更喜歡CUBE生成的視頻。

未來展望

當(dāng)然，CUBE還有提升的空間。未來團(tuán)隊(duì)希望將邊緣信息和紋理信息結(jié)合，使視頻更具細(xì)節(jié)和真實(shí)感，同時(shí)探索更多領(lǐng)域適用性，甚至將其應(yīng)用在實(shí)時(shí)場(chǎng)景中。這一技術(shù)不僅適合電影、動(dòng)畫生成等領(lǐng)域，還可以用于自動(dòng)駕駛、監(jiān)控等需要快速識(shí)別動(dòng)態(tài)環(huán)境的場(chǎng)景。

CUBE不僅是一項(xiàng)技術(shù)，更是一次在事件相機(jī)與AI生成視頻領(lǐng)域的新探索。

如果你也對(duì)AI生成視頻感興趣，可進(jìn)一步參考完整論文和開源代碼。

論文地址：https://ieeexplore.ieee.org/abstract/document/10647468
代碼已開源：https://github.com/IndigoPurple/cube

責(zé)任編輯：張燕妮來源：量子位

AI 視頻生成

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

軌跡可控視頻生成新范式，復(fù)旦微軟破解視頻生成難題，精準(zhǔn)控制任意物體運(yùn)動(dòng)
研究人員提出了MagicMotion，一種創(chuàng)新的圖像到視頻生成框架，共同第一作者為復(fù)旦大學(xué)研究生李全昊、邢楨，通訊作者為復(fù)旦大學(xué)吳祖煊副教授。

2025-03-27 09:24:16

無需訓(xùn)練、即插即用，新算法大幅增強(qiáng)視頻生成質(zhì)量
簡(jiǎn)單來說，新算法通過調(diào)整時(shí)間注意力層輸出的一個(gè)關(guān)鍵參數(shù)，能夠在幾乎不增加推理負(fù)擔(dān)的情況下，大幅提升生成視頻的細(xì)節(jié)表現(xiàn)和時(shí)序連貫性。

2024-12-26 00:51:38

浙大 | 騰訊 | 華為提出視頻生成框架VideoMaker，可由參考圖實(shí)現(xiàn)Zero-shot定制化視頻生成
零樣本定制視頻生成因其巨大的應(yīng)用潛力而備受關(guān)注?，F(xiàn)有方法依賴于附加模型來提取和注入?yún)⒖贾黧w特征，認(rèn)為單靠視頻擴(kuò)散模型(VDM)不足以生成零樣本定制視頻。

2025-01-26 10:50:00

模型視頻生成

全球首發(fā)，國(guó)產(chǎn)開源「文本-視頻生成」模型！免費(fèi)在線體驗(yàn)，一鍵實(shí)現(xiàn)視頻生成自由
AIGC進(jìn)軍視頻生成！

2023-04-03 10:04:44

開源模型

時(shí)間、空間可控的視頻生成走進(jìn)現(xiàn)實(shí)，阿里大模型新作VideoComposer火了
阿里巴巴和螞蟻集團(tuán)的研究團(tuán)隊(duì)率先做出嘗試并提出了VideoComposer，即通過組合式生成范式同時(shí)實(shí)現(xiàn)視頻在時(shí)間和空間兩個(gè)維度上的可控性。

2023-06-13 09:33:37

視頻阿里巴巴

突破自動(dòng)駕駛視頻生成極限：港中文&港科大&華為聯(lián)手推出MagicDriveDiT
現(xiàn)在，香港中文大學(xué)、香港科技大學(xué)和華為聯(lián)手向這一長(zhǎng)期挑戰(zhàn)發(fā)起了沖鋒：推出MagicDriveDiT，重新定義自動(dòng)駕駛視頻生成的標(biāo)準(zhǔn)。

2024-12-20 09:30:00

模型訓(xùn)練數(shù)據(jù)

無需訓(xùn)練、即插即用，新算法大幅增強(qiáng)視頻生成質(zhì)量｜NUS＆上海AI Lab&UT Austin
和最近人氣超高的混元視頻生成模型（HunyuanVideo）對(duì)比來看，加入EnhanceAVideo的版本在生成畫面中表現(xiàn)出了更加豐富的細(xì)節(jié)和更高的語(yǔ)義契合度，生成內(nèi)容和用戶輸入的文本提示更匹配：

2024-12-26 07:20:00

單張人像生成視頻！中國(guó)團(tuán)隊(duì)提出3D人臉視頻生成模型，實(shí)現(xiàn)SOTA
稀疏人臉特征點(diǎn)生成的人臉圖像視頻通常會(huì)遇到圖像質(zhì)量損失、圖像失真、身份改變，以及表情不匹配等問題。為此作者使用重建出的三維人臉動(dòng)態(tài)信息來指導(dǎo)人臉視頻的生成。結(jié)果顯示，F(xiàn)aceAnime從單張靜止人臉圖像生成的視頻比其它方法效果更好。

2021-08-13 15:07:02

模型人工智能深度學(xué)習(xí)

60秒內(nèi)即可生成5秒AI視頻，豆包視頻生成模型Seaweed上線即夢(mèng)AI
11月8日，字節(jié)跳動(dòng)旗下的AI內(nèi)容平臺(tái)即夢(mèng)AI宣布，即日起，由字節(jié)跳動(dòng)自研的視頻生成模型Seaweed面向平臺(tái)用戶正式開放。用戶登陸后，在“視頻生成”功能下，視頻模型選擇“視頻S2.0”即可體驗(yàn)。

2024-11-08 17:34:38

火山引擎發(fā)布大模型訓(xùn)練視頻預(yù)處理方案，已應(yīng)用于豆包視頻生成模型
10月15日，火山引擎在視頻云技術(shù)大會(huì)上發(fā)布了大模型訓(xùn)練視頻預(yù)處理方案，助力解決視頻大模型訓(xùn)練的成本、質(zhì)量和性能等方面的技術(shù)挑戰(zhàn)。目前，該技術(shù)方案已應(yīng)用于豆包視頻生成模型。

2024-10-15 14:08:06

同時(shí)提升攝像機(jī)控制效率、視頻質(zhì)量，可控視頻生成架構(gòu)AC3D來了
AC3D對(duì)視頻擴(kuò)散模型中的攝像機(jī)運(yùn)動(dòng)進(jìn)行系統(tǒng)性分析，從而顯著提升控制的精度和效率。

2025-01-14 14:02:05

Adobe與MIT推出自回歸實(shí)時(shí)視頻生成技術(shù)CausVid。AI可以邊生成視頻邊實(shí)時(shí)播放！
我們的模型在VBenchLong基準(zhǔn)上獲得了84.27的總分，超越了所有以前的視頻生成模型。

2025-01-15 09:21:57

AI視頻生成新突破！字節(jié)提出一致性視頻生成方法Phantom：通過跨模態(tài)對(duì)齊生成主題一致的視頻，超多應(yīng)用場(chǎng)景
它通過重新設(shè)計(jì)聯(lián)合文本圖像注入模型，利用文本圖像視頻三元組數(shù)據(jù)實(shí)現(xiàn)跨模態(tài)對(duì)齊。

2025-04-28 09:28:14

AI恐怖體操視頻腿腳亂飛、大變活人，LeCun：視頻生成模型根本不懂物理
前段時(shí)間SD3翻車，同樣對(duì)人體生成效果不好，網(wǎng)友也討論過這一問題，過于嚴(yán)格的數(shù)據(jù)審核，可能誤刪了一些無害的成人圖像，影響了模型對(duì)人體結(jié)構(gòu)的理解。

2024-07-01 13:02:53

字節(jié)視頻生成模型 PixelDance上線即夢(mèng)AI，用戶可免費(fèi)體驗(yàn)
11月15日，字節(jié)跳動(dòng)視頻生成模型PixelDance和Seaweed在即夢(mèng)AI正式上線，面向公眾免費(fèi)開放使用。用戶進(jìn)入即夢(mèng)AI的“視頻生成”界面，在視頻模型里選擇“視頻P2.0Pro”或“視頻S2.0Pro”，即可分別體驗(yàn)這兩款模型，目前網(wǎng)頁(yè)版和手機(jī)端APP均已支持。

2024-11-18 10:50:39

谷歌發(fā)布AI視頻生成器Lumiere，在生成可愛動(dòng)物視頻方面表現(xiàn)出色
谷歌公布了一款名為L(zhǎng)umiere的人工智能視頻生成器，并在相關(guān)的預(yù)印本論文中稱其為“逼真視頻生成的時(shí)空擴(kuò)散模型”。Lumiere在制作可愛動(dòng)物在荒謬場(chǎng)景中的視頻方面做得很好，比如穿旱冰鞋、開車或彈鋼琴。

2024-02-04 19:58:27

谷歌 AI視頻生成器

Sora終于來了，但卷王可靈已經(jīng)「拍」上了AI電影
今年年初Sora一把火，徹底點(diǎn)燃了AI視頻生成這個(gè)賽道。6月6日，快手率先推出自研的視頻生成大模型「可靈AI」，成為全球首個(gè)用戶可用的真實(shí)影像級(jí)視頻生成大模型。

2024-12-12 08:35:58

谷歌AI視頻生成模型Veo 2定價(jià)公布
谷歌近期在其定價(jià)頁(yè)面上低調(diào)公布了新一代AI視頻生成模型Veo2的使用費(fèi)用。根據(jù)官方信息，使用Veo2的成本為每秒50美分，換算下來，每分鐘的費(fèi)用為30美元，每小時(shí)則高達(dá)1800美元。

2025-02-24 10:03:21

亞馬遜發(fā)布 Nova 系列 AI 模型，提供文本、圖像和視頻生成功能
亞馬遜宣布推出一系列新的AI基礎(chǔ)模型，品牌為“Nova”，并將通過AWS的AmazonBedrock模型庫(kù)提供。

2024-12-04 11:07:09

Pika、Gen-2、ModelScope、SEINE……AI視頻生成哪家強(qiáng)？這個(gè)框架一測(cè)便知
昨天，Meta、紐約大學(xué)的研究者用「自我獎(jiǎng)勵(lì)方法」，讓大模型自己生成自己的微調(diào)數(shù)據(jù)，從而在Llama270B的迭代微調(diào)后超越了GPT4。今天，英偉達(dá)的全新對(duì)話QA模型「ChatQA70B」在不使用任何GPT模型數(shù)據(jù)的情況下，在10個(gè)對(duì)話QA數(shù)據(jù)集上的平均得分略勝于GPT4。

2024-01-22 07:10:00

AI 視頻

相似話題

機(jī)器學(xué)習(xí)
2031內(nèi)容

深度學(xué)習(xí)
1694內(nèi)容

自然語(yǔ)言處理
 110內(nèi)容

語(yǔ)音識(shí)別
 107內(nèi)容
全部話題

同話題下的熱門內(nèi)容

DeepSeek R2提前泄露？周二或周三發(fā)布？海外謠言一夜刷屏，HggingFace CEO一帖子引瘋狂猜想，DS又被消費(fèi)了深夜突襲，阿里Qwen3登頂全球開源王座！暴擊DeepSeek-R1，2小時(shí)狂攬17k星僅用3周時(shí)間，就打造出Manus開源平替！貢獻(xiàn)源代碼，免費(fèi)用 MCP 服務(wù)器很危險(xiǎn)！這里有安全使用指南！剛剛，Qwen3強(qiáng)勢(shì)登頂，成開源新王！國(guó)內(nèi)首個(gè)混合推理模型，235B擊敗R1、o1!源神火力全開：全系列8個(gè)模型一口氣開源！Kimi-Audio開源橫掃全場(chǎng)景，1300萬+小時(shí)數(shù)據(jù)煉成語(yǔ)音世界“大一統(tǒng)”看不懂GitHub代碼？剛剛這個(gè)AI工具讓全球每個(gè)GitHub項(xiàng)目開口說話一文詳解深度學(xué)習(xí)中的標(biāo)量、向量、矩陣、張量

相關(guān)專題更多

解讀惠普Z(yǔ)系列工作站ZBook Ultra G1a高性能移動(dòng)

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長(zhǎng)學(xué)院 | 成長(zhǎng)有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營(yíng)

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動(dòng)態(tài)

站點(diǎn)地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號(hào)ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號(hào)：110108002980號(hào)
營(yíng)業(yè)執(zhí)照京ICP備09067568號(hào)

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請(qǐng)勿轉(zhuǎn)載

營(yíng)業(yè)執(zhí)照出版物經(jīng)營(yíng)許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動(dòng)科技科技行者 TechWeb 艾瑞網(wǎng)站長(zhǎng)之家速途網(wǎng)中國(guó)經(jīng)濟(jì)新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會(huì)議中國(guó)IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號(hào)

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷

^{<blockquote id="fhwd0"></blockquote>}