自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="vpml6"><li id="vpml6"><menuitem id="vpml6"></menuitem></li></p>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys 精華

輕薄滴假象

發(fā)布于 2024-8-26 09:42

瀏覽

0收藏

自今年起，OpenAI 的 Sora 和其他基于 DiT 的視頻生成模型在 AI 領域掀起了又一波浪潮。但由于起步較晚，視頻生成領域的很多基礎設施都還有待完善。

今年 2 月份，新加坡國立大學尤洋團隊開源的一個名為 ???OpenDiT?? 的項目為訓練和部署 DiT 模型打開了新思路。這是一個易于使用、快速且內存高效的系統(tǒng)，專門用于提高 DiT 應用程序的訓練和推理效率，包括文本到視頻生成和文本到圖像生成。

項目上線后非常受歡迎，尤洋團隊也一直在繼續(xù)這方面的工作，包括增加對 Open-Sora 等模型的支持，開發(fā) DSP、PAB 加速技術等。

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

最近，他們更是把這些進展都融合到了一起，開發(fā)出了一個名為 VideoSys 的視頻生成系統(tǒng)。

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

團隊表示，與 LLM 不同，視頻模型要處理長序列和復雜的執(zhí)行流程。并且模型的每個組件都具有獨特的特征，對內存和計算提出了不同的挑戰(zhàn)。

VideoSys 是一個簡單高效的視頻生成系統(tǒng)，旨在讓視頻生成對于每個人而言都簡便、迅速且成本低廉。

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

此外，它還是一個開源項目，為視頻生成提供了一個用戶友好的高性能基礎設施。這個全面的工具包將支持從訓練、推理到服務和壓縮的整個 pipeline。它標志著視頻生成的新篇章。

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

從 OpenDiT 到 VideoSys，尤洋團隊的相關工作已經(jīng)收獲了 1.4k 的 star 量。

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

項目鏈接：https://github.com/NUS-HPC-AI-Lab/VideoSys?

VideoSys 的安裝、使用方法和相關技術如下。

安裝方法

安裝準備：

Python >= 3.10
PyTorch >= 1.13（建議使用 2.0 以上版本）
CUDA >= 11.6

強烈建議使用 Anaconda 創(chuàng)建一個新環(huán)境（Python>=3.10）來運行示例：

conda create -n videosys pythnotallow=3.10 -y
conda activate videosys

安裝 VideoSys：

git clone https://github.com/NUS-HPC-AI-Lab/VideoSyscd VideoSys
pip install -e .

使用方法

VideoSys 通過各種加速技術支持許多擴散模型，使這些模型能夠運行得更快并消耗更少的內存。

你可以在下表中找到所有可用模型及其支持的加速技術。

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

加速技術

Pyramid Attention Broadcast (PAB)

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

PAB 是業(yè)內第一種可以實時輸出的、基于 DiT 的視頻生成方法，無需任何訓練即可提供無損質量。通過減少冗余注意力計算，PAB 實現(xiàn)了高達 21.6 FPS 的幀率和 10.6 倍的加速，同時不會犧牲包括 Open-Sora、Open-Sora-Plan 和 Latte 在內的基于 DiT 的視頻生成模型的質量。值得注意的是，作為一種不需要訓練的方法，PAB 可以為任何未來基于 DiT 的視頻生成模型提供加速，讓其具備實時生成的能力。詳情請參見機器之心報道：《???史上首個實時 AI 視頻生成技術：DiT 通用，速度提升 10.6 倍??》

論文：https://arxiv.org/abs/2408.12588
博客：https://arxiv.org/abs/2403.10266
文檔：https://github.com/NUS-HPC-AI-Lab/VideoSys/blob/master/docs/pab.md

Dyanmic Sequence Parallelism（DSP）

DSP 是一種新穎、優(yōu)雅、超高效的序列并行算法，適用于 Open-Sora、Latte 等多維 transformer 架構。

與 sota 序列并行方法 DeepSpeed Ulysses 相比，它在 Open-Sora 中實現(xiàn)了 3 倍的訓練加速和 2 倍的推理加速。對于 10 秒（80 幀）的 512x512 視頻，Open-Sora 的推理延遲如下：

視頻生成要有自己的系統(tǒng)！尤洋團隊歷時半年開源VideoSys-AI.x社區(qū)

論文：https://arxiv.org/abs/2403.10266
文檔：https://github.com/NUS-HPC-AI-Lab/VideoSys/blob/master/docs/dsp.md?

更多詳細信息請參考該項目 Github 界面。

本文轉自機器之心，作者：機器之心

原文鏈接:??https://mp.weixin.qq.com/s/Q-AHzIOT0PBP6Yvdk_T3Sg??

標簽

贊

收藏

回復

舉報

回復

相關推薦

阿里巴巴AI研究團隊打破視頻生成技術壁壘，EasyAnimate實現(xiàn)高質量長視頻生成

Syrupup ? 3702瀏覽 ? 0回復
北大快手攻克復雜視頻生成難題！新框架輕松組合各種細節(jié)，代碼將開源

Crystalcxt ? 2653瀏覽 ? 0回復
曠視開源的AI人像視頻生成太炸了！輸入照片即可模仿任意表情包

輕薄滴假象 ? 2776瀏覽 ? 0回復
生成式AI多代理系統(tǒng)：技術團隊的秘密武器

51CTO內容精選 ? 2455瀏覽 ? 0回復
AI首次實時生成視頻！尤洋團隊新作，網(wǎng)友：這是新紀元

angel ? 2634瀏覽 ? 0回復
長視頻生成速度提升100倍！新加坡國立提出Video-Infinity：分布式長視頻生成

angel ? 2750瀏覽 ? 0回復
賈佳亞團隊重磅開源ControlNeXt：超強圖像視頻生成方法

angel ? 3063瀏覽 ? 0回復
賈佳亞團隊推出，即插即用，還能控制視頻生成

Crystalcxt ? 1869瀏覽 ? 0回復
長視頻生成又有重大突破！DreamFactory：一致、連貫且引人入勝的長視頻生成框架

angel ? 7984瀏覽 ? 0回復
長視頻生成再突破！高質量連貫達600幀 | ConFiner：專家鏈加持的免訓練長視頻生成器

angel ? 2242瀏覽 ? 0回復
精準可控新視角視頻生成+場景級3D生成！北大&港中文&騰訊等開源ViewCrafter

angel ? 2437瀏覽 ? 0回復
Open-Sora 1.1 解讀：完全開源的高效復現(xiàn)類Sora視頻生成方案！

angel ? 2259瀏覽 ? 0回復
Meta Movie Gen：新的 SOTA 視頻生成模型-技術報告解讀

amei2000go ? 3313瀏覽 ? 0回復
阿里商業(yè)級視頻生成框架——軌跡控制版視頻生成 Tora 重磅開源！

angel ? 2303瀏覽 ? 0回復
OpenAI 發(fā)布 Sora：最受期待的 AI 視頻生成工具

Halo咯咯 ? 1788瀏覽 ? 0回復
騰訊的混源視頻模型HunyuanVideo：大視頻生成模型訓練的系統(tǒng)框架

Halo咯咯 ? 2514瀏覽 ? 0回復
昆侖萬維開源首個面向AI短劇的視頻生成模型

angel ? 3058瀏覽 ? 0回復
ControlNet作者：視頻生成論文Frameback，超低顯存生成高質量視頻，ComfyUI必備組件！

石映飛云 ? 450瀏覽 ? 0回復
AI視頻生成新突破！字節(jié)提出一致性視頻生成方法Phantom：通過跨模態(tài)對齊生成主題一致的視頻，超多應用場景

AIGCStudio ? 120瀏覽 ? 0回復

輕薄滴假象

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

DeepSeek一口氣開源3個項目，還有梁文鋒親自參與，昨晚API大降價 2025-02-27 12:40:06發(fā)布
全球首個AI CUDA工程師來了！將PyTorch原生實現(xiàn)提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇： ECCV 2024 | 引入DiT的原生3D通用框架，適用任意神經(jīng)場、秒級生成

下一篇：視頻生成控制提升幾十倍，新一代輕量級ControlNeXt火了，賈佳亞團隊正挑戰(zhàn)Scaling Law

社區(qū)精華內容

目錄

<sub id="bcheu"></sub>^{<sub id="bcheu"></sub>}