自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="6yxgr"><p id="6yxgr"></p></sub>

^{<thead id="6yxgr"></thead>}

<sub id="6yxgr"><i id="6yxgr"></i></sub>

^{<blockquote id="6yxgr"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！原創(chuàng)

發(fā)布于 2024-7-4 16:35

瀏覽

0收藏

編輯 | 言征

出品 | 51CTO技術棧（微信號：blog51cto）

視頻生成賽道，商湯今天精準“開大”了！

Sora、Luma等模型留給業(yè)界驚艷的同時，也甩給了無數(shù)后期剪輯的噩夢：好好的一個人物，動不動臉部就變形了，這魔法有點離譜，有時候，不可控就意味著不可用。

就好比之前小編用Luma，生成一段“牛頓被蘋果砸著頭”視頻，蘋果樹下的牛頓，遠景和特寫咋看都是兩個人。

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！-AI.x社區(qū)

難怪有人說讓AI生成一張合適的人物表情，簡直就需要“歐皇”的運氣，抽到SSS卡才行。

1.首個可控人物視頻生成大模型Vimi厲害在哪里？

而就在今天，商湯科技做到了！商湯發(fā)布了業(yè)內(nèi)首個“可控”人物視頻生成大模型產(chǎn)品Vimi。毫不夸張的說，視頻制作者的福音來了！

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！-AI.x社區(qū)

想一想1分鐘穩(wěn)定的單鏡頭人物特寫鏡頭，畫面效果不會隨著時間的變化而劣化或失真，這將省去多大的工作量！

更令人興奮的是，還可以隨心控制表情和肢體，這將是怎樣的效率突破！

7月4日，世界人工智能大會開幕。在上海這座創(chuàng)新之城，商湯直接拋出一個炸裂的發(fā)布：首個面向C端用戶的可控人物視頻生成大模型Vimi驚艷亮相。

據(jù)悉，該模型主要面向C端用戶。根據(jù)現(xiàn)場展示來看，難得之處就在于，Vimi能夠實現(xiàn)精準的人物表情控制，同時還可實現(xiàn)在半身區(qū)域內(nèi)控制照片中人物的自然肢體變化，并自動生成與人物相符的頭發(fā)、服飾及背景變化，可穩(wěn)定生成1分鐘的單鏡頭人物類視頻。

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！-AI.x社區(qū) 圖片

也可以讓你喜歡的人物角色為你奉上一場“表情大賞”。

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！-AI.x社區(qū)

這還沒完，除了生成你想要的動態(tài)表情包，還可以為人物配上相應的服飾、配飾和背景，看起來毫無違和感。

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！-AI.x社區(qū)

當然了，根據(jù)照片，可快速生成寫真視頻，這一點也自然能輕松做到了。吐槽：妙鴨相機要有壓力了~

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！-AI.x社區(qū) 圖片

據(jù)悉Vimi將完全面向C端用戶開放使用，到時候聊天、唱歌、舞動等多種娛樂互動場景相信都能看到Vimi的身影。

不過，現(xiàn)在處于內(nèi)測階段，小編第一時間也申請了，目前還在焦急等待中。

2.寫在最后

總結下，vimi有以下四大特點：

1、人物可控性：可控生成高一致性的人物表情及肢體動作視頻

2、多種控制方式：可以通過人物視頻、動畫參數(shù)、語音文字等輸入驅動

3、分鐘級單鏡頭：支持生成分鐘級的單鏡頭人物視頻，在演示的視頻中，可以看到視頻長達1分鐘。

4、生成合理的視頻場景：支持人物合理的頭發(fā)、服飾、背景補全，并支持光影變化。

整體上看，通過一張任意風格的照片就能生成和目標動作一致不隨時間變化而失真的人物類視頻，可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動，足夠在人物方面把Luma比下去了，畢竟各有所長。

至于Vimi為什么這么厲害？當然還是底座模型太給力了，商湯日日新大模型SenseNova，猜測是圖文多模態(tài)大模型SenseChat-Vision的加持，不過免費體驗期已經(jīng)截止了。

精準開大招！商湯發(fā)布首個可控人物大模型！分鐘級、不失真，視頻制作門檻要被砍沒了！-AI.x社區(qū) 圖片

忘了，上個內(nèi)測申請鏈接：??? https://www.wjx.cn/vm/mhSxfGv.aspx??

本文轉載自??51CTO技術棧??，作者：言征

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

基于圖增強的大模型可控生成框架

kcoufee ? 2856瀏覽 ? 0回復
今日arXiv最熱NLP大模型論文：浙大發(fā)布歌曲合成工具Prompt-Singer，歌手性別風格均可控！

pangguiyu ? 5017瀏覽 ? 0回復
首個開源世界模型！百萬級上下文，長視頻理解吊打GPT-4，UC伯克利華人一作

duhorse ? 2943瀏覽 ? 0回復
谷歌發(fā)布Veo：文生超1分鐘、1080P視頻，媲美Sora

Aceryt ? 3944瀏覽 ? 0回復
人物照片+文字 = 定制化視頻，騰訊光子開源ID-Animator

輕薄滴假象 ? 2992瀏覽 ? 0回復
為消除幻覺，Amazon Bedrock開大招！推出上下文基礎和 RAG 連接器！

51CTO技術棧 ? 2922瀏覽 ? 1回復
綜述 | 大模型的可控文本生成

NLP工作站 ? 3380瀏覽 ? 0回復
精準可控新視角視頻生成+場景級3D生成！北大&港中文&騰訊等開源ViewCrafter

angel ? 2437瀏覽 ? 0回復
從秒級到小時級：TikTok等發(fā)布首篇面向長視頻理解的多模態(tài)大語言模型全面綜述

angel ? 5324瀏覽 ? 0回復
如何使用NotebookLM制作YouTube視頻學習指南？

51CTO內(nèi)容精選 ? 2469瀏覽 ? 0回復
用戶可控的電影級圖像到視頻生成方法！港中文&Adobe發(fā)布MotionCanvas

angel ? 2017瀏覽 ? 0回復
港大&字節(jié)發(fā)布領先商用級圖像視頻生成模型Goku有點東西

angel ? 2096瀏覽 ? 0回復
ICLR 2025 | 視頻編輯最新SOTA！VideoGrain零樣本實現(xiàn)多粒度控制，精準到像素級

angel ? 2032瀏覽 ? 0回復
庫克藏了7年的大招！蘋果手表偷偷長眼睛，人類要被AI看光了？

算家計算 ? 1051瀏覽 ? 0回復
全球首個會“邊想邊干”的智能體發(fā)布：人類要被炒魷魚了？

算家計算 ? 818瀏覽 ? 0回復
企業(yè)級RAG全解析：實現(xiàn)精準、安全、高效智能客服

云原生AI百寶箱 ? 972瀏覽 ? 0回復
Meta放大招！Llama 4三大模型來襲，開源免費還超能打

Halo咯咯 ? 1586瀏覽 ? 0回復
開辟視頻模型的“新語言”，Prompt的門檻被砍沒了！

51CTO技術棧 ? 1166瀏覽 ? 0回復
使用測試時間訓練（TTT）生成一分鐘視頻

51CTO內(nèi)容精選 ? 555瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

中國開源大模型新成員：小米推理大模型首秀！ 4h前發(fā)布
剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點贊！真實跑步水平曝光：2m/s接近天工！ 9h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

微軟突然封鎖Cursor，全面禁用C、C++、C#擴展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

上一篇：在OpenAI，蘋果一分沒花，就辦完了微軟130億元做成的事

下一篇：快手開源圖生視頻模型LivePortrait，等待生成時間僅需10秒，棄擴散改用隱式關鍵點框架技術，網(wǎng)友：強得可怕

社區(qū)精華內(nèi)容

目錄

<sub id="qycqx"></sub>