從今以后,所有淘寶天貓商家都能一鍵圖生視頻了
這兩年,大模型作為前沿技術(shù),正逐步深入電商行業(yè)的各個(gè)環(huán)節(jié)。
2025,這一變革仍在加速:近日,【淘寶星辰 · 圖生視頻】工具已重磅上線,并對(duì)淘寶天貓商家正式開放!
體驗(yàn)地址:https://agi.taobao.com/
(目前僅對(duì)淘寶天貓商家開放,普通用戶請(qǐng)耐心等待~)
以下視頻來源于
一、淘寶星辰:懂你,更懂電商!
【淘寶星辰】是由阿里媽媽基于自研的淘寶星辰視頻生成大模型推出的視頻AIGC工具。依靠先進(jìn)的自研大模型、海量的電商數(shù)據(jù)、豐富的設(shè)計(jì)語言和業(yè)內(nèi)領(lǐng)先的營銷經(jīng)驗(yàn),【淘寶星辰 · 圖生視頻】工具在電商視頻生成中展現(xiàn)出以下核心優(yōu)勢(shì):
- 更懂商品的展示手法:基于豐富的電商數(shù)據(jù)和設(shè)計(jì)經(jīng)驗(yàn),自動(dòng)識(shí)別并應(yīng)用最適合不同類別商品的展示手法。從產(chǎn)品細(xì)節(jié)的精準(zhǔn)呈現(xiàn)到整體風(fēng)格的統(tǒng)一協(xié)調(diào),確保每一件商品都能以最佳方式展示。
- 更強(qiáng)的多語種語義遵循能力:深度理解參考圖片和多語種指令(中/英),精準(zhǔn)捕捉文本指令中的關(guān)鍵動(dòng)作信息,確保生成視頻與用戶意圖高度契合。
- 合理的物理和動(dòng)作規(guī)律:嚴(yán)格遵循物理規(guī)律和動(dòng)作規(guī)范,確保畫面流暢自然,避免出現(xiàn)不符合現(xiàn)實(shí)的畫面效果,提升視頻的真實(shí)感和專業(yè)度。
- 穩(wěn)定的人物、商品和裝飾保持:無論是人臉、商品、還是文字、貼紙等裝飾元素,始終保持清晰、完整、無抖動(dòng)或變形,提升視覺一致性。
二、淘寶星辰視頻生成大模型
在主流AIGC背景下,視頻生成早已不是單純的生成算法優(yōu)化和應(yīng)用,而是一個(gè)更加復(fù)雜的、系統(tǒng)性的算法工程,其中人、數(shù)據(jù)、模型、算力是最核心的四個(gè)因素。
在2024年3月,我們基于Unet Diffusion Model路線研發(fā)并上線了阿瞳木動(dòng)效視頻,實(shí)現(xiàn)了視頻AIGC在電商場(chǎng)景的首次應(yīng)用落地,在業(yè)內(nèi)產(chǎn)生了一定的傳播度和影響力。但是,由于技術(shù)路線、數(shù)據(jù)等多個(gè)因素的限制,阿瞳木動(dòng)效視頻在畫面穩(wěn)定性、內(nèi)容可控性、目標(biāo)與動(dòng)作豐富性等關(guān)鍵要素上,仍然存在較大的進(jìn)步空間。
從去年3月至今,我們?cè)谝曨lAIGC方向上堅(jiān)定地持續(xù)投入。通過算法、數(shù)據(jù)、工程等眾多團(tuán)隊(duì)的密切協(xié)作,我們完成了面向生成任務(wù)的數(shù)據(jù)飛輪、自研3D VAE、自研淘寶星辰視頻生成大模型(包括Tbstar-T2V、Tbstar-I2V、Tbstar-V2V等)等多個(gè)關(guān)鍵模塊和模型從0到1的建設(shè)。目前,Tbstar-I2V大模型已經(jīng)應(yīng)用于【淘寶星辰 · 圖生視頻】工具中,為用戶提供更懂電商的圖生視頻功能。
淘寶星辰視頻生成大模型
三、更懂電商的圖生視頻
1.操作便捷
僅需輸入一張靜態(tài)圖片,淘寶星辰可根據(jù)對(duì)圖片的理解直接生成視頻,也可遵循用戶輸入的文本描述生成視頻,一鍵生成高質(zhì)量的5秒視頻。
【淘寶星辰 · 圖生視頻】工具
2.更懂商品的展示手法
以更懂電商的方式展示服飾和非服飾商品,尤其是對(duì)模特動(dòng)作的流暢性和專業(yè)性提升顯著。
prompt:一個(gè)模特臉上帶著酷酷的表情展示衣服
prompt:模特拿著咖啡,走向鏡頭,展示衣服
prompt:懸浮的氣泡和水滴飄動(dòng)
prompt:商品不動(dòng),植物隨風(fēng)搖動(dòng),云霧移動(dòng)
3.更強(qiáng)的多語種語義遵循能力
深度理解參考圖片,支持中英輸入,精準(zhǔn)捕捉文本指令中的關(guān)鍵動(dòng)作信息,確保生成視頻與用戶意圖高度契合。
prompt:模特拿手機(jī)擋著臉,對(duì)鏡自拍展示衣服
prompt:男生把手搭在女生肩膀上,兩人靠在一起
4.專業(yè)的光影效果
根據(jù)參考圖片和用戶,推理光線變化,生成電影質(zhì)感的光影效果。
prompt:一個(gè)女人的臉部特寫,創(chuàng)造出柔和的陰影和高光
prompt:光線緩慢移動(dòng),創(chuàng)造出動(dòng)態(tài)的陰影,背景保持不變,突出了人物面部和裝飾的微妙變
5.穩(wěn)定的人物、商品和裝飾保持
尤其針對(duì)電商圖片中常見的文字、貼紙等裝飾元素,始終保持清晰、完整、無抖動(dòng)或變形,提升視覺一致性。
prompt:一個(gè)女模特對(duì)著鏡頭展示衣服
prompt:鏡頭后退,女模特走向鏡頭,展示衣服
四、高品質(zhì)低成本的原生化應(yīng)用
結(jié)合解說視頻、模版視頻等后期剪輯類工具,實(shí)現(xiàn)高品質(zhì)、原生化電商視頻的低成本智造,應(yīng)用至主流電商場(chǎng)景,以及泛娛樂場(chǎng)景。
應(yīng)用1:商品主圖視頻供給
單張商品主圖一鍵生成主圖視頻。
單張主圖 vs 主圖視頻
應(yīng)用2:賣點(diǎn)吸睛視頻
根據(jù)多張模特圖分別生成視頻片段,采用模版視頻方式制作商品短視頻,添加轉(zhuǎn)場(chǎng)、特效和文字,快速生成吸睛的產(chǎn)品展示視頻。
應(yīng)用3:服飾一體化解決方案
“模特圖”或“平鋪圖”+虛擬模特,都能輕松生成多樣化服飾視頻。
不同SKU平鋪圖 | 虛擬模特穿搭圖 | 多SKU服飾視頻
應(yīng)用4:虛擬試穿視頻
根據(jù)用戶虛擬試穿圖片一鍵生成虛擬試穿視頻,模擬服飾的真實(shí)上身效果。
用戶虛擬試穿圖
用戶虛擬試穿視頻
應(yīng)用5:UGC場(chǎng)景視頻化
UGC圖片一鍵轉(zhuǎn)為視頻,提升視頻供給,例如評(píng)價(jià)、買家秀、逛逛等。
應(yīng)用6:泛娛樂場(chǎng)景
AIGC時(shí)代可以不活但不能沒活兒~
prompt:超級(jí)英雄和恐龍?jiān)谏碁┥下⒉剑尘笆浅鞘械奶祀H線