自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

豆包大模型再造爆款:抖音“AI繪本特效”播放超11億

企業(yè)動(dòng)態(tài)
國(guó)慶期間,抖音上一款名為“AI治愈繪本”的特效憑借溫暖優(yōu)美的畫(huà)風(fēng)和高還原度吸引了數(shù)百萬(wàn)用戶(hù)投稿,采用了動(dòng)態(tài)繪本的擬物玩法,“AI治愈繪本”特效首次使用了3D立體翻書(shū)的形式,巧妙地將首張用戶(hù)圖作為書(shū)皮呈現(xiàn),玩法新穎有趣。基于該特效投稿的“成為繪本里的溫暖主角”話(huà)題播放量超過(guò)11億。

國(guó)慶期間,抖音上一款名為“AI治愈繪本”的特效憑借溫暖優(yōu)美的畫(huà)風(fēng)和高還原度吸引了數(shù)百萬(wàn)用戶(hù)投稿,采用了動(dòng)態(tài)繪本的擬物玩法,“AI治愈繪本”特效首次使用了3D立體翻書(shū)的形式,巧妙地將首張用戶(hù)圖作為書(shū)皮呈現(xiàn),玩法新穎有趣?;谠撎匦陡宓摹俺蔀槔L本里的溫暖主角”話(huà)題播放量超過(guò)11億。

據(jù)了解,“AI治愈繪本”特效底層使用了字節(jié)跳動(dòng)豆包大模型的圖像生成能力,技術(shù)團(tuán)隊(duì)通過(guò)多項(xiàng)自研算法,保證了模型有更好的風(fēng)格響應(yīng)度、畫(huà)面美觀(guān)度,讓風(fēng)格化效果更富有表現(xiàn)力,并且更大程度還原了人物面部特征、服裝款式、顏色、配飾等主體特征,在“美且像”的維度上取得了良好的效果。

為呈現(xiàn)更好的交互方式,技術(shù)團(tuán)隊(duì)還使用了自研的主體抹除、擴(kuò)圖能力,對(duì)風(fēng)格化結(jié)果圖進(jìn)行后處理,使得多張結(jié)果圖可以在端上進(jìn)行切換。上述過(guò)程中應(yīng)用到的IP保持技術(shù)RealCustom和 AI擴(kuò)圖和AI消除技術(shù)ByteEdit,兩項(xiàng)成果分別入選CVPR2024和ECCV2024。

RealCustom :生成效果又美又像本人的IP保持技術(shù)

RealCustom是一種個(gè)性化定制技術(shù)即IP保持,對(duì)于任意開(kāi)放域物體或人物 IP 均可實(shí)現(xiàn)無(wú)需微調(diào)的實(shí)時(shí)定制化生成,在AI繪本中主要起到保持輸入圖片特征的作用。不同于以往風(fēng)格化特效中用的圖片特征保持方法, RealCustom不僅能夠還原圖片的細(xì)節(jié)特征,還具有對(duì)圖片的抽象語(yǔ)義理解,從而可以根據(jù)文本輸入自適應(yīng)地做出變化,并生成更加和諧的效果。為了更好的還原主體外觀(guān),RealCustom使用了多個(gè)層次的圖片信息融合,為了讓視覺(jué)信息跟文本信息能更好的融合,RealCustom 通過(guò)自適應(yīng)模塊學(xué)習(xí)了視覺(jué)條件與文本條件之間的對(duì)齊能力,并根據(jù)不同時(shí)刻的狀態(tài)準(zhǔn)確地推導(dǎo)出相應(yīng)的視覺(jué)條件。從而能對(duì)用戶(hù)多種多樣的輸入做出自適應(yīng)的處理,在保證好看的風(fēng)格化效果的同時(shí),穩(wěn)定的保持圖片特征。

RealCustom 論文已入選CVPR2024,了解詳細(xì)內(nèi)容見(jiàn):https://corleone-huang.github.io/realcustom/,https://corleone-huang.github.io/RealCustom_plus_plus/

ByteEdit:讓填充背景更自然和諧的AI擴(kuò)圖和AI消除能力

特效中用到了AI擴(kuò)圖和AI消除的能力,其中AI消除是指消除圖像中指定的某個(gè)物體或區(qū)域,并根據(jù)周?chē)谋尘皝?lái)填充消除位置的內(nèi)容;AI擴(kuò)圖則根據(jù)指定的擴(kuò)展比例來(lái)延展原圖像的內(nèi)容。這兩個(gè)任務(wù)本質(zhì)上都是根據(jù)已知圖像的內(nèi)容去填充周?chē)膮^(qū)域,重點(diǎn)在于如何讓填充的內(nèi)容和原圖沒(méi)有違和感。

為了達(dá)到這個(gè)目的,首先,技術(shù)團(tuán)隊(duì)增大了訓(xùn)練數(shù)據(jù)量級(jí),讓模型「看到」更多泛化場(chǎng)景,此外,ByteEdit提出了一種創(chuàng)新的框架,利用反饋學(xué)習(xí)來(lái)增強(qiáng)生成性圖像編輯任務(wù)。ByteEdit通過(guò)集成圖像獎(jiǎng)勵(lì)模型來(lái)提升美學(xué)質(zhì)量、圖像與文本的一致性,并引入密集的像素級(jí)獎(jiǎng)勵(lì)模型以增強(qiáng)輸出的一致性,讓希望填充的區(qū)域和非填充區(qū)域更加的和諧。此外,提出了一種對(duì)抗性和漸進(jìn)式反饋學(xué)習(xí)策略,以加快模型的推理速度。


原圖


左:獎(jiǎng)勵(lì)模型前生成的圖;右:加入獎(jiǎng)勵(lì)模型后的圖。


原圖


左:獎(jiǎng)勵(lì)模型前生成的圖;右:加入獎(jiǎng)勵(lì)模型后的圖。

ByteEdit已入選ECCV2024,詳見(jiàn)論文主頁(yè):https://byte-edit.github.io/

除此之外,“AI治愈繪本”特效可以支持用戶(hù)上傳多張圖,在做能力部署時(shí),技術(shù)團(tuán)隊(duì)針對(duì)該場(chǎng)景單獨(dú)做了一套多服務(wù)并行邏輯以及性能加速策略,最大程度保障了在流量高峰期時(shí),能夠在最短時(shí)間內(nèi)將風(fēng)格化結(jié)果圖、后處理結(jié)果圖等順利返回到端上。端上獲取多張結(jié)果圖后,技術(shù)團(tuán)隊(duì)依托自研的書(shū)本3D運(yùn)動(dòng)和陰影跟隨算法,對(duì)書(shū)內(nèi)各個(gè)物體的運(yùn)動(dòng)曲線(xiàn)進(jìn)行參數(shù)自動(dòng)化調(diào)整,在模擬書(shū)本翻頁(yè)以及內(nèi)頁(yè)跳出的過(guò)程中,陰影效果可以隨書(shū)頁(yè)自然移動(dòng),更大程度保留了書(shū)頁(yè)翻動(dòng)的立體感與自然感,邊緣的陰影過(guò)渡相對(duì)流暢。

近期,抖音特效團(tuán)隊(duì)還在國(guó)慶期間上線(xiàn)了同樣是溫暖治愈系的“金秋繪本風(fēng)特效”,特效投稿已超百萬(wàn),相關(guān)話(huà)題播放超過(guò)1.8億。

豆包大模型是字節(jié)跳動(dòng)自研的大語(yǔ)言模型,通過(guò)字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎面向企業(yè)開(kāi)放服務(wù)。目前豆包模型家族已全面覆蓋語(yǔ)言、語(yǔ)音、圖像、視頻等全模態(tài),全方位滿(mǎn)足不同行業(yè)和領(lǐng)域的業(yè)務(wù)場(chǎng)景需求。

責(zé)任編輯:鳶瑋 來(lái)源: 字節(jié)跳動(dòng)
相關(guān)推薦

2023-01-04 12:48:06

2024-06-25 10:07:56

2017-11-10 18:32:31

OPPO

2023-02-23 13:42:18

技術(shù)AI

2021-08-03 13:36:14

數(shù)字化

2023-06-28 16:40:40

火山引擎大模型

2021-08-04 16:50:22

數(shù)字化

2019-06-21 09:55:10

刷抖美腿App

2020-01-16 15:19:52

APP下載抖音

2024-10-30 11:02:03

2024-07-26 16:12:35

火山引擎豆包大模型上汽乘用車(chē)

2021-08-03 16:30:07

數(shù)字化

2024-05-15 23:53:27

火山引擎豆包大模型火山方舟

2025-02-05 08:30:00

開(kāi)源模型實(shí)踐
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)