Phantom是一個(gè)統(tǒng)一的視頻生成框架,適用于單主題和多主題參考,基于現(xiàn)有的文本轉(zhuǎn)視頻和圖像轉(zhuǎn)視頻架構(gòu)構(gòu)建。它通過(guò)重新設(shè)計(jì)聯(lián)合文本圖像注入模型,利用文本圖像視頻三元組數(shù)據(jù)實(shí)現(xiàn)跨模態(tài)對(duì)齊。此外,它在人物生成中強(qiáng)調(diào)主題一致性,同時(shí)增強(qiáng)了身份保留視頻生成。相關(guān)鏈接論文:https:arxiv.orgabs2502.11079代碼:https:github.comPhantomvideoPhantom主頁(yè):https:phantomvideo.github.ioPhantomComfyUI:https:github.comkijaiC...
2天前 197瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
2025年4月14日,中國(guó)AI領(lǐng)軍企業(yè)智譜AI正式推出GLM432B0414系列大模型,以32B參數(shù)量實(shí)現(xiàn)全方位能力躍升。該系列創(chuàng)新性融合對(duì)話、推理、沉思等多元智能模塊,在基準(zhǔn)測(cè)試中展現(xiàn)出與GPT4o、DeepSeekV3R1等國(guó)際頂尖模型比肩的綜合性能。尤為關(guān)鍵的是,智譜此次以MIT開(kāi)源協(xié)議向全球開(kāi)放模型權(quán)重,結(jié)合其突出的本地化部署優(yōu)勢(shì),真正實(shí)現(xiàn)了"高性能"與"普惠性"的雙重突破。作為"大模型六小虎"中IPO進(jìn)程最快的企業(yè),智譜此番動(dòng)作既彰顯了...
2025-04-17 06:52:43 770瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
FlashFace技術(shù)是由香港大學(xué)、阿里巴巴集團(tuán)、螞蟻集團(tuán)共同研發(fā)的一項(xiàng)實(shí)用工具,用戶可以通過(guò)提供一張或幾張參考面部圖像和文本提示,就可以輕松地即時(shí)個(gè)性化自己的相片。與現(xiàn)有的人像定制方法相比,F(xiàn)lashFace方法具有更高保真度的身份保留性。能夠精確地保留參考人臉的特征,包括紋身、疤痕等。這意味著,無(wú)論是真實(shí)人物還是虛擬角色,F(xiàn)lashFace都能夠準(zhǔn)確地捕捉到他們獨(dú)特的面部特征,如罕見(jiàn)的臉型等。下面展示一些FlashFace的...
2025-04-07 00:22:03 1082瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
今天給大家介紹一個(gè)字節(jié)剛開(kāi)源的換臉寫(xiě)真新模型InfiniteYou,這是一種先進(jìn)的零樣本身份ID一致性保持模型,由字節(jié)跳動(dòng)基于文生圖領(lǐng)域最強(qiáng)開(kāi)源模型FLUX模型研發(fā)的。InfiniteYou專注于利用擴(kuò)散變換器(DiTs)技術(shù)實(shí)現(xiàn)靈活且高保真的身份保留圖像生成。它解決了現(xiàn)有方法中存在的問(wèn)題,如身份相似性不足、文本與圖像對(duì)齊不佳以及生成質(zhì)量和美學(xué)水平低下等。同時(shí),InfiniteYou具有高度的兼容性,可以與現(xiàn)有的多種方法無(wú)縫集成,如FLUX...
2025-04-07 00:18:40 948瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
Docling團(tuán)隊(duì)聯(lián)合IBM提出了一種多模式圖像文本到文本模型SmolDocling,旨在實(shí)現(xiàn)高效的文檔轉(zhuǎn)換。它保留了Docling最受歡迎的功能,同時(shí)通過(guò)無(wú)縫支持DoclingDocuments確保與Docling完全兼容。目前已經(jīng)沖到了Huggingface熱門(mén)榜單Top3!相關(guān)鏈接主頁(yè):https:huggingface.cods4sdSmolDocling256Mpreview論文:https:arxiv.orgabs2503.11576試用:https:huggingface.cospacesds4sdSmolDocling256MDemo特點(diǎn):???用于高效標(biāo)記化的DocTags...
2025-03-25 01:06:48 1165瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
LuminaBrushLuminaBrush是一個(gè)構(gòu)建交互式工具以在圖像上繪制照明效果的項(xiàng)目。該框架采用兩階段方法:第一階段將圖像轉(zhuǎn)換為“均勻照明”的外觀,第二階段利用用戶涂鴉生成照明效果。。相關(guān)鏈接HF演示:https:huggingface.cospaceslllyasvielLuminaBrushGitHub:https:github.comlllyasvielLuminaBrush演示LuminaBrush目前基于Flux。種子為12345的示例:框架LuminaBrush是一個(gè)兩階段框架。第一階段(左側(cè))將圖像轉(zhuǎn)換為“均勻照明...
2025-03-10 00:56:47 1417瀏覽 0點(diǎn)贊 0回復(fù) 0收藏