自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

這個懂中文的AI高手，畫出的高山明月太驚艷！中英雙語AltDiffusion模型已開源

作者：新智元 2022-11-16 14:05:56

人工智能新聞

AIGC 如火如荼發(fā)展的當下，中文世界的創(chuàng)作者常有幾大痛點：思考英文Prompts準確表達的絞盡腦汁，翻譯軟件詞不達意的尷尬，精細構(gòu)思的 Prompts 在畫面生成中找不到一絲痕跡，亦或面對文化誤解中的「中國風」哭笑不得……

日前，智源研究院大模型研究團隊開源最新雙語 AltDiffusion 模型，為中文世界帶來專業(yè)級 AI 文圖創(chuàng)作的強勁動力：

支持精細長中文 Prompts 高級創(chuàng)作；無需文化轉(zhuǎn)譯，從原汁原味中國話直達形神兼?zhèn)渲袊?；且在繪畫水平上達到低門檻中英對齊原版 Stable Diffusion 級震撼視效，可以說是講中文的世界級 AI 繪畫高手。

創(chuàng)新模型 AltCLIP 為這一工作的基石，為原 CLIP 模型補齊更強的跨語言三大能力。AltDiffusion 和 AltCLIP 模型均為多語言模型，中英雙語為第一階段工作，代碼與模型已開源。

AltDiffusion

https://github.com/FlagAI-Open/FlagAI/tree/master/examples/AltDiffusion

AltCLIP

https://github.com/FlagAI-Open/FlagAI/examples/AltCLIP

HuggingFace space試玩地址：

https://huggingface.co/spaces/BAAI/bilingual_stable_diffusion

技術(shù)報告

https://arxiv.org/abs/2211.06679

專業(yè)級中文 AltDiffusion

——長Prompt精細繪畫 + 原生中國風，滿足中文AI創(chuàng)作高手的高需求

得益于以 AltCLIP 為基礎的強大中英雙語言對齊能力，AltDiffusion 達到近似于 Stable Diffusion 程度的視效水平，尤其具備更懂中國話、更善中國畫的獨特優(yōu)勢，非常值得專業(yè)級中文AI文圖創(chuàng)作者期待。

1. 長Prompt生成，畫面效果毫不遜色

Prompt長短是檢驗模型文圖生成能力的分水嶺，越長的Prompt，越考驗語言理解、圖文對齊和跨語言這三大能力。

在同樣的中英文長 Prompt 輸入調(diào)校下，AltDiffusion 在不少圖片生成案例中表現(xiàn)力甚至更勝一籌：元素構(gòu)成豐富精彩、細節(jié)描摹細膩精準。

2. 更懂中國話，更善中國畫

除中英文 Prompts 輸入表現(xiàn)近似之外，AltDiffusion 還能補齊西方世界里中國畫風的不足，利用中文圖文對繼續(xù)微調(diào)出中文特色的生成，例如國畫風格生成模型，產(chǎn)出真正的「中國風」。

AltDiffusion 更懂中文，在中國文化語境中的意義描摹上指哪打哪，秒懂創(chuàng)作者意圖。例如對「唐朝盛景」的描繪，避免出現(xiàn)因文化誤解而產(chǎn)生的跑題情況。

尤其對原生于中國文化的概念，理解與表現(xiàn)更為精確，得以避免「日本風」與「中國風」混淆，令人啼笑皆非的狀況。例如，與Stable Diffusion在中英文輸入對應唐裝人物風格的Prompts，差異一目了然:

在特定風格的生成中，會原生以中文文化語境為身份主體，進行風格創(chuàng)作，例如對于下面帶有「古建筑」的prompt，會默認生成中國古代建筑。在創(chuàng)作風格上更加貼合中文創(chuàng)作者身份。

3. 中英雙語，生成效果對齊

AltDiffusion基于Stable Diffusion，通過將原來Stable Diffusion中的CLIP替換成AltCLIP，并且用中英文圖文對對模型進行進一步的訓練得到。得益于 AltCLIP 強大的語言對齊能力，AltDiffusion 的生成效果在英文上與 Stable Diffusion 很接近，在中英文雙語的表現(xiàn)上也體現(xiàn)了一致性。

如「戴帽子小狗」的同義中英文Prompts輸入AltDiffusion后，生成畫面效果基本對齊，一致性極高：

在對「男孩」的畫面增加描述詞為「中國男孩」之后，在原小男孩形象基礎上，精準調(diào)整成典型「中國」孩子，在語言控制生成中展現(xiàn)出極佳語言理解能力和精準的生成表達結(jié)果。

打通StableDiffusion原生態(tài)

——豐富生態(tài)工具與PromptsBook應用，可玩性極佳

特別值得一提的是 AltDiffusion 的生態(tài)打通能力：

所有支持Stable Diffusion的工具如Stable Diffusion WebUI，DreamBooth等都可應用在我們的中英雙語 Diffusion 模型上,為中文AI創(chuàng)作提供了豐富選擇：

1. Stable Diffusion WebUI

一個優(yōu)秀的文圖生成、文圖編輯的網(wǎng)頁工具；當我們把北大夜景圖霍格沃茨（prompt: Hogwarts）化，瞬間即可呈現(xiàn)夢幻的魔法世界；

2. DreamBooth

通過少量樣本對模型進行調(diào)試以生成特定的風格的工具；通過這一工具，在AltDiffusion上利用少量中文圖片即可生成特定風格，比如「大鬧天宮」風格。

3. 充分利用社區(qū)Stable Prompts Book

Prompts 對于生成模型非常重要，社區(qū)用戶通過大量 prompts 嘗試，積累出豐富的生成效果案例。這些寶貴的 prompts 經(jīng)驗，對于 AltDiffusion 用戶幾乎全都適用！

此外，還可以通過混合中英文方式去搭配一些神奇的風格和元素，或繼續(xù)挖掘?qū)ltDiffusion適用的中文Prompts。

4. 方便中文創(chuàng)作者微調(diào)

開源的AltDiffusion提供了中文生成模型的一個基礎，大家可以在這個基礎上用更多特定領(lǐng)域的中文數(shù)據(jù)進行模型微調(diào)，方便中文創(chuàng)作者表達。

以首個雙語 AltCLIP 為基石

——全面增強跨語言三大能力，中英對齊、中文更優(yōu)，極低門檻

語言理解，圖文對齊，跨語言能力，是跨語言研究必備的三種能力。

AltDiffusion 的諸多專業(yè)級能力，源于 AltCLIP 以創(chuàng)新性換塔思路，在這三大能力上全面增強：與原 CLIP 中英文語言對齊能力大大提高，可以無縫接入 Stable Diffusion 等所有建立在原 CLIP 上的模型和生態(tài)工具；同時賦予其強悍的中文能力,在多項數(shù)據(jù)集取得中文更優(yōu)效果。（詳細解讀請參考技術(shù)報告）

值得一提的是，這種對齊方法對訓練多語言多模態(tài)表征模型的門檻大大降低，相對于重新去做中文或者英文的圖文對預訓練，只需約 1% 的計算資源與圖文對數(shù)據(jù)。

在全面CLIP benchmark中取得了和英文原版一致效果

在一些檢索類數(shù)據(jù)集上如Flicker-30K上超過了原版

Flicker-30K上表現(xiàn)效果超過原版CLIP

中文ImageNet上zero-shot結(jié)果最優(yōu)

責任編輯：張燕妮來源：新智元

51CTO技術(shù)棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<del id="xrjle"><mark id="xrjle"></mark></del>

<form id="xrjle"><rp id="xrjle"></rp></form>