超強(qiáng)開源SDXL 1.0發(fā)布!質(zhì)量拉滿,超簡單prompt一鍵生成
就在剛剛,Stability AI正式發(fā)布了下一代文生圖模型——SDXL 1.0。
要知道,SDXL 0.9也就才發(fā)布一個(gè)月拐點(diǎn)彎。
而據(jù)官博介紹,這次的1.0版本是StabilityAI的旗艦版生圖模型,也是最棒的開源生圖模型。
殺手小貓
cchahao
幽靈騎士
SDXL 1.0
別的不說,生圖模型最重要的當(dāng)然就是生圖質(zhì)量。
從官博中統(tǒng)計(jì)的數(shù)據(jù)可以看出,和其它模型相對比,用戶更青睞1.0版本生成的圖像。
該結(jié)果來自StabilityAI在Discord上進(jìn)行的這幾代Stable Diffusion模型的偏好測試。
可以看到,上圖中縱軸是偏好比例,橫軸則是各代SDXL或SD模型。一個(gè)月前的0.9版本偏好率是24.4%,低于1.0新版26.2%的偏好。
雖然差距沒那么明顯,但該說不說,新模型就得比老模型強(qiáng)。
StabilityAI表示,SDXL幾乎可以生成任何藝術(shù)風(fēng)格的高質(zhì)量圖像,是實(shí)現(xiàn)一頂一逼真效果的最佳模型。
它可以生成各具特色的圖像,而不需要模型賦予任何特定的感覺,這樣子才能確保風(fēng)格的絕對自由。
參數(shù)方面,SDXL 1.0在色彩的鮮艷度和準(zhǔn)確度方面做了很好的調(diào)整,對比度、光照和陰影都比SDXL 0.9更好,新版本生成的圖片全部采用原生的1024x1024分辨率。
此外,SDXL 還能生成圖像模型難以渲染的概念,如手和文字,還有各種物體的空間排列組合。
比如下面這四個(gè)圖片。
同時(shí),除了圖片生成質(zhì)量的上調(diào),prompt的設(shè)定也變得更加方便。
現(xiàn)在,1.0版本的SDXL只需幾個(gè)字的prompt就可以生成出復(fù)雜、細(xì)致、美觀的圖像。
以往,用戶可能需要在prompt中加入「杰作」這類字眼,才能獲得滿意的高質(zhì)量圖像,現(xiàn)在不用了。
而且還有個(gè)小細(xì)節(jié)——prompt中細(xì)微的差別也能敏銳識別的。
比方說當(dāng)「The Red Square」大寫的時(shí)候,指的是景點(diǎn)「紅場」,小寫的「red square」,指的是紅色的正方形。
現(xiàn)在SDXL都可以一步到位的領(lǐng)會(huì)意思了。
最大的開放式圖像模型
從模型的參數(shù)規(guī)模上看,SDXL 1.0是目前開放式圖像模型中參數(shù)數(shù)量最多的。
官方表示,這次采用的是全新的架構(gòu),基礎(chǔ)模型的參數(shù)規(guī)模達(dá)到35億,同時(shí)還有一個(gè)66億參數(shù)大小的細(xì)化模型。
完整模型由一個(gè)用于潛在擴(kuò)散的專家混合管道組成:
第一步,基礎(chǔ)模型先生成(噪聲)潛變量。
第二步,用專門用于最終去噪步驟的細(xì)化模型對其進(jìn)行進(jìn)一步處理。這里要注意的是,基礎(chǔ)模型也可以作為獨(dú)立模塊使用。
這種兩階段的架構(gòu)可確保圖像生成的穩(wěn)健性,而不會(huì)影響速度或者使用過多的計(jì)算資源。
SDXL 1.0可以在配備 8GB VRAM 的消費(fèi)級GPU上運(yùn)行,也可以在就緒的云上運(yùn)行。
有了SDXL 1.0,根據(jù)自定義數(shù)據(jù)對模型進(jìn)行微調(diào)比以往此前的版本都要容易。
自定義LoRA或是檢查點(diǎn)的生成不需要太多的數(shù)據(jù)處理。Stability AI目前正在利用專門用于SDXL的T2I/ControlNet 來構(gòu)建下一代的特定任務(wù)結(jié)構(gòu)、樣式和組成控制。
官方表示,這些功能目前處于測試預(yù)覽階段。
其實(shí)從6月份開始,Stability AI一直在預(yù)覽SDXL 1.0的功能,還發(fā)布過一個(gè)僅用于研究的版本,目的就是展示該模型的全新功能。
官方表示,和之前的SDXL模型相比,SDXL 1.0的增強(qiáng)功能包括改進(jìn)過后的圖像提煉過程,可以生成更鮮艷的色彩、光照和對比度。
SDXL 1.0還引入了微調(diào)功能,使用戶能夠輕松創(chuàng)建高度定制的圖像。
使用方法
而想要使用最新的SDXL 1.0也非常簡單。
1. 在Clipdrop上體驗(yàn)SDXL 1.0。
別忘了,下面還有很多風(fēng)格樣式可選。
2. 在Stability AI的GitHub頁面獲取SDXL 1.0的權(quán)重和相關(guān)源代碼。
3. 在Stability AI平臺上通過API使用SDXL 1.0。
4. 在AWS Sagemaker和AWS Bedrock上獲取SDXL 1.0。
5. 可以加入Stable Foundation Discord進(jìn)行SDXL模型的實(shí)時(shí)測試。
6. DreamStudio也提供SDXL 1.0用于圖像生成。