自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DPG-Bench榜首!智譜開源文生圖模型CogView4:支持中英文輸入和生成,免費商用授權(quán)!

人工智能 新聞
今年,圖像模型領(lǐng)域終于迎來了新的突破,而CogView4無疑是這場變革中的佼佼者。

在圖像生成技術(shù)的浪潮中,智譜開源再次引領(lǐng)潮流,推出了全新的文生圖模型——CogView4。這款模型不僅支持中英雙語提示詞輸入,更擅長理解和遵循中文指令,讓創(chuàng)意表達(dá)無界限。尤為值得一提的是,CogView4開創(chuàng)了先河,成為首個能在畫面中直接生成漢字的開源文生圖模型,讓文字與圖像的融合更加自然流暢。

圖片

不僅如此,CogView4還具備極高的靈活性,支持生成任意寬高比的圖片,同時接受任意長度的提示詞輸入,滿足用戶多樣化的創(chuàng)作需求。更令人期待的是,后續(xù)還將開源對應(yīng)的Controlnet、Comfyui支持及模型微調(diào)工具,為用戶帶來更加便捷、高效的創(chuàng)作體驗。

圖片

在DPG-Bench基準(zhǔn)測試中,CogView4憑借卓越的表現(xiàn)榮獲綜合評分第一,彰顯了其在圖像生成領(lǐng)域的強(qiáng)大實力。今年,圖像模型領(lǐng)域終于迎來了新的突破,而CogView4無疑是這場變革中的佼佼者。

CogView4主要特點總結(jié)如下:

  • 支持中英雙語提示詞輸入,擅長理解和遵循中文提示詞
  • 首個能夠在畫面中生成漢字的開源文生圖模型
  • 支持生成任意寬高的圖片以及任意長度提示詞輸入

相關(guān)鏈接

  • 論文:https://arxiv.org/pdf/2403.05121
  • 項目:github.com/THUDM/CogView4
  • 模型:huggingface.co/THUDM/CogView4-6B
  • 試用:https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4

圖片

效果展示

圖片

推理要求與模型介紹

  • 分辨率:寬度和高度必須介于512px和之間2048px,可被 整除32,并且確保最大像素數(shù)不超過2^21px。
  • 精度:BF16 / FP32(不支持 FP16,因為它會導(dǎo)致溢出,從而導(dǎo)致圖像完全變黑) 使用BF16精度為batchsize=4進(jìn)行測試,內(nèi)存使用情況如下表所示:圖片

模型指標(biāo)

DFG-Bench

圖片

GenEval

圖片

T2I-CompBench

圖片

Chinese Text Accuracy Evaluation

圖片

責(zé)任編輯:張燕妮 來源: AIGC Studio
相關(guān)推薦

2024-05-14 16:58:05

騰訊混元大模型文生圖

2024-05-15 17:30:51

開源模型

2023-08-09 10:08:00

模型AI

2024-10-28 09:47:53

2023-12-25 13:24:00

模型OCR頁面

2023-09-16 13:31:25

模型訓(xùn)練

2015-08-18 15:19:51

2025-04-15 12:16:17

2020-07-16 13:00:18

人工智能機(jī)器學(xué)習(xí)技術(shù)

2020-07-20 09:49:56

開源技術(shù) 趨勢

2021-10-15 15:26:10

AI 數(shù)據(jù)人工智能

2020-06-08 11:16:06

百度

2024-09-05 12:11:25

大模型抓取列表頁

2015-12-01 11:17:41

Windows 10Version 151鏡像

2010-04-06 09:33:37

CentOS系統(tǒng)

2009-10-20 14:07:00

CCIE必讀書籍

2013-06-21 10:48:18

WP7Windows Pho中英文互翻譯

2009-08-13 09:26:14

.NET正則表達(dá)式

2009-03-17 09:52:22

Unicode中英文Python
點贊
收藏

51CTO技術(shù)棧公眾號