谷歌發(fā)布文生圖模型Imagen 3,寫實(shí)效果超強(qiáng)! 精華
谷歌在“I/O2024”大會(huì)上發(fā)布了,全新文生圖片模型Imagen3。
據(jù)悉,Imagen3在理解文本提示方面比前兩代更好,可捕捉長(zhǎng)文本提示中的很多細(xì)微細(xì)節(jié),對(duì)圖片的嵌入文字生成也更加準(zhǔn)確、穩(wěn)定。
Imagen3可生成漫畫、寫實(shí)、賽博朋克、水墨、油畫、素描等幾十種風(fēng)格,尤其是生成的寫實(shí)風(fēng)格圖片質(zhì)量很好,和真人拍攝的相片幾乎差不多。
目前,Imagen3支持申請(qǐng)?jiān)囉?,有興趣的小伙伴可以去體驗(yàn)下。
可申請(qǐng)?bào)w驗(yàn):https://docs.google.com/forms/d/e/1FAIpQLSeC6n1KQlaqRNUGNuNRt5Q7YeoyXsq828niw2ZvIoAtW1FtYQ/viewform?resourcekey=0-qDKZCeB4G9nS9dttXGdnHQ&pli=1
在谷歌展示的Imagen3案例中,其生成寫實(shí)圖片的能力非常強(qiáng)可比肩Midjourney DALL·E 3 等頭部產(chǎn)品。
例如,用單反相機(jī)和偏振濾鏡拍攝。這是在土耳其卡帕多西亞獨(dú)特的巖石形態(tài)上空漂浮的兩個(gè)熱氣球的照片。這些熱氣球上的顏色和圖案與下方土地的土色形成了美麗的對(duì)比。
一張?zhí)貙懻掌?展示一只折紙鳥在城市天際線中翱翔,與其他不同顏色和圖案的鳥群一起,投射出復(fù)雜的陰影在下方的建筑物上。
三名女性站在一起爽朗大笑,前景中有一名女性略微模糊。太陽在她們身后落山,形成了鏡頭光暈和溫暖的光芒,突顯了她們的頭發(fā),并在背景中產(chǎn)生了淺景深效果。
攝影風(fēng)格真實(shí)自然,捕捉到了朋友之間真摯的連接和快樂時(shí)刻。黃金時(shí)刻的溫暖光線賦予了圖像懷舊和親密的感覺。
一頭優(yōu)雅的狼站在灰色背景前,特寫鏡頭展現(xiàn)其雄姿,高分辨率照片展現(xiàn)了豐富的細(xì)節(jié),色彩梯度采用超現(xiàn)實(shí)風(fēng)格。
從上面看到美麗的河谷,有樹木展示了其令人驚嘆的自然美景,綠色的山脈和藍(lán)色的水。捕捉了大自然創(chuàng)造的廣闊風(fēng)貌,寫實(shí)風(fēng)格。
一雙磨損嚴(yán)重、沾滿泥巴的徒步皮靴,靜靜地躺在崎嶇的小徑上。一只松鼠的頭從其中一只靴子里探出來,懶洋洋地看著鏡頭,仿佛這是它的領(lǐng)地。
兩只靴子的鞋帶松松地垂落在地上。背景是多山的景色。這是一張電影般的靜止畫面,用高質(zhì)量的數(shù)碼單反相機(jī)拍攝。
除了寫實(shí)風(fēng)格照片,谷歌還展示了其他類型風(fēng)格的圖片,例如,一個(gè)風(fēng)化的木制機(jī)械機(jī)器人被開滿鮮花的藤蔓覆蓋,安靜地站在一片高大的野花田中,一只小藍(lán)鳥停在它伸出的手上。數(shù)字卡通、色彩溫暖、線條柔和。后面是一座高大的瀑布懸崖。
桌子上放著一個(gè)舊藍(lán)色玻璃花瓶里的一大束色彩斑斕的花。前面是一朵美麗的牡丹花,周圍有玫瑰、百合、雛菊、蘭花、水果、漿果和綠葉等各種其他花朵。背景是深灰色。這是荷蘭黃金時(shí)代風(fēng)格的油畫。
從上面這些案例不難看出,Imagen3在文本語義還原、光影、飽和度、景深、構(gòu)圖等方面比前兩代更出色,幾乎和真人拍攝的圖片差不多,這對(duì)于游戲開發(fā)、市場(chǎng)營(yíng)銷、日常辦公等人員,提供快速設(shè)計(jì)圖片的捷徑。
谷歌表示,為了滿足不同領(lǐng)域用戶的創(chuàng)作需求,Imagen3將推出多個(gè)版本,包括從快速草圖到高分辨率圖像等各類任務(wù)優(yōu)化。目前,Imagen3支持申請(qǐng)使用,并很快將在VertexAI上全面推廣使用。
本文轉(zhuǎn)自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)
