自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

蘋(píng)果展示 AI 新模型 MGIE,可一句話精修圖片

新聞 人工智能
蘋(píng)果公司近日發(fā)布了名為“MGIE”的新型開(kāi)源人工智能模型,它可以根據(jù)自然語(yǔ)言指令編輯圖像。

2 月 8 日消息,相比較微軟的風(fēng)生水起,蘋(píng)果公司在 AI 領(lǐng)域的布局顯得低調(diào)很多,但這并不意味著蘋(píng)果在該領(lǐng)域就沒(méi)有絲毫建樹(shù)。蘋(píng)果公司近日發(fā)布了名為“MGIE”的新型開(kāi)源人工智能模型,它可以根據(jù)自然語(yǔ)言指令編輯圖像。

圖源:VentureBeat 與 Midjourney 合作制作

MGIE 的全稱是 MLLM-Guided Image Editing,利用多模態(tài)大型語(yǔ)言模型(MLLM)解釋用戶指令并執(zhí)行像素級(jí)操作。MGIE 可以理解用戶下達(dá)的自然語(yǔ)言命令,進(jìn)行 Photoshop 風(fēng)格的修改、全局照片優(yōu)化和局部編輯等操作。

蘋(píng)果公司和加州大學(xué)圣巴巴拉分校研究人員合作,在 2024 年國(guó)際學(xué)習(xí)表征會(huì)議(ICLR)上發(fā)表 MGIE 相關(guān)研究成果,而 ICLR 是人工智能研究的頂級(jí)會(huì)議之一。

介紹 MGIE 之前,IT之家先來(lái)介紹下 MLLM。MLLM 是一種強(qiáng)大的人工智能模型,可以同時(shí)處理文本和圖像,從而增強(qiáng)基于指令的圖像編輯能力。MLLMs 在跨模態(tài)理解和視覺(jué)感知響應(yīng)生成方面表現(xiàn)出卓越的能力,但尚未廣泛應(yīng)用于圖像編輯任務(wù)。

MGIE 通過(guò)兩種方式將 MLLMs 集成到圖像編輯過(guò)程中:首先,它使用 MLLMs 從用戶輸入中推導(dǎo)出富有表現(xiàn)力的指令。這些指令簡(jiǎn)潔明了,為編輯過(guò)程提供了明確的指導(dǎo)。

例如,當(dāng)輸入“讓天空更藍(lán)”時(shí),MGIE 可以生成“將天空區(qū)域的飽和度提高 20%”的指令。

其次,它使用 MLLM 生成視覺(jué)想象力,即所需編輯的潛在表征。這一表征捕捉了編輯的本質(zhì),可用于指導(dǎo)像素級(jí)操作。MGIE 采用了一種新穎的端到端訓(xùn)練方案,可聯(lián)合優(yōu)化指令推導(dǎo)、視覺(jué)想象和圖像編輯模塊。

MGIE 可以處理各種編輯情況,從簡(jiǎn)單的顏色調(diào)整到復(fù)雜的對(duì)象操作。該模型還可以根據(jù)用戶的偏好執(zhí)行全局和局部編輯。MGIE 的部分特性和功能包括:

  • 基于指令的表達(dá)式編輯:MGIE 可以生成簡(jiǎn)潔明了的說(shuō)明,有效指導(dǎo)編輯過(guò)程。這不僅能提高編輯質(zhì)量,還能增強(qiáng)用戶的整體體驗(yàn)。
  • Photoshop 風(fēng)格修改:MGIE 可以執(zhí)行常見(jiàn)的 Photoshop 風(fēng)格編輯,如裁剪、調(diào)整大小、旋轉(zhuǎn)、翻轉(zhuǎn)和添加濾鏡。該模型還可以應(yīng)用更高級(jí)的編輯,如更改背景、添加或刪除對(duì)象以及混合圖像。
  • 全局照片優(yōu)化:MGIE 可以優(yōu)化照片的整體質(zhì)量,如亮度、對(duì)比度、清晰度和色彩平衡。該模型還能應(yīng)用素描、繪畫(huà)和漫畫(huà)等藝術(shù)效果。
  • 局部編輯:MGIE 可以編輯圖像中的特定區(qū)域或?qū)ο?,如臉部、眼睛、頭發(fā)、衣服和配飾。模型還可以修改這些區(qū)域或?qū)ο蟮膶傩?,如形狀、大小、顏色、紋理和風(fēng)格。

MGIE 是 GitHub 上的一個(gè)開(kāi)源項(xiàng)目,用戶可以點(diǎn)擊這里找到代碼、數(shù)據(jù)和預(yù)訓(xùn)練模型。該項(xiàng)目還提供了一個(gè)演示筆記本,展示如何使用 MGIE 完成各種編輯任務(wù)。

責(zé)任編輯:龐桂玉 來(lái)源: IT之家
相關(guān)推薦

2022-12-12 13:45:46

模型修圖

2023-06-09 08:35:54

2023-05-12 14:13:23

3D建模OpenAI

2023-09-05 23:34:52

Kubernetes云原生

2015-08-03 10:21:04

設(shè)計(jì)模式表達(dá)

2020-11-27 09:57:11

Python代碼PyPy

2019-09-05 10:13:28

2023-12-13 21:50:59

騰訊AI模型

2024-03-04 12:32:39

AI數(shù)據(jù)

2010-03-29 11:55:12

無(wú)線上網(wǎng)報(bào)錯(cuò)

2023-05-08 15:44:23

3D數(shù)字人

2022-09-30 15:35:43

AI視頻

2024-06-13 17:51:47

2024-11-11 11:34:26

2024-07-01 07:40:00

2014-05-07 10:47:51

移動(dòng)金融互聯(lián)網(wǎng)金融GMIC

2018-01-15 10:45:43

社交網(wǎng)絡(luò)互聯(lián)網(wǎng)巨頭百度

2020-12-16 10:43:44

PythonPyPy代碼

2024-04-01 13:03:00

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)