自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

新聞 人工智能
計(jì)算機(jī)視覺領(lǐng)域中有很多任務(wù),如目標(biāo)檢測、圖像轉(zhuǎn)換、風(fēng)格遷移等,但你聽說過「圖像情感遷移」嗎?

圖像風(fēng)格遷移?語音情感遷移?不,是圖像情感遷移。

計(jì)算機(jī)視覺領(lǐng)域中有很多任務(wù),如目標(biāo)檢測、圖像轉(zhuǎn)換、風(fēng)格遷移等,但你聽說過「圖像情感遷移」嗎?

羅切斯特大學(xué)羅杰波教授團(tuán)隊(duì)提出了這項(xiàng)研究任務(wù) [1]。與其他計(jì)算機(jī)視覺任務(wù)相比,圖像情感遷移更有挑戰(zhàn)性,需要對圖像中的每個物體進(jìn)行不同的情感遷移。該研究提出一種靈活有效的物體級圖像情感遷移框架和新模型 SentiGAN,實(shí)驗(yàn)證明該框架可以有效執(zhí)行物體級圖像情感遷移。

什么是圖像情感遷移?

圖像情感遷移是一個待探索的新型研究任務(wù)。與圖像轉(zhuǎn)換、圖像風(fēng)格遷移和面部表情遷移任務(wù)相比,圖像情感遷移關(guān)注更高級更抽象的對圖像整體外觀和感覺的修改,而不改變其場景內(nèi)容。如圖 1a 所示,將渾濁的海水變得清澈并給海鳥著色后,原本傳遞中性或消極情感的圖像變得積極溫暖,而圖像中的內(nèi)容并未被更改。

與圖像轉(zhuǎn)換和圖像風(fēng)格遷移相比,該研究認(rèn)為圖像情感遷移更具挑戰(zhàn)性。其中一個難點(diǎn)在于對不同類別的物體進(jìn)行情感遷移時需要使用不同的規(guī)則。這有別于風(fēng)格遷移,后者可以將一種繪畫風(fēng)格統(tǒng)一添加給圖像中的所有物體。如圖 1 所示,要讓輸入圖像具備積極情感,應(yīng)把海水遷移成清澈的藍(lán)色,海鳥遷移成彩色的。這兩種操作不是基于同一張參考圖像,否則就會像圖 1b 和 1c 那樣不真實(shí)。

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

解決方案

為了解決這一挑戰(zhàn),該研究提出了一種有效框架,可以在物體級別執(zhí)行圖像情感遷移。整個過程可分為兩步:

1. 給定一張輸入圖像,該框架利用圖像描述生成模型和語義分割模型檢測所有物體,找出其像素級掩碼。結(jié)合使用兩個模型的目的是,維護(hù)高質(zhì)量的物體掩碼,同時大幅擴(kuò)大物體集的范圍。

2. 對于輸入圖像中每一個檢測出的物體,使用包含同樣物體的參考圖像進(jìn)行情感遷移。該設(shè)計(jì)成功地解決了前述問題,并使框架保持強(qiáng)大的靈活性,例如用戶可以給輸入圖像中的每一個物體賦予不同的情感。此外,它還可以使用戶無需提供參考圖像,直接輸入想要賦予每一個檢測出物體的情感詞匯即可執(zhí)行情感遷移(如對鳥輸入「colorful」、對天空輸入「sunny」、對山輸入「magnificent」)。有了物體和情感詞匯,系統(tǒng)就可以自動檢索對應(yīng)的參考圖像,并執(zhí)行情感遷移。

該框架的整體性能由第二步?jīng)Q定,即目標(biāo)級情感遷移。這里可以直接應(yīng)用風(fēng)格遷移模型,但是情感遷移任務(wù)需要遷移后的圖像看起來自然,不需要局部模式(如紋理)的顯式遷移,而這正是風(fēng)格遷移模型的固有元素。因此,研究人員轉(zhuǎn)而利用多模態(tài)圖像轉(zhuǎn)換模型,如 MUNIT 和 DRIT。它們可以分離內(nèi)容和風(fēng)格信息,為輸入圖像保存更多基于內(nèi)容的元素。只需要對這些雙領(lǐng)域映射模型做簡單的修改,就可以使其適用于情感遷移任務(wù),而這并不會明顯限制輸入和遷移圖像的域。

但是,使用以上模型仍然存在缺陷。首先,MUNIT 和 DRIT 最初是為圖像級變換任務(wù)設(shè)計(jì)的,它們在細(xì)粒度物體級遷移任務(wù)上表現(xiàn)不好。第二個問題與情感遷移的本質(zhì)有關(guān)。相比于輪廓、紋理和繪畫風(fēng)格,圖像情感更敏感,往往與基于顏色的元素有關(guān),如對比度、飽和度、亮度和主色。

理想情況下,我們希望模型能夠?qū)⑤斎雸D像的這些元素完全遷移為參考圖像。現(xiàn)有的多模態(tài)模型通常將視覺表示分解為內(nèi)容碼和風(fēng)格碼。遷移即通過自適應(yīng)實(shí)例歸一化 (AdaIN),將參考圖像 / 物體的風(fēng)格碼注入輸入圖像 / 物體的內(nèi)容碼。但是,如下圖 2 所示,具備不同內(nèi)容碼的物體即使使用相同的風(fēng)格碼,得到的整體色彩分布仍然大不相同。這表明,現(xiàn)有模型無法充分將色彩信息和內(nèi)容碼分離開,因而導(dǎo)致不完全的顏色遷移。

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

為解決以上缺陷,該研究提出了一種新方法 Sentiment-aware GAN (SentiGAN)。對于第一種缺陷,該研究創(chuàng)建了對應(yīng)的物體級損失函數(shù),與圖像級損失一起訓(xùn)練模型。對于第二種缺陷,其解決方案基于以下觀察:額外遷移內(nèi)容碼全局信息可以更好地遷移輸入物體的顏色信息。同時,研究人員還通過維護(hù)空間信息來阻止其他內(nèi)容信息(如紋理)的改變。為此,他們使用有效的約束,使遷移物體的內(nèi)容碼與參考物體的內(nèi)容碼全局接近,但與輸入物體的內(nèi)容碼局部接近。這些約束通過訓(xùn)練過程中的內(nèi)容分離損失和推斷過程中的內(nèi)容對齊步驟來實(shí)現(xiàn)。該研究表明這兩種方法具備互補(bǔ)性,能夠顯著提高情感遷移的性能。

該研究提出的圖像風(fēng)格遷移框架如下圖 3 所示:

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

框架原理如下:

給定輸入圖像,首先執(zhí)行物體掩碼提取來提取物體和對應(yīng)的掩碼;然后使用圖像描述生成和圖像語義分割來獲取所有物體和高質(zhì)量掩碼;最后,使用 SentiGAN 逐個物體地執(zhí)行情感遷移。

核心組件 SentiGAN 的架構(gòu)如下圖所示:

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

實(shí)驗(yàn)

研究人員創(chuàng)建了三個任務(wù)來評估圖像情感遷移模型的性能。這三個任務(wù)均基于 50 張選自測試集的輸入圖像,這些圖像具備精確的物體掩碼和相對中性或模糊的情感信息(方便向積極或消極情感方向遷移)。

任務(wù) 1:粗粒度情感遷移

第一個任務(wù)旨在衡量模型在執(zhí)行圖像粗粒度情感遷移時的性能。研究人員訓(xùn)練一個圖像情感二分類模型來用于預(yù)測提取測試集中的典型積極圖像和典型消極圖像。對于每一張輸入圖像,不同的情感遷移模型可從十組采樣的積極參考圖像和十組采樣的消極參考圖像中,對輸入圖像進(jìn)行情感遷移。圖像情感分類模型對于各個情感遷移模型得到的遷移圖形評估結(jié)果參見下表 1:

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

從表 1 中可以看出,SentiGAN 獲得了最高的平均真正率和真負(fù)率。這表明,SentiGAN 可以有效執(zhí)行圖像粗粒度情感遷移。

此外,研究人員還請五位志愿者從 SentiGAN 輸出的 500 張遷移圖像對(積極圖像和消極圖像)中選擇積極圖像。如表 2 所示,選擇正確的概率為 72.4%,這表明情感遷移效果可以被用戶觀察到。圖 5 展示了 SentiGAN 輸出的情感遷移示例。

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

任務(wù) 2:驗(yàn)證物體級情感遷移的效果

第二個任務(wù)是驗(yàn)證物體級情感遷移的效果。

研究人員令 SentiGAN 執(zhí)行三種遷移策略——物體 級遷移、全局遷移、非對應(yīng)物體的物體級遷移,并生成 50 組遷移圖像。令五位志愿者在每組中選擇最真實(shí)的圖像,每人負(fù)責(zé) 50 組。如表 3 所示,對于大多數(shù)組,志愿者認(rèn)為目標(biāo)級情感遷移生成的圖像最真實(shí),這與圖 7 示例表現(xiàn)一致。

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)
圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

任務(wù) 3:遷移圖像與參考圖像間的情感一致性

第三個任務(wù)是評估遷移圖像和參考圖像之間的情感一致性(sentiment consistency)。研究者對每個輸入圖像收集了不同模型預(yù)測的遷移圖像,并請五位志愿者從中選擇出一或多個與參考圖像最具情感一致性的遷移圖像。

如下表 4 所示,SentiGAN 獲得了最高的選中率,而且大幅領(lǐng)先,這表明它在遷移參考圖像的情感中實(shí)現(xiàn)了最優(yōu)性能。示例參見圖 6。

圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)
圖像也能做情感遷移?羅切斯特大學(xué)團(tuán)隊(duì)提出計(jì)算機(jī)視覺新任務(wù)

羅杰波教授團(tuán)隊(duì)還提出了一種基于全局的圖像情感遷移方法 [2],感興趣的讀者可查看原論文。

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2024-11-28 13:04:59

AI模型

2023-04-24 16:31:03

計(jì)算機(jī)模型

2021-12-14 15:59:38

數(shù)據(jù)模型推理

2022-08-03 16:21:03

AI算法神經(jīng)網(wǎng)絡(luò)

2021-06-15 10:29:47

計(jì)算機(jī)互聯(lián)網(wǎng) 技術(shù)

2018-08-20 11:51:35

Worktile

2020-08-20 10:41:12

人工智能檢查圖像分割

2023-07-07 10:53:08

2022-07-04 15:50:41

Windows 11微軟任務(wù)管理器

2020-10-15 14:33:07

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2022-01-26 11:02:40

芯片技術(shù)光子

2023-04-04 08:25:31

計(jì)算機(jī)視覺圖片

2021-01-11 11:14:38

Windows 10Windows微軟

2015-08-17 14:47:26

大數(shù)據(jù)

2011-04-18 10:50:16

Windows 8任務(wù)管理器

2020-10-23 07:32:28

計(jì)算機(jī)視覺CV

2021-01-14 21:40:40

機(jī)器學(xué)習(xí)計(jì)算機(jī)視覺圖像數(shù)據(jù)集

2020-10-30 13:10:14

Windows 10任務(wù)管理器PC游戲

2013-05-20 09:51:00

計(jì)算機(jī)書籍書籍封面語言書籍

2009-07-07 08:43:18

微軟Windows 7新功能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號