自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

圖片遲遲加載不了、一片馬賽克?谷歌開源模型優(yōu)先顯示圖像受關(guān)注部分

人工智能 新聞
本文提出注意力中心模型,用于預(yù)測(cè)人眼在圖像上首先注意到的位置,從而提高用戶體驗(yàn)。

當(dāng)觀察一副圖像時(shí),你會(huì)先注意圖像的哪些內(nèi)容,或者說圖像中的哪些區(qū)域會(huì)首先吸引你的注意力,機(jī)器能否學(xué)會(huì)人類的這種注意力形式。在來自谷歌的一項(xiàng)研究中,他們開源的注意力中心模型(attention center model)可以做到這一點(diǎn)。并且該模型可用于 JPEG XL 圖像格式上。

舉例來說,下圖是注意力中心模型的一些預(yù)測(cè)示例,其中綠點(diǎn)為預(yù)測(cè)的圖像的注意力中心點(diǎn)。

圖片

圖像來自 Kodak 圖像數(shù)據(jù)集:http://r0k.us/graphics/kodak/

注意力中心模型大小為 2MB,格式為 TensorFlow Lite。它以 RGB 圖像作為輸入,并輸出一個(gè) 2D 點(diǎn),該點(diǎn)是圖像上的預(yù)測(cè)注意力中心點(diǎn)。

為了訓(xùn)練模型來預(yù)測(cè)注意力中心,首先需要一些來自注意力中心的真實(shí)數(shù)據(jù)。給定一張圖像,一些注意力點(diǎn)可以通過眼動(dòng)儀收集,或者通過鼠標(biāo)點(diǎn)擊圖像來接近。該研究首先對(duì)這些注意點(diǎn)進(jìn)行時(shí)間濾波,只保留最初的注意力點(diǎn),然后應(yīng)用空間濾波去除噪聲。最后,計(jì)算剩余注意力點(diǎn)的中心作為真值注意力中心。下面顯示了獲取真值過程的示例說明圖。

圖片

項(xiàng)目地址:https://github.com/google/attention-center

注意力中心模型架構(gòu)

注意力中心模型是一個(gè)深度神經(jīng)網(wǎng)絡(luò),以一張圖像為輸入,使用預(yù)訓(xùn)練分類網(wǎng)絡(luò)如 ResNet、MobileNet 等作為骨干。從骨干網(wǎng)絡(luò)輸出的幾個(gè)中間層被用作注意力中心預(yù)測(cè)模塊的輸入。這些不同的中間層包含不同的信息,例如,淺層通常包含較低層次的信息,如強(qiáng)度 / 顏色 / 紋理,而更深層次通常包含更高、更語義的信息,如形狀 / 目標(biāo)。

注意中心預(yù)測(cè)采用卷積、反卷積調(diào)整算子,并結(jié)合聚合和 sigmoid 函數(shù),生成注意力中心的權(quán)重圖。然后一個(gè)算子(在例子中是愛因斯坦求和算子)可用于從加權(quán)圖中計(jì)算中心。預(yù)測(cè)注意力中心和真實(shí)注意力中心之間的 L2 范數(shù)作為訓(xùn)練損失。

圖片

此外 JPEG XL 是一種新的圖像格式,允許用戶在對(duì)圖像編碼時(shí),確保有趣的部分率先顯示。這樣做的好處是,當(dāng)用戶在網(wǎng)上瀏覽圖像時(shí),圖像中吸引人的部分可以率先顯示出來,也就是用戶首先看到的部分,在理想情況下,一旦用戶看向圖片其余地方時(shí),圖像的其他部分也已經(jīng)就位并已解碼。

在 JPEG XL 中,圖像通常被劃分為大小為 256 x 256 的矩陣, JPEG XL 編碼器將在圖像中選擇一個(gè)起始組,然后圍繞該組生成同心正方形。Chrome 瀏覽器從 107 版增加了對(duì) JPEG XL 圖像的漸進(jìn)解碼功能。目前,JPEG XL 還是一個(gè)實(shí)驗(yàn)性的產(chǎn)物,在 chrome://flags 中通過搜索 jxl 即可啟用。

要想了解漸進(jìn)式加載 JPEG XL 圖像的效果,可以訪問網(wǎng)址進(jìn)行查看:

https://google.github.io/attention-center/

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2012-05-25 14:41:19

JavaScript

2021-05-31 10:30:46

密碼馬賽克工具

2009-08-17 13:07:27

C#馬賽克算法

2022-09-07 08:37:34

DCGAN圖片AI

2021-02-24 10:19:43

人工智能馬賽克

2020-12-09 14:18:46

AI 技術(shù)馬賽克

2018-07-03 08:50:12

人工智能深度學(xué)習(xí)CNN

2020-12-02 15:07:23

算法開源AI

2015-04-30 10:29:32

WOC視頻會(huì)議優(yōu)化方案深信服

2015-10-15 17:31:14

微軟

2017-02-10 18:13:46

谷歌大腦人工智能

2017-04-10 09:17:08

神經(jīng)網(wǎng)絡(luò)分辨率像素遞歸

2024-07-29 08:43:57

2017-02-09 07:50:32

復(fù)原馬賽克科技新聞早報(bào)

2018-09-12 16:30:45

Python編程語言馬賽克畫

2011-08-18 15:56:03

深信服廣域網(wǎng)優(yōu)化

2023-11-22 11:20:38

2020-05-07 11:03:32

AI 馬賽克工具

2021-01-04 05:36:23

AI人工智能深度學(xué)習(xí)

2012-03-16 16:33:35

視頻會(huì)議馬賽克深信服
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)