自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

空間變換網(wǎng)絡(luò)簡單介紹

網(wǎng)絡(luò)
對空間變換網(wǎng)絡(luò)STN做了一個(gè)簡單的原理性的介紹。

作為谷歌Summer of Code項(xiàng)目的一部分,我要實(shí)現(xiàn)的第一個(gè)模型是空間變壓器網(wǎng)絡(luò)。空間變壓器網(wǎng)絡(luò)(STN)是一個(gè)可學(xué)習(xí)的模塊,可以放置在卷積神經(jīng)網(wǎng)絡(luò)(CNN)中,有效地增加空間不變性。空間不變性是指模型對圖像的空間變換如旋轉(zhuǎn)、平移和縮放不變性。不變性是指即使輸入被變換或輕微修改,模型也能識別和識別特征的能力??臻g變壓器可以放置到CNN中,以完成各種任務(wù)。圖像分類就是一個(gè)例子。假設(shè)任務(wù)是對手寫數(shù)字進(jìn)行分類,每個(gè)樣本中數(shù)字的位置、大小和方向變化顯著。一個(gè)空間轉(zhuǎn)換器將提取、變換和縮放樣本中感興趣的區(qū)域。現(xiàn)在CNN可以完成分類的任務(wù)。

空間變換網(wǎng)絡(luò)簡單介紹

 

空間變壓器網(wǎng)絡(luò)由3個(gè)主要組成部分組成:

(i) 定位網(wǎng)絡(luò):該網(wǎng)絡(luò)以一個(gè)batch的圖像的四維張量表示(寬度x高度x通道x Batch_Size)作為輸入。它是一個(gè)簡單的神經(jīng)網(wǎng)絡(luò),有幾個(gè)卷積層和幾個(gè)dense層。將變換參數(shù)預(yù)測為輸出。這些參數(shù)決定了輸入必須旋轉(zhuǎn)的角度、要完成的平移量以及聚焦于輸入特征圖中感興趣的區(qū)域所需的比例因子。

(ii) 采樣網(wǎng)格生成器:對batch中每幅圖像使用定位網(wǎng)絡(luò)預(yù)測的變換參數(shù),其形式為大小為2×3的仿射變換矩陣。仿射變換是一種保留點(diǎn)、直線和平面的變換。經(jīng)過仿射變換后,平行線保持平行。旋轉(zhuǎn)、縮放和平移都是仿射變換。

空間變換網(wǎng)絡(luò)簡單介紹

 

這里,T是這個(gè)仿射變換,A是表示仿射變換的矩陣。θ11, θ12, θ21, θ22被用來確定圖像旋轉(zhuǎn)的角度。θ13, θ23分別確定了圖像沿寬度和高度的平移量。因此,我們得到了一個(gè)轉(zhuǎn)換索引的采樣網(wǎng)格。

(iii) 變換后索引上的雙線性插值:現(xiàn)在圖像的索引和坐標(biāo)軸已經(jīng)進(jìn)行了仿射變換。它的像素移動(dòng)了。例如,一個(gè)點(diǎn)(1,1)在軸逆時(shí)針旋轉(zhuǎn)45度后變成(√2,0),因此要找到變換點(diǎn)處的像素值,我們需要使用四個(gè)最接近的像素值進(jìn)行雙線性插值。

空間變換網(wǎng)絡(luò)簡單介紹

 

為了找到點(diǎn)(x, y)上的像素值,我們?nèi)?個(gè)最近的點(diǎn),如上圖所示。其中,floor(x)表示最大整數(shù)函數(shù),ceil(x)表示ceiling函數(shù)。線性插值必須在x和y兩個(gè)方向上完成。因此,這個(gè)函數(shù)返回完全轉(zhuǎn)換后的圖像,并在轉(zhuǎn)換索引處使用適當(dāng)?shù)南袼刂怠?/p>

純Julia實(shí)現(xiàn)空間變壓器網(wǎng)絡(luò)的代碼可以在這里找到:https://github.com/thebhatman/Spatial-Transformer-Network/blob/master/src/stn.jl。我在一些圖像上測試了我的空間轉(zhuǎn)換器模塊的功能。下面是轉(zhuǎn)換函數(shù)輸出的一些示例圖像。左邊的圖像是轉(zhuǎn)換器模塊的輸入,右邊的圖像是輸出。

  1. 放大感興趣的區(qū)域
空間變換網(wǎng)絡(luò)簡單介紹

 

  1. 對人臉進(jìn)行放大并旋轉(zhuǎn)45度。
空間變換網(wǎng)絡(luò)簡單介紹

 

  1. 對圖像沿著寬度平移,移到中心。
空間變換網(wǎng)絡(luò)簡單介紹

 

從上面的例子可以清楚地看出,空間轉(zhuǎn)換器模塊能夠執(zhí)行任何類型的仿射變換。在實(shí)現(xiàn)過程中,我花了很多時(shí)間來理解數(shù)組的reshape、permutedims和concatenation是如何工作的,因?yàn)楫?dāng)我使用這些函數(shù)時(shí),很難調(diào)試像素和索引是如何移動(dòng)的。在STN實(shí)現(xiàn)過程中,調(diào)試插值和圖像索引是最耗費(fèi)時(shí)間和最令人沮喪的部分。

現(xiàn)在,我計(jì)劃使用一個(gè)CNN來訓(xùn)練這個(gè)空間轉(zhuǎn)換器模塊,以便對一個(gè)雜亂和扭曲的MNIST數(shù)據(jù)集進(jìn)行手寫數(shù)字分類。空間變壓器將能夠增加CNN的空間不變性,因此期望即使在數(shù)字被平移、旋轉(zhuǎn)或縮放時(shí)也能給出良好的分類結(jié)果。

責(zé)任編輯:姜華 來源: 今日頭條 AI公園
相關(guān)推薦

2011-07-04 10:04:52

java網(wǎng)絡(luò)程序

2011-02-17 10:54:59

CSS3變換 簡單快捷

2010-07-08 13:39:12

HART協(xié)議

2010-03-15 15:49:01

Ubuntu 8.10

2011-03-29 09:14:37

2011-04-01 09:39:17

zabbix

2011-01-21 18:08:22

Qmail

2011-03-04 13:19:09

VSFTP介紹

2011-02-22 16:38:03

Konqueror

2010-03-16 18:44:55

Ubuntu 8.10

2011-01-21 10:40:52

Sendmail

2009-06-17 17:59:01

介紹Spring

2011-01-21 16:49:15

Zimbra

2011-02-24 14:40:47

Proftpd

2011-02-23 13:28:12

2009-06-18 13:18:04

Spring IDE

2011-03-18 09:35:50

lamp

2009-09-09 14:20:49

LINQ To Luc

2010-03-23 17:41:09

CentOS安裝

2010-06-24 13:52:50

LEACH協(xié)議
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號