自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

基于分層自監(jiān)督學(xué)習(xí)將視覺Transformer擴(kuò)展到千兆像素圖像

人工智能 新聞
Vision Transformers (ViT) 及其多尺度和分層變體已成功地捕獲圖像表示,但它們的使用通常被研究用于低分辨率圖像(例如256×256、384×384)。

本文經(jīng)計算機(jī)視覺研究院公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

論文地址:https://arxiv.org/pdf/2206.02647.pdf

1 概括

對于計算病理學(xué)中的千兆像素全玻片成像 (WSI),WSI在20倍放大倍率下可大至150000×150000像素,并在不同分辨率下呈現(xiàn)視覺標(biāo)記的層次結(jié)構(gòu):從捕獲單個細(xì)胞的16×16圖像到4096×4096圖像表征組織微環(huán)境內(nèi)的相互作用。

研究者引入了一種新的ViT架構(gòu),稱為分層圖像金字塔變換器 (HIPT),它利用WSI中固有的自然分層結(jié)構(gòu),使用兩個級別的自監(jiān)督學(xué)習(xí)來學(xué)習(xí)高分辨率圖像表示。HIPT使用10,678千兆像素WSI、408,218 4096×4096圖像和104M 256×256圖像對33種癌癥類型進(jìn)行了預(yù)訓(xùn)練。在9個幻燈片級任務(wù)上對HIPT表示進(jìn)行基準(zhǔn)測試,并證明:

1) 具有分層預(yù)訓(xùn)練的HIPT優(yōu)于當(dāng)前最先進(jìn)的癌癥分型和生存預(yù)測方法;

2) 自監(jiān)督ViT能夠?qū)χ匾臍w納建模關(guān)于腫瘤微環(huán)境中表型的層次結(jié)構(gòu)的偏見。

主要框架

圖片

整張幻燈片圖像(WSI)的層次結(jié)構(gòu)。左邊:與自然圖像不同,由于WSI具有固定的比例,因此存在不同圖像分辨率的視覺標(biāo)記的層次結(jié)構(gòu)。右邊:除了將單個256×256圖像表示為256 [16×16]標(biāo)記的序列外,還可以將這些256×256圖像視為4096中更大的、不相交的[256×256]標(biāo)記序列的一部分4096×4096區(qū)域。

HIPT 架構(gòu)

受在自然語言處理中使用分層表示的啟發(fā),其中嵌入可以在字符、單詞、句子和段落級別聚合以形成文檔表示,在x16單元格、x256補(bǔ)丁、x4096區(qū)域級以形成幻燈片表示。為了在每個階段對視覺概念之間的重要依賴關(guān)系進(jìn)行建模,將Transformer自注意力調(diào)整為置換等變聚合層。請注意,由于使用x256標(biāo)記修補(bǔ)x4096區(qū)域的復(fù)雜性與使用x16標(biāo)記修補(bǔ)x256圖像的復(fù)雜性相同,可以使用類似的自監(jiān)督ViT技術(shù)為低分辨率圖像預(yù)訓(xùn)練高分辨率圖像的聚合層。

圖片


Multi-Head Self-Attention Visualization of SelfSupervised ViTs

對于浸潤性導(dǎo)管癌(IDC),展示了ViT256-16和ViT4096-256的自監(jiān)督可視化,分別在x256和x4096區(qū)域上進(jìn)行了預(yù)訓(xùn)練。對于x256補(bǔ)丁,ViT256-16能夠描繪x16 tokens中的基質(zhì)、細(xì)胞和“空白”存在。對于x4096區(qū)域,ViT4096-256描繪了粗粒度的形態(tài)特征,例如腫瘤巢及其周圍的促纖維增生(松散)基質(zhì)。

3 實驗

圖片

HIPT中的Hierarchical Attention Maps

圖片

ViT256-16 DINO Pretraining

圖片

Hierarchical Attention Maps for Colorectal Cancer (CRC)

責(zé)任編輯:張燕妮 來源: 計算機(jī)視覺研究院
相關(guān)推薦

2024-07-30 11:20:00

圖像視覺

2024-05-24 15:53:20

視覺圖像

2025-04-25 08:00:00

2021-12-06 17:38:51

強(qiáng)化學(xué)習(xí)工具人工智能

2025-01-09 11:14:13

2023-05-24 09:36:43

模型架構(gòu)

2022-11-29 15:38:01

學(xué)習(xí)框架編碼器數(shù)據(jù)

2022-11-23 13:36:38

模型研究

2024-11-21 16:06:02

2023-11-23 15:54:01

人工智能監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)

2022-04-26 09:44:29

算法庫EasyCV開源

2023-07-07 09:55:23

互聯(lián)網(wǎng)論文

2022-05-17 16:38:40

數(shù)據(jù)訓(xùn)練

2025-04-25 11:55:46

WebSSL視覺問答圖像模型

2021-10-13 17:28:33

AI 數(shù)據(jù)人工智能

2025-03-24 10:15:00

2021-07-07 17:19:07

人工智能代碼開源

2020-04-28 17:26:04

監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)

2025-04-10 11:52:55

2017-06-12 14:04:45

深度學(xué)習(xí)人工智能
點贊
收藏

51CTO技術(shù)棧公眾號