自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<big id="x0kuk"><code id="x0kuk"><option id="x0kuk"></option></code></big>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

基于分層自監(jiān)督學(xué)習(xí)將視覺Transformer擴(kuò)展到千兆像素圖像

作者：計算機(jī)視覺研究院 2024-06-13 11:44:43

人工智能新聞

Vision Transformers (ViT) 及其多尺度和分層變體已成功地捕獲圖像表示，但它們的使用通常被研究用于低分辨率圖像（例如256×256、384×384）。

本文經(jīng)計算機(jī)視覺研究院公眾號授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請聯(lián)系出處。

論文地址：https://arxiv.org/pdf/2206.02647.pdf

1 概括

對于計算病理學(xué)中的千兆像素全玻片成像 (WSI)，WSI在20倍放大倍率下可大至150000×150000像素，并在不同分辨率下呈現(xiàn)視覺標(biāo)記的層次結(jié)構(gòu)：從捕獲單個細(xì)胞的16×16圖像到4096×4096圖像表征組織微環(huán)境內(nèi)的相互作用。

研究者引入了一種新的ViT架構(gòu)，稱為分層圖像金字塔變換器 (HIPT)，它利用WSI中固有的自然分層結(jié)構(gòu)，使用兩個級別的自監(jiān)督學(xué)習(xí)來學(xué)習(xí)高分辨率圖像表示。HIPT使用10,678千兆像素WSI、408,218 4096×4096圖像和104M 256×256圖像對33種癌癥類型進(jìn)行了預(yù)訓(xùn)練。在9個幻燈片級任務(wù)上對HIPT表示進(jìn)行基準(zhǔn)測試，并證明：

1) 具有分層預(yù)訓(xùn)練的HIPT優(yōu)于當(dāng)前最先進(jìn)的癌癥分型和生存預(yù)測方法；

2) 自監(jiān)督ViT能夠?qū)χ匾臍w納建模關(guān)于腫瘤微環(huán)境中表型的層次結(jié)構(gòu)的偏見。

2 主要框架

整張幻燈片圖像(WSI)的層次結(jié)構(gòu)。左邊：與自然圖像不同，由于WSI具有固定的比例，因此存在不同圖像分辨率的視覺標(biāo)記的層次結(jié)構(gòu)。右邊：除了將單個256×256圖像表示為256 [16×16]標(biāo)記的序列外，還可以將這些256×256圖像視為4096中更大的、不相交的[256×256]標(biāo)記序列的一部分4096×4096區(qū)域。

HIPT 架構(gòu)

受在自然語言處理中使用分層表示的啟發(fā)，其中嵌入可以在字符、單詞、句子和段落級別聚合以形成文檔表示，在x16單元格、x256補(bǔ)丁、x4096區(qū)域級以形成幻燈片表示。為了在每個階段對視覺概念之間的重要依賴關(guān)系進(jìn)行建模，將Transformer自注意力調(diào)整為置換等變聚合層。請注意，由于使用x256標(biāo)記修補(bǔ)x4096區(qū)域的復(fù)雜性與使用x16標(biāo)記修補(bǔ)x256圖像的復(fù)雜性相同，可以使用類似的自監(jiān)督ViT技術(shù)為低分辨率圖像預(yù)訓(xùn)練高分辨率圖像的聚合層。

Multi-Head Self-Attention Visualization of SelfSupervised ViTs

對于浸潤性導(dǎo)管癌(IDC)，展示了ViT256-16和ViT4096-256的自監(jiān)督可視化，分別在x256和x4096區(qū)域上進(jìn)行了預(yù)訓(xùn)練。對于x256補(bǔ)丁，ViT256-16能夠描繪x16 tokens中的基質(zhì)、細(xì)胞和“空白”存在。對于x4096區(qū)域，ViT4096-256描繪了粗粒度的形態(tài)特征，例如腫瘤巢及其周圍的促纖維增生（松散）基質(zhì)。

3 實驗

HIPT中的Hierarchical Attention Maps

ViT256-16 DINO Pretraining

Hierarchical Attention Maps for Colorectal Cancer (CRC)

責(zé)任編輯：張燕妮來源：計算機(jī)視覺研究院

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

^{<blockquote id="z4fpc"></blockquote>}

<strike id="z4fpc"></strike>

<big id="z4fpc"><tbody id="z4fpc"><form id="z4fpc"></form></tbody></big>

<sub id="z4fpc"></sub>

<cite id="z4fpc"></cite>