放射科醫(yī)生再臨危機(jī)!國(guó)外五大機(jī)構(gòu)聯(lián)合發(fā)布「胸部X光」最新基準(zhǔn)
胸部X光(CXR)檢查是一種廣泛應(yīng)用于各種疾病的篩查、診斷檢查的臨床成像方式。
臨床診斷中,不僅包括常見的疾病類型,往往還會(huì)描述相應(yīng)嚴(yán)重程度和不確定性,目前的醫(yī)學(xué)圖像數(shù)據(jù)庫(kù)往往滿足于預(yù)測(cè)疾病類型,而忽視了具有重大臨床意義的后者。
最近,德州州立阿靈頓分校、NIH、理化學(xué)研究所、東京大學(xué)以及日本國(guó)立癌癥研究中心的研究人員從臨床角度出發(fā),提出了提出一個(gè)包含疾病嚴(yán)重程度和不確定性的全新數(shù)據(jù)集并提出了一種用于CXR疾病分類的解剖結(jié)構(gòu)感知的多關(guān)系圖學(xué)習(xí)方法。
論文地址:https://arxiv.org/abs/2309.03331
項(xiàng)目主頁(yè):https://github.com/MengRes/Uncertain-Label.git
數(shù)據(jù)集:https://physionet.org/content/cad-chest/1.0/
這篇論文的主要貢獻(xiàn)有兩點(diǎn):
1. 提出一個(gè)包含疾病嚴(yán)重程度和不確定性的數(shù)據(jù)集。
2. 提出了一種使用醫(yī)學(xué)知識(shí)的多關(guān)系圖學(xué)習(xí)方法用于CXR疾病分類。
全新數(shù)據(jù)集
診斷疾病的嚴(yán)重程度在臨床診斷中至關(guān)重要,超越了疾病類別存在或不存在的二元分類,在MIMIC-CXR數(shù)據(jù)集中(最大的胸片數(shù)據(jù)集之一)以及隨附的放射學(xué)報(bào)告,疾病嚴(yán)重程度的描述(例如圖1中的「small pleural effusion」或「mild cardiomegaly」)很常見。
圖1:放射學(xué)報(bào)告中關(guān)于疾病不確定性和嚴(yán)重程度的描述(疾病用紅色字體標(biāo)出,嚴(yán)重程度用綠色高亮,不確定性用藍(lán)色高亮)
據(jù)了解,之前沒有研究解決報(bào)告的疾病嚴(yán)重程度的問(wèn)題。
其次,由于胸片的基本復(fù)雜性和難度,對(duì)醫(yī)生的疾病不確定性進(jìn)行建模非常重要。放射科醫(yī)生經(jīng)常在臨床記錄中使用「可能」、「不排除」和「也許」等術(shù)語(yǔ)在臨床記錄中表明不同程度的不確定性。
大多數(shù)先前的研究將這種不確定性視為負(fù)面類別,這可能會(huì)誤導(dǎo)臨床決策。
研究人員使用了基于規(guī)則的提取方法從放射學(xué)報(bào)告中提取疾病的名稱,嚴(yán)重程度和不確定性信息。
對(duì)于疾病名稱,研究人員列出每一種疾病可能使用的表述,對(duì)于疾病嚴(yán)重程度,并列出了表示嚴(yán)重程度的詞語(yǔ),并將嚴(yán)重程度量化為輕度(mild),中度(moderate)和嚴(yán)重(sever)三個(gè)等級(jí),如表1所示。
對(duì)于疾病的不確定性,研究人員與醫(yī)生合作,制定了不同的不確定性詞語(yǔ)與標(biāo)簽值的映射,將不同的嚴(yán)重程度對(duì)應(yīng)于不同的標(biāo)簽值,對(duì)疾病的描述越肯定,標(biāo)簽值越高,如表2所示。
表1:表示疾病嚴(yán)重程度的詞語(yǔ)
表2:表示疾病不確定性的詞語(yǔ)
研究人員邀請(qǐng)經(jīng)驗(yàn)豐富的醫(yī)生評(píng)估提取的標(biāo)簽的準(zhǔn)確性,向醫(yī)生提供了500份隨機(jī)選擇的放射學(xué)報(bào)告及其相應(yīng)提取的疾病,嚴(yán)重程度和不確定性標(biāo)簽。
根據(jù)醫(yī)生的反饋統(tǒng)計(jì)了標(biāo)簽的準(zhǔn)確性,如表3所示。
表3:提取的標(biāo)簽的準(zhǔn)確性評(píng)估
方法
基于上述提取的標(biāo)簽上使用圖網(wǎng)絡(luò)對(duì)疾病分類。
根據(jù)醫(yī)生提供的醫(yī)學(xué)知識(shí),構(gòu)建出了三種圖網(wǎng)絡(luò)關(guān)系,分別為spatial graph(表示解剖學(xué)結(jié)構(gòu)之間的關(guān)系),semantic graph(疾病之間的關(guān)系)和implicit graph(表示潛在的關(guān)系)。
模型結(jié)構(gòu)如圖2所示,具體介紹情參見論文。
圖2:方法的網(wǎng)絡(luò)結(jié)構(gòu)
實(shí)驗(yàn)
研究人員在提取的標(biāo)簽上進(jìn)行實(shí)驗(yàn)并和其他方法比較,結(jié)果如表4所示。
表4:與其他方法的比較結(jié)果
研究人員使用二元標(biāo)簽和不確定標(biāo)簽來(lái)訓(xùn)練模型,記為Ours(0-1)和Ours(Uncertain)。
為了更深入地研究方法的性能,文中還進(jìn)行了消融研究。每個(gè)實(shí)驗(yàn)都針對(duì)具有二元標(biāo)簽和不確定標(biāo)簽的spatial graph、semantic graph和implicit graph進(jìn)行單獨(dú)訓(xùn)練。
作者將疾病感興趣區(qū)域與在ResNet-50模型上使用Grad-CAM生成結(jié)果進(jìn)行比較。從報(bào)告中提取異常區(qū)域如下圖所示??梢园l(fā)現(xiàn),放射學(xué)報(bào)告顯示雙側(cè)下肺(左下肺和右下肺)出現(xiàn)混濁。
此外,右肺的混濁可能代表肺炎。ResNet-50模型在不透明和肺炎的情況下重點(diǎn)關(guān)注右下肺、右中肺和心臟區(qū)域。
從報(bào)告中可以發(fā)現(xiàn)心臟區(qū)域沒有異常,而左下肺的疾病被遺漏,使得Grad-CAM結(jié)果不太準(zhǔn)確。研究人員提出的模型同時(shí)關(guān)注左下肺和右下肺,并且比ResNet-50方法表現(xiàn)更好。
圖4:報(bào)告中的異常描述以紅色突出顯示,從文本中提取的異常和位置在報(bào)告下方提供。為每個(gè)異常提供兩張圖像以進(jìn)行比較。(a)和(c)是ResNet-50模型中Grad-CAM獲得的異常感興趣區(qū)域。(b)和(d)是通過(guò)研究人員的方法獲得的感興趣的節(jié)點(diǎn)。在結(jié)果中,每個(gè)邊界框?qū)?yīng)一個(gè)解剖區(qū)域的節(jié)點(diǎn),紅色邊界框是關(guān)注度最高的節(jié)點(diǎn),黃色邊界框?qū)?yīng)與紅色邊界框密切相關(guān)的節(jié)點(diǎn)。綠色箭頭表示節(jié)點(diǎn)之間的連接。
結(jié)論
在這項(xiàng)研究中,作者提出CXR疾病診斷在臨床中存在的疾病嚴(yán)重性和不確定性描述的問(wèn)題。
針對(duì)此問(wèn)題作者使用基于規(guī)則的方法從放射學(xué)報(bào)告中提取包含疾病嚴(yán)重程度和不確定性的標(biāo)簽。
在該數(shù)據(jù)集上,作者使用基于醫(yī)學(xué)知識(shí)的圖神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)疾病的嚴(yán)重程度和不確定性。