AI模型幫助研究人員提高癌癥檢測精度
Madhu Nair博士和Asha Das博士即將實現(xiàn)一項重大突破,即使用人工智能(AI)模型在患者組織樣本的掃描圖像中檢測乳腺癌癥細胞。
這兩位印度研究人員曾面臨著一個巨大的挑戰(zhàn):他們花了幾個月的時間來訓(xùn)練他們的人工智能模型,以準確識別癌癥細胞。Das和她的團隊經(jīng)常花數(shù)周時間審查成堆的高分辨率巨型像素圖像,逐個圖像標記癌區(qū)。
該團隊需要一種能夠準確快速地掃描這些圖像的解決方案,并且無需人工監(jiān)督。
2022年,印度科欽科技大學人工智能與計算機視覺實驗室的研究人員Das博士和Nair博士與英特爾工程、銷售和營銷團隊合作,使用英特爾至強可擴展處理器和英特爾優(yōu)化TensorFlow實現(xiàn)了一種新的解決方案,一個依賴英特爾CPU加速功能的軟件套件。
今天,發(fā)現(xiàn)癌癥的早期癥狀在很大程度上依賴于放射科醫(yī)生和治療醫(yī)生的專業(yè)知識,他們手動掃描組織病理學結(jié)果。但是,根據(jù)美國國家癌癥研究所(National cancer Institute)的數(shù)據(jù),僅僅依靠人眼也有其負面影響,大約20%的乳腺癌癥癥狀會被忽視。
這就是人工智能可以提供幫助的地方。由于計算技術(shù)的突破,越來越多的醫(yī)院開始接受使用人工智能來發(fā)現(xiàn)醫(yī)生可能會錯過的東西的思路。去年12月,英特爾和賓夕法尼亞醫(yī)學院宣布,他們已經(jīng)幫助研究人員將癌癥腦瘤的檢測提高了33%。
Das解釋了她的團隊是如何首先采用基于GPU的解決方案來增強他們的深度學習模型的。只有一個問題:他們基于GPU的系統(tǒng)經(jīng)常會失敗,因為處理大圖像所需的計算量遠遠超過了系統(tǒng)的設(shè)計限制,導(dǎo)致莫名其妙的停機和令人沮喪的重啟。
Nair在描述這些挑戰(zhàn)時寫道:“我們的模型對計算要求很高,我們使用GPU訓(xùn)練模型的嘗試失敗了。”“我們花了幾天時間來執(zhí)行,發(fā)現(xiàn)很難完成更高分辨率圖像的訓(xùn)練。這促使我們尋找更好的計算設(shè)備?!?/span>
2022年,Nair發(fā)現(xiàn)了英特爾的機會。幾個月后,他們部署了四臺服務(wù)器,作為一個單一的計算集群運行,沒有任何深度學習加速器。服務(wù)器和存儲器使用高速以太網(wǎng)連接。在軟件方面,聯(lián)合團隊轉(zhuǎn)向了英特爾針對TensorFlow的優(yōu)化軟件套件,通過利用英特爾CPU的加速功能來提高TensorFlow性能。
研究結(jié)果正是研究人員所希望的,還有一個令人欣慰的驚喜:他們的模型不僅能標記癌細胞,還能區(qū)分不同級別的癌癥。它非常準確:該解決方案的準確率為98%,比其他模型高出約10個百分點。隨著時間的推移和在更多的數(shù)據(jù)集上訓(xùn)練他們的模型,研究人員預(yù)計準確率會逐漸上升。
Nair說:“英特爾的體系結(jié)構(gòu)令人驚嘆。“我們能夠在幾個小時內(nèi)完成培訓(xùn)。因為服務(wù)器有192GB的內(nèi)存,超過了顯卡上的40GB或80GB,所以我們能夠使用高分辨率圖像,并將整個模型放入內(nèi)存中。英特爾還幫助我們改進了模型,并與我們分享了優(yōu)化,使其發(fā)揮作用。這就是我們能夠成功的原因?!?/span>
考慮到準確度數(shù)據(jù)是用比其他模型所需的訓(xùn)練數(shù)據(jù)少得多的數(shù)據(jù)實現(xiàn)的,這一結(jié)果更令人印象深刻,大大縮短了周轉(zhuǎn)時間。她補充道,“值得注意的是,我們只注釋了20%的數(shù)據(jù),就實現(xiàn)了98%的準確率。這真的很令人興奮?!?/span>
該技術(shù)的下一步正在等待,因為該團隊獲得了專利,并找到了愿意打破習慣于人類接觸的市場空間的商業(yè)合作伙伴。另外還有準確性的問題,雖然98%的準確率可能看起來很高,但對于現(xiàn)實世界的患者來說,它還不夠精確。
現(xiàn)在Das和Nair已經(jīng)證明了他們的模型能夠可靠地檢測到乳腺癌癥細胞,他們正在研究對腦動脈瘤應(yīng)用類似的方法,并從內(nèi)窺鏡檢查中對息肉進行分類。Das說:“我們還計劃擴展這個模型來檢測多器官癌癥?!彼a充說,她現(xiàn)在正致力于擴展解決方案來分析淋巴結(jié)圖像,因為乳腺癌癥經(jīng)常會擴散到腋下相鄰的淋巴結(jié)。