自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

人工智能 新聞
中外71位科學(xué)家共同研發(fā)了一個(gè)AI系統(tǒng),可以像醫(yī)生一樣準(zhǔn)確地檢測(cè)出測(cè)試結(jié)果,診斷兒童疾病。準(zhǔn)確率方面始終與初級(jí)保健兒科醫(yī)生相當(dāng),甚至有所超越。這是中國(guó)研究團(tuán)隊(duì)首次在頂級(jí)醫(yī)學(xué)雜志發(fā)表有關(guān)NLP技術(shù)基于文本型電子病歷(EMR)做臨床智能診斷的研究成果!

 

[[257228]]

 

【新智元導(dǎo)讀】中外71位科學(xué)家共同研發(fā)了一個(gè)AI系統(tǒng),可以像醫(yī)生一樣準(zhǔn)確地檢測(cè)出測(cè)試結(jié)果,診斷兒童疾病。準(zhǔn)確率方面始終與初級(jí)保健兒科醫(yī)生相當(dāng),甚至有所超越。這是中國(guó)研究團(tuán)隊(duì)首次在頂級(jí)醫(yī)學(xué)雜志發(fā)表有關(guān)NLP技術(shù)基于文本型電子病歷(EMR)做臨床智能診斷的研究成果!

我國(guó)研究人員再創(chuàng)佳績(jī)!

昨日,Nature子刊Medicine發(fā)布了一篇重磅文章——《使用人工智能評(píng)估和準(zhǔn)確診斷兒科疾病》,在業(yè)界引發(fā)了不小的反響。

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

 

這是中國(guó)研究團(tuán)隊(duì)首次在頂級(jí)醫(yī)學(xué)雜志發(fā)表有關(guān)自然語(yǔ)言處理(NLP)技術(shù)基于文本型電子病歷(EMR)做臨床智能診斷的研究成果!

這項(xiàng)人工智能程序,可以像醫(yī)生一樣準(zhǔn)確地檢測(cè)出測(cè)試結(jié)果、健康記錄甚至手寫(xiě)筆記,診斷兒童疾病。

從流感、哮喘到威脅生命的肺炎和腦膜炎,該系統(tǒng)的準(zhǔn)確率始終與初級(jí)保健兒科醫(yī)生相當(dāng),甚至有所超越:

  • AI程序診斷出呼吸道感染和鼻竇炎準(zhǔn)確率為95%;
  • 不常見(jiàn)的疾病的確診率也很高:急性哮喘(97%)、細(xì)菌性腦膜炎和水痘(93%)以及單核細(xì)胞增多癥(90%)。

Nature雜志在一份新聞稿件中表示:

這項(xiàng)技術(shù)可能來(lái)的正是時(shí)候。近年來(lái),由于疾病的范圍、診斷測(cè)試和治療方案都呈指數(shù)級(jí)增長(zhǎng),這就使得醫(yī)生的決策過(guò)程變得更加復(fù)雜。

但是伯明翰大學(xué)工程學(xué)Duc Pham教授表示:

從結(jié)果來(lái)看,該系統(tǒng)的表現(xiàn)確實(shí)優(yōu)于初級(jí)醫(yī)生,但它絕對(duì)不能完全取代臨床醫(yī)生。無(wú)論使用多少訓(xùn)練樣例,都無(wú)法保證100%正確的結(jié)果。

本文的作者之一,張康教授也表示:“醫(yī)生和AI的關(guān)系,可以類(lèi)比于人類(lèi)駕駛員和在其監(jiān)督下的自動(dòng)駕駛汽車(chē)。它只會(huì)讓醫(yī)生在更短的時(shí)間內(nèi)以更低的成本做更好的事情。”

基于人工智能(AI)的方法已成改變醫(yī)療保健的有力工具

雖然機(jī)器學(xué)習(xí)分類(lèi)器(MLCs)已經(jīng)在基于圖像的診斷中顯示出其強(qiáng)大的性能,但對(duì)各種大規(guī)模電子健康記錄(EHR)數(shù)據(jù)的分析仍然具有挑戰(zhàn)性。

在本文,作者表明MLC可以以類(lèi)似于醫(yī)生使用的假設(shè) - 演繹推理的方式查詢(xún)EHR,并且發(fā)現(xiàn)以前的統(tǒng)計(jì)方法所沒(méi)有找到的關(guān)聯(lián)特性。作者的模型采用一種自動(dòng)化的自然語(yǔ)言處理系統(tǒng),使用深度學(xué)習(xí)技術(shù)從EHR中提取臨床相關(guān)信息。

本研究共分析了1362559名兒科患者就診于某大型轉(zhuǎn)診中心的10160萬(wàn)個(gè)數(shù)據(jù)點(diǎn),對(duì)該框架進(jìn)行了訓(xùn)練和驗(yàn)證。

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

 

兒科診斷框架的工作流程圖

首先提取數(shù)據(jù),基于深度學(xué)習(xí)構(gòu)建NLP模型,對(duì)數(shù)據(jù)進(jìn)行語(yǔ)義分析,其次將數(shù)據(jù)進(jìn)行結(jié)構(gòu)化,最后對(duì)這些完全結(jié)構(gòu)化的數(shù)據(jù)庫(kù)用疾病分類(lèi)器處理,預(yù)測(cè)臨床診斷。

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

 

大型兒科隊(duì)列中診斷框架的層次結(jié)構(gòu):使用分層邏輯回歸分類(lèi)器,來(lái)建立基于解剖學(xué)劃分的診斷系統(tǒng)

基于器官的方法,首先將器官系統(tǒng)按照大類(lèi)可以劃分為5類(lèi),分別是呼吸系統(tǒng)疾病、系統(tǒng)性全身性疾病、神經(jīng)精神疾病、泌尿生殖系統(tǒng)疾病、胃腸道疾病。然后將每個(gè)大類(lèi)再細(xì)分成器官子系統(tǒng),甚至更具體的診斷組。

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

 

下劃線(xiàn)為計(jì)算機(jī)預(yù)測(cè)的診斷結(jié)果,醫(yī)生診斷顯示在頂部的第一行

在診斷層級(jí)的第一級(jí),分類(lèi)器能準(zhǔn)確地辨別出,大量?jī)嚎苹颊叩钠鞴傧到y(tǒng)之間,存在哪些廣泛解剖學(xué)分類(lèi)。接下來(lái)診斷層級(jí)的第二級(jí),我們拿呼吸系統(tǒng)疾病診斷舉例。

在呼吸系統(tǒng)疾病的診斷中,分類(lèi)器可以辨別上呼吸狀況和下呼吸狀況。

在上呼吸道系統(tǒng)內(nèi),可以進(jìn)一步區(qū)分最常見(jiàn)的急性上呼吸道感染:鼻竇炎和喉炎,二者診斷準(zhǔn)確度均超過(guò)95%。

哮喘被歸類(lèi)為呼吸系統(tǒng)中的一個(gè)獨(dú)立類(lèi)別,診斷系統(tǒng)準(zhǔn)確地區(qū)分了無(wú)并發(fā)癥的哮喘、咳嗽變異性哮喘和急性哮喘急性發(fā)作。

人類(lèi)醫(yī)生確診的315661次主要呼吸道疾病中,AI夠正確預(yù)測(cè)其中的295403例,精確度達(dá)到92%。

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

 

使用F1score來(lái)評(píng)估不同組(行)的診斷性能(Root是診斷分類(lèi)的第一級(jí))

表中第二列是AI的診斷結(jié)果,后面的1組和2組都是初級(jí)醫(yī)師診斷結(jié)果,剩下的3組結(jié)果分別由三個(gè)高級(jí)醫(yī)師給出。

可以看出,機(jī)器學(xué)習(xí)模型比初級(jí)醫(yī)師組表現(xiàn)更好,但比三個(gè)經(jīng)驗(yàn)豐富的醫(yī)師組略差。

AI診斷系統(tǒng)方法介紹

數(shù)據(jù)收集

我們的數(shù)據(jù)收集自廣州婦女兒童醫(yī)學(xué)中心,來(lái)自該機(jī)構(gòu)的567498名兒科患者中獲得了1362559次門(mén)診的電子病歷。時(shí)間范圍從2016年1月至2017年7月?;颊吣挲g中位數(shù)為2.35歲,40.11%為女性。我們使用廣東省增城婦女兒童醫(yī)院的一組獨(dú)立兒科患者的11926例就診記錄,將我們的AI系統(tǒng)和人類(lèi)醫(yī)生的表現(xiàn)進(jìn)行對(duì)比。

NLP模型構(gòu)建

我們建立了原始信息提取模型,從電子病歷的原始數(shù)據(jù)中提取出關(guān)鍵概念和相關(guān)類(lèi)別,并將其轉(zhuǎn)換為查詢(xún)-答案組合的新格式的臨床數(shù)據(jù)。這些數(shù)據(jù)將相關(guān)癥狀進(jìn)行分組,通過(guò)表示模型依賴(lài)的確切特征來(lái)進(jìn)行診斷,從而提高了可解釋性。三名醫(yī)生策劃并驗(yàn)證了這些模式,其中包括患者主訴、現(xiàn)有病史,體檢和實(shí)驗(yàn)室報(bào)告。

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

 

自然語(yǔ)言處理信息提取模型的設(shè)計(jì)

NLP框架有多個(gè)組成部分:詞典構(gòu)建、符號(hào)化、單詞嵌入、圖構(gòu)建,以及使用LSTM架構(gòu)的句子分類(lèi)。

詞典構(gòu)建

我們通過(guò)閱讀訓(xùn)練數(shù)據(jù)中的句子,并選擇臨床相關(guān)單詞以用于查詢(xún)-答案模型構(gòu)建來(lái)生成詞典。詞典的關(guān)鍵詞由我們的醫(yī)生策劃,并使用中文醫(yī)學(xué)詞典生成。接下來(lái),根據(jù)醫(yī)生的臨床知識(shí)和經(jīng)驗(yàn),以及專(zhuān)家共識(shí)修訂詞典中的錯(cuò)誤。迭代運(yùn)行程序,直到找不到現(xiàn)有疾病和體檢的新的概念為止。然后使用這些句子來(lái)訓(xùn)練單詞嵌入模型。

架構(gòu)設(shè)計(jì)

架構(gòu)由醫(yī)生策劃的問(wèn)題列表組成,用于提取癥狀信息以進(jìn)行診斷。比如問(wèn)題有“患者是否發(fā)燒?”和“患者是否咳嗽?”。答案包括關(guān)鍵位置和數(shù)字函數(shù)。前者對(duì)解剖的位置進(jìn)行編碼,如肺或胃腸道。因此,該值可以是分類(lèi)變量,也可以是二進(jìn)制數(shù),具體取決于要素類(lèi)型。

然后,我們?yōu)槊糠N類(lèi)型的病例數(shù)據(jù)構(gòu)建一個(gè)模式:由當(dāng)前疾病的病史和患者主訴,體檢與實(shí)驗(yàn)室檢查構(gòu)成。然后將此架構(gòu)用于文本新格式的建模。架構(gòu)設(shè)計(jì)的基本原理是增強(qiáng)不同醫(yī)院之間的數(shù)據(jù)的互操作性,以便將來(lái)進(jìn)行進(jìn)一步研究。此外,與使用有可能被識(shí)別出的原始病例相比,以新格式提供病例也有助于保護(hù)患者的隱私。

符號(hào)化與詞嵌入

由于缺乏公開(kāi)的標(biāo)記臨床中文數(shù)據(jù)資源,我們?yōu)榉衷~建立了標(biāo)準(zhǔn)數(shù)據(jù)集。我們使用pythonTensorflow包中的word2vec來(lái)嵌入具有100個(gè)特征的4,363個(gè)令牌,以表示高維空間中單詞的語(yǔ)義和相似性。

LSTM模型訓(xùn)練集和測(cè)試集的構(gòu)建

我們創(chuàng)建了一個(gè)用于訓(xùn)練問(wèn)答提取模型的小數(shù)據(jù)集,并在訓(xùn)練和驗(yàn)證隊(duì)列中對(duì)問(wèn)答信息進(jìn)行了手動(dòng)注釋。對(duì)于答案為是/否的問(wèn)題,我們使用0或1來(lái)表示。

對(duì)自由文本協(xié)調(diào)過(guò)程使用之前描述的基于注意力的LSTM建模。我們使用Tensorflow實(shí)現(xiàn)并訓(xùn)練模型。我們將NLP模型應(yīng)用于所有電子病歷中。我們沒(méi)有調(diào)整超參數(shù),而是使用LSTM模型的默認(rèn)或常用的超參數(shù)設(shè)置。

分層多標(biāo)簽診斷

診斷的層級(jí)結(jié)構(gòu)由專(zhuān)家醫(yī)生研究確定,采用基于解剖學(xué)的分類(lèi)系統(tǒng)進(jìn)行,因?yàn)檫@是在人類(lèi)醫(yī)師評(píng)估患者時(shí)制定差異化診斷的常見(jiàn)做法。首先,將診斷范圍分至一般器官系統(tǒng)(比如呼吸系統(tǒng)、神經(jīng)精神病學(xué)或胃腸系統(tǒng))。在每個(gè)器官系統(tǒng)內(nèi),再進(jìn)一步分為子系統(tǒng)(如上呼吸道和下呼吸道),并將“全身”專(zhuān)門(mén)標(biāo)記為一個(gè)系統(tǒng),適用于全身性多器官疾病的情況。

模型訓(xùn)練和驗(yàn)證

來(lái)自問(wèn)答模型的數(shù)據(jù)由混合分類(lèi)變量和是/否形式的答案組成。因此,我們首先通過(guò)訪(fǎng)問(wèn)矩陣將分類(lèi)和答案轉(zhuǎn)換為統(tǒng)一的二進(jìn)制特征。然后將數(shù)據(jù)隨機(jī)分成訓(xùn)練組(包括總訪(fǎng)問(wèn)數(shù)據(jù)記錄的70%)和測(cè)試組(剩余的30%)。然后通過(guò)構(gòu)建問(wèn)答矩陣,在訓(xùn)練和測(cè)試隊(duì)列中對(duì)每個(gè)訪(fǎng)問(wèn)記錄進(jìn)行注釋。對(duì)于每個(gè)中間節(jié)點(diǎn),我們基于直接子項(xiàng)訓(xùn)練了多類(lèi)線(xiàn)性邏輯回歸分類(lèi)器。子項(xiàng)的所有子類(lèi)都折疊到子項(xiàng)的級(jí)別。使用Sklearn類(lèi)邏輯回歸來(lái)訓(xùn)練多類(lèi)別分類(lèi)器,使用默認(rèn)的l1正則化懲罰(Lasso),模擬醫(yī)生基于有限數(shù)量的癥狀進(jìn)行的診斷。

對(duì)疾病的層級(jí)聚類(lèi)

為了評(píng)估聚類(lèi)結(jié)果的穩(wěn)健性,我們首先將數(shù)據(jù)隨機(jī)分成兩半,一半用于訓(xùn)練,另一半用于測(cè)試,并獨(dú)立地重新生成訓(xùn)練和測(cè)試數(shù)據(jù)的兩個(gè)聚類(lèi)圖。我們通過(guò)在相應(yīng)高度獨(dú)立地切割相關(guān)的樹(shù)形圖,將訓(xùn)練和測(cè)試聚類(lèi)圖中的葉子分配給10個(gè)類(lèi)別。使用調(diào)整的Rand指數(shù)(ARI)24評(píng)估訓(xùn)練和測(cè)試數(shù)據(jù)之間的類(lèi)別分配一致性。結(jié)果表明我們的聚類(lèi)圖是穩(wěn)健的。

中國(guó)AI臨床診斷首次被Nature翻牌:71位專(zhuān)家巨獻(xiàn)準(zhǔn)確度超人類(lèi)醫(yī)生

 

無(wú)人監(jiān)督聚類(lèi)NLP從兒科疾病中提取文本特征(灰色框內(nèi)是聚類(lèi)塊)

在一些病例中,系統(tǒng)使用相關(guān)的ICD-10代碼進(jìn)行聚類(lèi)診斷,說(shuō)明具備檢測(cè)與人類(lèi)定義的分類(lèi)系統(tǒng)一致的臨床特征的趨勢(shì)。但是,另一些時(shí)候,系統(tǒng)會(huì)將相關(guān)類(lèi)型的診斷分為一類(lèi),但不包括該類(lèi)別中的其他非常類(lèi)似的診斷。比如將“哮喘”和“咳嗽變異性哮喘”分到同一組中,但該類(lèi)中不包括“急性哮喘惡化”,該病與“急性鼻竇炎”組合在一起。在許多情況下,即使沒(méi)有任何定向標(biāo)記或分類(lèi)系統(tǒng),系統(tǒng)也成功建立了相關(guān)診斷的廣泛分組,這表明我們開(kāi)發(fā)的臨床特征成功學(xué)習(xí)了建模和診斷的條件之間的關(guān)鍵的相似性和差異。

AI系統(tǒng)與人類(lèi)醫(yī)生的表現(xiàn)對(duì)比

我們選擇了20名兒科醫(yī)生,根據(jù)多年的臨床實(shí)踐經(jīng)驗(yàn)對(duì)11926條病歷記錄進(jìn)行手動(dòng)標(biāo)記。這五個(gè)小組的醫(yī)生涵蓋住院醫(yī)師到主任醫(yī)師,臨床實(shí)踐從3年到25年不等。每組中的醫(yī)生從獨(dú)立驗(yàn)證數(shù)據(jù)集中讀取2981個(gè)臨床記錄的隨機(jī)子集并分配診斷。每條患者記錄被隨機(jī)分配并由四名醫(yī)師(每組一名)評(píng)分。我們使用F1評(píng)分評(píng)估了每個(gè)醫(yī)師組在前15個(gè)診斷類(lèi)別中的診斷表現(xiàn)。

參考鏈接:

https://www.nature.com/articles/s41591-018-0335-9#Sec17 

責(zé)任編輯:龐桂玉 來(lái)源: 今日頭條
相關(guān)推薦

2025-03-31 10:00:00

AI模型預(yù)測(cè)

2017-06-05 16:08:28

2025-04-21 16:28:16

AI醫(yī)生生成式AI醫(yī)療AI

2018-04-23 10:42:43

AI醫(yī)療醫(yī)生

2019-10-31 14:37:55

技術(shù)人工智能開(kāi)發(fā)

2023-12-19 13:28:06

2020-10-29 15:58:43

阿里AI雙11

2022-01-24 15:07:59

量子

2024-12-09 08:30:00

AI模型

2011-07-04 10:10:08

2023-10-26 20:14:28

Nature神經(jīng)網(wǎng)絡(luò)

2024-11-11 10:00:00

ChatGPT模型

2020-07-03 15:19:04

AI 數(shù)據(jù)人工智能

2020-12-23 16:14:04

AI 數(shù)據(jù)人工智能

2024-09-13 12:31:21

谷歌DataGemmaAI

2023-07-14 11:47:08

AI醫(yī)生

2024-05-27 00:00:00

2022-04-24 14:05:02

人工智能深度學(xué)習(xí)量化

2024-04-01 07:00:00

模型AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)