人工智能輔助診療發(fā)展現(xiàn)狀與戰(zhàn)略研究
一、前言
每年我國各類醫(yī)療機構(gòu)診療總?cè)舜纬^70億次,且存在醫(yī)療資源分配不均、布局結(jié)構(gòu)不合理等問題,醫(yī)療衛(wèi)生行業(yè)面臨巨大的服務需求壓力。隨著醫(yī)療信息化的快速發(fā)展,電子病歷和健康檔案的實行,產(chǎn)生了大量的文檔、表格、圖像、語音等多媒體信息。利用人工智能技術輔助開展醫(yī)療過程,對數(shù)據(jù)進行整合分析,為提升醫(yī)療衛(wèi)生服務能力,解決醫(yī)療資源緊缺帶來了新契機。
2017年7月,國務院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中提到,應深化人工智能在智能醫(yī)療領域的應用,推廣應用人工智能診療新模式、新手段,建立快速精準的智能醫(yī)療體系。人工智能技術能夠?qū)Υ笠?guī)模開放式醫(yī)療數(shù)據(jù)的語義進行分析、挖掘和理解,實現(xiàn)對醫(yī)學語義網(wǎng)絡和知識中心的自動構(gòu)建。通過對海量的醫(yī)學文獻、病例數(shù)據(jù)和診療方案進行快速檢索,分析數(shù)據(jù)之間的隱含關系,能夠開展輔助診療、藥物研發(fā)等問題的研究,推動醫(yī)療技術的進步。通過對醫(yī)學影像的智能分析,能夠準確提取特征,定位病灶,為疾病預防與診斷提供幫助。此外,語音識別、視頻理解、智能問答等技術能夠在輔助病歷記錄、臨床護理、康復指導、自動導診等諸多領域展開應用。
實現(xiàn)醫(yī)療信息和健康數(shù)據(jù)的融合、開放共享,并利用人工智能對碎片化醫(yī)學信息進行整理分析,對醫(yī)療診斷過程提供輔助,可改善醫(yī)療健康服務,促進政府決策合理化,解決醫(yī)療衛(wèi)生資源配置不均衡問題,是人工智能與醫(yī)療領域的最直接應用,也是醫(yī)療人工智能發(fā)展的重點。本文選取健康醫(yī)療信息人機交互、數(shù)據(jù)智能中的語義理解與醫(yī)學影像分析作為切入點,簡要闡述了人工智能在輔助診療問題上的發(fā)展方向與現(xiàn)狀,討論了智能診療技術發(fā)展與應用的問題與挑戰(zhàn),為相關部門提供決策支持。
二、醫(yī)療信息語義理解與影像分析發(fā)展現(xiàn)狀
目前,利用人工智能技術對疾病進行臨床診斷 的研究主要圍繞兩方面展開:一是對海量醫(yī)學數(shù)據(jù) 進行分析處理,通過推理、分析、對比、歸納、總 結(jié)和論證,從大量數(shù)據(jù)中快速提取關鍵信息,對患 者身體狀態(tài)和患病情況得出認知結(jié)論 [1,2];二是通過對文字、音頻、圖像、視頻等多媒體形式的診斷 數(shù)據(jù)進行分析與理解,挖掘和區(qū)分病情特征,進行 診斷和評估 [3]。其中,醫(yī)學信息的標準化表征和 結(jié)構(gòu)化整合是實現(xiàn)基于大數(shù)據(jù)智能手段進行輔助診 斷的基礎;而醫(yī)學影像數(shù)據(jù)作為一種能夠準確、直 觀反映病情表征狀態(tài)的重要診斷依據(jù),加之深度學 習技術在圖像特征提取方面的突破性進展,成為當 前人工智能與輔助診斷結(jié)合最緊密的領域之一。本 節(jié)將從醫(yī)療信息語義理解與醫(yī)學影像分析兩方面的 研究現(xiàn)狀入手,對人工智能輔助診療的發(fā)展現(xiàn)狀進 行分析。
(一)醫(yī)學知識圖譜與醫(yī)學術語標準構(gòu)建
醫(yī)療健康信息化的推進積累了海量的醫(yī)學數(shù)據(jù)。轉(zhuǎn)化自然語言的原始數(shù)據(jù)表達方式,整合提煉不同來源的數(shù)據(jù),形成標準化信息,建立結(jié)構(gòu)統(tǒng)一的信息化醫(yī)學檔案,不僅方便對醫(yī)學數(shù)據(jù)進行存儲、整理和查找,也有利于與人工智能技術相結(jié)合。
知識圖譜作為一種應對互聯(lián)網(wǎng)當中海量而零散信息的高效檢索需求所設計的語義網(wǎng)絡結(jié)構(gòu),對大規(guī)模數(shù)據(jù)及數(shù)據(jù)實體之間的關系具有很強的表達和管理能力。通過對海量的醫(yī)學概念、實體、關系及事實進行整合,能夠有效表示實體間的語義關系。將醫(yī)療機構(gòu)、醫(yī)藥產(chǎn)品、診療病例、健康監(jiān)測數(shù)據(jù)、基因數(shù)據(jù)、健康飲食數(shù)據(jù)、運動數(shù)據(jù)等相關數(shù)據(jù)與圖譜進行鏈接并在時間維度上進行延展,是構(gòu)建個性化、動態(tài)、多模態(tài)、可語義理解并用于人工智能輔助決策的健康醫(yī)療信息的基礎?;谥R圖譜既能夠進行高效的信息檢索、查詢,也能夠基于已有信息進行推理,挖掘隱含知識,開展科普查詢、輔助診療、臨床決策、藥物研發(fā)、智能導醫(yī)等相關應用的研究[4,5],提高醫(yī)生及醫(yī)院的工作效率,提供針對分級診療的智能輔助。
目前,通用知識圖譜的應用已經(jīng)十分廣泛,如GoogleKnowledgeGraph、Yago、DBpedia、搜狗“知立方”等。大型知識圖譜的構(gòu)建是在融合“在線百科全書”等結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)的基礎上,利用實體抽取、實體鏈接、關系抽取、屬性填充等技術,對不斷產(chǎn)生的不同來源、不同格式的開放式非結(jié)構(gòu)化信息進行抽取,并通過知識融合、知識驗證實現(xiàn)對知識圖譜的擴充和更新[6]。
作為知識圖譜重要的垂直應用領域,醫(yī)學知識圖譜的發(fā)展也早已引起國內(nèi)外的關注。醫(yī)學知識圖 譜構(gòu)建在對醫(yī)學知識進行全面整理的基礎上,對關 鍵醫(yī)學知識和基本概念進行嚴格定義,形成權威、 準確的醫(yī)學本體描述規(guī)范,方便對不同學科、不同 專業(yè)和不同來源的數(shù)據(jù)進行融合與驗證,形成語義 網(wǎng)絡,為臨床數(shù)據(jù)標引、醫(yī)療信息存儲、檢索和聚 合提供便利。耶魯大學通過整合神經(jīng)科學知識庫 SenseLab[7],構(gòu)建了包含從微觀分子層面到宏觀行 為層面的腦科學知識圖譜,幫助人類理解和表示神 經(jīng)科學領域海量信息之間的關聯(lián)。由國際衛(wèi)生術語 標準制定組織(IHTSDO)維護的醫(yī)學本體知識庫 SNOMED CT[8],包含了超過 31 萬個具有獨立編 號的醫(yī)學相關的本體,以及超過 136 萬個本體間的 相關關系,廣泛應用于電子病歷、基因數(shù)據(jù)庫、檢 驗結(jié)果報告和計算機輔助醫(yī)囑錄入等多個領域。由 美國國立醫(yī)學圖書館(NLM)建設的一體化醫(yī)學 知識語言 UMLS[9],整合了 100 多部受控詞表和分 類體系,包含了超過 100 萬個生物醫(yī)學概念和超過 500 萬個概念名稱。UMLS 對不同詞表在不同領域 當中的應用進行聯(lián)通,具有跨語言、跨領域和工具 化的特點,在信息檢索、自然語言處理、電子病歷 和健康數(shù)據(jù)標準方面得到廣泛應用。
我國對臨床術語的探索起步較晚,目前還未形 成一套完整的、廣泛應用的術語標準。中國中醫(yī)科 學院中醫(yī)藥信息研究所研制的中醫(yī)藥學語言系統(tǒng)包 含超過 12 萬個概念,60 萬個術語和 127 萬個語義 關系的大型語義網(wǎng)絡,構(gòu)建了中醫(yī)藥知識圖譜 [10]。 但該系統(tǒng)存在構(gòu)建定位局限、內(nèi)容不夠完善等問 題,尚未得到廣泛應用。此外,國內(nèi)醫(yī)療衛(wèi)生領域 的相關機構(gòu)和個人發(fā)起成立了開放醫(yī)療與健康聯(lián)盟 (OMAHA),通過行業(yè)協(xié)作、開源開放的方式來實 現(xiàn)健康信息技術的標準化。2017 年 5 月,OMAHA 啟動了醫(yī)學術語協(xié)作項目,致力于通過眾包協(xié)作的 方式構(gòu)建中文醫(yī)學術語標準。
(二)人工智能醫(yī)學影像分析
傳統(tǒng)基于機器學習的醫(yī)學影像研究圍繞醫(yī)生指定的圖像特征展開研究,這使得模型只能圍繞指定特征進行判斷,導致模型泛化能力弱,且難以對病情發(fā)展程度進行分類。而深度學習模型具備良好的圖像特征提取能力,能夠?qū)θ祟愲y以分辨和容易忽略的特征進行準確提取和有效分析,從而取得更高的準確率。
基于人工智能的醫(yī)學影像研究圍繞電子計算機斷層掃描(CT)、核磁共振(MRI)、X射線、超聲波、內(nèi)窺鏡和病理切片等多種類型的醫(yī)學圖像分析展開,對包括肺、乳腺、皮膚、腦部疾病和眼底病變等展開研究。對于部分疾病,人工智能診斷和分析的準確率已達到專業(yè)醫(yī)生的水準。
視網(wǎng)膜“糖網(wǎng)”病變是糖尿病的一種典型癥狀。GoogleDeepMindHealth團隊將深度學習模型應用到視網(wǎng)膜“糖網(wǎng)”病變分類問題當中,通過準確檢測視網(wǎng)膜眼底圖像的病變情況對糖尿病黃斑水腫程度進行分級,對測試者進行病情預警和診斷。研究團隊利用12.8萬張視網(wǎng)膜眼底圖像對深度學習模型進行訓練,在測試過程中取得了97.5%的靈敏性和93.4%的特異性,判斷準確率與人類專業(yè)醫(yī)生相當。
國內(nèi)利用人工智能技術開展醫(yī)學影像進行分 析的研究也已收獲成果。某眼科中心研發(fā)的人工智 能診斷平臺 [11] 能夠利用深度學習模型對先天性 白內(nèi)障進行檢測,利用晶狀體不透明面積、深淺和 位置三大指標對患者的患病幾率進行危險評估,并 根據(jù)診斷結(jié)果輔助眼科醫(yī)師進行治療決策。通過實 驗對先天性白內(nèi)障的診斷準確率達到 98.87 %,三 項指標(不透明面積、深淺和位置)準確率分別為 93.98 %、95.06 % 和 95.12 %。在輔助決策方面,為 醫(yī)師提供建議的準確率達到 97.56 %。
目前,基于深度學習的醫(yī)學影像分析主要是利 用深度學習模型對圖像特征的提取能力,完成病灶 區(qū)域識別和病情病種分類。盡管這類技術能夠取得 較高的準確率,但其結(jié)果缺乏對判斷依據(jù)的描述, 難以與人類醫(yī)生的思路相結(jié)合,難以投入實際應用。 因此,醫(yī)學影像分析需進一步結(jié)合注意力機制等技 術 [12],尋求得到符合人類思維邏輯的分析結(jié)果。
斯坦福大學提出的 CheXNet 深度卷積神經(jīng)網(wǎng)絡 模型,在利用胸部 X 線片對肺炎患者的患病情況進 行判斷的基礎上,考慮了模型的可解釋性。該模型 利用 DenseNet 深度神經(jīng)網(wǎng)絡模型對圖像特征進行 分析,不僅在利用胸部 X 線片作為診斷依據(jù)的情況 下,精度超過人類醫(yī)生的平均水平,還通過計算模 型每個像素點上的各類圖像特征的權值之和,衡量 圖像各位置在分類決策中的重要性,解釋決策過程, 幫助人類醫(yī)生對患者病情進行理解??突仿〈?學邢波教授組近期提出一個多任務協(xié)同框架,通過引入?yún)f(xié)同注意力機制,來對異常區(qū)域進行準確定位 和概括。不僅通過標簽對圖像內(nèi)容進行描述,還利 用層級長短期記憶(LSTM)模型生成長文本形式 的醫(yī)學影像分析報告,通過文字描述對分析結(jié)果進 行描述和解釋 [13]。
除了直接通過對醫(yī)學影像圖片進行特征提取的 方式來進行病情預測與診斷外,還能夠通過影像對 人體結(jié)構(gòu)進行三維建模,實現(xiàn)對內(nèi)鏡機器人等微型 診療設備在人體內(nèi)的定位和識別 [14,15],提供更加 豐富的醫(yī)療數(shù)據(jù)采集方式。采用無監(jiān)督學習等方式 對醫(yī)學影像特征進行提取分析,減少對數(shù)據(jù)標注的 依賴,方便醫(yī)學影像分析過程的開展 [16],也是當 前醫(yī)學影像研究的重要內(nèi)容。此外,目前主要的醫(yī) 學影像研究僅圍繞影像數(shù)據(jù)本身展開。利用海量醫(yī) 學知識,構(gòu)建多模態(tài)數(shù)據(jù)采集分析與結(jié)構(gòu)化知識推 理相結(jié)合的智能診療模型,將成為醫(yī)學影像分析的 未來發(fā)展方向之一。
三、我國人工智能輔助診斷發(fā)展存在的難點與挑戰(zhàn)
(一)醫(yī)療信息化程度問題
人工智能技術以數(shù)據(jù)驅(qū)動為主體,構(gòu)建內(nèi)容齊全、結(jié)構(gòu)統(tǒng)一的醫(yī)學健康大數(shù)據(jù)能夠為人工智能在醫(yī)療診療領域的研究提供有力支持,也有助于智能診療技術的應用與推廣。
近年來,我國在全面提升醫(yī)療信息化水平方面做出了巨大努力。自2010年以來,國家財政多次撥款,加大各地醫(yī)療信息化建設力度,推進國家、省級、區(qū)域三級衛(wèi)生信息平臺建設。目前,我國的區(qū)域醫(yī)療信息化覆蓋率較高,計算機基礎設施基本實現(xiàn)廣泛覆蓋,省、市級醫(yī)院已基本實現(xiàn)全面信息化管理。但應對人工智能輔助醫(yī)療的新形勢,尚存在許多問題:一方面,不同地區(qū)、不同機構(gòu)間的醫(yī)療信息化發(fā)展程度存在較大差異,利用信息化手段解決醫(yī)療衛(wèi)生問題的技能與思想尚未得到有效普及;另一方面,各機構(gòu)之間的醫(yī)療信息化平臺缺乏協(xié)同性,不同平臺、不同版本之間缺乏標準化信息交換接口,機構(gòu)之間信息交流不暢,缺乏對醫(yī)療數(shù)據(jù)的統(tǒng)一管理與長期存儲。此外,醫(yī)療信息的產(chǎn)生過程和質(zhì)量的控制也制約著人工智能相關技術的應用深度,構(gòu)建共享、開放、規(guī)?;?、高質(zhì)量的面向?qū)I(yè)疾病的智能輔助分析決策、新藥研發(fā)、公共衛(wèi)生決策的統(tǒng)一醫(yī)療健康大數(shù)據(jù)是重要而長期的工作任務。建立國家級的健康醫(yī)療大數(shù)據(jù)云平臺,開放數(shù)據(jù)市場,制定醫(yī)院服務中數(shù)據(jù)還給患者的方式方法,服務流程標準及收費規(guī)范,以個體的應用以及交易帶動健康醫(yī)療數(shù)據(jù)市場化的發(fā)展,從而開辟新的數(shù)據(jù)和信息整合、知識發(fā)現(xiàn)及服務市場。
(二)醫(yī)療工作者參與度問題
不論是構(gòu)建規(guī)范統(tǒng)一的醫(yī)學信息系統(tǒng)和內(nèi)容準確完備的知識圖譜,還是設計實現(xiàn)針對特定疾病的輔助診療系統(tǒng),都需要獲取權威的醫(yī)學知識和豐富的臨床經(jīng)驗,經(jīng)驗豐富的醫(yī)生與醫(yī)學專家的參與和指導至關重要。但在現(xiàn)階段,我國存在人口眾多,人均優(yōu)質(zhì)醫(yī)療衛(wèi)生資源匱乏的問題,一些醫(yī)生與專家雖期待人工智能能夠為診療方式帶來變革,但往往忙于臨床診療,難以投入大量精力參與到相關研究工作當中。因此,需要在跨領域協(xié)作組織和激勵機制上進行改善,成立相應的創(chuàng)新中心,部署新穎的科技計劃,實施有效的“產(chǎn)學研”一體化策略,推動該領域快速健康發(fā)展。
(三)人工智能技術與醫(yī)療設備結(jié)合問題
相比于醫(yī)療器械強國,我國醫(yī)療器械研發(fā)技術 的創(chuàng)新能力依然不足,核心技術開發(fā)能力不強,原 創(chuàng)核心技術較少,低端產(chǎn)品較多,關鍵零部件依賴 進口,高端產(chǎn)品依然以仿制和改進為主 [17]。缺乏 高端醫(yī)療設備的開發(fā)能力與自主知識產(chǎn)權,使得人 工智能技術難以實現(xiàn)在國產(chǎn)高端醫(yī)療設備上的關聯(lián) 與部署,這使得構(gòu)建信息采集、分析處理與整合存 儲的一體化信息化醫(yī)療系統(tǒng)難度進一步增大。醫(yī)療 器械自主研發(fā)與生產(chǎn)能力不足,導致高端醫(yī)療器械 與設備依賴進口,價格昂貴,難以在基層醫(yī)療機構(gòu) 實現(xiàn)全面部署,也是當前醫(yī)療人工智能系統(tǒng)的推廣 和普及所面臨的困難,并制約我國醫(yī)療產(chǎn)業(yè)的升級 轉(zhuǎn)型。有針對性地制定企業(yè)在該領域的創(chuàng)新發(fā)展策 略,鼓勵企業(yè)跨國并購該領域的優(yōu)秀國外傳統(tǒng)醫(yī)療 器械制造企業(yè),相應的醫(yī)療器械與人工智能相結(jié)合 的產(chǎn)品在稅收、審批、補助以及等級醫(yī)院在國產(chǎn)人 工智能設備采購上給予相關的政策傾斜,助力我國 在前沿市場上發(fā)力成為新一輪產(chǎn)業(yè)的領導者。
四、人工智能輔助診療的發(fā)展建議
(一)構(gòu)建開放共享的健康醫(yī)療信息環(huán)境
人工智能輔助診療以大數(shù)據(jù)智能作為基礎,需要解決醫(yī)療健康數(shù)據(jù)碎片化的問題,實現(xiàn)從數(shù)據(jù)到知識,從知識到智能的跨躍,打穿數(shù)據(jù)孤島,建立鏈接個人和醫(yī)療機構(gòu)的跨領域醫(yī)療知識中心,形成開放式、互聯(lián)互通的醫(yī)療信息共享機制。
首先,我國應著手建立一套完備的中文醫(yī)學本體知識庫,對目前主要的醫(yī)學本體內(nèi)容制定統(tǒng)一的描述規(guī)范,建立完善的分類編碼描述方式,對內(nèi)容進行管理,定期進行修改和補充。
其次,應整合不同來源、不同類型的醫(yī)療數(shù)據(jù),依照統(tǒng)一標準,開展針對不同醫(yī)學學科、醫(yī)療領域、醫(yī)療機構(gòu)和具體應用的醫(yī)學知識圖譜構(gòu)建工作,完善數(shù)字化中文醫(yī)學體系,推動信息化醫(yī)學語義網(wǎng)絡的構(gòu)建,并在此基礎上開發(fā)醫(yī)學概念查詢、文獻檢索等工具,為醫(yī)療工作者提供權威、準確的醫(yī)學信息查詢渠道。
最后,應構(gòu)建開放共享的健康醫(yī)療大數(shù)據(jù)云平臺。建議對各級醫(yī)療機構(gòu)、各種健康信息數(shù)據(jù)源、公共醫(yī)療健康服務機構(gòu)的信息進行統(tǒng)一管理,實現(xiàn)對個體健康檔案、生物樣本、基因序列、醫(yī)療保健、行為方式甚至生活環(huán)境等數(shù)據(jù)的高度整合;另一方面,在現(xiàn)有醫(yī)療信息化平臺的基礎上進行標準化改良,統(tǒng)一數(shù)據(jù)格式和描述規(guī)范,實現(xiàn)不同機構(gòu)、不同來源信息存儲與表達的規(guī)范化。利用標準化信息接口串聯(lián)各機構(gòu)數(shù)據(jù),優(yōu)化健康醫(yī)療信息管理結(jié)構(gòu),實現(xiàn)健康醫(yī)療信息系統(tǒng)的實時、同步更新,實現(xiàn)各級、各機構(gòu)間的健康醫(yī)療信息共享網(wǎng)絡。
(二)建立人機結(jié)合的新型醫(yī)療發(fā)展體系
利用人工智能參與診療過程,不是讓人工智能取代醫(yī)生,而是應當構(gòu)建人機協(xié)同的新型醫(yī)療診療體系,將生物智能與人工智能相結(jié)合。在利用認知模型實現(xiàn)人工智能系統(tǒng)知識更新的同時,提升人類對醫(yī)學領域的認知水平。
在醫(yī)療設備方面,應加強國產(chǎn)高端醫(yī)療器械的研發(fā)力度,推動智能化醫(yī)療器械和智能可穿戴式設備的研發(fā),實現(xiàn)醫(yī)療器械與信息化醫(yī)療數(shù)據(jù)管理平臺的數(shù)據(jù)對接,方便人工智能系統(tǒng)的部署。
在醫(yī)療人員方面,應當建立醫(yī)學信息化人才 培養(yǎng)體系,加強醫(yī)療工作者利用人工智能輔助醫(yī)療 流程的思維方式與能力,改變傳統(tǒng)的工作流程與習 慣 [18]。同時,應當鼓勵醫(yī)療工作者參與人工智能 與醫(yī)療結(jié)合的相關研究,將人工智能作為研究醫(yī)學、 了解醫(yī)學的新手段,促進醫(yī)學理論的更新與發(fā)展。 最后,還應當將人工智能應用到醫(yī)療衛(wèi)生教育與培 訓過程中,改進傳統(tǒng)教育與培訓模式,縮短高水平 醫(yī)務人員的培訓周期。
(三)推動相關制度的制定與完善
智能診療系統(tǒng)投入實際應用,需要依照相關規(guī)定和標準進行開發(fā)、生產(chǎn)和審批。較之發(fā)達國家,我國尚未構(gòu)建醫(yī)療信息產(chǎn)業(yè)的一些基礎行業(yè)標準,也未針對智能輔助診療系統(tǒng)的開發(fā)和應用制定適宜的行業(yè)監(jiān)管制度。應當盡快制定與技術進展相匹配的醫(yī)療信息與人工智能系統(tǒng)的行業(yè)標準,為相關系統(tǒng)和設備投入市場化運營提供制度與監(jiān)管上的支持。