將數(shù)字孿生融入醫(yī)療保健領(lǐng)域的十大基本要素
數(shù)字孿生的核心優(yōu)勢在于集中捕捉數(shù)據(jù)、提升反饋獲取效率并實(shí)施有效干預(yù),從而徹底顛覆我們所熟知的整個(gè)醫(yī)療保健思路。但完成這一目標(biāo)的難點(diǎn),在于實(shí)現(xiàn)模擬所需要的信息往往廣泛分散在各類醫(yī)療記錄、可穿戴設(shè)備、移動(dòng)應(yīng)用以及無處不在的傳感器當(dāng)中。
醫(yī)學(xué)領(lǐng)域的數(shù)字孿生方案可以使用自然語言處理(NLP)、API及圖數(shù)據(jù)庫等原始數(shù)字成分實(shí)現(xiàn)數(shù)據(jù)理解,同時(shí)消除噪音以歸納當(dāng)前客觀模式。更重要的是,研究人員還可以對(duì)這些原始材料進(jìn)行重組以建立起醫(yī)療機(jī)構(gòu)、藥物乃至醫(yī)療設(shè)備的數(shù)字孿生副本,借此改善醫(yī)療效果并降低運(yùn)營成本。目前,其他行業(yè)也已經(jīng)在建筑、產(chǎn)品開發(fā)及供應(yīng)鏈管理中通過類似的方式建立起新的純數(shù)字化工作流程。
“活的”數(shù)據(jù)系統(tǒng)
醫(yī)學(xué)數(shù)字孿生的一大發(fā)展承諾,就是不僅能在生病時(shí)幫助我們摸清問題、治療病癥,甚至有望減緩我們的衰弱速度。專門投資數(shù)字醫(yī)學(xué)初創(chuàng)企業(yè)的OMX Ventures公司董事總經(jīng)理Dan Fero在采訪中表示,“數(shù)字孿生代表著一套「活的」數(shù)據(jù)系統(tǒng),它能夠隨時(shí)間推移持續(xù)接收縱向生物數(shù)據(jù),跟蹤并不斷從變化著的數(shù)據(jù)集中學(xué)習(xí),借此反映人體的當(dāng)前健康狀況乃至持續(xù)健康軌跡。”
這項(xiàng)工作的第一步就是測量并跟蹤生物數(shù)據(jù),例如膽固醇水平、維生素含量與醫(yī)學(xué)成像結(jié)果。此外,系統(tǒng)還需要引入更復(fù)雜的其他數(shù)據(jù)點(diǎn),例如基因組、表觀遺傳、代謝組學(xué)以及免疫功能等數(shù)據(jù)。
Fero解釋道,“目前,我們在面對(duì)這些相互孤立的數(shù)據(jù)集時(shí)已經(jīng)能夠做出「一定程度」的推斷,但還沒有能力把這些數(shù)據(jù)集真正聯(lián)系起來、再借助這種聯(lián)系展望人體未來可能發(fā)生的健康水平變化?!痹谒磥?,下階段的發(fā)展目標(biāo)就是開展數(shù)據(jù)編碼以大規(guī)模創(chuàng)建數(shù)字孿生。現(xiàn)在已經(jīng)有Q Bio等幾家公司投入到這項(xiàng)意義重大的工作中來。
Fero還強(qiáng)調(diào),“我認(rèn)為這將是個(gè)極具吸引力的領(lǐng)域。此領(lǐng)域?qū)⒃诮酉聛淼膸资曛胁粩喟l(fā)展,而這一切的基礎(chǔ)就是我們不斷探索如何獲取新的生物數(shù)據(jù)點(diǎn)、篩選這些數(shù)據(jù)點(diǎn)以把握可能影響健康變化的重要及預(yù)后指標(biāo),將海量數(shù)據(jù)集關(guān)聯(lián)起來以解釋整個(gè)生命體系的運(yùn)作方式,最終找到一條準(zhǔn)確可靠的縱向跟蹤、甚至能夠扭轉(zhuǎn)病患長期健康狀態(tài)的道路。”
很明顯,當(dāng)前構(gòu)建數(shù)字孿生的要素還不夠完備,但我們已經(jīng)看到了一些可喜的希望。下面,我們就一同了解這十大基本要素在醫(yī)學(xué)數(shù)字孿生領(lǐng)域各自發(fā)揮的作用:
電子健康記錄
第一大要素就是記錄系統(tǒng),即醫(yī)療保健行業(yè)的電子健康記錄(EHR)。電子健康記錄系統(tǒng)負(fù)責(zé)收集診療交互、用藥跟蹤、治療計(jì)劃與實(shí)際效果等信息。目前全球領(lǐng)先的電子健康記錄廠商包括Cerner Corporation、Epic Systems以及Meditech等。
這些系統(tǒng)能夠?yàn)獒t(yī)療組織提供靜態(tài)信息基準(zhǔn)。但要想更進(jìn)一步、超越現(xiàn)有醫(yī)療保健流程與跨供應(yīng)商擴(kuò)展,還有很多現(xiàn)實(shí)挑戰(zhàn)需要克服。猶他大學(xué)的一項(xiàng)研究發(fā)現(xiàn),2018年內(nèi)有33%的診療計(jì)劃無法及時(shí)發(fā)現(xiàn)有風(fēng)險(xiǎn)、甚至致命性的藥物配伍錯(cuò)誤。雖然這一結(jié)果已經(jīng)2011年的46%有了很大改善,但與理想狀態(tài)仍有不小的距離。
但目前的電子健康記錄方案普遍提供對(duì)藥物組合的安全檢測功能,所以研究人員們推測導(dǎo)致藥物配伍不能被及時(shí)發(fā)現(xiàn)的原因,很可能是各家醫(yī)院根據(jù)自身工作流程進(jìn)行系統(tǒng)定制時(shí)干擾到了這些檢測功能。最終得出的結(jié)論就是需要投入更多精力以提高數(shù)據(jù)質(zhì)量,并將發(fā)現(xiàn)集成到各家廠商的系統(tǒng)當(dāng)中。
Health Data Analytics Institute(健康數(shù)據(jù)分析研究院)CEO Nassib Chamoun在采訪中提到,“醫(yī)生必須在有限的時(shí)間內(nèi)利用殘缺不全的信息做出幾十項(xiàng)關(guān)于診斷和治療的重要決定。遺憾的是,現(xiàn)有電子健康記錄中的數(shù)據(jù)無論是數(shù)量還是質(zhì)量還遠(yuǎn)遠(yuǎn)跟不上實(shí)際需求?!?/p>
本體
為了在不同組織、不同環(huán)境下準(zhǔn)確描述事物并保證可理解性,語言也就應(yīng)運(yùn)而生。所謂本體,就是借由標(biāo)準(zhǔn)化的數(shù)據(jù)含義及其與其他概念間的聯(lián)系,幫助人們在混亂當(dāng)中建立起秩序。作為典型的跨學(xué)科領(lǐng)域,醫(yī)療行業(yè)也孕育出了豐富的本體。目前美國國家生物醫(yī)學(xué)本體中心已經(jīng)列出953項(xiàng)醫(yī)學(xué)本體,具體包含1300萬個(gè)種類。
Semantic Arts公司(一家專門為業(yè)務(wù)系統(tǒng)提供本體專業(yè)知識(shí)服務(wù)的商業(yè)咨詢企業(yè))總裁、《Data-Centric Revolution》一書作者Dave McComb表示,“醫(yī)學(xué)非常復(fù)雜,無法被整合進(jìn)單一的數(shù)據(jù)模型當(dāng)中?!?/p>
目前已經(jīng)有努力在對(duì)這些浩如煙海的不同本體加以聯(lián)合,其中包括雄心勃勃、定位為全球最詳盡醫(yī)學(xué)本體的SNOMED-CT項(xiàng)目。但McComb也承認(rèn),這些努力還沒有完全解決程序員如何編碼這些數(shù)據(jù)結(jié)構(gòu)的問題,例如如何在命名、驗(yàn)證、安全性、完整性及應(yīng)用代碼等層面準(zhǔn)確表達(dá)含義。但只要邁過這道難關(guān),數(shù)字孿生就有望依靠智能API網(wǎng)關(guān)、NLP與現(xiàn)實(shí)世界證據(jù)平臺(tái)等工具連通各個(gè)數(shù)據(jù)孤島。
圖數(shù)據(jù)庫
圖數(shù)據(jù)庫特別適合把涉及不同概念(例如癥狀與疾病)的異構(gòu)數(shù)據(jù)同醫(yī)療記錄、測試結(jié)果與診斷記錄整合至統(tǒng)一的系統(tǒng)當(dāng)中。從實(shí)踐層面來看,相當(dāng)一部分?jǐn)?shù)字孿生用例也都要求把不同類型、不同來源的數(shù)據(jù)紡織起來以探索其中的模式,所以圖數(shù)據(jù)庫自然可以為此貢獻(xiàn)力量。
Neo4J圖數(shù)據(jù)科學(xué)總監(jiān)Alicia Frame在采訪中表示,“我們發(fā)現(xiàn)已經(jīng)有很多制藥和保險(xiǎn)企業(yè)利用圖數(shù)據(jù)庫技術(shù)從電子健康記錄中獲得大量有價(jià)值信息——包括將電子健康數(shù)據(jù)導(dǎo)入圖數(shù)據(jù)庫以摸清因果關(guān)系,或者快速發(fā)現(xiàn)異常的行為模式等。”以制藥界巨頭阿斯利康為例,他們就使用電子健康記錄數(shù)據(jù)與圖數(shù)據(jù)庫跟蹤上市新藥、改善患者治療效果。
某大型保險(xiǎn)公司就利用TigerGraph圖數(shù)據(jù)庫整合了200多個(gè)數(shù)據(jù)源,借此提高了呼叫中心服務(wù)過程中查詢患者病歷記錄的效率。以此為基礎(chǔ),客服人員能夠快速調(diào)出全部診斷、索賠、處主補(bǔ)充及咨詢通話等信息,將呼叫中心的單位處理時(shí)長縮短了十分之一、也成功提高了反映客戶滿意度的凈推薦值。
但Frame也發(fā)現(xiàn),在Epic、Cerner等醫(yī)院當(dāng)中,圖數(shù)據(jù)庫還較少被作為電子健康記錄的配套數(shù)據(jù)庫。她感嘆道,“我個(gè)人認(rèn)為這種滯后源自陳舊技術(shù)的遺留影響,也反映出存儲(chǔ)健康記錄數(shù)據(jù)與理解記錄數(shù)據(jù)間仍然存在鴻溝——相信在逐步推廣之后,圖數(shù)據(jù)庫能夠幫助院方打通這些孤島。”
展望未來,TigerGraph醫(yī)療保健行業(yè)實(shí)踐負(fù)責(zé)人Andrew Anderson認(rèn)為圖數(shù)據(jù)庫必將在構(gòu)建社群數(shù)字孿生、衡量并改善人口健康方面發(fā)揮更大的作用。他表示,“只有將醫(yī)療信息與社會(huì)層面的決定性健康影響因素進(jìn)行對(duì)比,才能把握并解決護(hù)理服務(wù)供應(yīng)、食品安全問題、人口統(tǒng)計(jì)與財(cái)務(wù)差異等難題。”
API
無論建模對(duì)象是患者個(gè)人還是醫(yī)療機(jī)構(gòu),數(shù)字孿生都需要使用大量原始數(shù)據(jù)素材,具體涵蓋電子健康記錄(EHR)、疾病登記、可穿戴設(shè)備等。Change Healthcare的Cautam Shah在采訪中指出,“無論配合哪種模型,API都有助于提升數(shù)字孿生效率、擴(kuò)展使用范圍,進(jìn)而改善醫(yī)療保健的成本與質(zhì)量曲線?!?/p>
Shah還提到,“但多數(shù)情況下,醫(yī)療數(shù)據(jù)的來源與格式都太過分散?!边@時(shí)候就需要API協(xié)助解決跨來源數(shù)據(jù)命名、組織與管理等層面的具體問題。再有,API還能減少數(shù)據(jù)的收集、關(guān)聯(lián)與準(zhǔn)備時(shí)間,確保研究人員能夠?qū)W⒂诎l(fā)掘數(shù)字孿生中的實(shí)際價(jià)值。
現(xiàn)代API平臺(tái)已經(jīng)超越傳統(tǒng)數(shù)據(jù)傳輸管道,逐步發(fā)展成智能連接體系。例如,API能夠幫助我們構(gòu)建起精準(zhǔn)醫(yī)學(xué)中的數(shù)字孿生副本,及時(shí)捕捉反饋與數(shù)據(jù)并將結(jié)果傳遞回孿生副本,從而不斷更新數(shù)字孿生模型。
自然語言處理
醫(yī)療數(shù)據(jù)的來源多種多樣,繁雜的信息往往令我們無法準(zhǔn)確把握患者的整體情況。而一旦將目標(biāo)投向大規(guī)模人群,復(fù)雜度又將呈現(xiàn)指數(shù)級(jí)增長。John Snow Labs首席技術(shù)官David Talby表示,“數(shù)字孿生有助于消除信息過載,改善整體護(hù)理成效。今天,人類生成的數(shù)據(jù)比以往任何時(shí)候都多,根本不可能再額外花時(shí)間對(duì)數(shù)據(jù)進(jìn)行整理?!彼援?dāng)病人接受初級(jí)保健醫(yī)生的診療時(shí),患者的個(gè)人情況、病史和用藥史就會(huì)被記錄在案。如果病情未能好轉(zhuǎn)、轉(zhuǎn)由??漆t(yī)生接診時(shí),這些信息就能避免患者重復(fù)回答同樣的問題。
另外,臨床NLP軟件還能從圖像與無格式文本數(shù)據(jù)中提取信息,再將內(nèi)容填寫到電子健康記錄當(dāng)中。例如,Roche就使用NLP技術(shù)建立起臨床決策支持方案,而且起步就指向腫瘤學(xué)領(lǐng)域。NLP能夠從病理學(xué)和放射學(xué)報(bào)告中提取臨床事實(shí),再把這些事實(shí)與非結(jié)構(gòu)化的無格式文本信息結(jié)合起來,更好地支持醫(yī)生的臨床決策。
結(jié)構(gòu)化數(shù)據(jù)往往包含大量細(xì)節(jié),例如患者是否患有慢性病、是否服用過治療藥物或者有過醫(yī)療保險(xiǎn)。但真正影響診治狀態(tài)的卻往往是其他更復(fù)雜的因素,例如疼痛程度、食欲和睡眠狀態(tài)等,這些只能從無格式文本中找尋。NLP的介入無疑給找尋開辟了通路。
生物模擬
生物模擬屬于計(jì)算機(jī)輔助數(shù)學(xué)模擬的范疇,能夠模擬服用一定劑量的藥物之后、人體會(huì)發(fā)生哪些變化。這是一種規(guī)模龐大的復(fù)雜模型,能夠模擬藥物在體內(nèi)的運(yùn)輸、代謝、排泄與起效機(jī)制,改善用藥安全與效果。所以這樣的模型越強(qiáng),價(jià)值2000億美元的全球藥物研發(fā)行業(yè)就能獲得更大的發(fā)展驅(qū)動(dòng)力。Certara公司CEO William Feehery博士在采訪中提到,“過去幾十年以來,生物模擬軟件平臺(tái)已經(jīng)給藥物研發(fā)帶來過重大變革,預(yù)計(jì)這一趨勢將繼續(xù)保持下去?!?/p>
美國食品藥監(jiān)局(FDA)與歐洲藥品管理局(EMA)先后發(fā)布過二十多份建模與模擬相關(guān)指導(dǎo)文件,希望摸清藥物配伍時(shí)的相互作用。過去十年以來,包含生物模擬內(nèi)容的科學(xué)出版物數(shù)量也增加了兩倍。
目前最具前景的方向之一就是藥理生物模擬,即整合藥物與生理信息以建立數(shù)學(xué)建模框架。這類模型能夠預(yù)測各類未經(jīng)測試的臨床結(jié)果,從而助力藥物研發(fā)。Certara等公司希望為患者個(gè)體建立數(shù)字孿生,從而把生物模擬的邊界繼續(xù)向外拓展。其中的基本原理就是重現(xiàn)每位患者的不同生理特征,探索這些特征如何影響藥物在體內(nèi)的代謝動(dòng)力表現(xiàn)、進(jìn)而影響最終治療效果。
這些進(jìn)展也讓我們能夠更好地針對(duì)不同患者亞群(例如老人與兒童)設(shè)定用藥劑量。Feehery表示,“我們的下階段目標(biāo),就是將虛擬孿生技術(shù)引入病患護(hù)理與臨床決策,為個(gè)性化醫(yī)療提供指導(dǎo)?!?/p>
真實(shí)世界證據(jù)
研究人員往往需要通過多種來源查詢數(shù)據(jù),借此深入理解特定問題。而真實(shí)世界證據(jù)(RWE)平臺(tái)的定位就是匯總并審查原始數(shù)據(jù),確保這些正確的數(shù)據(jù)可以反映出關(guān)鍵決策中的因果關(guān)系。2020年美國食品藥監(jiān)局批準(zhǔn)的所有新藥中,約有75%涉及某種形式的真實(shí)世界證據(jù)。這類數(shù)據(jù)可以來自電子健康記錄、保險(xiǎn)索賠、產(chǎn)品與疾病登記、醫(yī)療設(shè)備與可穿戴設(shè)備等等。由于數(shù)據(jù)來源過多、彼此間又有著諸多互操作性限制,所以如何收集完整且高質(zhì)量的數(shù)據(jù)一直是個(gè)重大難題。
Aetion公司高級(jí)副總裁兼副本分析總經(jīng)理Khaled El Emam博士認(rèn)為,“這些平臺(tái)能夠幫助客戶推斷出研究人員在源數(shù)據(jù)中發(fā)現(xiàn)因果關(guān)系的依據(jù),由此提升合成數(shù)據(jù)或數(shù)字孿生的價(jià)值。如果沒有真實(shí)世界證據(jù)平臺(tái)提供適當(dāng)?shù)纳舷挛闹С?,研究人員將很難從數(shù)字孿生中分析出直觀可見的模式?!?/p>
除了醫(yī)療保健之外,真實(shí)世界證據(jù)平臺(tái)在保障建筑物、車輛及其他產(chǎn)品安全等方面,也給高度強(qiáng)調(diào)安全性的行業(yè)帶來了福音。El Emam指出,“保障質(zhì)量與可行性標(biāo)準(zhǔn)是真實(shí)世界證據(jù)流程中的重要組成部分。我們也應(yīng)該將這些標(biāo)準(zhǔn)引入整個(gè)真實(shí)世界證據(jù)的生成過程,確保從數(shù)據(jù)源、數(shù)據(jù)處理再到適用場景定義,各個(gè)環(huán)節(jié)都穩(wěn)定可靠?!?/p>
手術(shù)智能
手術(shù)智能是Theator公司提出的一個(gè)新概念,強(qiáng)調(diào)通過工具捕捉手術(shù)過程中的各項(xiàng)數(shù)據(jù)。Theator公司CEO兼聯(lián)合創(chuàng)始人Tamir Wolf博士解釋道,“其中的創(chuàng)新不僅體現(xiàn)在我們建立的數(shù)據(jù)結(jié)構(gòu)與新本體上,更在于外科醫(yī)生在手術(shù)完成后能夠立即收到準(zhǔn)確反饋。”
手術(shù)智能其實(shí)與Drishti、Tulip Interfaces等制造與物流企業(yè)已經(jīng)實(shí)施的物理流程捕捉工具類似。在醫(yī)學(xué)領(lǐng)域,這些工具將幫助外科醫(yī)生在手術(shù)過程中進(jìn)行操作校正,同時(shí)捕捉手術(shù)操作中的每一個(gè)微小細(xì)節(jié)。
Wolf表示,“醫(yī)院系統(tǒng)要想有效部署數(shù)字孿生,最關(guān)鍵的前提之一就是要能夠收集關(guān)于治療需求的高質(zhì)量數(shù)據(jù),這樣才能將目標(biāo)與實(shí)效聯(lián)系起來、總結(jié)出值得推廣的最佳實(shí)踐?!?/p>
預(yù)測分析
數(shù)字孿生還有另一個(gè)極具前景的探索方向,就是幫助我們預(yù)測特定癥狀組合發(fā)生幾率,而后評(píng)估各種治療組合幫助患者恢復(fù)健康的可能性。預(yù)測分析工具可以與數(shù)字孿生技術(shù)協(xié)同,將患者的數(shù)字孿生與其他具有相似特征的以往病患進(jìn)行匹配和比對(duì)。
Health Data Analytics Institute CEO Nassib Chamoun認(rèn)為,“先進(jìn)的統(tǒng)計(jì)技術(shù)有望幫助我們預(yù)估健康風(fēng)險(xiǎn),幫助臨床醫(yī)生推斷哪些既有治療手段對(duì)這類患者更加有效,之后做出更明智的診療決策。”簡而言之,預(yù)測分析工具可以幫助預(yù)測不同治療方案的成本和臨床結(jié)果。
預(yù)測分析還能與數(shù)字孿生攜手提供不同的UI體驗(yàn),隨時(shí)交付各類洞見結(jié)論。例如,HDAI就為臨床醫(yī)生、患者和人口健康管理員開發(fā)出自定義視圖。臨床醫(yī)生的意見可以直接嵌入至電子健康記錄,管理員與患者自己的意見也可嵌入各類應(yīng)用端。
可視化
醫(yī)學(xué)影像的顯影效果再逼真,摸不清其中表達(dá)的規(guī)律和趨勢還是沒有意義。例如,更深入的洞見結(jié)論能幫助醫(yī)生們更好地使用醫(yī)學(xué)影像,據(jù)此確定該選擇多大的植入物、具體植入到哪里。FEops公司CEO Matthieu De Beule表示,“說起來容易,但實(shí)際判斷其實(shí)非常困難。我們很難單憑想象來斷定醫(yī)療設(shè)備會(huì)怎樣與患者的身體進(jìn)行交互。”
經(jīng)過監(jiān)管認(rèn)證的器官醫(yī)學(xué)數(shù)字孿生能夠改善手術(shù)計(jì)劃與指導(dǎo)思路。例如,F(xiàn)Eops公司開發(fā)出一種獲得審批的心臟模擬工具,能夠縮短手術(shù)操作與輻射下的暴露時(shí)間。多家主要心臟瓣膜制造商也打算利用這款工具開發(fā)下一代植入方案。
De Beule還提到,他們公司正在與GE、飛利浦和西門子等大型醫(yī)學(xué)成像公司合作。FEops HEARTguide產(chǎn)品使用AI技術(shù)對(duì)原始成像數(shù)據(jù)進(jìn)行校準(zhǔn),確保其能夠反映患者獨(dú)特的解剖特征與生理構(gòu)造,從而指導(dǎo)醫(yī)生在手術(shù)過程中為植入物選擇更恰當(dāng)?shù)奈恢谩?/p>