醫(yī)療健康大數(shù)據(jù)關(guān)鍵問題及對策研究
1.醫(yī)療健康大數(shù)據(jù)應(yīng)用研究現(xiàn)狀和意義
在醫(yī)療衛(wèi)生領(lǐng)域,我國對大數(shù)據(jù)技術(shù)的應(yīng)用成熟度還不高。如何將傳統(tǒng)的醫(yī)療數(shù)據(jù)平滑過渡到大數(shù)據(jù)體系中,通過數(shù)據(jù)挖掘等手段對其進行專業(yè)的分析來實現(xiàn)數(shù)據(jù)的“增值”,是當下亟待解決的重要問題。能夠為精準臨床診療、決策支持、疾病監(jiān)測預警與管理、公眾健康服務(wù)等領(lǐng)域提供有效的支撐,并能發(fā)揮區(qū)域衛(wèi)生信息平臺上匯聚采集的數(shù)據(jù)價值。
2.醫(yī)療健康大數(shù)據(jù)分析需要解決的關(guān)鍵問題
本文的研究目的就是探討如何解決大數(shù)據(jù)分析關(guān)鍵問題,主要包括:醫(yī)療健康數(shù)據(jù)類型和結(jié)構(gòu)復雜而多樣;從技術(shù)到業(yè)務(wù)有巨大的鴻溝:缺乏面向醫(yī)療健康領(lǐng)域的分析和挖掘算法庫、模型庫;缺少醫(yī)療健康知識庫支撐;大數(shù)據(jù)技術(shù)架構(gòu)及工具選擇所面臨的挑戰(zhàn):選擇一種架構(gòu)并構(gòu)建合適的大數(shù)據(jù)解決方案***挑戰(zhàn),因為需要考慮非常多的因素;技術(shù)本身的挑戰(zhàn):醫(yī)療健康語義知識庫構(gòu)建,非結(jié)構(gòu)數(shù)據(jù)的語義處理,傳統(tǒng)分析和挖掘技術(shù)的并行化,醫(yī)療健康標準化問題和數(shù)據(jù)質(zhì)量問題;如何研究基于大數(shù)據(jù)的應(yīng)用。
3. 醫(yī)療健康大數(shù)據(jù)分析對策
本文結(jié)合在上海市衛(wèi)計委醫(yī)療大數(shù)據(jù)分析案例給出醫(yī)療健康大數(shù)據(jù)分析對策。
3.1 確定醫(yī)療健康大數(shù)據(jù)的業(yè)務(wù)研究主題
結(jié)合上海市衛(wèi)計委目前信息化現(xiàn)狀,以及采集的數(shù)據(jù)范圍,確定醫(yī)療健康大數(shù)據(jù)的業(yè)務(wù)研究主題,包括:個性化健康管理:健康評估預警、健康自我管理、康復跟蹤、就醫(yī)輔助、健康處方制定、健康異常提醒;醫(yī)療衛(wèi)生服務(wù):醫(yī)療臨床輔助、臨床成本效益、智能診療方案分析、療效評估、臨床質(zhì)量分析、醫(yī)療數(shù)據(jù)透明度;精準化衛(wèi)生管理:醫(yī)療資源分配、管理績效分析、公眾健康監(jiān)測、病人疾病經(jīng)濟負擔、醫(yī)療服務(wù)定價、醫(yī)??刭M;醫(yī)療科研:比較效果研究、疾病模式分析、合理用藥分析、傳染病預警、慢性病發(fā)病趨勢;企業(yè)大數(shù)據(jù)利用:新藥研究、藥物不良反應(yīng)、醫(yī)療保險定價、健康管理服務(wù)。
3.2 醫(yī)療健康大數(shù)據(jù)技術(shù)架構(gòu)
醫(yī)療健康大數(shù)據(jù)技術(shù)架構(gòu)解決方案提供基于大數(shù)據(jù)的醫(yī)療健康智能服務(wù)。通過聚合數(shù)據(jù)、重構(gòu)數(shù)據(jù)、挖掘數(shù)據(jù)價值,實現(xiàn)醫(yī)療健康領(lǐng)域的智能化服務(wù)。
3.3 醫(yī)療健康大數(shù)據(jù)的數(shù)據(jù)分類
醫(yī)療健康大數(shù)據(jù)根據(jù)數(shù)據(jù)的采集來源和業(yè)務(wù)分類可以分為:醫(yī)院醫(yī)療大數(shù)據(jù):包括各種門急診記錄、住院記錄、影像記錄、實驗室記錄、用藥記錄、手術(shù)記錄、隨訪記錄和醫(yī)保數(shù)據(jù)等;區(qū)域服務(wù)平臺醫(yī)療健康大數(shù)據(jù);疾病監(jiān)測大數(shù)據(jù):基于大量人群的醫(yī)學研究或者疾病監(jiān)測的大數(shù)據(jù);自我量化大數(shù)據(jù):基于移動物聯(lián)網(wǎng)的個人身體體征和活動的自我量化數(shù)據(jù),包含血壓、心跳、血糖、呼吸、睡眠、體育鍛煉等信息;互聯(lián)網(wǎng)及社交媒體數(shù)據(jù):是指互聯(lián)網(wǎng)上與醫(yī)學相關(guān)的各種數(shù)據(jù);生物大數(shù)據(jù):主要是關(guān)于生物標本和基因測序的信息,直接關(guān)系到臨床的個性化診療及精準醫(yī)療;保險數(shù)據(jù):醫(yī)保、新農(nóng)合、健康保險數(shù)據(jù)等;外部數(shù)據(jù):包括環(huán)境、氣象、地理數(shù)據(jù)等。
3.4 醫(yī)療健康大數(shù)據(jù)標準制定
上海市衛(wèi)計委醫(yī)療衛(wèi)生大數(shù)據(jù)平臺標準體系將在相關(guān)國際標準、國家標準、省市的區(qū)域衛(wèi)生信息化建設(shè)中已發(fā)布的數(shù)據(jù)元、數(shù)據(jù)元值域代碼、醫(yī)療衛(wèi)生術(shù)語、共享文檔規(guī)范等標準基礎(chǔ)上,結(jié)合業(yè)務(wù)特性建立業(yè)務(wù)的關(guān)聯(lián)性,建立業(yè)務(wù)邏輯模型,并落實到醫(yī)療健康大數(shù)據(jù)采集的相關(guān)數(shù)據(jù)接口中。從而建立醫(yī)療衛(wèi)生大數(shù)據(jù)標準體系,包括醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)數(shù)據(jù)規(guī)范、醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)接入管理規(guī)范、醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)開放管理規(guī)范和醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)安全隱私規(guī)范。
3.5 醫(yī)療健康大數(shù)據(jù)治理策略
數(shù)據(jù)質(zhì)量依賴于數(shù)據(jù)的應(yīng)用,如何用大數(shù)據(jù)思維、新理念、新技術(shù)、新方法對采集到的數(shù)據(jù)進行梳理、整體分類。醫(yī)療健康數(shù)據(jù)的整合、存儲、挖掘和探索的基礎(chǔ)是數(shù)據(jù)治理。數(shù)據(jù)質(zhì)量問題已經(jīng)成為限制醫(yī)療衛(wèi)生信息系統(tǒng)效能發(fā)揮的瓶頸和短板。數(shù)據(jù)質(zhì)量涉及許多因素,包括準確性、完整性、一致性、時效性、可信性和可解釋性。為了提高數(shù)據(jù)時效性,任何數(shù)據(jù)都在醫(yī)務(wù)人員的實際工作過程中在其工作平臺軟件上錄入,業(yè)務(wù)軟件上采集的數(shù)據(jù)按照一定的規(guī)則和標準逐級匯總到衛(wèi)計委/局的數(shù)據(jù)中心。
3.6 醫(yī)療健康大數(shù)據(jù)挖掘分析關(guān)鍵技術(shù)
醫(yī)療健康大數(shù)據(jù)挖掘分析的技術(shù)包括:計算、互聯(lián)和存儲;數(shù)據(jù)處理和管理;數(shù)據(jù)分析;可視化;應(yīng)用和服務(wù)。
4.上海市衛(wèi)計委糖尿病用藥推薦案例分析
確定大數(shù)據(jù)分析主題:研究影響醫(yī)生給糖尿病患者用藥的相關(guān)因素;數(shù)據(jù)預處理與特征提?。焊鶕?jù)診斷編碼ICD-10篩選糖尿病人診療記錄,共472 460診療記錄,涉及516 340個病人;根據(jù)初篩的特征變量進行數(shù)據(jù)質(zhì)量分析,判斷其實際可用性。通過兩輪篩選判別,最終選取可用變量38 項,最終形成糖尿病病人特征大表,共260萬條記錄;目標的模型構(gòu)建與評估:將300多種藥品,按目錄通用名分為26類,利用隨機森林樹算法的多分類挖掘方法,給出28種藥品的使用概率,基于概率大小推薦Top藥品組合;最終優(yōu)化結(jié)果:模型準確度為0.64,模型的精度為0.25。
5 結(jié)論
本文結(jié)合在上海市衛(wèi)計委醫(yī)療健康大數(shù)據(jù)分析的項目案例,提出醫(yī)療健康大數(shù)據(jù)分析的關(guān)鍵問題,探索和總結(jié)了解決這些關(guān)鍵問題的對策。研究醫(yī)療健康大數(shù)據(jù)分析的方法、模型和算法,結(jié)合臨床、科研、藥品、公共衛(wèi)生等領(lǐng)域的業(yè)務(wù)需求,能夠充分挖掘區(qū)域衛(wèi)生信息平臺中積累的醫(yī)療健康大數(shù)據(jù)的應(yīng)用價值。