雙流行將至,機(jī)器學(xué)習(xí)算法如何助力新冠肺炎病毒的快速檢測
原創(chuàng)【51CTO.com原創(chuàng)稿件】秋冬季節(jié)臨近,流感與新冠肺炎的高發(fā)季再次到來。全球再度面臨“雙流行”的嚴(yán)峻考驗(yàn)。
目前為止,檢測新冠肺炎病毒的最好標(biāo)準(zhǔn),依然是進(jìn)行病原學(xué)檢測或免疫學(xué)檢測,也就是我們常說的核酸檢測。
但由于核酸檢測的復(fù)雜性問題,正常的檢測流程最快也需要24小時(shí)才能夠獲得結(jié)果,且準(zhǔn)確率僅能保證在50%—70%,這樣的檢測效果并不十分理想。那么是否有其他技術(shù)或方法能夠幫助我們更加快速準(zhǔn)確的對新冠肺炎病毒進(jìn)行檢測區(qū)分呢?
其實(shí)早在2020年,國內(nèi)相關(guān)科研團(tuán)隊(duì)已經(jīng)就該方向進(jìn)行了進(jìn)一步的研究并取得了一定的理論成果。
研究中,科研團(tuán)隊(duì)通過更為普遍快捷的血常規(guī)、PCT(降鈣素原)、CRP(C反應(yīng)蛋白)等檢驗(yàn)進(jìn)行數(shù)據(jù)指標(biāo)的獲取,并創(chuàng)新性的嘗試?yán)脵C(jī)器學(xué)習(xí)算法對系統(tǒng)進(jìn)行病毒檢測分類的訓(xùn)練。
在實(shí)驗(yàn)初期的數(shù)據(jù)預(yù)處理層面,研究人員利用患者的可鑒別數(shù)據(jù)建立原始特征庫并進(jìn)行初步篩選。根據(jù)具體情況對初步篩選后的數(shù)據(jù)進(jìn)行異常值與噪聲處理,利用獨(dú)立樣本t檢驗(yàn)的方法,成功對新冠肺炎病毒的多項(xiàng)異常指標(biāo)進(jìn)行了確認(rèn)。
而后,在病毒檢測算法的評估過程中,研究人員采取數(shù)據(jù)特征直方圖、密集分布圖對數(shù)據(jù)進(jìn)行分析,并根據(jù)結(jié)果對數(shù)據(jù)進(jìn)行正態(tài)化處理,通過Box-Cox轉(zhuǎn)換提高模型準(zhǔn)確度。
成功獲取準(zhǔn)確模型后,針對邏輯回歸算法(LR)、線性判別分析(LDA)、分類與回歸算法(CART)、支持向量機(jī)(SVM)、貝葉斯分類器(NB)、K近鄰算法(KNN)六種線性與非線性算法,隨機(jī)森林(RF)、極端隨機(jī)樹算法(ET)、AdaBoost(AB)、隨機(jī)梯度上升(GBM)四種集成算法,統(tǒng)一采用10折交叉驗(yàn)證進(jìn)行數(shù)據(jù)分離工作。
使用不同算法對數(shù)據(jù)進(jìn)行鑒別分類訓(xùn)練時(shí),根據(jù)反饋?zhàn)鞒鰬土P系數(shù)C、徑向基函數(shù)kernel以及估計(jì)量estimators的參數(shù)調(diào)整。利用準(zhǔn)確度比較算法進(jìn)行結(jié)果對比,以找到能夠?qū)π鹿诜窝走M(jìn)行最優(yōu)檢測的算法。
最終,研究人員通過對十種算法的訓(xùn)練準(zhǔn)確度進(jìn)行對比評估發(fā)現(xiàn),在懲罰系數(shù) C=2.0且徑向基函數(shù)kernel為rbf 時(shí),支持向量機(jī)算法對正態(tài)化數(shù)據(jù)的檢測分類具有最優(yōu)的準(zhǔn)確率95%。
這意味著,當(dāng)滿足以上條件時(shí),利用該算法對檢測系統(tǒng)進(jìn)行訓(xùn)練,能夠使系統(tǒng)對新冠肺炎病毒的檢測準(zhǔn)確率達(dá)到95%。這一結(jié)果已經(jīng)遠(yuǎn)超傳統(tǒng)核算檢測50%—70%的準(zhǔn)確率。
而檢測效率方面,基于機(jī)器學(xué)習(xí)的快速鑒別方法也實(shí)現(xiàn)了對傳統(tǒng)核酸檢測的完全超越,通過更為簡便快捷的血液檢測流程,僅需幾分鐘時(shí)間便可通過系統(tǒng)獲取到準(zhǔn)確的檢驗(yàn)結(jié)果。
研究團(tuán)隊(duì)表示,該系統(tǒng)的測試應(yīng)用普遍獲得了臨床醫(yī)生的肯定。在疫情影響的特殊時(shí)期,我們更應(yīng)當(dāng)繼續(xù)加大研發(fā)力度,推動技術(shù)不斷走向成熟和完善。
雖然由于在疾病推理覆蓋面、用戶體驗(yàn)、靜態(tài)知識庫方面還需進(jìn)一步優(yōu)化和提升,該系統(tǒng)還沒有正式實(shí)現(xiàn)大范圍普及。但是相信在不久的將來,這項(xiàng)基于機(jī)器學(xué)習(xí)算法的創(chuàng)新技術(shù)定會成為我們徹底戰(zhàn)勝疫情的有力武器。
時(shí)至今日,我們已經(jīng)正式進(jìn)入了一個(gè)“算法”的時(shí)代。各式算法應(yīng)用在各領(lǐng)域中大放異彩?,F(xiàn)如今,在產(chǎn)業(yè)的信息化、數(shù)字化、乃至更火爆的智能化過程中,算法能起到多大作用,算法應(yīng)用還有哪些成功案例,產(chǎn)業(yè)互聯(lián)網(wǎng)與消費(fèi)互聯(lián)網(wǎng)中算法的應(yīng)用有哪些不同?敬請關(guān)注WOT全球技術(shù)創(chuàng)新大會2022“算法與AI應(yīng)用”專題。
☆ WOT全球技術(shù)創(chuàng)新大會2022 ☆
2022/4/9-4/10
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請注明原文作者和出處為51CTO.com】