自然語(yǔ)言處理助力全球抗擊新冠肺炎疫情
隨著互聯(lián)網(wǎng)的普及和海量信息的涌現(xiàn),作為人工智能領(lǐng)域中的一個(gè)重要方向,自然語(yǔ)言處理(NLP)正在人們的日常生活中扮演著越來(lái)越重要的角色,并將在科技創(chuàng)新的過(guò)程中發(fā)揮越來(lái)越重要的作用。正如國(guó)際知名學(xué)者周海中教授曾經(jīng)所言:“自然語(yǔ)言處理是極有吸引力的研究領(lǐng)域,它具有重大的理論意義和實(shí)用價(jià)值。”
在全球抗擊新冠肺炎(Covid-19)疫情方面,各種各樣的高新科技都有望“大顯身手”,其中最突出的是自然語(yǔ)言處理技術(shù)。無(wú)論是在抗疫一線,還是在社區(qū)管控、疫苗研發(fā)等大后方,自然語(yǔ)言處理技術(shù)發(fā)揮的作用都不可忽視。目前世界上有多個(gè)研究團(tuán)隊(duì)使用該技術(shù)對(duì)抗新冠肺炎病毒。例如:
在此次新冠肺炎疫情中,最早正式發(fā)出疫情警告的并不是美國(guó)疾控中心或世衛(wèi)組織,而是加拿大一家名為“藍(lán)點(diǎn)”(BlueDot)的健康監(jiān)測(cè)平臺(tái);它早在2019年12月31日就向其客戶(hù)發(fā)出了提前疫情警告,避開(kāi)武漢等危險(xiǎn)區(qū)域。該平臺(tái)設(shè)計(jì)了疾病監(jiān)測(cè)分析程序,使用自然語(yǔ)言處理和機(jī)器學(xué)習(xí)等技術(shù)來(lái)篩選65種語(yǔ)言的新聞報(bào)道,以及航空公司數(shù)據(jù)和動(dòng)物疾病暴發(fā)的報(bào)道。這在新冠肺炎疫情暴發(fā)之初發(fā)揮了監(jiān)測(cè)功能。有關(guān)專(zhuān)家認(rèn)為:只有真正了解現(xiàn)狀,預(yù)測(cè)走勢(shì),才能做出更為理性判斷,對(duì)下一步行為做指導(dǎo)。
美國(guó)艾倫人工智能研究所最近發(fā)布了“新冠肺炎開(kāi)放研究數(shù)據(jù)集”(CORD-19)的資源管理器以及全文本搜索引擎,并表示希望它可以幫助人們探索數(shù)據(jù)集并確定潛在的研究成果。該機(jī)構(gòu)語(yǔ)言學(xué)家道格·雷蒙德博士說(shuō):“過(guò)去幾年,我們?cè)谧匀徽Z(yǔ)言處理方面取得了長(zhǎng)足進(jìn)步,CORD-19這類(lèi)數(shù)據(jù)集的實(shí)用性可能會(huì)比幾年前更大,因?yàn)楝F(xiàn)在我們有了更多可用的工具。”近日,美國(guó)政府宣布聯(lián)合艾倫人工智能研究所、微軟研究院、國(guó)立衛(wèi)生研究院等機(jī)構(gòu)共同發(fā)布了有關(guān)新冠肺炎的學(xué)術(shù)文獻(xiàn)的開(kāi)放研究數(shù)據(jù)集CORD-19,并呼吁世界各地的人工智能專(zhuān)家采取行動(dòng),開(kāi)發(fā)新的文本和數(shù)據(jù)挖掘技術(shù),以幫助科學(xué)界回答與新冠肺炎相關(guān)的高優(yōu)先級(jí)科學(xué)問(wèn)題。
美國(guó)哈佛大學(xué)醫(yī)學(xué)院的研究人員借助自然語(yǔ)言處理技術(shù)最近開(kāi)發(fā)出了一種工具,可以評(píng)估新冠肺炎患者的病例、社交媒體和健康衛(wèi)生數(shù)據(jù)。他們率先努力通過(guò)使用機(jī)器學(xué)習(xí)技術(shù)查看來(lái)自各種來(lái)源的數(shù)據(jù)和信息(包括患者記錄、社交媒體和公共衛(wèi)生數(shù)據(jù))來(lái)尋找新冠肺炎病毒的解決方案。借助自然語(yǔ)言處理工具,他們還可以搜索有關(guān)新冠肺炎病毒的在線信息,并了解爆發(fā)的當(dāng)前位置。另外,研究人員還利用自然語(yǔ)言處理技術(shù)對(duì)新冠病毒、藥物和疫苗等密集展開(kāi)研究,同時(shí)包括臨床診斷與治療以及流行病學(xué)研究等。
中國(guó)疾病預(yù)防控制中心的研究人員最近在使用科技巨頭阿里巴巴達(dá)摩院最新的自然語(yǔ)言處理技術(shù)開(kāi)展病歷文本分析和流行病學(xué)調(diào)查工作,日前已經(jīng)取得階段性成果。另外,達(dá)摩院的研究人員通過(guò)自然語(yǔ)言處理回顧性數(shù)據(jù)、使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練CT影像的識(shí)別系統(tǒng),它可以快速鑒別新冠肺炎影像與普通病毒性肺炎影像的區(qū)別,最終識(shí)別準(zhǔn)確率高達(dá) 96%。該系統(tǒng)每識(shí)別一個(gè)病例平均只需要不到20秒,可有效減輕醫(yī)生壓力;它還能直接算出病灶部位的占比比例,進(jìn)而量化病癥的輕重程度,大幅提升臨床診斷效率。順帶一提,達(dá)摩院的StructBERT模型日前被評(píng)為全球性能最強(qiáng)的自然語(yǔ)言處理系統(tǒng)。
智能問(wèn)診系統(tǒng)能夠在線為病患提供問(wèn)診服務(wù),其使用應(yīng)用語(yǔ)義理解、情感分析等自然語(yǔ)言處理技術(shù),通過(guò)問(wèn)題預(yù)判、意圖反問(wèn)、分類(lèi)識(shí)別、相似度匹配等方法,不僅能夠解答何種情況需要就醫(yī),還能實(shí)現(xiàn)疫情防控動(dòng)態(tài)進(jìn)展、科學(xué)防護(hù)知識(shí)、謠言鑒別等問(wèn)題精準(zhǔn)解答,并支持人機(jī)協(xié)作、自主學(xué)習(xí)、會(huì)話引導(dǎo)等功能。比如中國(guó)百度靈醫(yī)智惠最近推出的“智能咨詢(xún)助手”,包含常見(jiàn)問(wèn)題解答、標(biāo)準(zhǔn)化預(yù)問(wèn)診路徑、在線醫(yī)生咨詢(xún)輔助三大模塊,通過(guò)自然語(yǔ)言處理技術(shù)賦能在線健康咨詢(xún)平臺(tái)、政府疫情防控平臺(tái)、互聯(lián)網(wǎng)醫(yī)院等第三方平臺(tái),助力其直接為公眾提供有關(guān)新冠肺炎的在線科普、在線咨詢(xún),倍數(shù)級(jí)提升效率。
疫情發(fā)生至今,情況越演越烈;人們一邊要提防新冠肺炎的傳染,一邊又要不斷接受著海量的真假難辨的信息的轟炸。但是自然語(yǔ)言處理技術(shù)在疫情輿情管控中可以發(fā)揮一定的作用。一方面,政府職能部門(mén)通過(guò)智能搜索第一時(shí)間掌握輿情動(dòng)態(tài),分析公眾關(guān)心焦點(diǎn),從而發(fā)布最科學(xué)、最可靠的信息,如借助自然語(yǔ)言處理可以分析與新冠肺炎相關(guān)的社交媒體內(nèi)容的互動(dòng)和參與,收集“Covid-19”關(guān)鍵字/詞的相關(guān)評(píng)論和帖子做信息處理,分析人們對(duì)官方防疫措施及策略的認(rèn)同或質(zhì)疑。另一方面,自然語(yǔ)言處理可以幫助人們識(shí)別準(zhǔn)確且可信賴(lài)的新聞文章,如采用疫情防范中重要的指導(dǎo)原則等并強(qiáng)化促進(jìn)官方的建議,以此幫助安撫民眾,穩(wěn)定社會(huì)焦慮情緒。自然語(yǔ)言處理能夠幫助人們提取新聞主要觀點(diǎn),識(shí)別文章情緒甚至分析文章的可信度,這將在信息戰(zhàn)場(chǎng)將“謠言”粉碎,促進(jìn)輿論生態(tài)良性循環(huán),從而為抗疫工作提供一份助力。
由上可知,自然語(yǔ)言處理可以在抗擊新冠肺炎疫情中大顯身手,為打贏這場(chǎng)疫情攻堅(jiān)戰(zhàn)提供了有效的技術(shù)支撐。有了自然語(yǔ)言處理技術(shù)相助,抗疫工作將變得更安全、更高效。完全可以相信,在各國(guó)的共同努力之下,人類(lèi)一定能夠戰(zhàn)勝這次疫情,并迎來(lái)更加美好的未來(lái)。