人工智能技術(shù)在科研大數(shù)據(jù)中的應(yīng)用
人工智能經(jīng)過幾十年的技術(shù)發(fā)展,它已進入一個嶄新的時代——人工智能時代。在這一新時代,各種各樣的研究成果不斷涌現(xiàn)。就像中國科學(xué)家、未來學(xué)家周海中先生在上世紀90年代所預(yù)言的那樣:“隨著科技進步,人工智能時代即將到來;屆時,人工智能技術(shù)將廣泛應(yīng)用到各學(xué)科領(lǐng)域,會產(chǎn)生意想不到的效果。”科學(xué)研究會經(jīng)常遇到如何處理大數(shù)據(jù)的問題;下面就簡要談?wù)勅斯ぶ悄芗夹g(shù)在科研大數(shù)據(jù)中的應(yīng)用。
大數(shù)據(jù)(big data)又稱巨量資料,指的是無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)的概念,對于不同的人有不同的理解;而目前適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理數(shù)據(jù)庫、分布式數(shù)據(jù)庫、數(shù)據(jù)挖掘電網(wǎng)、云計算平臺、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、分布式文件系統(tǒng)和可擴展的存儲系統(tǒng)。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。近年來,在人工智能技術(shù)的助力下,科研中的許多大數(shù)據(jù)問題得到了有效的解決。
例如,為了探索地外文明(俗稱“外星人”),美國宇航局(NASA)前不久與英特爾、谷歌和IBM等科技公司展開合作,以開發(fā)先進的人工智能技術(shù),這些技術(shù)可用于大數(shù)據(jù)分析,尋找外星人。當然并不是說,使用人工智能技術(shù)去“直接觀看”外星人;而是分析太空探測器和天文望遠鏡所獲得的數(shù)據(jù),來識別地外行星的圖像、研究地質(zhì)結(jié)構(gòu)和化學(xué)性質(zhì)等,看那里是否具備外星人存在的基本條件,以便探索結(jié)果更深入、更有效。有關(guān)專家認為,將人工智能技術(shù)用于分析海量的數(shù)據(jù),確實是一個比較好的有關(guān)地外文明的探索方法。
又如,1972年,美國生物化學(xué)家、諾貝爾化學(xué)獎得主克里斯蒂安·安芬森先生在獲獎感言中提出了一個假設(shè)來說明酶進行化學(xué)合成的可能性。這就是著名的蛋白質(zhì)折疊結(jié)構(gòu)預(yù)測;由于它的計算難度很高,計算量也超級巨大,計算結(jié)果的準確度始終無法超過做實驗得出的結(jié)果。這個假設(shè)成了生物化學(xué)方面近50年來一個重大難題;該難題最近被谷歌DeepMind推出的AlphaFold破解了。此消息一出,立刻被《自然》(Nature)、《科學(xué)》(Science)等多家雜志報道。有專家認為,這可能是首個有望獲得諾貝爾獎的人工智能成果。
再如,在新冠肺炎(COVID-19)疫情期間,廣大科研人員借助人工智能技術(shù)抗擊新冠病毒,使這一高新技術(shù)在疫情中發(fā)揮了前所未有的能力。他們通過新冠患者的數(shù)據(jù)了解到潛伏期、臨床特征,為新冠早期癥狀鑒別起了很大作用;他們根據(jù)大數(shù)據(jù)做出新冠疫情的預(yù)測模型,為政策制定提供了重要依據(jù)。比如中國香港理工大學(xué)及澳門科技大學(xué)根據(jù)有關(guān)數(shù)據(jù),研發(fā)出能快速診斷新冠患者的人工智能系統(tǒng);只需20秒便能斷癥,并預(yù)測患者病情是否會惡化,準確率達90%以上。
從上面列舉的實例可見,人工智能技術(shù)可以在科研大數(shù)據(jù)中發(fā)揮巨大作用。隨著科研工作量的增大,數(shù)據(jù)的規(guī)模也成倍增長;在現(xiàn)有的科研環(huán)境中,如何處理長期積累的歷史數(shù)據(jù),分析日常值守的實時數(shù)據(jù)和預(yù)判將要發(fā)生的事件變得尤為重要。完全可以相信,有了人工智能技術(shù)助力,今后科研中的大數(shù)據(jù)問題將會迎刃而解。