初步嘗試:力學和數(shù)據(jù)科學的融合
當今是數(shù)據(jù)的時代,數(shù)據(jù)科學居于顯赫地位。力學學者該如何順應(yīng)這個時代,而不是置身時代之外,這是一個值得我們思考的問題。投身于時代之中,可能大展宏圖;游離于時代之外,必將喪失難逢的機遇。
近期,浙江大學王永副教授和亞利桑那州立大學姜漢卿教授課題組共同發(fā)展了一種新的數(shù)據(jù)驅(qū)動方法,該方法通過離散噪聲數(shù)據(jù)直接獲得經(jīng)典物理及力學問題的變分律。這項工作剛發(fā)表于Journal of Mechanics and Physics of Solids. 下面就對其基本思路、實現(xiàn)方法做一簡單介紹。
數(shù)據(jù)科學的核心是算法,或者說是優(yōu)化方法。將數(shù)據(jù)科學成果應(yīng)用于指導(dǎo)力學學科的研究已經(jīng)取得了一些最新的研究成果。例如:貝葉斯機器學習指導(dǎo)下的超材料設(shè)計方法1,異質(zhì)材料塑性特性的數(shù)據(jù)驅(qū)動模型2,以及應(yīng)用遞歸神經(jīng)網(wǎng)絡(luò)的歷史和路徑依賴現(xiàn)象預(yù)測方法3 等。同時,也有一些工作利用數(shù)據(jù)來識別物理系統(tǒng)的代數(shù)不變量和微分方程,主要包括符號回歸和稀疏回歸兩類方法。
一般而言,在數(shù)據(jù)科學中,為了能較好地描述已有數(shù)據(jù),特別是能給出較準確的預(yù)測數(shù)據(jù),需要大量數(shù)據(jù)以作訓(xùn)練和檢驗之用。那么依據(jù)數(shù)據(jù)所建立的模型如果過于簡單,其模型外延性存疑;如果模型過于復(fù)雜則會過擬合。這是基于數(shù)據(jù)且僅基于數(shù)據(jù)的方法的本質(zhì)缺陷,所以很難在數(shù)據(jù)科學的自身范疇內(nèi)解決。
和數(shù)據(jù)方法對立的是理論方法。與數(shù)據(jù)方法追求結(jié)果的有效性不同,理論方法追求體系的完美性和結(jié)果的可解釋性。在這項工作中,作者試圖用理論指導(dǎo)的數(shù)據(jù)方法4(如圖1所示),將理論知識與數(shù)據(jù)相結(jié)合,從而不再是盲目的數(shù)據(jù)分析,而是部分地有目的的數(shù)據(jù)分析。

圖1. 數(shù)據(jù)與理論知識的關(guān)系4
具體做法是:將變分原理(知識)與數(shù)據(jù)方法(數(shù)據(jù))相結(jié)合,在變分原理的框架下應(yīng)用數(shù)據(jù)驅(qū)動方法,識別出物理系統(tǒng)的變分律。這種從時域和空間域離散數(shù)據(jù)出發(fā),識別物理系統(tǒng)變分律的方法,與從物理系統(tǒng)變分律出發(fā),計算時域和空間域離散數(shù)據(jù)的有限元方法,構(gòu)成了互逆過程。因此該方法也可被視為“逆有限元方法”5(如圖2所示)。

圖2. 有限單元方法 vs. 變分框架下的數(shù)據(jù)驅(qū)動方法
圖3給出了該方法的具體操作步驟5。

圖3. 物理變分律自動化識別的數(shù)據(jù)驅(qū)動方法流程圖
概言之,針對具體物理系統(tǒng),作者在變分框架下設(shè)定變分模式(知識I),其中待定的時域積分式則通過數(shù)據(jù)方法給出(數(shù)據(jù))。進一步地,結(jié)合量綱匹配原則(知識II),從具有不同物理屬性值的同一系統(tǒng)的離散數(shù)據(jù)出發(fā),應(yīng)用數(shù)據(jù)方法可給出顯式包含物理屬性的積分式表達式。得到了具不同參數(shù)值的同一物理系統(tǒng)的時域積分式后,亦可通過符號回歸方法,得出顯式包含物理屬性的積分式。該方法成功識別了自由落體、電場中的相對論粒子、van del Pol系統(tǒng)、Duffing 系統(tǒng)、二自由度耗散系統(tǒng)和連續(xù)體系統(tǒng)的變分律5(如圖4所示)。文中也討論了這種方法對數(shù)據(jù)量的敏感性,對數(shù)據(jù)質(zhì)量(即噪聲)的魯棒性。由于該方法在處理時域積分時,可以在滿足時域端點變分為零的前提下任意選取變分模式,因此,在不需要大數(shù)據(jù)量和有一定噪聲的情況下,也可以得到令人滿意的識別結(jié)果。

圖4. 數(shù)據(jù)驅(qū)動方法識別的變分律匯總
這項工作以理論指導(dǎo)的數(shù)據(jù)方法重做了開普勒等科學巨匠做的工作??茖W巨匠們以天分和勤奮識別出物理律;而理論指導(dǎo)的數(shù)據(jù)方法則舍棄了對天分的要求,經(jīng)由規(guī)范的步驟給出了一致的結(jié)果。具體到力學變分律,Landau物理學力學卷就是從變分框架開始,而其中的時域積分式則通過伽利略變換從理論上逐步導(dǎo)出6;Feynman在其物理學講義中則指出,確定此時域積分式需應(yīng)用試錯方法,不斷測試直至滿意7。這項工作則擯棄了其中最難的部分,在變分框架下以規(guī)范的方式解決了問題。
這項工作嘗試了將力學原理與數(shù)據(jù)科學相結(jié)合的可能性。作者寄望這個初步的工作能夠聯(lián)接力學和數(shù)據(jù)科學兩個學科:不僅是將數(shù)據(jù)科學成果用于力學問題研究,同樣也可以由力學理論來指導(dǎo)數(shù)據(jù)科學的研究。