中科院自動化所登Science子刊:自組織反向傳播提升網(wǎng)絡(luò)學(xué)習(xí)效率
在人工智能領(lǐng)域,目前人工神經(jīng)網(wǎng)絡(luò)中被廣泛使用的反向傳播算法(Backpropagation,BP)采用全局優(yōu)化策略,這種端到端的學(xué)習(xí)方法性能卓越,但學(xué)習(xí)過程能量消耗大,且缺乏靈活性。中科院腦智卓越中心徐波、蒲慕明聯(lián)合研究團隊近期借助生物網(wǎng)絡(luò)中發(fā)現(xiàn)的介觀尺度自組織反向傳播機制(Self-backpropagation,SBP),在更具效率和靈活性的類腦局部學(xué)習(xí)方法方面取得了重要進(jìn)展。
該研究的論文《Self-backpropagation of synaptic modifications elevates the efficiency of spiking and artificial neural networks》已于 2021 年 10 月 20 日(美東時間)在線發(fā)表于《科學(xué)》子刊《Science Advances》上。

論文地址:https://www.science.org/doi/10.1126/sciadv.abh0146
借助 SBP 降低計算能耗
SBP 的發(fā)現(xiàn)最早可以追溯到 1997 年。蒲慕明團隊在 Nature 雜志上撰文發(fā)現(xiàn)海馬體內(nèi)的神經(jīng)元可以將長時程抑制(Long-term depression,LTD)可塑性自組織地傳播到三個方向,分別是突觸前側(cè)向傳播(Presynaptic lateral spread)、突觸后側(cè)向傳播(Postsynaptic lateral spread)、反向傳播(Backpropagation)[1],這個發(fā)現(xiàn)就是自組織反向傳播神經(jīng)可塑性機制(SBP)。
后續(xù)研究證實,SBP 現(xiàn)象具有普遍性,不僅覆蓋更多的神經(jīng)區(qū)域如視網(wǎng)膜 - 頂蓋系統(tǒng) [2],還覆蓋更多的可塑性類型 [3],如長時程增強(Long-term potentiation,LTP)。該機制的發(fā)生歸結(jié)于生物神經(jīng)元內(nèi)分子調(diào)制信號的天然逆向傳遞,被認(rèn)為是可能導(dǎo)致生物神經(jīng)網(wǎng)絡(luò)高效反饋學(xué)習(xí)的關(guān)鍵 [4]。
中科院研究團隊受到該機制的啟發(fā),對 SBP 的反向傳播方向(第三個方向)單獨構(gòu)建數(shù)學(xué)模型(圖 1A),重點描述了神經(jīng)元輸出突觸的可塑性可以反向傳播到輸入突觸中(圖 1B),可塑性的發(fā)生可以通過時序依賴突觸可塑性(Spike timing-dependent plasticity,STDP),也可以通過人工局部梯度調(diào)節(jié)。在標(biāo)準(zhǔn)三層脈沖神經(jīng)網(wǎng)絡(luò)(Spiking neural network,SNN)的學(xué)習(xí)過程中,SBP 機制可以自組織地完成前一層網(wǎng)絡(luò)權(quán)重的學(xué)習(xí),且可以結(jié)合短時突觸可塑性(Short-term plasticity,STP)、膜電位平衡(Homeo-static membrane potential)等,形成更強大的 SNN 組合學(xué)習(xí)方法(圖 1C)。

圖 1:SBP 在 SNN 中的應(yīng)用。(A),SBP 可塑性機制。(B),SBP 在 SNN 中的局部反向傳播。(C),SBP 和其它可塑性機制在 SNN 中的組合優(yōu)化。
在一類人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)如受限玻爾茲曼機網(wǎng)絡(luò)(Restricted Boltzmann machine,RBM)的學(xué)習(xí)中(圖 2A),SBP 機制也可以替換迭代過程中部分 BP 機制,實現(xiàn)交替的協(xié)作優(yōu)化(圖 2B-E)。針對 SNN 和 RBM 的不同,團隊又分別設(shè)置了兩種不同的能量函數(shù)約束,來保證訓(xùn)練過程中網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的平穩(wěn)性。

圖 2:SBP 在 RBM 中的應(yīng)用。(A),SBP 和 BP 在 RBM 中的組合優(yōu)化。(B),SBP 和 BP 的交替協(xié)作流程。(C),RBM 中的標(biāo)準(zhǔn) Sleep Phase。(D),含有 SBP 的 Wake Phase。(E),含有 BP 的 Wake Phase。
此外,研究團隊針對性地提出了一種統(tǒng)計訓(xùn)練過程中能量消耗的新方法(圖 3)。在圖片分類(MNIST)、語音識別(NETtalk)、動態(tài)手勢識別(DvsGesture)等多類標(biāo)準(zhǔn)數(shù)據(jù)集上,SBP 機制通過組合其它可塑性機制,實現(xiàn)了更低能耗和更高精度的 SNN 局部學(xué)習(xí)(圖 4)。在 ANN-RBM 的學(xué)習(xí)中,SBP 機制也可以大量的替換 BP 機制實現(xiàn)全局和局部交叉學(xué)習(xí),在降低計算能耗同時卻不損失精度(圖 5)。如圖 5C 所示,使用 SBP 進(jìn)行訓(xùn)練的計算成本比僅使用 BP 進(jìn)行訓(xùn)練時降低了約 57.1%。

圖 3:訓(xùn)練能量消耗的計算方法。(A),平均迭代次數(shù)。(B),每次迭代中的算法復(fù)雜度。

圖 4:在 MNIST、NETtalk、DvsGesture 三個數(shù)據(jù)集上的性能對比。(A,C,E),SBP 分別取得了基于梯度和基于可塑性方法的 SNN 最優(yōu)性能。(B,D,F),SBP 分別取得了基于梯度和基于可塑性方法的 SNN 最低能耗。

圖 5:SBP 有助于 RBM 提升精度和降低能耗。(A-C),在 MNIST 數(shù)據(jù)集中,SBP 可以少量降低 RBM 的訓(xùn)練誤差(A),可以同時平衡精度和能耗得到最優(yōu)的 Wake Phase 次數(shù)(B),且可以顯著降低訓(xùn)練能耗(C)。(D-I),在 NETtalk 和 DvsGesture 數(shù)據(jù)集中,SBP 得到了和在 MNIST 中類似的結(jié)論。
研究人員認(rèn)為,SBP 是一類介觀尺度的特殊生物可塑性機制,該機制同時在 SNN 和 ANN 中獲得了廣泛的組合優(yōu)化優(yōu)勢,對進(jìn)一步深入探索類腦局部計算具有很大的啟示性。生物智能計算的本質(zhì),很可能就是靈活融合多類微觀、介觀等可塑性機制的自組織局部學(xué)習(xí),結(jié)合遺傳演化賦予的遠(yuǎn)程投射網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)高效的全局優(yōu)化學(xué)習(xí)效果。該工作可以進(jìn)一步引導(dǎo)生物和人工網(wǎng)絡(luò)的深度融合,最終實現(xiàn)能效比高、可解釋性強、靈活度高的新一代人工智能模型。
中國科學(xué)院自動化研究所類腦智能研究中心張鐵林副研究員為該研究第一作者,徐波研究員為通訊作者,程翔(博士生)、賈順程(博士生)、蒲慕明研究員和曾毅研究員為共同作者。相關(guān)研究工作得到了國家自然科學(xué)基金委、先導(dǎo) B 等項目的資助。