加速度計(jì)成本暴降1/400!哈工大首次突破精度、量程瓶頸|AAAI 2025 Oral
低成本加速度計(jì)憑借體積小、易集成、可穿戴及量產(chǎn)化優(yōu)勢,在工業(yè)自動化、醫(yī)療監(jiān)測和消費(fèi)電子等領(lǐng)域廣泛應(yīng)用,但其精度受限、噪聲顯著且量程范圍狹窄的問題嚴(yán)重制約了高動態(tài)場景下的應(yīng)用。
為此,哈爾濱工業(yè)大學(xué)的研究人員提出HEROS-GAN,首次通過生成式深度學(xué)習(xí)將低成本加速度計(jì)信號映射為高成本等效信號,突破其精度與量程瓶頸。
目前,論文已被頂會AAAI 2025接收為Oral,具有一定的理論價(jià)值和啟發(fā)性。
論文地址:https://arxiv.org/abs/2502.18064
針對無法獲取配對訓(xùn)練標(biāo)簽的核心挑戰(zhàn),文中設(shè)計(jì)最優(yōu)傳輸監(jiān)督(OTS),利用最優(yōu)傳輸理論挖掘未配對數(shù)據(jù)間的潛在一致性,從而最大化利用監(jiān)督信息。
同時(shí),提出調(diào)制拉普拉斯能量(MLE),通過自適應(yīng)調(diào)節(jié)特征層能量,激勵生成器突破量程限制、增強(qiáng)局部細(xì)節(jié)。
并且,文中還構(gòu)建了首個(gè)低成本加速度計(jì)信號增強(qiáng)專用數(shù)據(jù)集LASED。
圖1 HEROS-GAN框架圖
實(shí)驗(yàn)結(jié)果表明,單獨(dú)集成OTS或MLE的GAN模型即可超越現(xiàn)有信號增強(qiáng)方法一個(gè)數(shù)量級;而融合兩者的HEROS-GAN顯著優(yōu)于最優(yōu)基線,量程從8g擴(kuò)展至16g,噪聲降低兩個(gè)數(shù)量級,使$0.5級傳感器達(dá)到$200級工業(yè)產(chǎn)品的實(shí)測性能。
此外,文中提出物理可解釋性評估體系(CSRE/ZVRE),可以評估生成信號的物理合理性,從而保證生成模型的可靠性與實(shí)用性。
研究背景
低成本加速度計(jì)憑借其微型化設(shè)計(jì)、易于集成和低成本優(yōu)勢,已成為現(xiàn)代工業(yè)自動化、醫(yī)療健康監(jiān)測及消費(fèi)電子領(lǐng)域的核心傳感組件。
在工業(yè)場景中,此類傳感器廣泛應(yīng)用于機(jī)械臂運(yùn)動控制、生產(chǎn)線振動監(jiān)測與設(shè)備故障預(yù)警;在消費(fèi)電子領(lǐng)域,其支撐智能手機(jī)的姿態(tài)交互、增強(qiáng)現(xiàn)實(shí)(AR)應(yīng)用及健康監(jiān)測功能;在醫(yī)療領(lǐng)域,則實(shí)現(xiàn)患者運(yùn)動追蹤、康復(fù)訓(xùn)練評估與跌倒檢測等關(guān)鍵任務(wù)。
然而,受限于硬件成本約束,主流低成本加速度計(jì)普遍存在兩大技術(shù)瓶頸:精度不足(信號噪聲顯著)與動態(tài)范圍狹窄(典型量程為±2g至±8g)。
例如,工業(yè)機(jī)械臂高速運(yùn)動需±16g量程以精確捕捉復(fù)雜動作,而醫(yī)療場景中跌倒檢測常需識別瞬時(shí)超10g的加速度信號。
現(xiàn)有低成本傳感器在高動態(tài)場景下易因信號飽和導(dǎo)致數(shù)據(jù)失真或丟失,嚴(yán)重影響系統(tǒng)可靠性。盡管高端傳感器(如Xsens系列,部分產(chǎn)品單價(jià)超1500美元)可滿足性能需求,但其高昂成本阻礙了規(guī)?;渴稹?/span>
因此,通過智能算法提升低成本硬件性能,實(shí)現(xiàn)“低硬件成本+高算法效能”的技術(shù)路徑,對推動高精度傳感技術(shù)的普惠化具有重要戰(zhàn)略意義。
近年來,生成式深度學(xué)習(xí)的快速發(fā)展為傳感器信號增強(qiáng)提供了新思路。通過構(gòu)建從低成本信號到高成本信號的映射模型,理論上可突破硬件固有局限。
然而,此類方法的核心挑戰(zhàn)在于:低成本與高成本傳感器的信號難以實(shí)現(xiàn)幀級嚴(yán)格配對。硬件差異、采樣率不匹配及動態(tài)環(huán)境干擾導(dǎo)致監(jiān)督信息缺失,傳統(tǒng)生成式深度學(xué)習(xí)模型無法充分利用非配對數(shù)據(jù)內(nèi)隱藏的監(jiān)督信息,因此易生成不滿足物理合理性的失真信號。
現(xiàn)有研究多聚焦于信號降噪(如卡爾曼濾波、經(jīng)驗(yàn)?zāi)B(tài)分解),但此類方法依賴先驗(yàn)假設(shè),泛化能力受限;而數(shù)據(jù)驅(qū)動方法雖能自適應(yīng)學(xué)習(xí),卻受限于配對數(shù)據(jù)的稀缺性。
針對上述問題,研究人員提出的HEROS-GAN(Honed-Energy Regularized and Optimal Supervised GAN),首次實(shí)現(xiàn)非配對數(shù)據(jù)監(jiān)督下的加速度計(jì)信號精度提升與量程擴(kuò)展雙重目標(biāo),其核心創(chuàng)新包括:
- 最優(yōu)傳輸監(jiān)督(Optimal Transport Supervision, OTS):基于最優(yōu)傳輸理論,挖掘未配對信號間的潛在特征分布一致性,構(gòu)建柔性監(jiān)督機(jī)制。通過最小化特征遷移代價(jià),實(shí)現(xiàn)跨域特征對齊,突破傳統(tǒng)方法對嚴(yán)格配對數(shù)據(jù)的依賴。
- 調(diào)制拉普拉斯能量(Modulated Laplace Energy, MLE):在生成器特征層引入拉普拉斯能量自適應(yīng)調(diào)控機(jī)制。通過微分幾何特征動態(tài)調(diào)節(jié)生成信號的高頻能量分布,實(shí)現(xiàn)高動態(tài)場景下的量程突破與穩(wěn)態(tài)噪聲抑制,實(shí)現(xiàn)量程擴(kuò)展與噪聲抑制的雙重優(yōu)化。
- 本研究提出物理可解釋性評估體系(CSRE/ZVRE),它可以驗(yàn)證生成信號的物理合理性,首次為生成模型的可靠性與工程實(shí)用性建立嚴(yán)格的數(shù)學(xué)驗(yàn)證框架,填補(bǔ)領(lǐng)域內(nèi)生成信號質(zhì)量評估的理論空白。
最優(yōu)傳輸監(jiān)督
考慮到配對的低成本與高成本傳感器信號難以獲取,無法對生成模型施加逐元素匹配的端到端監(jiān)督,文中提出基于最優(yōu)傳輸理論的特征對齊機(jī)制,通過挖掘非配對信號特征間的潛在關(guān)聯(lián)性實(shí)現(xiàn)跨域監(jiān)督。
其核心思想在于:盡管兩類信號未嚴(yán)格配對,但其深層特征分布因物理量測本質(zhì)的一致性(如加速度的動力學(xué)約束、物理運(yùn)動的時(shí)空連續(xù)性等)呈現(xiàn)潛在關(guān)聯(lián)性。
具體而言,最優(yōu)傳輸理論通過量化特征間的全局遷移成本(如特征相似度與分布差異),動態(tài)構(gòu)建低成本特征向高成本特征的最優(yōu)映射關(guān)系。
這一過程不僅識別未配對數(shù)據(jù)中隱含的相似性模式(如動態(tài)響應(yīng)特征與噪聲分布規(guī)律),更通過最小化全局遷移代價(jià)實(shí)現(xiàn)特征空間的柔性對齊。
基于此映射關(guān)系,研究人員設(shè)計(jì)最優(yōu)傳輸監(jiān)督可以引導(dǎo)生成器逐步修正特征分布偏差,使得低成本信號特征在保持物理合理性的前提下逼近高成本信號特征。
該機(jī)制突破傳統(tǒng)方法對嚴(yán)格配對數(shù)據(jù)的依賴,通過全局分布匹配而非逐點(diǎn)強(qiáng)制映射,在未配對數(shù)據(jù)下最大化利用跨域監(jiān)督信息,為生成模型的可靠性與泛化性提供了理論保障。
圖2 最優(yōu)傳輸監(jiān)督示意圖
調(diào)制拉普拉斯能量
針對傳統(tǒng)生成模型對信號細(xì)節(jié)刻畫不足的問題,文中定義了深度學(xué)習(xí)特征的拉普拉斯能量,并在生成器特征層設(shè)計(jì)了一種拉普拉斯能量調(diào)制機(jī)制(Modulated Laplace Energy, MLE)。
該機(jī)制通過動態(tài)感知信號局部曲率特征,在高動態(tài)區(qū)間增強(qiáng)高頻分量以突破量程限制,在穩(wěn)態(tài)區(qū)間抑制噪聲能量以提升信噪比,實(shí)現(xiàn)物理規(guī)律引導(dǎo)下的信號細(xì)節(jié)重構(gòu)。
該方法首次將微分幾何約束嵌入生成式模型,為物理信息驅(qū)動的信號增強(qiáng)提供了可擴(kuò)展的算法框架。
圖3 拉普拉斯能量調(diào)制機(jī)制流程圖
實(shí)驗(yàn)
文中構(gòu)建了首個(gè)包含10類智能設(shè)備的加速度計(jì)信號增強(qiáng)數(shù)據(jù)集LASED,并提出物理可解釋性評估體系:CSRE/ZVRE。
在過載信號重構(gòu)任務(wù)中,該方法在15g量程下的重構(gòu)誤差較傳統(tǒng)方法降低83.4%,零速度殘差(ZVRE)達(dá)到0.065m/s的物理一致性水平。
Allan方差分析表明,靜態(tài)噪聲中的量化噪聲降低94%,達(dá)到高端傳感器實(shí)測性能。在實(shí)際工業(yè)場景測試中,成功捕捉到13.2g的機(jī)械沖擊峰值(傳統(tǒng)傳感器在8.0g即飽和),并通過高精度三維高速運(yùn)動捕捉設(shè)備驗(yàn)證了信號波形的時(shí)頻域保真度。
結(jié)論
首先,OTS機(jī)制為跨域非配對數(shù)據(jù)建模提供了新的優(yōu)化范式,研究人員將其推廣至多模態(tài)醫(yī)療影像分析、跨平臺機(jī)器人感知等場景。
此外,MLE模塊開創(chuàng)了微分算子約束與生成式模型的融合路徑,為物理規(guī)律驅(qū)動的信號重建提供了方法論指導(dǎo)。
文中構(gòu)建的評估體系建立了算法性能與物理可解釋性的定量關(guān)聯(lián),為傳感器信號處理領(lǐng)域確立了新的評價(jià)標(biāo)準(zhǔn)。
工程層面,該技術(shù)已應(yīng)用于工業(yè)機(jī)械臂振動監(jiān)測系統(tǒng),使成本$0.5以內(nèi)傳感器的測量精度達(dá)到$200專業(yè)設(shè)備的水平,驗(yàn)證了算法落地應(yīng)用的可行性。這項(xiàng)工作不僅突破了低成本傳感器的性能極限,更啟示了生成式模型在物理信息處理中的巨大潛力,為智能感知領(lǐng)域的算法-硬件協(xié)同創(chuàng)新提供了范式參考。
作者介紹
王一峰,哈工大博士生,2023年受國家留學(xué)基金委資助,赴新加坡國立大學(xué)進(jìn)行博士聯(lián)合培養(yǎng),研究方向包括深度學(xué)習(xí)可解釋性分析、傳感器信號處理與分析、AI物理感知等。擔(dān)任國際生物信息與生物醫(yī)學(xué)工程會議(BIBE)、計(jì)算機(jī)技術(shù)與信息科學(xué)國際會議(CTIS)、機(jī)器人自動化與智能控制國際會議(ICRAIC)分會主席,CVPR、ECCV、AAAI、Information Fusion、Pattern Recognition, Information Science等人工智能頂級會議/期刊審稿人。
趙毅, 哈工大教授,應(yīng)用數(shù)學(xué)研究中心主任和學(xué)科學(xué)術(shù)帶頭人,英國數(shù)學(xué)與應(yīng)用學(xué)會會士,廣東省數(shù)學(xué)學(xué)會理事,廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會常務(wù)理事,研究方向包括應(yīng)用動力系統(tǒng)、非線性時(shí)間序列分析、復(fù)雜網(wǎng)絡(luò)和數(shù)據(jù)科學(xué)理論等。近五年以第一/通信作者發(fā)表SCI論文59篇,其中3篇論文入選ESI高被引論文。