機器學(xué)習(xí)在鐵路缺陷檢測中的實際應(yīng)用
譯文【51CTO.com快譯】介紹
鐵軌在列車行進過程中往往承受著巨大的壓力,而這一過程可能會產(chǎn)生導(dǎo)致火車發(fā)生事故的缺陷,如圖1所示。
圖1:由于鐵軌存在缺陷而引起的列車出軌事故
鐵軌缺陷與預(yù)防性檢測是鐵路安全領(lǐng)域的一個極其重要的領(lǐng)域。本文將對廣泛應(yīng)用于火車鐵軌診斷的超聲波檢測技術(shù)進行闡述和分析。
分析缺陷檢測結(jié)果面臨的一個主要問題是,目前缺乏在數(shù)百公里的鐵軌上捕獲缺陷數(shù)據(jù)的自動檢測能力。而在人工搜索缺陷時,遺漏缺陷的可能性很高,并且其結(jié)果主要取決于檢測人員的經(jīng)驗和人為因素。
問題陳述
在這項工作中,主要的任務(wù)是創(chuàng)建一個神經(jīng)網(wǎng)絡(luò)的工作原型,以自動檢測鐵軌超聲檢測圖上的缺陷,其準確性需要超過85%。
超聲波檢測中的鐵軌缺陷的分類
為了訓(xùn)練神經(jīng)網(wǎng)絡(luò),需要以數(shù)字形式對鐵軌進行超聲波檢查的初始數(shù)據(jù),這些數(shù)據(jù)可以使用相應(yīng)的缺陷圖的檢測儀獲得,這些檢測儀以B掃描(BSCAN)的形式顯示。
BSCAN形成的原理是將脈沖超聲波信號以一定的角度和距離輸入到鐵軌中,并記錄其反射信號(如圖2所示)。在反射信號強度圖中,不同的輸入角度的信號生成不同亮度的點。使用不同輸入角度的超聲波信號探測是由于缺陷具有不同性質(zhì),而反映信號的深度取決于缺陷的深度和形狀。
圖2:使用六個傳感器的鐵軌測深方案示例
為了對缺陷進行分類,需要考慮鐵軌缺陷分類的原則。而根據(jù)PJSC俄羅斯鐵路公司2017年推出的文件“關(guān)于無損鐵軌檢測結(jié)果解密的聲明”,其分類的所有鐵軌缺陷都用三位數(shù)字進行編碼。
為了創(chuàng)建數(shù)據(jù)集,以下選擇了8個最常見的缺陷。表1和表2顯示了所選鐵軌缺陷的視圖、缺陷代碼以及BSCAN的外觀。
表1:缺陷代碼及其缺陷圖列表的第1部分
表2:缺陷代碼及其缺陷圖列表的第2部分
在實際缺陷圖框架上訓(xùn)練的神經(jīng)網(wǎng)絡(luò)第一版
對現(xiàn)有缺陷圖數(shù)據(jù)庫的分析表明,由于各種制造商生產(chǎn)的設(shè)備具有各種信號處理算法、不同數(shù)量的發(fā)射器和接收器,因此無法同時使用它們。對于每個缺陷組都采用了Avikon-11檢測儀,根據(jù)估計,在兩個車站之間的鐵軌獲得的缺陷不會超過20個,而這對于創(chuàng)建有效的神經(jīng)網(wǎng)絡(luò)來說,這些缺陷的數(shù)量非常少。因此,在特定位置的參考缺陷鐵軌的現(xiàn)有站點上也采用了一組缺陷圖。這樣的一段鐵路被稱為“控制死區(qū)”。圖3顯示了一條鐵軌控制死區(qū)的缺陷圖。
圖3:采用Avikon-11檢測儀顯示的一根鐵軌截面的缺陷圖
可以將連續(xù)的缺陷圖“切割”為單獨的片段,然后將其分類并保存為單獨的文件——幀。圖3(第5點)所示的每個切割的幀同時包括沿其鐵軌截面的所有檢查區(qū)域。其測量通道的這種綜合考慮允許使用所有可用的信息特征來對缺陷圖幀進行分類。而[500,800]個條件點組成的幀數(shù)量很大,在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時需要大量的時間和計算成本。此外,它還需要較大的數(shù)據(jù)集。為了擴大帶有缺陷的數(shù)據(jù)集規(guī)模,可以使用一種偏移幀方法,如圖4所示。因此可以在一個缺陷上獲得50個以上的幀。這種方法允許將9個類的數(shù)據(jù)集從1,000個增加到60,000個,其中0類是無缺陷的鐵軌。
圖4:用于創(chuàng)建帶有缺陷的擴展數(shù)據(jù)集的幀
在這一過程中,合成了一個卷積神經(jīng)網(wǎng)絡(luò)用于無歧義的分類,其輸出端有一個完全連接的分類器(CNN)。經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在驗證數(shù)據(jù)上顯示35%的準確性。而每個可用的9類的準確率比純粹的隨機分類器要高出3倍。由于選擇了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和超參數(shù),因此無法提高識別精度。在這一階段,缺少規(guī)模足夠大的通用數(shù)據(jù)集是導(dǎo)致神經(jīng)網(wǎng)絡(luò)效率低下的關(guān)鍵因素。
基于模型數(shù)據(jù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)第二版
基于模型數(shù)據(jù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)第一版的效率比較低下的原因并不是因為使用的算法不佳,而是由于缺乏針對其訓(xùn)練的代表性的數(shù)據(jù)集,這才是關(guān)鍵因素。在測試鐵軌時,由于獲得新數(shù)據(jù)而導(dǎo)致數(shù)據(jù)集的增加是一個漫長的過程,可能會持續(xù)數(shù)年的時間。在這里實施的任務(wù)是考慮使用模型數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的可能性。
建模是加快增加數(shù)據(jù)集過程的一種方法,因此有必要基于數(shù)學(xué)模型,來獲得具有不同類別的缺陷圖幀的樣本。
建模類型選擇
神經(jīng)網(wǎng)絡(luò)操作及其訓(xùn)練的主要原理是抽象化在輸入端接收到的可見圖像,將其轉(zhuǎn)換為高級視覺概念,并同時過濾不重要的視覺細節(jié)。神經(jīng)網(wǎng)絡(luò)應(yīng)該只記住圖像,而細節(jié)只會妨礙它識別,這就是不必在鐵軌中創(chuàng)建精確的超聲波傳播物理模型的原因。超聲波在鐵軌中傳播的物理模型不能解決導(dǎo)致各種形式的缺陷及其位置的問題。此類缺陷需要人工創(chuàng)建,數(shù)量多達數(shù)萬個。而在鐵軌中引入超聲波并測量反射信號的模型、隨機性、對許多因素(生成器位置等)的依賴性等問題也沒有得到解決。
在這項工作中提出了一種方法,該方法包括創(chuàng)建參數(shù)仿真模型,基于該模型可以生成一個數(shù)據(jù)集,用于訓(xùn)練處理數(shù)以千計的每類缺陷的神經(jīng)網(wǎng)絡(luò)。
為了構(gòu)建這種神經(jīng)網(wǎng)絡(luò)的工作原型,選擇了超聲波輸入角為α=0(嚴格向下)的通道。其幀長(沿鐵軌長度)增加到1000個條件點,這對識別的準確性非常重要。
數(shù)學(xué)模型是在LabVIEW環(huán)境中開發(fā)的,用于原型設(shè)計和建模。所獲得的數(shù)學(xué)模型不僅考慮從反射器獲得的波形,而且考慮振幅的分布。在公共參數(shù)模型的輸出處獲得的每個幀都是唯一的,這是因為該模型的每個參數(shù)都有隨機生成器。表3和表4顯示了鐵軌中各個異質(zhì)結(jié)構(gòu)的測量數(shù)據(jù)和模型數(shù)據(jù)的BSCAN示例。
表3:鐵軌螺栓孔的實測數(shù)據(jù)和模型數(shù)據(jù)的BSCAN示例
表4:30組實測缺陷和模型缺陷掃描(表面缺陷和軌頭缺陷)
將單個鐵軌故障的超聲波檢查的測量數(shù)據(jù)與獲得的模型數(shù)據(jù)進行比較,可以了解它們的相似性。建議基于神經(jīng)網(wǎng)絡(luò)識別實際缺陷的準確性指標(biāo)來檢查所獲得模型的適當(dāng)性,該神經(jīng)網(wǎng)絡(luò)將從模型數(shù)據(jù)中學(xué)習(xí)。
從不同的鐵軌故障模型中,可以獲得對鐵軌進行超聲波檢查的幀。與此同時,模型的參數(shù)將會發(fā)生變化,以獲得在實際條件下可能發(fā)生的各種組合,也就是:
- 各種深度的缺陷;
- 各種坐標(biāo)的缺陷;
- 以螺栓孔的形式存在的缺陷和過程反射器的各個相對位置;
- 根據(jù)螺栓孔數(shù)的不同,螺栓連接的組合方式不同;
- 鐵軌中不同形式的缺陷和工藝異質(zhì)結(jié)構(gòu);
- 鐵軌中所有異類結(jié)構(gòu)的振幅響應(yīng)隨機性。
模型數(shù)據(jù)樣本的示例
圖5顯示了具有30組缺陷-表面缺陷和軌頭缺陷模型幀的樣本。
圖5:具有30組缺陷的模型幀樣本—表面缺陷和軌頭缺陷
為了進行比較,圖6顯示了來自Avikon-11檢測儀的實際數(shù)據(jù)。
圖6:具有第30組缺陷的真實幀的樣本—表面缺陷(軌頭缺陷)
圖7顯示了具有33組缺陷—軌頸缺陷模型幀的樣本。
圖7:具有33組缺陷—軌頸缺陷模型幀的樣本
為了進行比較,圖8顯示了來自Avikon-11檢測儀的實際數(shù)據(jù)。
圖8:具有33組缺陷-軌頸缺陷實際幀的樣本
圖9顯示了具有55組缺陷(軌頸中的缺陷)模型幀的樣本。圖10顯示了具有55組缺陷的實際幀。
圖9:具有55組缺陷-—軌頸缺陷模型幀的樣本
圖10:具有55組缺陷—-軌頸缺陷實際幀的樣本
圖11顯示了具有無缺陷條件(帶有和不帶有螺栓孔)模型幀的樣本。
圖11:處于無缺陷狀態(tài)(有螺栓孔和不帶有螺栓孔)模型幀的樣本
根據(jù)表5為每組模型幀分配一個類別編號(編碼標(biāo)記)
表5-分配類別
創(chuàng)建的數(shù)學(xué)模型使得有可能針對4個給定的類別(如上表中的0、1、2、3)生成10000個訓(xùn)練數(shù)據(jù)、1000個驗證數(shù)據(jù)和1000個測試數(shù)據(jù)的平衡集。這樣一個數(shù)據(jù)集的生成時間為10分鐘。
想法的有效性
此外,這項工作還進行了卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型的綜合、訓(xùn)練以及對創(chuàng)建的數(shù)據(jù)集的綜合(模型)數(shù)據(jù)的驗證。實踐表明,其訓(xùn)練數(shù)據(jù)的識別準確率為98%,測試數(shù)據(jù)的識別準確率為97%。
為了檢查識別實際缺陷幀(由檢測儀測量)的準確性,將來自控制死區(qū)的標(biāo)記幀(通過Avikon-11檢測儀檢查數(shù)據(jù)集,這里有3000個樣本)提供給所創(chuàng)建的神經(jīng)網(wǎng)絡(luò)的輸入。對Avikon-11型檢測儀實測數(shù)據(jù)的識別準確率為92%。
獲得的精度是一個很好的結(jié)果。但是采用一些方法可以提高精度。失配矩陣(如圖12所示)有助于了解神經(jīng)網(wǎng)絡(luò)在哪些幀上出錯。
圖12:失配矩陣
在分析矩陣之后,很明顯,神經(jīng)網(wǎng)絡(luò)會在3類(缺陷組-55)的幀中做出主要預(yù)測誤差,而在0類(無缺陷狀態(tài))的幀中進行預(yù)測,神經(jīng)網(wǎng)絡(luò)將其識別為一個螺栓孔的位置。由于其相似性,導(dǎo)致第55組出現(xiàn)缺陷(如圖13所示)。在這種情況下,有必要添加其他通道的信息符號,從而提高預(yù)測的準確性(在這種情況下通常是軌頸控制通道,這是由于存在螺栓孔)。這對圖13進行了解釋。
圖13:將幀錯誤分配給3類的示例
目前,在識別系統(tǒng)中已添加了在神經(jīng)網(wǎng)絡(luò)已“決定”分類的幀上突出顯示信息符號的算法(圖14中的黃色背景)。
結(jié)論和進一步的發(fā)展策略
獲得的92%的準確度表明了將模型數(shù)據(jù)用于訓(xùn)練網(wǎng)絡(luò)的可能性,并將其應(yīng)用于自動識別鐵軌超聲檢測的實際缺陷圖,從而解決了訓(xùn)練數(shù)據(jù)量少的問題,這將顯著加快采用自動缺陷識別系統(tǒng)生成軟件的進程。這一想法的進一步發(fā)展包括以下步驟:
(1)軌頭控制通道、軌頸控制通道、軌底控制通道的模型綜合。
(2)調(diào)整模型以消除噪音。
(3)將生成的缺陷“植入”(放置和引入)到實際缺陷圖(具有引入缺陷的真實噪聲圖)。
(4)改進模型以提高神經(jīng)網(wǎng)絡(luò)的精度。
工作原型所提出的發(fā)展階段將允許增加:
- 缺陷識別的準確性
- 已識別的缺陷類別的數(shù)量
- 創(chuàng)建一個完整的系統(tǒng),以通過所選檢測儀的所有測量通道來自動檢測缺陷。
所獲得的模型可以適合所需的檢測儀。
原文標(biāo)題:Using Machine Learning To Detect Railway Defects,作者:Alex Kaluzhniy
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】