最新機(jī)器人學(xué)習(xí)系統(tǒng)問世 一段視頻就能學(xué)會(huì)工作內(nèi)容
人類或許很快就能夠通過向機(jī)器人展示如何工作,讓機(jī)器人學(xué)會(huì)如何完成工作任務(wù),而且只需要演示一次。美國加州大學(xué)伯克利分校的研究人員已經(jīng)研發(fā)出一種方式來加速我們對(duì)這些機(jī)器朋友的教育。在最近發(fā)表的一篇論文中,研究人員公布了一種全新的學(xué)習(xí)算法,能夠讓機(jī)器人模擬完成在視頻中只觀看過一次的行動(dòng)。
現(xiàn)在訓(xùn)練機(jī)器人是一項(xiàng)艱難的工作,即使是拿起一個(gè)杯子這樣非常簡單的動(dòng)作也需要一段又一段的編碼,來告訴機(jī)器人每一個(gè)步驟需要做什么。這個(gè)編程過程對(duì)于我們?nèi)祟悂碚f非常困難而且復(fù)雜,甚至有時(shí)會(huì)令人感到沮喪。
即使是編碼完全編寫完成之后也還有許多工作要做。我們拿裝配線的機(jī)器人來舉例。在所有的指令被輸入到電路當(dāng)中之后,這些機(jī)器人必須經(jīng)歷一個(gè)長時(shí)間的訓(xùn)練過程,在這個(gè)訓(xùn)練過程中它們必須重復(fù)執(zhí)行每一個(gè)步驟。它們需要不斷重復(fù)這個(gè)過程,直到它們能夠在不犯錯(cuò)誤的情況下完成任務(wù)。
最近已經(jīng)有程序員研發(fā)出了一種軟件,能夠讓機(jī)器人僅僅通過觀察特定的任務(wù)就能夠?qū)崿F(xiàn)編程。雖然這種學(xué)習(xí)方式非常類似于我們或者動(dòng)物的學(xué)習(xí)方式,但這仍然是一種笨拙的方法。目前來說,我們需要向我們的機(jī)器人朋友展示這樣的訓(xùn)練視頻,而且在它們完全掌握之前需要播放數(shù)千次。
然而,加州大學(xué)伯克利的研究團(tuán)隊(duì)已經(jīng)描述了他們研發(fā)的另外一項(xiàng)新技術(shù),這項(xiàng)技術(shù)能夠讓機(jī)器人只觀察一次人類的某種動(dòng)作就學(xué)會(huì)它。研究人員稱,他們研發(fā)的這項(xiàng)技術(shù)將模仿學(xué)習(xí)與一種元學(xué)習(xí)算法結(jié)合到一起。
他們把這個(gè)系統(tǒng)命名為“未知模型元學(xué)習(xí)系統(tǒng)(簡稱MAML)”。元學(xué)習(xí)本質(zhì)上意味著學(xué)會(huì)學(xué)習(xí)的過程。MAML系統(tǒng)意味著機(jī)器人能夠在之前獲得經(jīng)驗(yàn)的基礎(chǔ)上來學(xué)習(xí)某種新的東西。比如說,如果向機(jī)器人展示的是某人拿取蘋果并且放進(jìn)一個(gè)杯子的視頻,那么它就能夠估計(jì)自己的目標(biāo)是什么,就是把蘋果放進(jìn)杯子當(dāng)中。
當(dāng)它學(xué)會(huì)如何處理這些物體時(shí),它就能夠?qū)⑦@種知識(shí)推廣到其它類似的行為。比如說,如果你隨后向它展示一段某人將一個(gè)桔子放在盤子上的視頻,它就能夠識(shí)別這些行為并且快速將其轉(zhuǎn)變成為自己完成這個(gè)任務(wù)需要的動(dòng)作。
對(duì)于那些流水線的裝配機(jī)器人來說,它們不需要了解什么是桔子或者什么是盤子,它只需要執(zhí)行需要完成的任務(wù)。簡言之,MAML系統(tǒng)提供了一個(gè)平臺(tái),讓神經(jīng)網(wǎng)絡(luò)或者機(jī)器人以相對(duì)較少的數(shù)據(jù)學(xué)會(huì)如何執(zhí)行各種任務(wù)。這幾乎與現(xiàn)在的神經(jīng)網(wǎng)絡(luò)工作方式完全相反,后者執(zhí)行一項(xiàng)簡單任務(wù)就需要大量的數(shù)據(jù)。
研究團(tuán)隊(duì)在幾個(gè)機(jī)器人身上對(duì)MAML系統(tǒng)進(jìn)行了測試。研究人員聲稱,在展示了一段演示視頻之后,機(jī)器人能夠成功完成視頻中展示的任務(wù)。研究人員推斷,經(jīng)過元學(xué)習(xí)之后,機(jī)器人借助人類的演示視頻就能夠?qū)W會(huì)放置、推動(dòng)以及拾取和放置新物體。