新的深度學(xué)習(xí)計(jì)劃如何克服機(jī)器人技術(shù)的挑戰(zhàn)?
當(dāng)數(shù)據(jù)科學(xué)家談?wù)撋疃葘W(xué)習(xí)時(shí),通常談?wù)摰氖菆D像生成、檢測(cè)、分類(lèi)和回歸任務(wù)。盡管如此,深度學(xué)習(xí)和人工智能正被廣泛應(yīng)用于機(jī)器人領(lǐng)域,并解決了其中一些重大的挑戰(zhàn)。正是對(duì)計(jì)算機(jī)視覺(jué)的深入學(xué)習(xí)推動(dòng)了人們對(duì)自動(dòng)駕駛汽車(chē)的追求。強(qiáng)化學(xué)習(xí)也為AlphaGo這樣的應(yīng)用提供了動(dòng)力,而更多的組織希望通過(guò)這些應(yīng)用獲得更多回報(bào)。
深度學(xué)習(xí)如今已經(jīng)取得了很多進(jìn)步,但人們?nèi)匀幌M谀硞€(gè)時(shí)間點(diǎn)達(dá)到最終目標(biāo)——通用人工智能(AGI)。
AGI機(jī)器人可以執(zhí)行任務(wù)嗎?
AGI是一種假想的機(jī)器智能,它可以理解或?qū)W習(xí)人類(lèi)可以完成的任何智能任務(wù)。
行業(yè)專(zhuān)家Steve Wozniak提出了一項(xiàng)用于確認(rèn)AGI具有人類(lèi)水平的測(cè)試,其中一項(xiàng)是家庭應(yīng)用的機(jī)器人需要知道如何煮咖啡——也就是說(shuō),機(jī)器人必須找到咖啡機(jī)和咖啡,加水,找到杯子,然后煮咖啡。
這項(xiàng)任務(wù)對(duì)人類(lèi)來(lái)說(shuō)可能輕而易舉。然而對(duì)于機(jī)器人來(lái)說(shuō),它本質(zhì)上意味著使用各種計(jì)算機(jī)視覺(jué)技術(shù)以正確的方式與環(huán)境進(jìn)行交互,以識(shí)別和使用對(duì)象,然后根據(jù)對(duì)任務(wù)的理解采取所有正確的措施。
確認(rèn)AGI的另一項(xiàng)測(cè)試是圖靈測(cè)試,其中人類(lèi)與機(jī)器交談,而人員必須猜測(cè)是在與機(jī)器還是在與另一個(gè)人交談。如果機(jī)器能夠愚弄人類(lèi)很多次,那么就會(huì)通過(guò)測(cè)試。
圖靈測(cè)試涉及對(duì)人類(lèi)語(yǔ)言及其結(jié)構(gòu)的深刻理解,這是一種如何連續(xù)使用語(yǔ)言的感覺(jué)。
人工智能能夠提供什么幫助?
埃隆·馬斯克、比爾·蓋茨以及史蒂芬·霍金等公眾人物都認(rèn)為人工智能可能對(duì)人類(lèi)構(gòu)成生存風(fēng)險(xiǎn)(例如終結(jié)者的Skynet),但是人們離真正害怕人工智能的地步還很遙遠(yuǎn)。
雖然像AlphaGo擊敗圍棋世界冠軍這樣的進(jìn)步確實(shí)讓人們以為計(jì)算機(jī)超越了人類(lèi),但必須明白的是,這臺(tái)機(jī)器本質(zhì)上是在試圖模仿它所學(xué)習(xí)的數(shù)以百萬(wàn)個(gè)棋局的邏輯。這些棋局提供了大量的訓(xùn)練數(shù)據(jù),與真實(shí)世界相比,人工智能采取的行動(dòng)的自由度非常有限。另一件事是,這些人工智能不是多功能的。這意味著,雖然人工智能可以很擅長(zhǎng)做一件事,但并不會(huì)做其他事情。而能夠獨(dú)立思考并產(chǎn)生現(xiàn)實(shí)行動(dòng)的機(jī)器人可能出現(xiàn)在遙遠(yuǎn)的未來(lái)。
盡管如此,人們?cè)趯?shí)現(xiàn)這一目標(biāo)方面正在取得一些進(jìn)展。而且應(yīng)該考慮如何立即設(shè)置過(guò)濾器或限制,以確保人工智能不會(huì)傷害人類(lèi)或帶來(lái)其他損害。人們已經(jīng)在基于人工智能的培訓(xùn)方式和人員的角度來(lái)應(yīng)對(duì)人工智能偏見(jiàn),因此在未來(lái)的自主人工智能出現(xiàn)之前,仍然存在很多障礙。
研究人員已經(jīng)在研究用于計(jì)算機(jī)視覺(jué)(CV)的深度學(xué)習(xí),它可以幫助機(jī)器人和機(jī)器人應(yīng)用程序使用各種傳感器來(lái)了解其環(huán)境,并幫助他們避開(kāi)道路上的障礙物。而機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)(CV)技術(shù)確實(shí)可以解決這一問(wèn)題。這將成為自動(dòng)駕駛汽車(chē)的重要組成部分,即使沒(méi)有訓(xùn)練數(shù)據(jù),它們也必須學(xué)習(xí)如何在新條件下觀察和學(xué)習(xí)。
許多研究也圍繞著語(yǔ)音識(shí)別(可用于將人類(lèi)語(yǔ)言轉(zhuǎn)換為機(jī)器語(yǔ)言)和自然語(yǔ)言處理(NLP)展開(kāi),自然語(yǔ)言處理可為機(jī)器提供理解和與人類(lèi)對(duì)話的能力。有些人已經(jīng)通過(guò)Alexa、Portal和Google家庭設(shè)備使用了低級(jí)的版本。事實(shí)上,GPT-3是一種新的語(yǔ)言生成模型,可以撰寫(xiě)有趣的文章,它再次通過(guò)在自然語(yǔ)言處理中使用深度學(xué)習(xí)來(lái)提供支持。
關(guān)于機(jī)器人深度學(xué)習(xí)的幾點(diǎn)思考
如今,人工智能的狀態(tài)往往以一種孤立的方式解決問(wèn)題。例如,視覺(jué)問(wèn)題與語(yǔ)言/語(yǔ)音問(wèn)題分開(kāi)解決。
研究人員需要做的下一件事是將所有這些功能集成到可以自己做出決定的工作機(jī)器人中。這些機(jī)器人需要能夠親身體驗(yàn)現(xiàn)實(shí)世界,以創(chuàng)建自己的世界觀,并從其環(huán)境中獲取可用于自身訓(xùn)練的其他數(shù)據(jù)。
雖然說(shuō)起來(lái)容易做起來(lái)難,但要達(dá)到這樣的目標(biāo)還需要更多的技術(shù)進(jìn)步,但是只要繼續(xù)朝著正確的方向前進(jìn),機(jī)器人實(shí)現(xiàn)AGI并開(kāi)啟全新的世界只是時(shí)間問(wèn)題。