自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="btoet"><p id="btoet"><li id="btoet"></li></p></sub>

<s id="btoet"><strong id="btoet"></strong></s>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

人工智能一大技術(shù)：強化學(xué)習(xí)（RL）

作者：智能制造網(wǎng) 2020-12-23 06:07:54

人工智能深度學(xué)習(xí)

強化學(xué)習(xí)主要由智能體(Agent)、環(huán)境(Environment)、狀態(tài)(State)和動作(Action)、獎勵(Reward)組成。智能體將在環(huán)境的當(dāng)前狀態(tài)下，根據(jù)獎勵信號做出動作，從而達到環(huán)境中的不同狀態(tài)并得到獎勵。

人工智能技術(shù)進步的速度越來越快，每種細分技術(shù)所創(chuàng)造的價值正日益得到展現(xiàn)。

2013年，DeepMind發(fā)明了DQN算法，成功將深度學(xué)習(xí)和強化學(xué)習(xí)結(jié)合起來，開啟了深度強化學(xué)習(xí)的新紀元。此后數(shù)年，強化學(xué)習(xí)的成果日新月異，很多非常困難的問題都被深度強化學(xué)習(xí)算法解決。

2016年，谷歌阿爾法圍棋以4:1戰(zhàn)勝圍棋世界冠軍、職業(yè)九段棋手李世石，不僅讓深度學(xué)習(xí)為人們所知，而且掀起了人工智能的“大眾熱”，大家由此更加關(guān)注強化學(xué)習(xí)這一技術(shù)要點。

使用強化學(xué)習(xí)的一個很好的例子是讓機器人學(xué)習(xí)如何走路。機器人首先向前邁出一大步然后跌倒。這一大步和摔倒是強化學(xué)習(xí)系統(tǒng)關(guān)注的響應(yīng)點。由于反饋是負面的，所以繼續(xù)調(diào)整，系統(tǒng)會根據(jù)多個負反饋的比對最終確定機器人應(yīng)該把步子邁的小一點，不停地小，直到機器人走路不會摔倒為止。

通過強化學(xué)習(xí)，Boston Dynamics公司的機器人已經(jīng)掌握了托舉、后空翻、跳上窗臺的要點。而迪斯尼幻想工程已經(jīng)把這一點帶到了一個新的層面，那就是讓人形機器人來執(zhí)行玩命的特技。

有業(yè)內(nèi)人士指出，強化學(xué)習(xí)和其他的人工智能技術(shù)有一個很大的差異，那就是它的學(xué)習(xí)范式和其它技術(shù)不太一樣。它不需要我們?nèi)ナ占瘮?shù)據(jù)，也不需要我們?nèi)プ鋈魏螛?biāo)記，而是我們把稱之為智能體(Agent)，放在一個環(huán)境里，就像動物或者我們自己生存的一個環(huán)境里，它會和環(huán)境自己打交道，自己學(xué)會在環(huán)境里如何完成一個任務(wù)，解決一個問題。

強化學(xué)習(xí)主要由智能體(Agent)、環(huán)境(Environment)、狀態(tài)(State)和動作(Action)、獎勵(Reward)組成。智能體將在環(huán)境的當(dāng)前狀態(tài)下，根據(jù)獎勵信號做出動作，從而達到環(huán)境中的不同狀態(tài)并得到獎勵。

除了強化學(xué)習(xí)外，機器學(xué)習(xí)也備受關(guān)注。機器學(xué)習(xí)是AI的一個子集，是通過不同場景中的經(jīng)驗來訓(xùn)練系統(tǒng)的能力。隨著車輛變得越來越自動化，開發(fā)人員可以使用機器學(xué)習(xí)訓(xùn)練系統(tǒng)來識別對象，并用更少的數(shù)據(jù)更好地解釋其環(huán)境。

再來看一下深度學(xué)習(xí)。深度學(xué)習(xí)就是從有限樣例中通過算法總結(jié)出一般性的規(guī)律，并可以應(yīng)用到新的未知數(shù)據(jù)上。例如，我們可以從一些歷史病例的集合中總結(jié)出癥狀和疾病之間的規(guī)律。這樣，當(dāng)有新的病人到來時，我們可以利用總結(jié)出來的規(guī)律來判斷這個病人得了什么疾病。

那么，強化學(xué)習(xí)、機器學(xué)習(xí)、深度學(xué)習(xí)三者的區(qū)別是什么?簡單說，人工智能范圍最大，涵蓋機器學(xué)習(xí)、深度學(xué)習(xí)和強化學(xué)習(xí)。如果把人工智能比喻成孩子大腦，那么機器學(xué)習(xí)是讓孩子去掌握認知能力的過程，而深度學(xué)習(xí)是這種過程中很有效率的一種教學(xué)體系。

由強化學(xué)習(xí)、機器學(xué)習(xí)等技術(shù)構(gòu)成的人工智能，其良好的發(fā)展前景引人期待。從全國來看，據(jù)艾瑞咨詢測算，2022年國內(nèi)人工智能核心產(chǎn)業(yè)規(guī)模有望達到1573億元，復(fù)合增速達58%，產(chǎn)業(yè)將持續(xù)快速增長。如此廣闊的市場空間，吸引著社會各界投資者的關(guān)注。

值得一提的是，發(fā)展“以人為本”的人工智能是全社會的課題，需要政府、商界、學(xué)界及所有利益相關(guān)方共擔(dān)責(zé)任，協(xié)力推動。作為技術(shù)應(yīng)用與推廣的主體，企業(yè)負有不可推卸的社會責(zé)任。在研究強化學(xué)習(xí)相關(guān)技術(shù)時，企業(yè)要自覺遵守法規(guī)制度和社會公約，以此促進其有序、可持續(xù)應(yīng)用。

未來，全球的可持續(xù)發(fā)展越來越依賴于數(shù)據(jù)創(chuàng)造的價值，而人工智能是數(shù)字經(jīng)濟中應(yīng)用十分廣泛的技術(shù)之一?；蛟S再過幾年，AI將在精準(zhǔn)農(nóng)業(yè)、智能家居、遠程醫(yī)療、自動駕駛等領(lǐng)域發(fā)揮更加重要的作用。

責(zé)任編輯：姜華來源：今日頭條

人工智能 AI 深度學(xué)習(xí)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

^{<blockquote id="qoopq"></blockquote>}