自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

大腦也在強化學(xué)習！「價值決策」被大腦高效編碼，登Neuron頂刊

作者：佚名 2021-11-29 10:09:50

新聞人工智能

人和動物的決策離不開大腦，大腦決策要靠「價值信息」。一項新研究揭示了這類關(guān)鍵信息更新和編碼的詳細機制，實驗表明，它們被編入一個資源庫，可以持久保存，長期調(diào)用。

我們每個人的一生都要做出大量的決定，小到「今天晚上吃什么」、「明天放假去哪里玩」，大到「這次戰(zhàn)役怎么打」、「這部法律如何制定」。

這些決定的結(jié)果，要由決策者的大腦來給出最終裁決。

所以，大腦中負責這類「裁決」的關(guān)鍵區(qū)域，成為科學(xué)家們關(guān)注的重點。

2019 年，加州大學(xué)圣地亞哥分校的研究人員就發(fā)現(xiàn)了做出「價值決策」的大腦區(qū)域。

大腦也在強化學(xué)習！「價值決策」被大腦高效編碼，登Neuron頂刊

他們發(fā)現(xiàn)，這個區(qū)域被稱為脾后皮層 (RSC)，是用來做出「有價值的選擇」的地方，比如決定今晚去哪家餐廳吃飯。然后，根據(jù)對今晚飯菜的喜好程度的新印象，用最新信息來更新RSC。

畢竟，只有及時更新信息，才能讓大腦做出最正確的決策。

現(xiàn)在，這個團隊在這個問題上又有新進展。該校生物科學(xué)系博士后 Ryoma Hattori 和 Takaki Komiyama 教授領(lǐng)導(dǎo)的新研究，揭示了大腦處理此類動態(tài)更新信息的詳細機制。

大腦也在強化學(xué)習！「價值決策」被大腦高效編碼，登Neuron頂刊

近日發(fā)表在Neuron期刊上的論文結(jié)果表明，RSC中的更新信息可以持久保存，就像一個可調(diào)用的資源庫。

這些「持久信息」可以最有效地表示或「編碼」有價值的信號，能夠跨越大腦的不同區(qū)域。

為了研究大腦活動如何表示基于價值的決策的細節(jié)，研究人員設(shè)置了強化學(xué)習實驗。價值決策是人類大腦的關(guān)鍵機制，在精神分裂癥、癡呆和成癮等神經(jīng)系統(tǒng)疾病中常常受損。

在實驗中，研究人員小鼠提供了多個選項，對小鼠的選擇以一定的概率獎勵，并記錄在強化學(xué)習過程中的相應(yīng)大腦活動。

大腦也在強化學(xué)習！「價值決策」被大腦高效編碼，登Neuron頂刊

由此產(chǎn)生的數(shù)據(jù)和網(wǎng)絡(luò)模擬指出了持續(xù)編碼在如何表示老鼠及其價值決定方面的重要性，以及 RSC 作為這項活動的紐帶。

研究人員在論文中解釋說：「這些結(jié)果表明，盡管信息編碼是高度分布的，但并非所有神經(jīng)活動中表示的信息都可以在每個區(qū)域中使用。這些結(jié)果表明，依賴于上下文的持久性信息，促進了可靠的信號編碼，擴大了信息在大腦中的分布?！?/p>

大腦也在強化學(xué)習！「價值決策」被大腦高效編碼，登Neuron頂刊

研究人員發(fā)現(xiàn)，信息的持久性，可以讓價值信號在大腦的不同區(qū)域得到最高效的編碼，尤其是在脾后皮層中。圖片來源：加州大學(xué)圣地亞哥分校 Komiyama 實驗室

研究團隊成員，論文作者之一Hattori表示，眾所周知，神經(jīng)元會在不同的活動模式中循環(huán)，一些神經(jīng)元的活動會激增，而另一些則保持沉默。

Ryoma Hattori

這些大腦活動模式已被證明與某些與任務(wù)相關(guān)的信息相關(guān)，例如決策的價值信息。由于 RSC 在連接多個大腦網(wǎng)絡(luò)和功能方面發(fā)揮著核心作用，此次新發(fā)現(xiàn)進一步強化了2019年的成果。

“我們認為在小鼠大腦中，RSC的作用是價值信息的穩(wěn)定儲存庫，當老鼠進行強化學(xué)習和決策時，RSC 會將價值信息分發(fā)到其他大腦區(qū)域，這些區(qū)域?qū)τ谶M一步處理價值信號至關(guān)重要。”

為了進一步測試他們的發(fā)現(xiàn)，Hattori 和 Komiyama 使用了他們在實驗期間記錄的超過 100000 次小鼠決策的「大數(shù)據(jù)」庫。

研究人員對人工智能 (AI) 網(wǎng)絡(luò)進行編程，模仿基于計算機的強化試驗中的行為策略，得到了與現(xiàn)實世界的實驗非常相似的結(jié)果。

Takaki Komiyama

「當我們訓(xùn)練AI做同樣的行為時，它采用了相同的策略和相同的方式來表示神經(jīng)活動中的信息，」Komiyama 說

「這表明，我們的發(fā)現(xiàn)確實是神經(jīng)回路執(zhí)行這種行為的選擇策略。AI和小鼠之間的這種相似性真的很有趣。」

責任編輯：張燕妮來源：新智元

AI 強化學(xué)習人工智能

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="t1u3r"></style>