自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大腦也在強化學(xué)習!「價值決策」被大腦高效編碼,登Neuron頂刊

新聞 人工智能
人和動物的決策離不開大腦,大腦決策要靠「價值信息」。一項新研究揭示了這類關(guān)鍵信息更新和編碼的詳細機制,實驗表明,它們被編入一個資源庫,可以持久保存,長期調(diào)用。

 [[437266]]

我們每個人的一生都要做出大量的決定,小到「今天晚上吃什么」、「明天放假去哪里玩」,大到「這次戰(zhàn)役怎么打」、「這部法律如何制定」。

這些決定的結(jié)果,要由決策者的大腦來給出最終裁決。

所以,大腦中負責這類「裁決」的關(guān)鍵區(qū)域,成為科學(xué)家們關(guān)注的重點。

2019 年,加州大學(xué)圣地亞哥分校的研究人員就發(fā)現(xiàn)了做出「價值決策」的大腦區(qū)域。

大腦也在強化學(xué)習!「價值決策」被大腦高效編碼,登Neuron頂刊

他們發(fā)現(xiàn),這個區(qū)域被稱為脾后皮層 (RSC),是用來做出「有價值的選擇」的地方,比如決定今晚去哪家餐廳吃飯。然后,根據(jù)對今晚飯菜的喜好程度的新印象,用最新信息來更新RSC。

畢竟,只有及時更新信息,才能讓大腦做出最正確的決策。

現(xiàn)在,這個團隊在這個問題上又有新進展。該校生物科學(xué)系博士后 Ryoma Hattori 和 Takaki Komiyama 教授領(lǐng)導(dǎo)的新研究,揭示了大腦處理此類動態(tài)更新信息的詳細機制。

大腦也在強化學(xué)習!「價值決策」被大腦高效編碼,登Neuron頂刊

近日發(fā)表在Neuron期刊上的論文結(jié)果表明,RSC中的更新信息可以持久保存,就像一個可調(diào)用的資源庫。

這些「持久信息」可以最有效地表示或「編碼」有價值的信號,能夠跨越大腦的不同區(qū)域。

[[437267]]

為了研究大腦活動如何表示基于價值的決策的細節(jié),研究人員設(shè)置了強化學(xué)習實驗。價值決策是人類大腦的關(guān)鍵機制,在精神分裂癥、癡呆和成癮等神經(jīng)系統(tǒng)疾病中常常受損。

在實驗中,研究人員小鼠提供了多個選項,對小鼠的選擇以一定的概率獎勵,并記錄在強化學(xué)習過程中的相應(yīng)大腦活動。

大腦也在強化學(xué)習!「價值決策」被大腦高效編碼,登Neuron頂刊

由此產(chǎn)生的數(shù)據(jù)和網(wǎng)絡(luò)模擬指出了持續(xù)編碼在如何表示老鼠及其價值決定方面的重要性,以及 RSC 作為這項活動的紐帶。

研究人員在論文中解釋說:「這些結(jié)果表明,盡管信息編碼是高度分布的,但并非所有神經(jīng)活動中表示的信息都可以在每個區(qū)域中使用。這些結(jié)果表明,依賴于上下文的持久性信息,促進了可靠的信號編碼,擴大了信息在大腦中的分布?!?/p>

大腦也在強化學(xué)習!「價值決策」被大腦高效編碼,登Neuron頂刊

研究人員發(fā)現(xiàn),信息的持久性,可以讓價值信號在大腦的不同區(qū)域得到最高效的編碼,尤其是在脾后皮層中。圖片來源:加州大學(xué)圣地亞哥分校 Komiyama 實驗室

研究團隊成員,論文作者之一Hattori表示,眾所周知,神經(jīng)元會在不同的活動模式中循環(huán),一些神經(jīng)元的活動會激增,而另一些則保持沉默。

[[437268]]

Ryoma Hattori

這些大腦活動模式已被證明與某些與任務(wù)相關(guān)的信息相關(guān),例如決策的價值信息。由于 RSC 在連接多個大腦網(wǎng)絡(luò)和功能方面發(fā)揮著核心作用,此次新發(fā)現(xiàn)進一步強化了2019年的成果。

“我們認為在小鼠大腦中,RSC的作用是價值信息的穩(wěn)定儲存庫,當老鼠進行強化學(xué)習和決策時,RSC 會將價值信息分發(fā)到其他大腦區(qū)域,這些區(qū)域?qū)τ谶M一步處理價值信號至關(guān)重要。”

為了進一步測試他們的發(fā)現(xiàn),Hattori 和 Komiyama 使用了他們在實驗期間記錄的超過 100000 次小鼠決策的「大數(shù)據(jù)」庫。

研究人員對人工智能 (AI) 網(wǎng)絡(luò)進行編程,模仿基于計算機的強化試驗中的行為策略,得到了與現(xiàn)實世界的實驗非常相似的結(jié)果。

[[437269]]

Takaki Komiyama

「當我們訓(xùn)練AI做同樣的行為時,它采用了相同的策略和相同的方式來表示神經(jīng)活動中的信息,」Komiyama 說

「這表明,我們的發(fā)現(xiàn)確實是神經(jīng)回路執(zhí)行這種行為的選擇策略。AI和小鼠之間的這種相似性真的很有趣。」

 

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2020-01-16 15:57:36

AI 數(shù)據(jù)人工智能

2022-01-04 11:00:15

AI 數(shù)據(jù)人工智能

2021-10-11 09:51:38

谷歌人工智能強化學(xué)習

2021-08-18 10:20:41

人工智能強化學(xué)習技術(shù)

2024-08-23 11:30:18

2023-09-21 10:29:01

AI模型

2021-07-02 17:14:43

算法機器人技術(shù)

2013-05-10 10:02:45

微芯片記憶植入

2023-01-27 13:32:51

大腦模型模仿

2020-01-23 15:33:07

AI 數(shù)據(jù)人工智能

2023-05-08 12:32:20

AI讀心

2022-10-08 09:53:17

AI算法

2021-04-13 16:18:30

人工智能強化學(xué)習人臉識別

2023-03-09 08:00:00

強化學(xué)習機器學(xué)習圍棋

2020-08-10 06:36:21

強化學(xué)習代碼深度學(xué)習

2023-12-11 19:08:03

AI模型

2023-08-31 13:37:00

訓(xùn)練模型

2025-04-25 09:08:00

2021-04-13 05:38:35

Kubernetes存儲數(shù)據(jù)庫

2023-11-07 07:13:31

推薦系統(tǒng)多任務(wù)學(xué)習
點贊
收藏

51CTO技術(shù)棧公眾號