自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

破解人類識別文字之謎,對圖像中的字母進行無監(jiān)督學習

人工智能 深度學習
Nature 子刊 Nature Human Behavior 上最新發(fā)表了一篇關(guān)于人類行為的研究,通過對自然圖像中的字母進行無監(jiān)督學習,探討了人類是如何獲得文字識別能力的。研究人員提出了一個基于深度神經(jīng)網(wǎng)絡(luò)的大規(guī)模字母識別計算模型,通過將概率生成模型與視覺輸入擬合,以完全無監(jiān)督的方式開發(fā)了復(fù)雜的內(nèi)部表征的層次結(jié)構(gòu)。

[[201526]]

Nature 子刊 Nature Human Behavior 上***發(fā)表了一篇關(guān)于人類行為的研究,通過對自然圖像中的字母進行無監(jiān)督學習,探討了人類是如何獲得文字識別能力的。研究人員提出了一個基于深度神經(jīng)網(wǎng)絡(luò)的大規(guī)模字母識別計算模型,通過將概率生成模型與視覺輸入擬合,以完全無監(jiān)督的方式開發(fā)了復(fù)雜的內(nèi)部表征的層次結(jié)構(gòu)。

書寫符號的使用是人類文化發(fā)展的重大成就。然而,抽象的字母表征是如何在視覺中進行學習的,這仍然是未解決的問題。發(fā)表在 Nature.com 上的一篇題為 Letter perception emerges from unsupervised deep learning and recycling of natural image features 的研究報告中,研究人員提出了一個基于深度神經(jīng)網(wǎng)絡(luò)的大規(guī)模的字母識別計算模型,通過將概率生成模型與視覺輸入擬合,以完全無監(jiān)督的方式開發(fā)了更為復(fù)雜的內(nèi)部表征的層次結(jié)構(gòu)。

有這樣一個假設(shè),學習書寫符號部分地重新使用了用于對象識別的預(yù)先存在的神經(jīng)元回路,模型的早期處理階段利用了從自然圖像中學習的一般領(lǐng)域(domain-general)的視覺特征,而特定領(lǐng)域(domain-specific)的特征則出現(xiàn)在曝光于印刷字母前的上游神經(jīng)元中。

研究論證,即使對于噪聲降級(noise-degraded)的圖像,這些高級別表征可以很容易地映射到字母識別,從而產(chǎn)生和人類觀察者類似的對于字母認知的廣泛實證結(jié)果的準確模擬。研究者的模型顯示出,通過重用自然的視覺原語(primitives),學習書寫符號只需要有限的、特定領(lǐng)域的調(diào)整,這支持了字母形狀被文化選擇以匹配自然環(huán)境的統(tǒng)計結(jié)構(gòu)的假設(shè)。

圖 1a 刻畫了研究者提出的模型的整體架構(gòu)。網(wǎng)絡(luò)底層接收了作為圖像像素 灰度級別激活編碼的感知信號。出現(xiàn)在視網(wǎng)膜和丘腦中的低級別視覺處理被一個啟發(fā)自生物學的 whitening 算法所模擬,捕捉到了圖像中的局部空間關(guān)系,成為了對比歸一化(contrast normalization)的一個步驟。

 

圖1 是深度學習架構(gòu)和自然圖像及印刷字母數(shù)據(jù)樣本。

a,深度學習架構(gòu)。每個框代表了網(wǎng)絡(luò)中的一層神經(jīng)元。和 whitening 步驟相應(yīng)的有方向的箭頭引出了前饋的處理過程,而無方向的連接顯示了無監(jiān)督生成學習所利用的雙向處理過程。和線性讀數(shù)層相應(yīng)的有方向的箭頭引出了監(jiān)督學習。在字母處理過程中涉及到的相應(yīng)大腦網(wǎng)絡(luò)顯示在右側(cè)(LGN, 背外側(cè)膝狀體核; V1, 首要視覺皮層; V2, 二級視覺皮層; V4, 紋狀體外視覺皮層;OTS, 顳枕溝);

b,包含多個小 patch (40 × 40 pixels)的自然圖像,顯示在右側(cè);c,研究者的數(shù)據(jù)集中印刷字母的樣本,使用多種字體、風格、大小和位置關(guān)系創(chuàng)造而成。

研究人員將編碼在***個內(nèi)部層(隱式)神經(jīng)元的潛在特征集稱為H1, H1 模仿了出現(xiàn)在早期大腦皮層視覺(corticalvision ,在 V1 和 V2 中)的處理類型。

 

圖2 是新出現(xiàn)的神經(jīng)元感受野(receptive fields)、表征選擇和模型中字母識別準確度。

a,在 H1 層中神經(jīng)元樣本的感受野,灰度體現(xiàn)其連接強度(黑色:強,inhibitory connection;白色:強,excitatory connection);

b,H2 層中隱式神經(jīng)元樣本的感受野;

c 和 d,H1 層(c)和H2層(d)中對于不同刺激的平均反饋(activation norm);

e, 作為噪聲級別函數(shù)(即, 高斯噪聲的標準偏差)的不同表征層讀數(shù)的準確度;f,無噪聲刺激樣本,及含噪聲的對應(yīng)版本,性能表現(xiàn)約為前者的 50%。

 

 

圖3 是人類心理物理學研究的模擬。

a,模型混淆矩陣和各種經(jīng)驗混淆矩陣之間的Pearson 相關(guān)性(均P <0.001)。注意,所有經(jīng)驗矩陣之間的平均互相關(guān)為0.56;b,通過 H2 表征層次聚類得出的樹狀圖,表明在網(wǎng)絡(luò)的內(nèi)部表征中保留了字母之間的視覺相似性。連接柱的高度表示歐氏距離(較小的條表示更大的相似度);

c,每個字體的平均perimetric 復(fù)雜度與noise-degraded 刺激的相應(yīng)平均字母識別精度之間的負相關(guān);

d,根據(jù)平均字母混淆排列的所有字體列表,從最小混亂(上)到***混亂(底部)。

 

圖4 是感知渠道中介字母識別的空間頻率分析。

a,b,疊加在高斯噪聲(均方根對比度= 0.2)和背景(亮度= 0.2)上的低通(a)和高通(b)濾波字母的樣本;

c,根據(jù)濾波器類型的H2讀數(shù)敏感度對比函數(shù),每個字母的頻率范圍從 0.8 到 6.6(兩個軸均為對數(shù))。注意,與對應(yīng)于低通和高通噪聲的曲線相比,對應(yīng)于低通濾波和高通濾波的曲線相反,因為研究者直接對輸入信號而不是調(diào)制噪聲進行濾波。 

責任編輯:龐桂玉 來源: 36大數(shù)據(jù)
相關(guān)推薦

2023-11-23 15:54:01

人工智能監(jiān)督學習無監(jiān)督學習

2020-04-28 17:26:04

監(jiān)督學習無監(jiān)督學習機器學習

2017-06-12 14:04:45

深度學習人工智能

2022-06-14 07:07:57

網(wǎng)絡(luò)威脅無監(jiān)督數(shù)據(jù)泄露

2017-11-09 14:04:22

無監(jiān)督學習數(shù)據(jù)缺失數(shù)據(jù)集

2019-03-29 14:10:35

無監(jiān)督學習機器學習人工智能

2017-10-09 23:21:08

無監(jiān)督學習機器學習人工智能

2023-11-28 12:03:46

人工智能無監(jiān)督學習算法

2022-05-17 16:38:40

數(shù)據(jù)訓練

2022-05-13 11:05:00

網(wǎng)絡(luò)威脅無監(jiān)督學習網(wǎng)絡(luò)攻擊

2022-11-29 15:38:01

學習框架編碼器數(shù)據(jù)

2020-08-14 11:00:44

機器學習人工智能機器人

2020-08-16 11:34:43

人工智能機器學習技術(shù)

2023-11-13 15:01:28

機器學習

2019-10-14 10:40:03

機器學習人工智能非監(jiān)督學習

2015-10-12 10:37:42

學習算法檢測

2024-09-30 06:04:02

人臉識別Python機器學習

2025-04-25 08:00:00

2022-07-17 15:46:24

機器學習無監(jiān)督學習算法

2017-07-03 07:14:49

深度學習無監(jiān)督學習稀疏編碼
點贊
收藏

51CTO技術(shù)棧公眾號