自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

人工智能 深度學(xué)習(xí)
我們對世界的體驗是多模態(tài)的 —— 我們看到物體,聽到聲音,感覺到質(zhì)地,聞到氣味,嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式,當(dāng)一個研究問題包含多個模態(tài)時,它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進展,它需要能夠同時解釋這些多模態(tài)的信號。

 使用深度學(xué)習(xí)融合各種來源的信息。

 

 

多模態(tài)數(shù)據(jù)

我們對世界的體驗是多模態(tài)的 —— 我們看到物體,聽到聲音,感覺到質(zhì)地,聞到氣味,嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式,當(dāng)一個研究問題包含多個模態(tài)時,它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進展,它需要能夠同時解釋這些多模態(tài)的信號。

例如,圖像通常與標(biāo)簽和文本解釋相關(guān)聯(lián),文本包含圖像,以更清楚地表達文章的中心思想。不同的模態(tài)具有非常不同的統(tǒng)計特性。

多模態(tài)深度學(xué)習(xí)

雖然結(jié)合不同的模態(tài)或信息類型來提高效果從直觀上看是一項很有吸引力的任務(wù),但在實踐中,如何結(jié)合不同的噪聲水平和模態(tài)之間的沖突是一個挑戰(zhàn)。此外,模型對預(yù)測結(jié)果有不同的定量影響。在實踐中最常見的方法是將不同輸入的高級嵌入連接起來,然后應(yīng)用softmax。

 

多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

 

多模態(tài)深度學(xué)習(xí)的例子,其中使用不同類型的神經(jīng)網(wǎng)絡(luò)提取特征

這種方法的問題是,它將給予所有子網(wǎng)絡(luò)/模式同等的重要性,這在現(xiàn)實情況中是非常不可能的。

 

多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

 

所有的模態(tài)對預(yù)測都有相同的貢獻

對網(wǎng)絡(luò)進行加權(quán)組合

我們采用子網(wǎng)絡(luò)的加權(quán)組合,以便每個輸入模態(tài)可以對輸出預(yù)測有一個學(xué)習(xí)貢獻(Theta)。

我們的優(yōu)化問題變成-

 

多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

 

對每個子網(wǎng)絡(luò)給出Theta權(quán)值后的損失函數(shù)。

 

多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

 

將權(quán)值附加到子網(wǎng)后預(yù)測輸出。

把所有的都用起來!

準(zhǔn)確性和可解釋性

我們在兩個現(xiàn)實多模態(tài)數(shù)據(jù)集上得到了SOTA:

Multimodal Corpus of Sentiment Intensity(MOSI) 數(shù)據(jù)集 —— 有417個標(biāo)注過的視頻,每毫秒標(biāo)注的音頻特征。共有2199個標(biāo)注數(shù)據(jù)點,其中情緒強度定義為從strongly negative到strongly positive,線性尺度從- 3到+3。

模態(tài)包括:

1、文本

2、音頻

3、語言

 

多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

 

每種模態(tài)對情緒預(yù)測的貢獻量

Transcription Start Site Prediction(TSS)數(shù)據(jù)集 —— Transcription是基因表達的第一步,在這一步中,特定的DNA片段被復(fù)制到RNA (mRNA)中。Transcription起始位點是transcription開始的位置。DNA片段的不同部分具有不同的特性,從而影響其存在。我們將TSS分為三個部分:

  1. 上游DNA
  2. 下游DNA
  3. TSS位置

我們?nèi)〉昧饲八从械母纳?,比之前的最先進的結(jié)果3%。使用TATA box的下游DNA區(qū)域?qū)@一過程影響最大。

 

多模態(tài)深度學(xué)習(xí):用深度學(xué)習(xí)的方式融合各種信息

 

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2024-04-08 00:12:19

2023-02-06 18:32:05

模型論文

2021-03-08 11:28:59

人工智能深度學(xué)習(xí)Python

2018-08-28 15:47:03

人工智能深度學(xué)習(xí)機器學(xué)習(xí)

2020-05-21 14:05:17

TFserving深度學(xué)習(xí)架構(gòu)

2017-05-27 14:00:06

深度學(xué)習(xí)人臉建模

2019-02-13 19:00:01

深度學(xué)習(xí)機器學(xué)習(xí)人工神經(jīng)

2017-05-08 16:13:33

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)深度

2021-05-06 09:05:11

深度學(xué)習(xí)

2017-03-06 16:56:37

深度學(xué)習(xí)本質(zhì)現(xiàn)狀

2021-04-16 11:31:24

人工智能深度學(xué)習(xí)

2017-06-27 14:49:20

深度學(xué)習(xí)機器學(xué)習(xí)

2021-02-03 13:56:09

KerasAPI深度學(xué)習(xí)

2023-05-28 23:26:16

多模態(tài)機器學(xué)習(xí)大腦

2019-03-06 09:55:54

Python 開發(fā)編程語言

2022-04-25 15:13:03

自動駕駛傳感器

2022-02-25 10:56:08

自動駕駛傳感器技術(shù)

2020-04-16 11:19:55

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)層

2021-11-12 15:16:32

深度學(xué)習(xí)數(shù)據(jù)合成人工智能

2017-03-06 16:13:41

深度學(xué)習(xí)人工智能
點贊
收藏

51CTO技術(shù)棧公眾號