自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="kp1fj"><tfoot id="kp1fj"><legend id="kp1fj"></legend></tfoot></sub>

<sub id="kp1fj"></sub>

<sub id="kp1fj"><rt id="kp1fj"></rt></sub>

<legend id="kp1fj"><track id="kp1fj"><menuitem id="kp1fj"></menuitem></track></legend>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

多模態(tài)深度學(xué)習(xí)：用深度學(xué)習(xí)的方式融合各種信息

作者：AI公園 2020-09-29 17:00:33

人工智能深度學(xué)習(xí)

我們對世界的體驗是多模態(tài)的 —— 我們看到物體，聽到聲音，感覺到質(zhì)地，聞到氣味，嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式，當(dāng)一個研究問題包含多個模態(tài)時，它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進展，它需要能夠同時解釋這些多模態(tài)的信號。

使用深度學(xué)習(xí)融合各種來源的信息。

多模態(tài)數(shù)據(jù)

我們對世界的體驗是多模態(tài)的 —— 我們看到物體，聽到聲音，感覺到質(zhì)地，聞到氣味，嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式，當(dāng)一個研究問題包含多個模態(tài)時，它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進展，它需要能夠同時解釋這些多模態(tài)的信號。

例如，圖像通常與標(biāo)簽和文本解釋相關(guān)聯(lián)，文本包含圖像，以更清楚地表達文章的中心思想。不同的模態(tài)具有非常不同的統(tǒng)計特性。

多模態(tài)深度學(xué)習(xí)

雖然結(jié)合不同的模態(tài)或信息類型來提高效果從直觀上看是一項很有吸引力的任務(wù)，但在實踐中，如何結(jié)合不同的噪聲水平和模態(tài)之間的沖突是一個挑戰(zhàn)。此外，模型對預(yù)測結(jié)果有不同的定量影響。在實踐中最常見的方法是將不同輸入的高級嵌入連接起來，然后應(yīng)用softmax。

多模態(tài)深度學(xué)習(xí)：用深度學(xué)習(xí)的方式融合各種信息

多模態(tài)深度學(xué)習(xí)的例子，其中使用不同類型的神經(jīng)網(wǎng)絡(luò)提取特征

這種方法的問題是，它將給予所有子網(wǎng)絡(luò)/模式同等的重要性，這在現(xiàn)實情況中是非常不可能的。

多模態(tài)深度學(xué)習(xí)：用深度學(xué)習(xí)的方式融合各種信息

所有的模態(tài)對預(yù)測都有相同的貢獻

對網(wǎng)絡(luò)進行加權(quán)組合

我們采用子網(wǎng)絡(luò)的加權(quán)組合，以便每個輸入模態(tài)可以對輸出預(yù)測有一個學(xué)習(xí)貢獻(Theta)。

我們的優(yōu)化問題變成-

多模態(tài)深度學(xué)習(xí)：用深度學(xué)習(xí)的方式融合各種信息

對每個子網(wǎng)絡(luò)給出Theta權(quán)值后的損失函數(shù)。

多模態(tài)深度學(xué)習(xí)：用深度學(xué)習(xí)的方式融合各種信息

將權(quán)值附加到子網(wǎng)后預(yù)測輸出。

把所有的都用起來!

準(zhǔn)確性和可解釋性

我們在兩個現(xiàn)實多模態(tài)數(shù)據(jù)集上得到了SOTA：

Multimodal Corpus of Sentiment Intensity(MOSI) 數(shù)據(jù)集 —— 有417個標(biāo)注過的視頻，每毫秒標(biāo)注的音頻特征。共有2199個標(biāo)注數(shù)據(jù)點，其中情緒強度定義為從strongly negative到strongly positive，線性尺度從- 3到+3。

模態(tài)包括：

1、文本

2、音頻

3、語言

多模態(tài)深度學(xué)習(xí)：用深度學(xué)習(xí)的方式融合各種信息

每種模態(tài)對情緒預(yù)測的貢獻量

Transcription Start Site Prediction(TSS)數(shù)據(jù)集 —— Transcription是基因表達的第一步，在這一步中，特定的DNA片段被復(fù)制到RNA (mRNA)中。Transcription起始位點是transcription開始的位置。DNA片段的不同部分具有不同的特性，從而影響其存在。我們將TSS分為三個部分：

上游DNA
下游DNA
TSS位置

我們?nèi)〉昧饲八从械母纳?，比之前的最先進的結(jié)果3%。使用TATA box的下游DNA區(qū)域?qū)@一過程影響最大。

多模態(tài)深度學(xué)習(xí)：用深度學(xué)習(xí)的方式融合各種信息

責(zé)任編輯：華軒來源：今日頭條

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="l903k"><rp id="l903k"></rp></cite>