自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

多模態(tài)與偽多模態(tài)大模型 原創(chuàng)

發(fā)布于 2024-9-10 09:24
瀏覽
0收藏

“ 透過現(xiàn)象看本質(zhì),才是最應(yīng)該做的選擇 ”

對大模型了解的人應(yīng)該知道,大模型是因為openAI的GPT模型爆火的,當(dāng)然大模型的發(fā)展也是經(jīng)過多年的發(fā)展才有了今天的地步。

在之前的文章中也介紹過,大模型的全程是大規(guī)模預(yù)訓(xùn)練語言模型的簡稱,也就是說大模型剛開始是在語言處理領(lǐng)域大放異彩的。

因此,可以說大模型是深度學(xué)習(xí),也就是神經(jīng)網(wǎng)絡(luò)模型與自然語言處理相結(jié)合而產(chǎn)生的一種技術(shù)。

而隨著大模型在自然語言處理領(lǐng)域的爆發(fā),一些技術(shù)人員開始把大模型應(yīng)用到圖片處理,視頻處理等領(lǐng)域,后來慢慢就誕生了處理各種模態(tài)數(shù)據(jù)的模型。

到今天,多模態(tài)成為了主流。

多模態(tài)大模型

什么是多模態(tài)?

模態(tài)值得是數(shù)據(jù)類型,比如文本,圖片,視頻等;而多模態(tài)就是指能夠同時處理文本,圖片,視頻等多種模態(tài)數(shù)據(jù)的模型。

簡單來說,多模態(tài)大模型就像一個人一樣,他既會寫字認(rèn)字,也會繪畫欣賞畫,他即能通過拍視頻的方式表達(dá)自己;也能看懂別人視頻所表達(dá)的思想。

而多模態(tài)大模型就是這樣,它既能看懂別人的文字,也能看懂別人的視頻,也可以把別人的視頻用語言表達(dá)出來,這就是多模態(tài)大模型。

多模態(tài)與偽多模態(tài)大模型-AI.x社區(qū)

這種實現(xiàn)方式,需要解決很多技術(shù)難點,比如說文本和視頻或圖片內(nèi)容等多種模態(tài)數(shù)據(jù)之間的融合,模態(tài)之間的數(shù)據(jù)差異問題,數(shù)據(jù)對齊與一致性問題等。

這種實現(xiàn)多模態(tài)大模型的方式,叫做真多模態(tài)大模型。

但實現(xiàn)多模態(tài)只有這種方式嗎?

其實,還有另一種實現(xiàn)多模態(tài)的方式或者說方法;那就是在多個處理不同模態(tài)數(shù)據(jù)的大模型之上,構(gòu)建一個虛擬的“多模態(tài)大模型”,我叫他偽多模態(tài)大模型。

簡單來說就是真實的多模態(tài)大模型就相當(dāng)于一個無所不能的人,天文地理,物理化學(xué),前知五百年后曉五百世;而偽多模態(tài)大模型,就相當(dāng)于給阿斗配一個頂級智囊團,雖然阿斗什么都不懂,但他可以問啊。

多模態(tài)與偽多模態(tài)大模型-AI.x社區(qū)

就比如說,用戶輸入一段文字,這時前置模塊就可以識別出這是文本模塊,那么它就可以問其它的大模型,你們誰能處理文本,然后文本模型就會說我我我。

而如果用戶輸入一段視頻,那么前置模塊就可以找一個視頻處理的大模型,最后再通過后置的轉(zhuǎn)化模塊,把輸出數(shù)據(jù)轉(zhuǎn)化為用戶需要的格式。

這就是偽多模態(tài),很多初創(chuàng)企業(yè)干的就是這種產(chǎn)品,他們通過集成多種類型的模型,來實現(xiàn)對多種模態(tài)數(shù)據(jù)的處理。

多模態(tài)與偽多模態(tài)大模型-AI.x社區(qū)

當(dāng)然,這種偽多模態(tài)模型雖然在外人看來都差不多,但我們要知道它們使用的是完全不同的技術(shù);并且,偽多模態(tài)大模型雖然能夠處理一些簡單任務(wù),但在復(fù)雜任務(wù)中可能就沒有真正的多模態(tài)模型表現(xiàn)得好了。

很多東西如果不能透過表象看本質(zhì),就會導(dǎo)致很大的認(rèn)知偏差;比如說,我們都以為語音處理的大模型,它是直接處理語音格式的數(shù)據(jù),事實上是會有一個前置層,先把語音文件轉(zhuǎn)化為文本格式,然后再讓大模型處理。

等大模型處理完之后,再把文本格式的數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)輸出,前者技術(shù)叫ASR,后者叫TTS。


本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/AXTjnpb2l1c-KeZSOpm_NA??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦