自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Meta 開源多感官人工智能模型,整合文本、音頻、視覺等六類數(shù)據(jù)

開源 人工智能
Meta 公司在博客文章中指出,未來的模型還可以添加其他感官輸入流,包括“觸覺、語音、氣味和大腦功能磁共振成像信號”。該公司還聲稱,這項(xiàng)研究“讓機(jī)器更接近于人類同時、全面、直接地從多種不同的信息形式中學(xué)習(xí)的能力?!?/div>

Meta 公司發(fā)布了一個新的開源人工智能模型 ImageBind,該模型能夠?qū)⒍喾N數(shù)據(jù)流,包括文本、音頻、視覺數(shù)據(jù)、溫度和運(yùn)動讀數(shù)等整合在一起。該模型目前只是一個研究項(xiàng)目,還沒有直接的消費(fèi)者或?qū)嶋H應(yīng)用,但它展示了未來生成式人工智能系統(tǒng)的可能性,這些系統(tǒng)能夠創(chuàng)造出沉浸式、多感官的體驗(yàn)。同時,該模型也表明了 Meta 公司在人工智能研究領(lǐng)域的開放態(tài)度,而其競爭對手如 OpenAI 和谷歌則變得越來越封閉。

該研究的核心概念是將多種類型的數(shù)據(jù)整合到一個多維索引(或用人工智能術(shù)語來說,“嵌入空間”)中。這個概念可能有些抽象,但它正是近期生成式人工智能熱潮的基礎(chǔ)。例如,人工智能圖像生成器,如 DALL-E、Stable Diffusion 和 Midjourney 等,都依賴于在訓(xùn)練階段將文本和圖像聯(lián)系在一起的系統(tǒng)。它們在尋找視覺數(shù)據(jù)中的模式的同時,將這些信息與圖像的描述相連。這就是為什么這些系統(tǒng)能夠根據(jù)用戶的文本輸入生成圖片。同樣的道理也適用于許多能夠以同樣方式生成視頻或音頻的人工智能工具。

Meta 公司稱,其模型 ImageBind 是第一個將六種類型的數(shù)據(jù)整合到一個嵌入空間中的模型。這六種類型的數(shù)據(jù)包括:視覺(包括圖像和視頻);熱力(紅外圖像);文本;音頻;深度信息;以及最有趣的一種 —— 由慣性測量單元(IMU)產(chǎn)生的運(yùn)動讀數(shù)。(IMU 存在于手機(jī)和智能手表中,用于執(zhí)行各種任務(wù),從手機(jī)從橫屏切換到豎屏,到區(qū)分不同類型的運(yùn)動。)

未來的人工智能系統(tǒng)將能夠像當(dāng)前針對文本輸入的系統(tǒng)一樣,交叉引用這些數(shù)據(jù)。例如,想象一下一個未來的虛擬現(xiàn)實(shí)設(shè)備,它不僅能夠生成音頻和視覺輸入,還能夠生成你所處的環(huán)境和物理站臺的運(yùn)動。你可以要求它模擬一次漫長的海上旅行,它不僅會讓你置身于一艘船上,并且有海浪的聲音作為背景,還會讓你感受到甲板在腳下?lián)u晃和海風(fēng)吹拂。

Meta 公司在博客文章中指出,未來的模型還可以添加其他感官輸入流,包括“觸覺、語音、氣味和大腦功能磁共振成像信號”。該公司還聲稱,這項(xiàng)研究“讓機(jī)器更接近于人類同時、全面、直接地從多種不同的信息形式中學(xué)習(xí)的能力?!?/p>

當(dāng)然,這很多都是基于預(yù)測的,而且很可能這項(xiàng)研究的直接應(yīng)用會非常有限。例如,去年,Meta 公司展示了一個人工智能模型,能夠根據(jù)文本描述生成短而模糊的視頻。像 ImageBind 這樣的研究顯示了未來版本的系統(tǒng)如何能夠整合其他數(shù)據(jù)流,例如生成與視頻輸出匹配的音頻。

對于行業(yè)觀察者來說,這項(xiàng)研究也很有趣,因?yàn)镮T之家注意到 Meta 公司是開源了底層模型的,這在人工智能領(lǐng)域是一個越來越受到關(guān)注的做法。

責(zé)任編輯:姜華 來源: IT之家
相關(guān)推薦

2018-01-17 21:56:09

網(wǎng)線電纜以太網(wǎng)

2023-12-08 08:00:00

人工智能MusicGen音樂模型

2023-05-10 14:58:06

開源模型

2023-09-28 20:57:23

Meta人工智能聊天機(jī)器人

2024-08-02 12:05:00

2021-11-05 09:56:36

人工智能AI指數(shù)

2023-11-29 15:15:30

人工智能AI

2022-07-31 23:46:57

人工智能語言模型感知力

2024-04-08 09:00:00

人工智能

2021-01-18 09:54:13

人工智能邊緣計算機(jī)器視覺

2012-04-25 14:56:12

超六類布線

2013-03-07 14:04:30

2010-04-26 14:52:37

2017-10-31 13:35:31

2010-03-25 15:51:42

雙絞線綜合布線

2022-06-16 16:19:12

模型神經(jīng)網(wǎng)絡(luò)

2018-04-14 08:15:32

2019-03-21 15:18:52

人工智能AI人工輔助

2024-01-22 13:17:00

AI模型

2024-02-20 16:14:36

人工智能開源AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號