自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Mistral多模態(tài)大模型來了!120億參數(shù),原生支持任意大小/數(shù)量圖像,公司估值已達(dá)420億

人工智能 新聞
雖然目前模型的訓(xùn)練數(shù)據(jù)、細(xì)節(jié)都未公開,但是通過模型代碼網(wǎng)友們發(fā)現(xiàn)了更多細(xì)節(jié)。

Mistral的多模態(tài)大模型來了!

Pixtral 12B正式發(fā)布,同時具備語言和視覺處理能力。

圖片

它建立在文本模型Nemo 12B基礎(chǔ)上,包含一個專門的視覺編碼器。

大概24GB,原生支持任意數(shù)量和尺寸的圖像,大約有40層神經(jīng)網(wǎng)絡(luò)、14,336 個隱藏維度大小和32個注意力頭,以及一個專用的視覺編碼器,支持高分辨率圖像(1024×1024)處理。

發(fā)布形式還是簡單直接一個種子鏈接。

圖片

現(xiàn)在可以通過鏈接、GitHub或Hugging Face下載模型。

Mistral的開發(fā)主管表示,后續(xù)也會在Chatbot上接入模型,并提供API服務(wù)。

圖片

超越Qwen、LLaVA等

雖然目前模型的訓(xùn)練數(shù)據(jù)、細(xì)節(jié)都未公開,但是通過模型代碼網(wǎng)友們發(fā)現(xiàn)了更多細(xì)節(jié)。

1、先進(jìn)架構(gòu):40層網(wǎng)絡(luò)、14336隱藏維度大小、32個注意力頭。

2、視覺能力:專用視覺編碼器,支持1024x1024圖像大小和24個隱藏層,用于高級圖像處理。

3、更大詞匯量:131072tokens,支持更細(xì)致語言理解和 生成。

4、使用GeLU(用于視覺適配器)和2D RoPE(用于視覺編碼器)。

5、Patch大?。?6×16像素。

6、在mistral_common中支持tokenizer。

7、模型權(quán)重bf16。

圖片

與此同時,還有人在放出了Mistral發(fā)布會上公布的模型基準(zhǔn)情況。

圖片

Pixtral 12B和Qwen2-VL-7B、LLaVA-OV-7B、Phi-3 Vision做了對比。

多模態(tài)知識和推理、QA等方面都表現(xiàn)不錯。

圖片

歐洲版OpenAI估值達(dá)60億美元

最近幾個月Mistral的動作還是非常密集的。

今年6月,他們通過股權(quán)債務(wù)融資完成約6.4億美元B輪融資。估值已達(dá)60億美元(折合人民幣約420億)。

完成融資后,他們便發(fā)布了Mistral Large 2旗艦?zāi)P汀MoE模型Mistral 8×22B以及開源模型Codestral等。

目前,微軟、AWS、Snowflake等巨頭均投資Mistral。尤其是微軟的入股,使得Mistral成為OpenAI以外,微軟Azure第二個商業(yè)閉源模型供應(yīng)商。這也進(jìn)一步夯實(shí)了Mistral“歐洲版OpenAI”的地位。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-03-04 10:33:14

2023-03-10 13:56:42

ChatGPT

2015-08-03 09:19:23

2021-04-13 10:04:43

微軟收購Nuance

2023-03-01 13:49:20

模型AI

2014-02-21 14:23:26

WhatsApp通信facebook

2013-08-23 13:31:43

雷軍小米

2012-06-27 09:33:15

小米融資

2023-04-23 10:28:01

2022-07-20 16:36:02

模型AI

2023-12-01 13:36:01

阿里云通義千問

2025-01-08 08:21:16

2023-10-19 13:44:00

數(shù)據(jù)訓(xùn)練

2023-12-01 12:31:22

AI模型

2009-06-23 09:14:35

2024-03-15 12:49:11

AI模型

2024-03-25 12:40:19

訓(xùn)練模型

2024-09-14 12:49:14

2019-05-05 12:50:02

UiPathRPA人工智能

2020-05-22 23:29:09

阿里云財報阿里巴巴
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號