下一個(gè)OpenAI來(lái)了?Mistral超大杯模型直逼GPT-4,93年創(chuàng)始人6人公司被微軟認(rèn)領(lǐng)
下一個(gè)OpenAI來(lái)了?
開源社區(qū)的另一個(gè)中心Mistral AI,剛剛發(fā)布了最強(qiáng)力的旗艦?zāi)P蚆istral Large,性能直接對(duì)標(biāo)GPT-4?。ǖ上У氖菦]有開源)
Mistral Large具備卓越的邏輯推理能力,能夠處理包括文本理解、轉(zhuǎn)換以及代碼生成在內(nèi)的復(fù)雜多語(yǔ)言任務(wù)。
在眾多主流基準(zhǔn)測(cè)試中,Mistral Large力壓Anthropic的Claude 2和谷歌的Gemini Pro,成績(jī)僅次于GPT-4!
LLM領(lǐng)域,格局再次改變。
同時(shí),就在今天,AI圈又一重磅消息曝出:繼OpenAI之后,微軟將Mistral也納入麾下!
Mistral從誕生之初,就充滿傳奇的光環(huán)。成立4周,6人團(tuán)隊(duì),7頁(yè)P(yáng)PT,8億融資(1.05億歐元),簡(jiǎn)直堪稱爽文走進(jìn)現(xiàn)實(shí)。
創(chuàng)始人Arthur Mensch是1993年出生的法國(guó)小伙,在谷歌工作3年后,在自己31歲時(shí)離開谷歌,拉攏了兩位Llama模型的開發(fā)者,一起創(chuàng)立了這個(gè)日后可以和OpenAI、Anthropic分庭抗禮的公司。
幾個(gè)人的團(tuán)隊(duì),極少的融資,做出的模型卻可以和GPT-4掰手腕。
如今再加上金主爸爸微軟的撐腰,Mistral 「下一個(gè)OpenAI」的名頭,是坐實(shí)了。
Mistral不開源?網(wǎng)友慌了!
現(xiàn)在,正處于全世界聚光燈下的Mistral,一舉一動(dòng)都十分引人注目。
有網(wǎng)友發(fā)現(xiàn)Mistral修改了網(wǎng)站內(nèi)容,刪除了所有提及開源社區(qū)義務(wù)的內(nèi)容,這立馬引發(fā)了恐慌!
之前的主頁(yè)(左);現(xiàn)在的主頁(yè)(右)
不過(guò),大家目前還不需要太過(guò)擔(dān)心。
根據(jù)外媒對(duì)Mistral CEO的采訪,未來(lái)他們依然會(huì)堅(jiān)持開源理念,但是同時(shí)也會(huì)推出性能最為強(qiáng)大的閉源模型參與商業(yè)競(jìng)爭(zhēng)。
現(xiàn)在他們已經(jīng)完成了以規(guī)模命名的開源模型:Mistral 7B和Mistral 8 x 7B回饋社區(qū),以「大中小」命名的閉源模型賺錢的產(chǎn)品線搭建。
歐洲最強(qiáng)大模型來(lái)了!
話說(shuō)回來(lái),這次發(fā)布的Mistral Large,可以說(shuō)是最適合歐洲人體質(zhì)的大模型。
簡(jiǎn)單來(lái)說(shuō):
- Mistral Large能夠母語(yǔ)般流利地使用英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、德語(yǔ)和意大利語(yǔ),深刻理解各自的語(yǔ)法規(guī)則和文化背景。
- Mistral Large能夠處理32K Token的上下文內(nèi)容,使其能夠從龐大的文檔中精確快速地提取信息。
- Mistral Large在執(zhí)行具體指令方面異常精準(zhǔn),這讓開發(fā)人員可以根據(jù)自己的需求定制內(nèi)容審查政策——例如,Mistral AI利用它來(lái)進(jìn)行了le Chat的系統(tǒng)級(jí)別審查。
- Mistral Large原生支持函數(shù)調(diào)用。這個(gè)特性,結(jié)合Mistral AI在la Plateforme上實(shí)施的輸出內(nèi)容限制模式,極大地促進(jìn)了應(yīng)用程序的開發(fā)和技術(shù)棧的現(xiàn)代化。
目前,Mistral AI的這個(gè)新旗艦?zāi)P蛢H在Azure AI和Mistral AI平臺(tái)上可用。
其中,在Azure AI上的定價(jià)如下:輸出為0.024美元/1000 token,輸入為0.008美元/1000 token。
推理能力與知識(shí)掌握
要說(shuō)Mistral Large最令人印象深刻的,還是超強(qiáng)的推理能力。
作為旗艦?zāi)P?,Mistral Large在常識(shí)、推理以及知識(shí)方面,都展現(xiàn)出了令人矚目的實(shí)力。
雖然和GPT-4還有不小的差距,但Claude 2和Gemini Pro 1.0基本上已經(jīng)是手下敗將了。
多語(yǔ)言能力
作為一款歐洲人自己的大模型,Mistral Large在法語(yǔ)、德語(yǔ)、西班牙語(yǔ)和意大利語(yǔ)上的表現(xiàn),均優(yōu)于Llama 2 70B模型。
同時(shí),也強(qiáng)過(guò)自家更小規(guī)模的模型。
數(shù)學(xué)與編程能力
在編程和數(shù)學(xué)方面,Mistral Large的能力也非常突出。
不僅相比自己其他模型有了大幅的提升,而且在主流的測(cè)試基準(zhǔn)上都取得了不俗的成績(jī)。
「小杯」也來(lái)了
相比之下,規(guī)模更小的Mistral Small,則更加專注于對(duì)延遲和成本的優(yōu)化。
相較于Mixtral 8x7B,Mistral Small展現(xiàn)出更優(yōu)異的性能和更低的延遲,是介于Mistral AI開源模型和旗艦?zāi)P椭g的解決方案。
與Mistral Large類似,Mistral Small同樣采用了在RAG和函數(shù)調(diào)用方面的創(chuàng)新技術(shù)。
此外,Mistral還優(yōu)化了自家的服務(wù)接口:
- 提供競(jìng)爭(zhēng)力價(jià)格的開放權(quán)重端點(diǎn),包括open-mistral-7B和open-mixtral-8x7b。
- 推出新的優(yōu)化模型端點(diǎn),包括mistral-small-2402和mistral-large-2402,同時(shí)繼續(xù)提供未更新的mistral-medium。
和微軟官宣合作,Mistral AI腰板更硬了
除了宣布模型之外,Mistral AI還官宣了和微軟的深度合作。
而這也是微軟繼OpenAI之后,再次「真金白銀」地入股AI圈的另一家頂流模型公司。
雖然2023年4月才成立,Mistral AI已經(jīng)對(duì)歐洲的AI領(lǐng)域產(chǎn)生了重大影響。
開源模型Mistral 7B和Mixtral的發(fā)布,驚艷了一眾開發(fā)者,在AI社區(qū)掀起了軒然大波。
如今微軟的支持,讓更多人堅(jiān)信:Mistral就是下一個(gè)OpenAI。
Mistral AI是法國(guó)的AI初創(chuàng)公司,微軟與它的合作,無(wú)疑讓微軟在歐洲也建立起了自己的AI影響力。
兩家公司的合作,目標(biāo)是彌補(bǔ)基礎(chǔ)AI研究與實(shí)際解決方案之間的差距。
如果在未來(lái)建立多年的合作伙伴關(guān)系,Mistral AI就可以訪問(wèn)微軟Azure的AI基礎(chǔ)設(shè)施了。
微軟的加持對(duì)Mistral AI意味著什么,不言而喻。
不光Mistral AI下一代LLM的開發(fā)和部署會(huì)大大加速,并且會(huì)開辟出新的商機(jī)。以歐洲為基礎(chǔ),Mistral AI會(huì)向全球市場(chǎng)擴(kuò)張自己的影響力!
具體來(lái)說(shuō),微軟和Mistral AI之間的合作集中在以下三個(gè)關(guān)鍵領(lǐng)域——
超算基礎(chǔ)結(jié)構(gòu):微軟將通過(guò)Azure AI超算基礎(chǔ)結(jié)構(gòu)支持Mistral AI,用于AI訓(xùn)練和推理工作負(fù)載。
擴(kuò)展市場(chǎng):微軟和Mistral AI將通過(guò)Azure AI Studio中的MaaS和Azure機(jī)器學(xué)習(xí)模型目錄,向客戶提供Mistral AI的高級(jí)模型。
AI研發(fā):微軟和Mistral AI將探索合作,為指定的客戶開發(fā)專有模型,甚至包括歐洲公共部門的工作負(fù)載。
目前,兩家公司還沒有透露財(cái)務(wù)細(xì)節(jié)。
最近,Mistral AI以近20億美元的估值,籌集了4.5億歐元,由科技投資者Andreessen Horowitz領(lǐng)投。
不過(guò),跟它在美國(guó)的競(jìng)爭(zhēng)者比,Mistral AI所獲得的資金顯然并不算多。
要知道,OpenAI僅從微軟就獲得了超過(guò)100億美元的投資,而Anthropic從谷歌和亞馬遜獲得的資金,也高達(dá)60億美元。
據(jù)《華爾街日?qǐng)?bào)》報(bào)道,去年10月,谷歌承諾向Anthropic投資20億美元
因此,此項(xiàng)合作一出,Mistral AI「歐洲版OpenAI」的名頭,更加坐實(shí)了。
而對(duì)于微軟來(lái)說(shuō),這項(xiàng)投資也是好處多多——這是它在歐洲AI領(lǐng)域站穩(wěn)腳跟的機(jī)會(huì)。
本來(lái),作為Azure云中歐盟服務(wù)器上OpenAI模型的唯一提供商,微軟已經(jīng)在歐洲的AI競(jìng)賽中處于領(lǐng)先地位。
不過(guò)AI在歐洲所受的待遇,并不像在美國(guó)那樣備受支持。
歐洲許多國(guó)家對(duì)于AI的態(tài)度偏保守,他們持的是批判性的態(tài)度,尤其是在數(shù)據(jù)保護(hù)方面。
而如果是歐洲服務(wù)器商的歐洲AI模型,或許能讓人放心,不失為一種不錯(cuò)的補(bǔ)救措施。
成立9個(gè)月的傳奇AI初創(chuàng)企業(yè),挑戰(zhàn)硅谷巨頭
Mistral在種子輪融資時(shí)「6人團(tuán)隊(duì),7頁(yè)P(yáng)PT,8億融資」的故事,值得好好講一講。
2023年初,還在谷歌工作的Arthur Mensch,剛剛30歲。
一年之后,他離開谷歌創(chuàng)立自己的公司,只用了9個(gè)來(lái)月的時(shí)間,就已經(jīng)估值20億美元!
Mensch于2020年初加入了谷歌,成為DeepMind的研究員,他的研究方向是提高AI和機(jī)器學(xué)習(xí)系統(tǒng)的效率。那時(shí)他27歲。
后來(lái),他和兩位之前一起參與了Llama模型研發(fā)的年輕人Timothée Lacroix和Guillaume Lample一起,決定成立一家公司,通過(guò)更加高效的方法構(gòu)建和部署AI模型。
他們相信,小團(tuán)隊(duì)能力在靈活性上超越硅谷的大公司,而開源模型就是他們實(shí)現(xiàn)這一目標(biāo)的利器。
雖然已經(jīng)從各路投資者那里籌集了超過(guò)5億美元,他的公司Mistral AI相比于微軟支持的OpenAI,谷歌,乃至Anthropic,依然顯得有些「微不足道」。
這些巨頭,以及巨頭重金支持的巨型獨(dú)角獸投入了幾十億美元來(lái)構(gòu)建全世界最先進(jìn)的AI系統(tǒng)。
但Mensch并不擔(dān)心與這些龐然大物競(jìng)爭(zhēng)。
「我們的目標(biāo)是成為 AI 領(lǐng)域中最節(jié)省資本的公司,」Mensch表示?!高@是我們成立的初衷?!?/span>
對(duì)于剛剛推出的Mistral Large模型,他認(rèn)為,這款模型在執(zhí)行某些推理任務(wù)上能夠與OpenAI最先進(jìn)的語(yǔ)言模型GPT-4和谷歌的新模型Gemini Ultra相匹敵。
Mensch透露,開發(fā)這款新模型的成本不到2000萬(wàn)歐元(約合2200萬(wàn)美元)。
Mistral巴黎總部的辦公室
相比之下,OpenAI的首席執(zhí)行官Sam Altman曾在去年發(fā)布GPT-4時(shí)表示,訓(xùn)練他們公司的大型模型的成本接近1億美元。
而且隨著他們用行業(yè)內(nèi)最為高效的開源模型不斷震驚業(yè)界,他們也獲得了微軟,英偉達(dá)和Salesforce等大公司的背書。
巨頭們也通過(guò)現(xiàn)金或者算力的支持,獲取了Mistral AI的少量股份。
伴隨著Mistral Large的發(fā)布,9個(gè)月前他們用7頁(yè)P(yáng)PT吹下的牛,已經(jīng)完全兌現(xiàn)了。
撬動(dòng)8億元投資的六人團(tuán)隊(duì)
這六個(gè)人的團(tuán)隊(duì),是這樣組成的。
Arthur Mensch在巴黎綜合理工學(xué)院和巴黎高等師范學(xué)院學(xué)習(xí)期間,結(jié)識(shí)了另兩位創(chuàng)始人——Timothée Lacroix和Guillaume Lample。
兩人都是Meta AI團(tuán)隊(duì)的,Lample甚至領(lǐng)導(dǎo)了LLaMA的開發(fā)。
幾個(gè)三十出頭的年輕人,在LLM開發(fā)領(lǐng)域已經(jīng)有不少經(jīng)驗(yàn)。
在當(dāng)時(shí),即使在全世界范圍內(nèi),具備構(gòu)建、訓(xùn)練和優(yōu)化LLM專業(yè)經(jīng)驗(yàn)的人,也不超過(guò)100人。
而另外三位,分別是來(lái)自法國(guó)巴黎健康初創(chuàng)公司Alan的CEO Jean-Charles Samuelian和CTO Charles Gorintin,以及前法國(guó)數(shù)字事務(wù)國(guó)務(wù)秘書Cédric O。
AI科學(xué)家,如何創(chuàng)立自己的獨(dú)角獸公司
Mensch個(gè)頭高大,一頭濃密的深色頭發(fā),他既不像典型的科技極客,也不像常見的CEO。
他的朋友和同事們說(shuō),他總是一邊喝啤酒一邊輕松地和朋友開玩笑。
作為一名運(yùn)動(dòng)愛好者,他在2018年提交博士論文前的幾個(gè)月,以不到三小時(shí)半的時(shí)間跑完了巴黎馬拉松。
Mensch從小就在學(xué)術(shù)追求與創(chuàng)業(yè)之間徘徊。他出生在巴黎西郊,母親是物理老師,父親擁有一家小型科技公司。
這位未來(lái)的CEO畢業(yè)于法國(guó)頂級(jí)的數(shù)學(xué)和機(jī)器學(xué)習(xí)院校。他的導(dǎo)師們將他描述為一個(gè)熱情投入、能夠迅速掌握自己幾乎沒有基礎(chǔ)的項(xiàng)目的學(xué)生。
「我確實(shí)熱愛探索新事物,」Mensch 表示?!肝液苋菀赘械絽捑搿!?/span>
在攻讀博士期間,Mensch的研究方向是優(yōu)化軟件,分析核磁共振圖像(fMRI)系統(tǒng)的三維大腦圖像,讓軟件能夠處理高達(dá)數(shù)百萬(wàn)的圖像量。
2020年底,Mensch加入了DeepMind,在那里他參與開發(fā)了大語(yǔ)言模型。
到了2022年,他以主要作者的身份發(fā)表了著名的「Chinchilla論文」。
這項(xiàng)研究重新定義了人們對(duì)AI模型的大小、訓(xùn)練它所需的數(shù)據(jù)量以及其性能之間關(guān)系的認(rèn)識(shí),被稱為AI縮放法則。
隨著2022年AI競(jìng)賽的升溫,Mensch對(duì)于大公司的AI實(shí)驗(yàn)室減少了關(guān)于大語(yǔ)言模型研究成果的發(fā)表,減少了與研究社區(qū)的分享這一情況表示失望。
ChatGPT發(fā)布后,谷歌決定加速追趕。
Mensch所在的團(tuán)隊(duì)從一個(gè)10人的小團(tuán)隊(duì)變?yōu)?0人,最后擴(kuò)充成為了一個(gè)70人的大團(tuán)隊(duì)。
「我覺得我在事情變得過(guò)于官僚化之前應(yīng)該離開了,」Mensch 說(shuō)?!肝也幌朐诖笮涂萍脊局虚_發(fā)那些不透明的技術(shù)。」
Mistral在2023年春天向投資者提出的最初方案中,批評(píng)了由美國(guó)公司主導(dǎo)的「正在形成的寡頭壟斷」,這些公司開發(fā)的是專有閉源模型。
對(duì)于Mensch和他的合伙人來(lái)說(shuō),將他們的初始AI系統(tǒng)作為開源軟件發(fā)布,允許任何人免費(fèi)使用或修改,這是一個(gè)重要的原則。
這也是吸引開發(fā)者和潛在客戶的一種方式,他們希望每個(gè)人對(duì)自己使用的AI有更多的控制權(quán)。
盡管Mistral現(xiàn)在的最先進(jìn)模型Mistral Large并不開源,但Mensch表示:
「在構(gòu)建商業(yè)模式和堅(jiān)持我們的開源價(jià)值觀之間找到一個(gè)平衡點(diǎn)是非常微妙的。我們希望創(chuàng)造新的事物、新的架構(gòu),但是還想向我們的客戶提供一些額外的產(chǎn)品和服務(wù)?!?/span>