Hugging Face最受歡迎15大AI機構出爐!清華第五,OpenAI第十,冠軍竟是它?
Hugging Face上最受歡迎的15個AI公司出爐了!
目前的冠軍,是Stability AI。
開源英雄Meta AI,取得亞軍之位。
而我們熟知的微軟、谷歌、OpenAI,分別名列第八、九、十的位置。
圖片
15個最受AI開源社區(qū)歡迎的公司
截止23年11月24日,榜單如下——
1. Stability AI,20000個贊
圖片
2022年AI大爆炸的兩個標志性事件,一個是ChatGPT,一個就是Stable Diffusion。
作為開源的圖像生成模型,可以說,Stable Diffusion的發(fā)布將AI生圖提高到了全新的高度,影響不亞于Open AI發(fā)布ChatGPT。
Stability AI,就是大名鼎鼎的Stable Diffusion背后的公司之一,掌門人和聯(lián)合創(chuàng)始人是Emad Mostaque。
不過,他此前有一些不好的傳言。
圖片
另外,Stability AI也開源了自己的大語言模型——StableLM。
2. Meta AI,20000個贊
圖片
實至名歸,Llama模型的開源鼻祖,如今大模型領域開源和閉源模型能夠分庭抗禮,沒有全被OpenAI、谷歌等明星初創(chuàng)公司和大科技公司壟斷,Meta AI功不可沒。
也因此,小扎被公認為「開源英雄」,而圖靈三巨頭之一的Yann LeCun,在Meta也起著定海神針的作用。
圖片
雖然排名第二,但是贊數(shù)和第一完全沒有差距??梢哉fMeta AI就是最受開源社區(qū)歡迎的AI公司。
正所謂,「開源AI社區(qū)共一石,Meta獨占八斗」。如果沒有Meta和LeCun對于AI開源社區(qū)的貢獻,整個AI行業(yè)的格局都會完全改變。
整個AI行業(yè)和開源AI的未來的發(fā)展,某種程度上都要倚仗LeCun和小扎繼續(xù)真金白銀的投入,以及不斷地搖旗吶喊。
3. Runway,11000個贊
視頻生成工具Gen-2,已經(jīng)成為生成式AI視頻領域的標桿,每次一發(fā)布更新,都能引起業(yè)內(nèi)不小的震撼。
圖片
從三無青年到15億美元獨角獸CEO,Runway CEO的故事,不過是又一個「平平無奇」的硅谷神話。
2018年,Cris Valenzuela(CEO)、Anastasis Germanidis和Alejandro Matamala-Ortiz 在紐約創(chuàng)辦Runway, 今年5月,Runway已完成了1.41億美元的C輪融資,估值達到15 億美元。
圖片
4. CompVis,10000個贊
Stable Diffusion,是Stability AI、RunwayML、LMU Munich、EleutherAI 和LAION的研究人員合作的結果。
在CompVis領導下的Stable Diffusion V1,改變了開源AI模型的性質,在全球范圍內(nèi)催生出了數(shù)百個其他模型和創(chuàng)新。
Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach領導了這個項目,他們在海德堡大學CompVis小組的研究奠定了這個項目的基礎。
在海德堡大學,他們創(chuàng)建了廣泛使用的VQGAN和Latent Diffusion。這兩個模型再加上OpenAI和Google Brain的成果,使Stable Diffusion得以實現(xiàn)。
5. 清華KEG,7,000個贊
清華KEG實驗室,一直是國內(nèi)AI技術的領頭羊。
中國頂尖開源大模型ChatGLM2-6B,可以說是清華系的ChatGPT,由清華知識工程研究室和智譜AI訓練。
圖片
ChatGLM2-6B允許免費商用后,我國的開源大模型也開啟了「安卓時刻」。
而清華系17人,則直接撐起了中國大模型創(chuàng)業(yè)的半壁江山。
圖片
6. BigScience,7,000個贊
BigScience Research Workshop,不是正式成立的實體,而是由HuggingFace、GENCI和IDRIS發(fā)起的開放式協(xié)作組織,以及一個同名的LLM研討會,匯聚了全球1000+研究人員。
這1000多名志愿研究者,在BigScience項目中創(chuàng)建了擁有1760億參數(shù)的模型BLOOM。
圖片
BLOOM是BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的縮寫,全名代表著大科學、大型、開放科學、開源的多語言大模型。
7. 阿聯(lián)酋技術創(chuàng)新研究所,7000個贊
阿聯(lián)酋技術創(chuàng)新研究所隸屬于阿布扎比政府先進技術研究委員會 (ATRC) ,負責監(jiān)督酋長國的技術研究。
圖片
2023年9月6日,阿聯(lián)酋(UAE)技術創(chuàng)新研究所(TII)推出Falcon180B,再次突破生成式AI的界限。
Falcon 180B擁有驚人的1800億參數(shù),經(jīng)過3.5萬億個token的訓練,在預訓練LLM的HuggingFace排行榜上名列前茅。甚至,它在各種基準測試中,都勝過了Meta的LaMA 2這種級別的競爭對手,包括推理、編碼、熟練程度和知識測試。
圖片
而且作為第一個有影響力的不限制商用的開源模型,F(xiàn)alcon用中東金主爸爸的豪氣,把開源模型的限制徹底打下來了。
這就不奇怪為什么開源社區(qū)對他們好感爆棚。
8. 微軟,6500個贊
在ChatGPT大爆發(fā)之后,突然化身「創(chuàng)業(yè)公司」的微軟,成為了硅谷大廠中今年最亮的一顆星。
微軟快速跟進,利用大模型能力改造了Bing,加班加點推出Copilot,并把他們?nèi)M了自家的拳頭產(chǎn)品Office和Windows之中,給科技圈秀了一把這家「年近50」科技巨頭的「狼性」。
圖片
另一邊,微軟Azure作為云計算行業(yè)的頭部玩家,無縫駛入了AI算力需求的快車道。
他們和Meta合作,對Llama 2等開源模型提供的良好支持,也進一步刷了一波在開源社區(qū)的好感度和存在感。
在最近的OpenAI驚天宮斗系列劇中,微軟差點通過「OpenAI 0元購」,成為了AI賽道的「終極寡頭」。
圖片
9. Google AI,6000個贊
作為對于AI技術投入最早也最大的科技巨頭,谷歌在AI社區(qū)中的影響力不用懷疑。
圖片
從AI基礎研究到AI產(chǎn)品,谷歌早已渾身上下都流淌著AI的血液。
DeepMind在強人工智能領域不斷地取得令人矚目的突破,谷歌云作為AI算力提供商是AI行業(yè)的基礎設計建設中最重要的一環(huán)。
雖然谷歌Bard和Palm大模型暫時在競爭之中不占優(yōu)勢,但傳說中的Gemini似乎遲早要將谷歌拉回AI行業(yè)舞臺的最中心。
圖片
而對于開源社區(qū)的發(fā)展,谷歌的貢獻同樣功不可沒,無數(shù)的開源項目已經(jīng)成為AI開源社區(qū)的基石。
圖片
10. OpenAI,4000個贊
作為AI行業(yè)今年大爆發(fā)的直接引領者,OpenAI的地位是毋庸置疑的。
雖然被調侃為「ClosedAI」,但是OpenAI對于AI開源社區(qū)的貢獻也是有目共睹的。
Whisper作為開源且性能最好的語音識別模型,幾乎所有相關的從業(yè)人員都能從中受益。
圖片
希望剛剛結束了「權游」的OpenAI,能繼續(xù)瞄準AGI,為整個AI行業(yè)開拓上限。
11. BigCode Project,4,000個贊
BigCode是一個開放的科學合作組織,致力于為編碼應用程序進行負責任的LLM訓練。
他們的主要工作有——
StarCoder,一種最先進的代碼語言模型。
BigCode項目中的StarCoder,是一個160億參數(shù)的模型,它使用了80多種編程語言、GitHub問題、Git提交和Jupiter 筆記本的一萬億個token。
StarCoder可以通過聊天進行微調,創(chuàng)建一個性化的編碼助手StarChat。
另外還有OctoPack,用于指令調優(yōu)大型代碼模型的工件;The Stack,最大的可用預訓練數(shù)據(jù)集,具有外圍代碼;SantaCoder,一個1.1B參數(shù)的代碼模型。
12. MosaicML,4000個贊
在今年6月被DataBrick斥資13億刀收購的獨角獸MosaicML,非常引人矚目。
從此,MosaicML的生成式AI平臺和Databricks的數(shù)據(jù)管理能力結合,將形成雙贏。
圖片
這家公司創(chuàng)立于21年,僅有62人。
創(chuàng)始人Naveen Rao是創(chuàng)辦的第一家公司Nervana Syatems,被英特爾收購。另一位創(chuàng)始人Hanlin Tan,是一位連續(xù)創(chuàng)業(yè)者,曾創(chuàng)立云計算公司,以及在谷歌、微軟和英特爾擔任職位。
MosaicML提供了一些開源、可商用的LLM,比如MPT模型。
MPT-7B和MPT-30B兩個模型,是目前最先進的開源、可商用的LLM之一。
圖片
13. UKP Lab,3000個贊
UKP Lab(無處不在的知識處理實驗室)由Iryna Gurevych教授于2009年創(chuàng)立,是達姆施塔特工業(yè)大學計算機科學系的一部分。
圖片
UKP Lab在自然語言處理(NLP)方面開展前沿研究,重點關注大型語言模型、對話式人工智能、問答、跨文檔NLP以及新穎的數(shù)據(jù)集和問題定義。
圖片
14. EleutherAI,3000個贊
EleutherAI成立于2020年7月,由Connor Leahy、Sid Black和Leo Gao創(chuàng)立,從一個討論GPT-3的Discord服務器,發(fā)展成為一個專注于大規(guī)模人工智能研究的非營利性研究機構。
圖片
現(xiàn)在,它是是一個開源的社區(qū)人工智能項目,旨在創(chuàng)建一個完全去中心化的、具有自治文明的單例人工智能。任何能連接互聯(lián)網(wǎng)且有GitHub帳戶的人都可以參與。
2021年,EleutherAI發(fā)布了The Pile,是一個825GB的多樣化文本數(shù)據(jù)集。
2021年6月,EleutherAI公布了GPT-J,它是一個60億參數(shù)的模型,在Pile上訓練。發(fā)布時,它是世界上最大的公開GPT-3風格的語言模型。
隨著GPT-NeoX的出現(xiàn),EleutherAI計劃將參數(shù)一直提高到1750億,發(fā)起了爭奪最大GPT-3模型的挑戰(zhàn)賽。
2023年4月,它發(fā)布了Pythia系列大模型。
15. Salesforce,3000個贊
Salesforce,是創(chuàng)建于1999年3月的一家客戶關系管理(CRM) 軟件服務提供商,總部設于美國舊金山,可提供隨需應用的客戶關系管理平臺。
創(chuàng)始人是Marc Benioff。27歲時,他就成為Oracle歷史上最年輕的高級副總裁。
圖片
正是因為預見到,會有越來越多的企業(yè)通過互聯(lián)網(wǎng)得到軟件服務,他才選擇離開Oracle,在37歲時創(chuàng)立Slesforce。
他提出了云計算和SaaS的理念,被譽為「軟件終結者」。
當下Salesforce正在推出AI功能,試圖將人工智能整合到辦公空間即時通訊應用Slack等產(chǎn)品中,并為銷售人員等推出了一款名為Einstein GPT的生成式人工智能產(chǎn)品。
圖片
Benioff稱,「我們非??释_保Salesforce成為第一大人工智能CRM?!?/p>
參考資料:
https://twitter.com/osanseviero/status/1727260746289905920