自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

最神秘國產(chǎn)大模型團隊冒泡,一出手就是萬億參數(shù)MoE,兩款應(yīng)用敞開玩

人工智能
和很多大模型一樣,躍問的知識庫信息只截止到2023年,后面的信息自然只能現(xiàn)搜了?!敖裉斓奶鞖馊绾巍碧唵?,我們直接問它馬斯克腦機接口公司的進展如何。結(jié)果,準(zhǔn)確檢索到1月份首位志愿者植入芯片的重大事件。

國內(nèi)基礎(chǔ)大模型創(chuàng)業(yè)公司,最后一位強實力選手終于正式來到臺前。

它就是微軟前全球副總裁姜大昕所創(chuàng)辦的階躍星辰。

圖片

一年前,量子位就對這位大牛的創(chuàng)業(yè)動向有所耳聞。

姜大昕在微軟工作16年有余,曾任職微軟全球副總裁,微軟亞洲互聯(lián)網(wǎng)工程院(STCA)首席科學(xué)家,全面負責(zé)微軟必應(yīng)搜索的技術(shù)研發(fā)工作。但就是這么一位風(fēng)云人物,此番創(chuàng)業(yè),卻有不少令人費解的動作。

一來,他在微軟職級極高,在微軟混得風(fēng)生水起,怎么想不開創(chuàng)業(yè)?

二來,階躍星辰已經(jīng)成立一年,但在百模群戰(zhàn)的2023年,這家公司低調(diào)得近乎隱形。不僅沒有主動對外發(fā)聲,連量子位在圈內(nèi)打聽消息也探不得虛實。

現(xiàn)如今,大模型五虎已經(jīng)初成格局,市場的注意力已經(jīng)被瓜分不少,階躍星辰的亮相才姍姍來遲——會不會晚了?

會者不晚。

一出手,階躍星辰就亮出了自己蟄伏水下一年沉淀的成績:

千億模型有了,ToC產(chǎn)品有了,萬億模型在路上,且通往AGI的路也十分明確:

走一條“單模態(tài)—多模態(tài)—多模理解和生成的統(tǒng)一—世界模型—AGI(通用人工智能)”的路。

圖片

2款C端產(chǎn)品全面開放使用

階躍星辰的產(chǎn)品是什么?

不玩虛的,一露面,階躍星辰就直接帶來了2款面向C端市場的應(yīng)用:

躍問冒泡鴨,均全面開放使用。

它們一個是聊天類應(yīng)用,定位個人效率助手。

圖片

一個是AI開放世界平臺,提供海量智能體,主打一個休閑娛樂。

圖片

具體效果怎么樣?火速注冊登錄,量子位帶大伙一睹為快。

先來看效率工具躍問。

第一輪基本問答我們讓它對比一下ChatGPT和Claude的不同,重點:以圖表形式呈現(xiàn)。

結(jié)果很快啊——

不止是開發(fā)公司、模型結(jié)構(gòu)、文件讀取能力這種硬性對比,也有專注方向、創(chuàng)新水平、安全性等偏主觀的總結(jié),一共14個小項,主打一個全面:

圖片

第二輪看看聯(lián)網(wǎng)、信息檢索能力。

和很多大模型一樣,躍問的知識庫信息只截止到2023年,后面的信息自然只能現(xiàn)搜了。

“今天的天氣如何”太簡單,我們直接問它馬斯克腦機接口公司的進展如何。

結(jié)果,準(zhǔn)確檢索到1月份首位志愿者植入芯片的重大事件。

圖片

不過不知道是不是對“重大進展”這一詞有不同理解,躍問沒提幾天前這位志愿者可以打游戲的報道。

我們追問之下,它倒也準(zhǔn)確“交代”出來,包括志愿者名字、玩的什么游戲——除了游戲,下象棋7勝4負的事兒也一并提了。

圖片

第三輪:文件處理。

身處AI科技圈,最新論文和大佬教程我們自然要緊跟步伐。

先用OpenAI前科學(xué)家Karpathy不久前的《從頭構(gòu)建GPT Tokenizer》視頻摸摸底。

直接給倆小時長的視頻目前沒有哪個大模型能直接解析,我們還是上傳字幕文件。

圖片

很快,全英文的內(nèi)容躍問刷刷刷地就總結(jié)完畢:

圖片

仔細幫大家驗證了,里面提到的例子都有都對。用起來相當(dāng)給力。

對于論文來說就更簡單了,直接給arXiv的鏈接就行。

一篇8.3萬字(基本滿足日常所需)的大模型微調(diào)方法論文(《AutoFT: Robust Fine-Tuning by Optimizing Hyperparameters on OOD Data》)丟進去,最核心的內(nèi)容幾秒便可知。

圖片

至于數(shù)據(jù)處理,如下圖所示,圖片轉(zhuǎn)表格、凈增長率計算,這種需要復(fù)雜邏輯推理的任務(wù),躍問用代碼的方式輕松解決。

圖片

最后,大家關(guān)心的多模態(tài):

解讀表情包,easy。

圖片

挑戰(zhàn)一下投資機構(gòu)整理的AI視頻公司全景圖。

別看logo們字體五花八門,躍問不僅迅速識別,還按照原圖歸門別類,閱讀起來相當(dāng)清晰。

圖片

相比之下,有同類選手不僅識別漏洞一個接一個,格式也完全顧不上。

圖片

總的來說,說起目前市面上的AI個人效率助手,已經(jīng)不算少。但躍問,該有的功能不僅有,在多模態(tài)、長文本理解上也能做得更好。

并且最重要的是:免費!

使用起來沒啥限制,目前也不用擔(dān)心宕機、模型“太累了”回答不出問題(手動狗頭),所以完全不失為一個優(yōu)秀的平替。

至于冒泡鴨,它有app版也有web版。

平臺上載有各種由多模態(tài)大模型驅(qū)動的智能對話體,可以進行各種有趣的對話、也可以探索有趣的劇情互動游戲(“戲精”們有福了)。

實在不夠,還可以自己上手創(chuàng)建:

圖片

官方也提供了非常詳細的上手文檔,包教包會。

圖片

我們淺試了《逃離精神病院》這一劇情。

圖片

和AI的對話相當(dāng)流暢、沉浸,讓人一不小心抬頭看時間才發(fā)現(xiàn)已經(jīng)玩了好久。

(不瞞您說,量子位開了好幾輪都沒能成功逃出“精神病院”,難度還是有億點點的。)

圖片

對于大模型產(chǎn)品,姜大昕表示:“我把模型和產(chǎn)品的關(guān)系比喻成靈魂和皮囊。大家一定聽過一句話,好看的皮囊千篇一律,有趣的靈魂萬里挑一。我們希望靈魂能更加有趣一點,才能顯示出產(chǎn)品的不同。”

那么,躍問和冒泡鴨背后的“靈魂”——大模型們長什么樣?

“鐵人四項”攀登萬億參數(shù)模型

冒泡鴨和躍問的背后,是階躍星辰已經(jīng)成熟的兩款千億參數(shù)大模型。

該公司將其稱為Step系列通用大模型,分別是Step-1千億參數(shù)語言大模型,以及Step-1V千億參數(shù)多模態(tài)大模型。

一路看來,階躍星辰訓(xùn)模型的路,走得出奇的順。

去年7月起,研發(fā)團隊正式開始訓(xùn)練模型。

2個月后,綜合性能超過GPT-3.5的千億參數(shù)大模型Step-1,一次性訓(xùn)練成功。

在大模型遍地開花的時代,聽起來擁有一個模型并不是什么難事,但短時間內(nèi)一次成功,這種效率仍然令人咋舌。

姜大昕把原因歸結(jié)于兩點。

  • 一是團隊本身在AI領(lǐng)域有經(jīng)驗和積累;
  • 二是創(chuàng)業(yè)公司團隊精悍,能對訓(xùn)練中遇到的問題及時溝通與反應(yīng)。

這次成功極大地鼓舞了團隊的信心,“這驗證了我們的方法是正確的?!?/p>

再2個月后,也就是去年11月,千億參數(shù)的多模態(tài)大模型Step-1V又告成。

Step-1V大模型可以精準(zhǔn)描述和理解圖像中的文字、數(shù)據(jù)、圖表等信息,并根據(jù)圖像信息實現(xiàn)內(nèi)容創(chuàng)作、邏輯推理、數(shù)據(jù)分析等多項任務(wù)。此外,它還能理解視頻中的內(nèi)容。

上海人工智能實驗室推出的大型模型評估平臺“司南”(OpenCompass)多模態(tài)模型評測榜單顯示,階躍星辰研發(fā)的Step-1V位列第一,性能比肩GPT-4V。

“千億參數(shù)的GPT-3.5模型是一個重要的分水嶺。”姜大昕表示。

模型要達到GPT-4的萬億參數(shù)規(guī)模,各個維度的要求都上了一個臺階。

譬如,訓(xùn)練萬億模型需要等效A800萬卡單一集群,進行高效穩(wěn)定的訓(xùn)練;需要十萬億tokens的高質(zhì)量數(shù)據(jù);需要駕馭好新穎的MoE架構(gòu)。

姜大昕稱,以上幾點,無論是有哪一點有所不足,都會導(dǎo)致Scaling Law難以向上攀登。

但是!

就在前幾天的全球開發(fā)者先鋒大會開幕式上,階躍星辰又給出了萬億參數(shù)MoE語言大模型Step-2的預(yù)覽版——這也是國內(nèi)初創(chuàng)公司,首次交出的萬億參數(shù)模型答卷。

姜大昕介紹,Step-2從去年12月啟動訓(xùn)練,目前訓(xùn)練穩(wěn)定,待完全訓(xùn)練完畢和打磨成熟。

“我堅信Scaling Law,(會)訓(xùn)練更大模型?!苯箨空劦?,團隊追求的是多模理解和生成的統(tǒng)一,“Step系列大模型將為多模理解和生成的統(tǒng)一奠定堅實基礎(chǔ)?!?/p>

圖片

基于實踐經(jīng)驗,團隊把攀登Scaling Law稱為一個“鐵人四項”般的超級工程。

哪四項?

算力、系統(tǒng)、數(shù)據(jù)、算法。

而階躍星辰自然有自己熟稔的打怪套路。

算力方面,通過自建機房+租用算力,積極進行算力儲備;

系統(tǒng)方面,團隊核心成員實踐過單集群萬卡以上的系統(tǒng)建設(shè)與管理,訓(xùn)練千億模型的MFU(有效算力輸出)達 57%;

數(shù)據(jù)方面,數(shù)據(jù)團隊核心骨干出身必應(yīng)搜索引擎,曾支持全球100多種語言,為200多個國家和地區(qū)提供服務(wù),對全球互聯(lián)網(wǎng)高質(zhì)量語料的分布有深入了解,并建立起強大的數(shù)據(jù)處理和知識圖譜流水線;

算法方面,團隊不僅能駕馭各種架構(gòu),比如萬億參數(shù)的MoE架構(gòu),而且對大模型的認知以及發(fā)展路線有深刻洞察。

不想只在時代的風(fēng)中凌亂

面對鐵人四項和多模態(tài)融合之路,階躍星辰就這么默默進發(fā)了一年。

那么,是什么樣的團隊行進在這條Scaling Law之路上?

量子位得知的消息是,階躍星辰現(xiàn)在已經(jīng)有一支150多人的隊伍。

領(lǐng)隊者姜大昕,現(xiàn)任階躍星辰CEO,同時也是團隊算法負責(zé)人。

2005年,姜大昕獲紐約布法羅州紐約州立大學(xué)計算機科學(xué)博士,在機器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言處理、生物信息等領(lǐng)域有豐富的經(jīng)驗和工程經(jīng)驗。

博士畢業(yè)后,他先后任南洋理工大學(xué)擔(dān)任助理教授,MSRA(微軟亞研院)研究員。

2011年開始,姜大昕轉(zhuǎn)入微軟亞洲互聯(lián)網(wǎng)工程院(STCA)工作。

該中心主要負責(zé)微軟全球產(chǎn)品的研發(fā)工作,包括必應(yīng)搜索引擎、智能語音助手Cortana、Azure認知服務(wù)以及Microsoft 365的自然語言理解系統(tǒng)等。

去年3月,姜大昕正式升任為微軟副總裁,同時兼任亞洲軟件技術(shù)中心WebXT S+D(網(wǎng)絡(luò)體驗、搜索和分銷)集團總經(jīng)理。

——是的,你沒聽錯,剛剛被升職,明明可以在微軟干到退休,卻跑出來創(chuàng)業(yè)了。

“在微軟,只能基于OpenAI的模型做工作。”姜大昕回憶,即便是微軟和OpenAI的關(guān)系,使用其模型也只能調(diào)用API,對黑盒里的秘密、模型算法的修復(fù)/迭代建議,完全插不上手。

我當(dāng)時感覺整個世界在我身邊呼嘯而過,都在往前沖,我在原地很茫然,留下自己在風(fēng)中凌亂,我不知道我在干什么。

琢磨再三,姜大昕決心不能再被動地風(fēng)中凌亂。

于是,離開微軟;于是,躬身入局。

有了創(chuàng)業(yè)想法的姜大昕,與現(xiàn)在階躍星辰的數(shù)據(jù)負責(zé)人焦斌星“密謀”兩個多小時,一拍即合。

焦斌星同樣出身微軟,是中科大和MSRA聯(lián)合培養(yǎng)博士。

博士畢業(yè)后,焦斌星正式入職微軟,是微軟必應(yīng)引擎核心搜索團隊前負責(zé)人,日常工作主要是利用數(shù)據(jù)挖掘和NLP算法優(yōu)化索引和搜索質(zhì)量;也曾開發(fā)全球高質(zhì)量站點的自動挖掘算法并用于索引和排序。

還在微軟時,他二人就聽說過外界盛傳大模型時代的“數(shù)據(jù)荒”,即Scaling Law所需的數(shù)據(jù)不夠用了。

當(dāng)時,他們不以為然。有搜索引擎背景在,眼見互聯(lián)網(wǎng)有上億、上萬億的網(wǎng)頁網(wǎng)站,怎么會不夠用?

等到自己置身其中時,發(fā)現(xiàn)是真的不夠用(笑死)。

好在現(xiàn)在既可以從多模態(tài)數(shù)據(jù)中挖掘更多數(shù)據(jù),也可以像OpenAI訓(xùn)練Sora那樣使用人造數(shù)據(jù)。

核心團隊的另外一位成員,朱亦博,此前擁有多次單集群萬卡以上的系統(tǒng)建設(shè)與管理實踐經(jīng)驗。

他博士畢業(yè)于美國加州大學(xué)圣芭芭拉分校,曾任微軟研究院研究員。

在這一波浪潮襲來之前,他的工作主要面向大規(guī)模系統(tǒng)以及超高速度性能網(wǎng)絡(luò)。

2018年,他任職字節(jié)跳動,負責(zé)公司AI基礎(chǔ)設(shè)施與基礎(chǔ)AI框架,開始積累萬卡集群的搭建經(jīng)驗;2022年底,他離開字節(jié),跳槽至Google任高級主管,直接支持OpenAI最大勁敵、Claude的背后公司Anthropic。

可以說,階躍星辰三位核心骨干的經(jīng)歷十分相似,就是第一階段(博士期間)進行相關(guān)研究,第二階段進入大廠在一線打拼,一直都在和AI的最新進展親密貼貼。

當(dāng)ChatGPT引領(lǐng)的大模型時代開始時,他們都意識到這是一個大變革,因此以最快速、最靈活、最全面的方式投身變革當(dāng)中。

如果AGI是一個需要長期攀登的山峰,看到正確的路徑,建立正確的能力,比早走幾步更加重要。

One More Thing

最最最后,階躍星辰的個人效率助手躍問,剛剛上線了一個很贊的新功能。

叫一圖讀懂。

說大白話就是丟給它一個文檔,就能一鍵生成解析重點的長圖文。

這是此前的ChatBot沒上線過的功能,想要體驗的朋友們,速去喲~

圖片

責(zé)任編輯:姜華 來源: 量子位
相關(guān)推薦

2024-04-01 12:10:48

數(shù)據(jù)訓(xùn)練

2024-07-25 12:31:06

2024-03-14 11:55:08

AI模型

2009-12-18 11:26:08

Intel 32nm

2024-08-01 12:44:58

2017-03-01 18:17:27

阿里巴巴

2015-11-25 14:43:44

2024-02-06 20:39:21

2024-11-12 09:14:52

2024-01-29 13:56:55

AI數(shù)據(jù)

2015-05-08 12:17:53

2024-02-05 13:37:35

AI數(shù)據(jù)

2011-12-14 09:32:06

微軟iPhone

2024-02-06 10:38:10

昆侖萬維大模型

2014-08-19 10:14:47

App應(yīng)用原型設(shè)計工具

2024-05-06 07:58:23

MoE模型系統(tǒng)

2013-08-22 15:01:40

易信微信移動
點贊
收藏

51CTO技術(shù)棧公眾號