自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

40%算力訓(xùn)練效果比肩GPT-4,實(shí)測(cè)DeepMind聯(lián)創(chuàng)大模型創(chuàng)業(yè)新成果

人工智能 新聞
Inflection-2.5,由DeepMind聯(lián)創(chuàng)Mustafa Suleyman的大模型初創(chuàng)公司打造。只用40%的計(jì)算資源訓(xùn)練,表現(xiàn)就超過(guò)了GPT-4的九成,尤其擅長(zhǎng)代碼和數(shù)學(xué)。

大模型競(jìng)賽,又殺出一匹黑馬——

Inflection-2.5,由DeepMind聯(lián)創(chuàng)Mustafa Suleyman的大模型初創(chuàng)公司打造。

只用40%的計(jì)算資源訓(xùn)練,表現(xiàn)就超過(guò)了GPT-4的九成,尤其擅長(zhǎng)代碼和數(shù)學(xué)。

而早期的Inflection模型,訓(xùn)練時(shí)只消耗了4%的計(jì)算資源,就達(dá)到了GPT-4表現(xiàn)的72%。

以Inflection模型為基礎(chǔ),該公司還推出了網(wǎng)頁(yè)端對(duì)話機(jī)器人Pi,主打“高情商”和“個(gè)性化”,還支持中文。

自誕生以來(lái),Pi的最高日活達(dá)到了100萬(wàn),累計(jì)產(chǎn)生了40億條消息,平均對(duì)話時(shí)長(zhǎng)來(lái)到了33分鐘。

而隨著這次基礎(chǔ)模型的升級(jí),Pi也迎來(lái)了它的新版本。

圖片圖片

那么,Inflection,或者說(shuō)Pi,表現(xiàn)到底有沒(méi)有那么強(qiáng),量子位進(jìn)行了一番實(shí)測(cè)。

無(wú)需登錄即可使用

打開(kāi)Pi的頁(yè)面,映入眼簾的是這樣一個(gè)極簡(jiǎn)界面,而且還可以不用登錄,直接點(diǎn)擊Next。

圖片圖片

連續(xù)Next幾次后,輸入希望Pi稱呼我們的方式。

圖片圖片

之后是選擇聲音和推薦話題,直接跳過(guò)就可以了,然后就進(jìn)入正式的聊天界面了。

圖片圖片

簡(jiǎn)單測(cè)試發(fā)現(xiàn),Pi支持中文對(duì)話,既然如此那就先把弱智吧Benchmark給安排上。

第一題,老鼠生病了可以吃老鼠藥治好嗎,Pi成功解答。

圖片圖片

再來(lái)一道“陷阱”題,這次依舊沒(méi)有上當(dāng)。

圖片圖片

兩道問(wèn)題過(guò)后,雖然沒(méi)有出現(xiàn)什么戲劇性效果,但看起來(lái)對(duì)中文也是有一定的理解了。

接下來(lái)就重點(diǎn)看看官方宣稱“尤其擅長(zhǎng)”的數(shù)學(xué)和代碼能力。

首先是一道涉及動(dòng)態(tài)規(guī)劃的編程題目。

圖片圖片

Pi給出的代碼成功解決了這個(gè)問(wèn)題,并且配有清晰的解釋。

圖片圖片

接下來(lái)再提升一下難度看看,讓其分析一個(gè)數(shù)字的階乘中末尾有多少個(gè)0。

圖片圖片

Pi給出的代碼不僅正確,而且簡(jiǎn)潔高效,運(yùn)行速度超過(guò)了LeetCode上73.8%的用戶。

圖片圖片

最后再來(lái)增加一下難度,以一道47.5%通過(guò)率的題目結(jié)束代碼部分的測(cè)試。

圖片圖片

看完代碼,再來(lái)測(cè)測(cè)Pi的數(shù)學(xué)能力怎么樣,讓它做做關(guān)于導(dǎo)數(shù)的題目:

求出函數(shù)f(x)=x3+2x2-1的極值點(diǎn)

解答完全正確,而是十分詳細(xì)。

當(dāng)然要想數(shù)學(xué)好,邏輯思維是必不可少的,所以我們?cè)诔R?guī)的數(shù)學(xué)題之外,又用一道經(jīng)典的題目考驗(yàn)了一下的Pi邏輯思維,結(jié)果還不錯(cuò)。


通過(guò)Pi的表現(xiàn),可以看出其背后的Inflection-2.5模型的確可圈可點(diǎn)。

而從官方自己公布的測(cè)試數(shù)據(jù)來(lái)看,無(wú)論是綜合能力還是各個(gè)子項(xiàng),Inflection-2.5的表現(xiàn)都緊隨GPT-4。

以數(shù)學(xué)和代碼為例,Inflection-2.5在MATH、HumanEval等測(cè)試中都比1.0版本都有大幅飛躍。

在這些常規(guī)的數(shù)據(jù)集之外,Inflection還挑戰(zhàn)了匈牙利高考數(shù)學(xué)試題和GRE物理測(cè)試,結(jié)果幾乎與GPT-4打成平手。

更“刁鉆”的,還有人專門用大模型難以理解的問(wèn)題構(gòu)建了一個(gè)BIG-Bench數(shù)據(jù)集,而Inflection-2.5挑戰(zhàn)了其中的Hard子集,結(jié)果和GPT-4的差距不到一分。

那么,Inflection-2.5的背后,是怎樣的一家公司呢?

DeepMind聯(lián)創(chuàng)大模型創(chuàng)業(yè)

這家公司名叫Inflection AI,由DeepMind聯(lián)創(chuàng)Mustafa Suleyman等人于2022年創(chuàng)立,目前共有70余人。

同樣來(lái)自DeepMind的,還有資深研究員Karen Simonyan,現(xiàn)擔(dān)任Inflection AI的首席科學(xué)家。

此外,LinkedIn聯(lián)創(chuàng)Reid Hoffman也參與了Inflection AI的創(chuàng)立。

創(chuàng)立以來(lái),Inflection AI已經(jīng)獲得了來(lái)自英偉達(dá)、微軟、比爾蓋茨等巨頭的共計(jì)15億美元的融資。

目前,基于Inflection的Pi還是免費(fèi)的,但CEO Suleyman也表示,一直用愛(ài)發(fā)電不現(xiàn)實(shí),長(zhǎng)久地看以后還是要收費(fèi)。

想要體驗(yàn)的朋友,可能要抓緊時(shí)間了~

傳送門:https://pi.ai

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-09-03 12:56:43

2023-09-11 15:57:16

人工智能模型GPT-4

2024-03-08 12:35:27

AI模型

2023-12-05 12:50:14

GPT-4DeepMind

2024-05-28 14:40:00

2024-07-16 13:13:26

2023-10-14 17:24:49

2024-06-17 18:04:38

2023-09-15 13:32:00

AI模型

2023-05-11 06:59:11

AI重構(gòu)搜索

2023-11-06 12:46:00

AI數(shù)據(jù)

2023-08-29 13:50:00

AI谷歌

2023-06-28 08:36:44

大語(yǔ)言模型人工智能

2023-06-27 13:37:17

谷歌AI

2023-07-23 18:55:20

ChatGPTGPT-4

2023-03-30 11:08:49

AI模型訓(xùn)練

2023-10-24 19:42:50

AI訓(xùn)練

2024-01-02 13:12:53

GPT-4UCSC數(shù)據(jù)

2023-09-25 07:31:19

算力AI框架

2023-12-26 08:17:23

微軟GPT-4
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)