自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)

人工智能
只要60分飄過八年級(jí)科學(xué)考試,就能收獲8萬美元獎(jiǎng)金(折合人民幣57萬元)。只不過,參加考試的“學(xué)生”,必須是個(gè)AI。

只要60分飄過八年級(jí)科學(xué)考試,就能收獲8萬美元獎(jiǎng)金(折合人民幣57萬元)。

[[276019]]

只不過,參加考試的“學(xué)生”,必須是個(gè)AI。

在長達(dá)四年的時(shí)間里,700多名計(jì)算機(jī)科學(xué)家參與到這項(xiàng)AI競賽當(dāng)中,但他們的AI紛紛折戟,沒有一個(gè)能拿到及格分。

但現(xiàn)在,歷史新紀(jì)錄來了。艾倫研究所的一個(gè)名叫Aristo的AI搞定了這件事,不僅在8年級(jí)科學(xué)考試中答對(duì)了90%以上的問題,連高三的考試,它都能答對(duì)80%!

AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)

這對(duì)于AI來說,有點(diǎn)鵝妹子嚶了。

語言理解+邏輯,難倒AI

雖然AI下圍棋能贏世界冠軍,打德?lián)溥€會(huì)詐唬,IBM的Watson也早在智力問答《危險(xiǎn)邊緣(Jeopardy!)》中大殺四方,但想要通過美國八年級(jí)科學(xué)考試,對(duì)AI來說仍然是一大挑戰(zhàn)。

即使排除了圖片題和圖表題,科學(xué)考試中的問答依然不是簡單的自然語言理解問題,還涉及到邏輯推理乃至常識(shí)——答案并不是明顯存在于某處文本中的。

舉個(gè)例子,在考試中,有的問題比較簡單,只涉及到信息檢索:

一組協(xié)同工作以執(zhí)行特定功能的組織稱為:

(1)器官

(2)有機(jī)體

(3)系統(tǒng)

(4)細(xì)胞

但有的問題它長這個(gè)樣子:

什么樣的改變會(huì)導(dǎo)致區(qū)域內(nèi)的松鼠數(shù)量減少?

(1)食肉動(dòng)物數(shù)量減少

(2)松鼠之間的競爭減弱

(3)食物增加

(4)森林火災(zāi)發(fā)生次數(shù)增多

這可就不是AI光靠學(xué)習(xí)規(guī)則就能回答的問題了,其中牽扯到的邏輯推理,對(duì)人類而言或許是小菜一碟,但對(duì)AI來說,并沒有那么簡單。

甚至還有多選問題。

就在AlphaGo震驚世界的2016年,最強(qiáng)的AI系統(tǒng)也只能在紐約州八年級(jí)科學(xué)考試中達(dá)到59.3%的準(zhǔn)確率,遺憾未能及格。

基于Bert的Aristo

Aristo是怎樣實(shí)現(xiàn)突破的呢?

其實(shí),它是站在了巨人的肩膀之上。

Aristo基于艾倫研究所的深度語境化詞表征ELMo(NAACL 2018最佳論文)和大名鼎鼎的BERT開發(fā)(現(xiàn)已替換為RoBERTa),集八種類型智能體于一身,有的智能體負(fù)責(zé)在數(shù)據(jù)庫中查找答案,有的負(fù)責(zé)檢查相關(guān)概念列表(元組),還有的專門執(zhí)行邏輯推理。

AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)

每個(gè)智能體都會(huì)為答案打分,而Aristo會(huì)對(duì)不同的分?jǐn)?shù)進(jìn)行加權(quán),最終做出選擇決策。

AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)

在實(shí)驗(yàn)測試中,研究人員讓Aristo參加了2017年到2019年各個(gè)年級(jí)的紐約州會(huì)考,結(jié)果顯示,Aristo在4年級(jí)和8年級(jí)的考試中正確率都到達(dá)了90%左右,符合紐約州教育部認(rèn)定的“優(yōu)秀標(biāo)準(zhǔn)”(85%)。而12年級(jí)考試的正確率則是83.54%,離優(yōu)秀只差了一點(diǎn)點(diǎn)。

AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)

在此之前,這些考試數(shù)據(jù)并不在Aristo的訓(xùn)練集中。

并且,現(xiàn)在Aristo的答題范圍不僅僅局限在文字問題中了,涉及到計(jì)算機(jī)視覺的圖表題,它也正在拿下。

AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)
AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)

在接受媒體采訪時(shí),Aristo項(xiàng)目的高級(jí)經(jīng)理Peter Clark表示:

Aristo的目標(biāo)不僅僅是通過科學(xué)考試,而是創(chuàng)造一個(gè)對(duì)科學(xué)有更深入理解的系統(tǒng)。

雖然如從事類似研究的微軟研究員Jingjing Liu所說,實(shí)際上,Aristo仍然不具備“真正”的智能,我們無法將Aristo的能力與人類學(xué)生的推理能力相比較。但無疑,它創(chuàng)造了一個(gè)很好的應(yīng)用方向。

比如更強(qiáng)大的搜索,比如個(gè)性化教育。

AI高分通過美國8年級(jí)科學(xué)考試:常識(shí)題推理題都能行,不服同臺(tái)對(duì)戰(zhàn)

對(duì)了,Aristo現(xiàn)在有了在線Demo,可以在線調(diào)戲喲。

傳送門

Demo:

http://aristo-demo.allenai.org/

數(shù)據(jù)集:

http://data.allenai.org/ai2-science-questions/

相關(guān)論文:

https://allenai.org/papers/papers-aristo-2019.html

 

責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2024-06-06 09:18:48

2025-03-03 09:40:00

2022-12-28 13:57:56

AI模型語言

2022-06-09 09:48:46

AI預(yù)測醫(yī)療

2023-08-11 14:01:35

GPT-4推理

2011-09-17 19:40:57

計(jì)算機(jī)等級(jí)考試

2009-04-27 13:43:15

軟件設(shè)計(jì)師沖刺預(yù)測題

2019-09-19 16:10:14

人工智能AI

2011-09-17 19:31:01

計(jì)算機(jī)等級(jí)考試

2011-09-17 19:34:08

計(jì)算機(jī)等級(jí)考試

2011-09-17 19:56:00

計(jì)算機(jī)等級(jí)考試

2011-09-17 19:44:59

計(jì)算機(jī)等級(jí)考試

2011-09-17 20:04:38

計(jì)算機(jī)等級(jí)考試

2025-04-03 02:25:00

2020-05-25 14:21:06

數(shù)學(xué)題Python微信

2011-09-17 19:58:36

計(jì)算機(jī)等級(jí)考試

2024-11-01 11:55:14

2009-09-01 00:00:00

CCNA考試注意事項(xiàng)

2010-05-10 13:21:48

思科認(rèn)證CCNA

2023-12-04 13:52:00

模型數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)