AI首次超越人類(lèi)!騰訊、阿里的NLP模型,比你更懂中文
?在AI科技圈,「中文語(yǔ)言理解」一直是一個(gè)難以攻克的問(wèn)題。因?yàn)樵谌澜缢械恼Z(yǔ)言中——中文的難度系數(shù)是最高的。
舉例來(lái)講,就下面這句簡(jiǎn)簡(jiǎn)單單20個(gè)字的句子,都絕對(duì)能讓不少外國(guó)人深感崩潰。
下雨天,我騎車(chē)差點(diǎn)摔倒,好在一把把把把住了。?
然而,在最新的中文語(yǔ)言理解領(lǐng)域權(quán)威榜單CLUE中,騰訊和阿里的AI模型卻先后超越了人類(lèi)的成績(jī)!實(shí)在讓人不禁感慨:這年頭,還有什么是AI做不了的嗎?
最新一期CLUE最新排名
CLUE的全稱(chēng)是Chinese Language Understanding Evaluation,即「中文語(yǔ)言理解測(cè)評(píng)基準(zhǔn)」。
就像英語(yǔ)的GLUE和SuperGLUE,CLUE是一組評(píng)估機(jī)器能夠像人類(lèi)一樣理解和響應(yīng)中文文本的任務(wù),上線于3年前,也是第一個(gè)大規(guī)模的中文語(yǔ)言評(píng)估基準(zhǔn),旨在推動(dòng)NLP技術(shù)的不斷進(jìn)步和突破。
在CLUE的官網(wǎng)上,有語(yǔ)料庫(kù)、排行榜、預(yù)訓(xùn)練模型和代表性的數(shù)據(jù)集等資料可供選擇。包括文本相似度、分類(lèi)、上下文推理、閱讀理解在內(nèi)的17項(xiàng)測(cè)評(píng)任務(wù),其介紹在官網(wǎng)上都有很詳盡的展示。
今年11月22日,阿里巴巴的AI模型「AliceMind」獲得了86.685的高分,穩(wěn)居總排行榜首位的同時(shí),也一舉打破了由人類(lèi)(HUMAN)在該系列測(cè)試中保持的紀(jì)錄。
值得一提的是,這也是人工智能在該系列測(cè)試中——首次超越人類(lèi)。
巧合的是,短短4天后,騰訊的「混元AI大模型」在測(cè)試中以86.918的高分再次刷新了紀(jì)錄——這甚至比AliceMind的成績(jī)還要高0.233分。
中國(guó)兩大互聯(lián)網(wǎng)巨頭你方唱罷我登場(chǎng),說(shuō)明人工智能在不同領(lǐng)域和方面都有超越人類(lèi)的能力。
上周五,阿里云計(jì)算部門(mén)也在一篇文章中表示,「這標(biāo)志著中國(guó)對(duì)AI模型的理解,達(dá)到了一個(gè)新的水平」。
中國(guó)的大型科技公司正努力改進(jìn)他們的自然語(yǔ)言處理 (NLP) 系統(tǒng),這些系統(tǒng)被用于支持如阿里巴巴的語(yǔ)音激活虛擬助手,騰訊的小微和AliGenie,以及機(jī)器翻譯和垃圾郵件檢測(cè)等其他功能。
今年早些時(shí)候,由百度研發(fā)的AI模型「度曉曉」寫(xiě)出的作文,盡管錯(cuò)誤地使用了不少互聯(lián)網(wǎng)俚語(yǔ)和生僻詞,但仍在高考得分中高于絕大多數(shù)學(xué)生。
此外在最新排行榜上,中國(guó)智能手機(jī)制造商O(píng)PPO和外賣(mài)巨頭美團(tuán)的人工智能模型,也分別排在第四和第五位。
盡管如此,一些研究人員表示:雖然機(jī)器在某些語(yǔ)言任務(wù)上可以比人類(lèi)做得更好,但大多數(shù)人工智能模型在真正理解語(yǔ)言的復(fù)雜性之前,還有很長(zhǎng)的路要走。
去年,由美國(guó)阿拉巴馬州奧本大學(xué)和Adobe的研究部門(mén)聯(lián)合研究發(fā)現(xiàn),許多在某些理解任務(wù)上表現(xiàn)優(yōu)于人類(lèi)的AI,仍無(wú)法分辨出單詞被隨機(jī)打亂的句子。
參考資料:
https://www.cluebenchmarks.com/rank.html
https://www.scmp.com/tech/big-tech/article/3201294/tencent-and-alibabas-ai-models-understand-chinese-better-humans-new-rankings-show
https://www.techtimes.com/articles/284084/20221128/tencent-alibaba-ai-tech-tops-chinese-language-comprehension-humans-ranks.htm
https://english.newstracklive.com/news/ai-models-from-tencent-and-alibaba-are-superior-to-humans-at-understanding-chinese-sc71-nu355-ta355-1259160-1.html