像人類一樣理解言外之意,阿里AI最新研究成果被國際頂會收錄
AI的語言理解能力又進一步了!7月30日,在全球線上舉行的人工智能頂會SIGIR 2020上,阿里巴巴研究團隊表現(xiàn)突出,共有29項研究成果入選,是全球論文數(shù)量最多的科技公司。據(jù)悉,阿里在多個成果中展現(xiàn)了AI在理解文本信息任務(wù)上的突破。
SIGIR是信息檢索研究領(lǐng)域最權(quán)威的學(xué)術(shù)會議,其覆蓋了文本分析、計算、機器學(xué)習(xí)和推薦系統(tǒng)等領(lǐng)域,微軟、谷歌、Facebook等頂級科技公司都曾在該會議上集中發(fā)布研究成果。據(jù)悉,SIGIR 2020共收到 1180 篇論文,但最終僅有340篇入選。
相比大家熟知的語音識別、圖像識別,理解復(fù)雜的文本信息是更難的人工智能任務(wù)。此次,阿里巴巴研究團隊在SIGIR 2020上率先提出多種創(chuàng)新思路,可大幅提升機器理解文本信息的效率。
在其中一篇論文中,阿里提出了一種能夠理解文本言外之意的方法,通過推敲給定隱晦文本的全局語義、局部語義,以及可能存在的噪音,有效提高了模型識別隱晦文本是否包含色情、暴力等內(nèi)容的精確率。
達摩院機器智能實驗室主任金榕表示,“信息檢索和自然語言處理技術(shù)是人工智能的基礎(chǔ)技術(shù),實現(xiàn)突破不僅需要全新的模型,還需要結(jié)合實際應(yīng)用提出更創(chuàng)新的訓(xùn)練和推理方法,阿里巴巴經(jīng)濟體豐富的場景為自然語言處理等技術(shù)的研究提供了絕佳條件。
過去兩年,阿里在信息檢索CIKM Cup、機器翻譯WMT、閱讀理解MS MARCO等自然語言處理領(lǐng)域頂級賽事獲得了多項世界冠軍;不僅如此,阿里還率先在情緒識別等前沿領(lǐng)域布局,可以讓機器讀懂人類情緒。目前,阿里自然語言技術(shù)已在金融、新零售、通訊、互聯(lián)網(wǎng)、醫(yī)療、電力等領(lǐng)域服務(wù)超十億用戶。