發(fā)力應(yīng)用研究 阿里多篇論文被國際數(shù)據(jù)挖掘頂會KDD收錄
5月23日消息,在2017國際知識發(fā)現(xiàn)與數(shù)據(jù)挖掘大會(KDD)全球論文投稿中,阿里集團(tuán)和螞蟻金服共有5篇論文被大會收錄,這是繼年初阿里云獲得KDD Cup 2017舉辦權(quán)之后,阿里巴巴在國際數(shù)據(jù)挖掘頂會KDD學(xué)術(shù)成果上的又一次突破。

圖 KDD 2017 官網(wǎng)圖片
KDD的英文全稱是Knowledge Discovery and Data Mining,即知識發(fā)現(xiàn)與數(shù)據(jù)挖掘,由美國計算機(jī)協(xié)會ACM下的數(shù)據(jù)挖掘分會舉辦,是國際數(shù)據(jù)挖掘領(lǐng)域的***會議,每年有大量來自世界各地的學(xué)術(shù)界和工業(yè)界人士參與此盛會。KDD 2017共吸引全世界1144篇論文投遞,收錄216篇,包括清華、中科院、阿里在內(nèi)的中國大陸學(xué)術(shù)界和工業(yè)界共被收錄25篇。今年8月,KDD 2017大會將在加拿大港口城市哈利法克斯召開,被稱為大數(shù)據(jù)領(lǐng)域奧運(yùn)會的KDD Cup也會同期舉辦。
據(jù)了解,阿里巴巴本次被收錄論文涵蓋深度學(xué)習(xí)、大規(guī)模圖計算、商品智能排序等多個研究領(lǐng)域,基于真實(shí)的業(yè)務(wù)場景或數(shù)據(jù)樣本,文中部分方法結(jié)論已經(jīng)在業(yè)務(wù)中運(yùn)用。如深度學(xué)習(xí)語義建模研究中提出了一種新的文本語義編碼算法conv-RNN,該模型在參考了較為常用的文本語義編碼模型循環(huán)神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的同時,進(jìn)行了進(jìn)一步的文本語義編碼優(yōu)化,實(shí)現(xiàn)更為精準(zhǔn)的文本分類和問答匹配并已應(yīng)用于阿里智能問答系統(tǒng)中。
作為全球***的互聯(lián)網(wǎng)科技企業(yè),過去一年阿里電商整體規(guī)模超過3.7萬億人民幣,記錄數(shù)億的活躍用戶購買行為數(shù)據(jù)、數(shù)十億的商品多維特征的刻畫數(shù)據(jù),有EB級別的數(shù)據(jù)沉淀。擁有海量數(shù)據(jù)的阿里在年初就發(fā)布NASA計劃,目的為“為了解決10年、20年后的困難”,另外還正在與國內(nèi)外***學(xué)術(shù)機(jī)構(gòu)中科院、SIGIR、ASPLOS等拓展合作,不久前,阿里iDST負(fù)責(zé)人金榕就受邀擔(dān)任國際計算機(jī)學(xué)會中國理事會常務(wù)理事。在部分領(lǐng)域阿里已經(jīng)實(shí)現(xiàn)突破,如聯(lián)合中科院研制出中國首臺光量子計算機(jī),單位體積內(nèi)的計算能力提升10倍的液冷服務(wù)器也計劃2018年大規(guī)模商用。