螞蟻集團(tuán)獲得Spider冠軍,登上兩項(xiàng)NL2SQL權(quán)威榜單榜首
日前,螞蟻集團(tuán)憑借在語(yǔ)義解析領(lǐng)域提出的中間表征語(yǔ)言PQL,超越了Meta、Allen Institute for AI、微軟、達(dá)摩院、耶魯大學(xué)、上海交通大學(xué)等研究機(jī)構(gòu)和科技企業(yè),以78.5分的成績(jī)獲得了NL2SQL國(guó)際權(quán)威榜單Spider的第一名,刷新了該任務(wù)的業(yè)界記錄。
近年來(lái),運(yùn)用人工智能技術(shù)提高結(jié)構(gòu)化數(shù)據(jù)利用效率成為了業(yè)界研究熱點(diǎn),NL2SQL(Natural Language to SQL)是一種自動(dòng)將用戶(hù)輸入的自然語(yǔ)言轉(zhuǎn)成數(shù)據(jù)庫(kù)可操作SQL查詢(xún)語(yǔ)句的技術(shù),可以有效提高人機(jī)交互效率,實(shí)現(xiàn)基于數(shù)據(jù)庫(kù)的自動(dòng)問(wèn)答能力,因此在對(duì)話(huà)系統(tǒng)、商業(yè)智能等場(chǎng)景有重要應(yīng)用價(jià)值。
Spider數(shù)據(jù)集由耶魯大學(xué)提出,是業(yè)界公認(rèn)的NL2SQL領(lǐng)域難度最大的大規(guī)??珙I(lǐng)域評(píng)測(cè)榜單,共涵蓋138個(gè)不同的領(lǐng)域,包含10181個(gè)問(wèn)題、5693個(gè)復(fù)雜SQL查詢(xún)語(yǔ)句、200個(gè)多表數(shù)據(jù)庫(kù),自2018年提出至今,Spider吸引了眾多國(guó)際領(lǐng)先機(jī)構(gòu)參加測(cè)評(píng),榜單排名競(jìng)爭(zhēng)激烈。此次摘下冠軍,顯示出螞蟻集團(tuán)在NL2SQL技術(shù)上的領(lǐng)先性。
在本次評(píng)測(cè)中,螞蟻集團(tuán)智能服務(wù)團(tuán)隊(duì)聯(lián)合螞蟻財(cái)富、搜索等螞蟻NLP研究小組共同設(shè)計(jì)了中間表征語(yǔ)言PQL,這是一種能同時(shí)兼容表格與圖譜查詢(xún)的中間語(yǔ)言,相比SQL,它能以更簡(jiǎn)潔的語(yǔ)法來(lái)表征自然語(yǔ)言問(wèn)題,對(duì)問(wèn)題中存在的關(guān)鍵推理路徑進(jìn)行對(duì)齊,并合并查詢(xún)圖中存在冗余或同義結(jié)構(gòu),從而有效提升模型對(duì)推理路徑的識(shí)別準(zhǔn)確性。
近幾年,螞蟻集團(tuán)在NL2SQL方向上深入多項(xiàng)研究,并結(jié)合NL2SQL、對(duì)話(huà)管理等技術(shù)提供結(jié)構(gòu)化表格的多輪對(duì)話(huà)問(wèn)答能力,目前這一技術(shù)已經(jīng)在螞蟻財(cái)富智能理財(cái)助理"支小寶"、客服等多個(gè)場(chǎng)景應(yīng)用,可以將用戶(hù)求助自動(dòng)轉(zhuǎn)化為背后數(shù)據(jù)庫(kù)查詢(xún),實(shí)現(xiàn)復(fù)雜問(wèn)題的理解和回答。例如,當(dāng)投資者遇到無(wú)法快速找到目標(biāo)基金的問(wèn)題時(shí),“支小寶”可以通過(guò)NL2SQL的技術(shù)能力及豐富的金融領(lǐng)域數(shù)據(jù),來(lái)幫助投資者解決,讓投資者不僅能直接用“所屬板塊、基金經(jīng)理、漲跌幅、夏普比” 等超過(guò)200種條件進(jìn)行查詢(xún),還可以自由組合條件,實(shí)現(xiàn)“所想即所得”的用戶(hù)體驗(yàn)。據(jù)了解,目前“支小寶"共累計(jì)回復(fù)了超過(guò)1億次金融問(wèn)答類(lèi)理財(cái)問(wèn)題,對(duì)該類(lèi)問(wèn)題的準(zhǔn)確識(shí)別率達(dá)到了93%。
根據(jù)公開(kāi)信息,去年6月,螞蟻集團(tuán)智能服務(wù)算法團(tuán)隊(duì)和支小寶團(tuán)隊(duì)登上了NL2SQL領(lǐng)域另一權(quán)威榜單WikiSQL的榜首。