自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<legend id="b860s"><track id="b860s"></track></legend>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

全球對話技術頂賽DSTC10落幕，百度PLATO斬獲多個冠軍！

作者：佚名 2021-10-23 09:25:43

企業(yè)動態(tài)

在上一屆DSTC 比賽中，百度PLATO-2 模型奪得多個任務冠軍；本次比賽，百度結合了最新發(fā)布的全球首個百億參數(shù)對話生成模型PLATO-XL

近日，第十屆對話系統(tǒng)技術挑戰(zhàn)賽DSTC10落下帷幕。作為全球人工智能頂級學術競賽之一，DSTC比賽持續(xù)受到國內外知名企業(yè)和機構關注。百度在DSTC10中斬獲了知識型任務口語對話賽道兩項任務的全部冠軍，并以大幅優(yōu)勢領先對手。

在上一屆DSTC 比賽中，百度PLATO-2 模型奪得多個任務冠軍；本次比賽，百度結合了最新發(fā)布的全球首個百億參數(shù)對話生成模型PLATO-XL，在賽題難度加大的情況下，憑借強大的技術實力再次拿下多個冠軍。

加入錯誤干擾數(shù)據(jù) 知識型任務口語賽道難度空前

任務型對話基于知識為用戶提供口語化的信息查詢、指令執(zhí)行等智能服務。今年DSTC的知識型任務口語對話賽道由對話狀態(tài)追蹤和知識對話兩項核心子任務構成，這兩項任務是判斷對話系統(tǒng)能否在多輪對話中準確理解用戶意圖、正確傳遞信息的關鍵。為了更接近真實場景，該賽道首次在競賽中使用了帶有自動語音識別（Automatic Speech Recognition, ASR）錯誤干擾的口語對話數(shù)據(jù)。下圖展示了驗證集中的一個對話片段，口語的表述更加復雜多樣，且 ASR 錯誤帶來的干擾很大（作為參考，灰色部分為人工再次核查錄音，校正后的對話內容）。相比于傳統(tǒng)對話系統(tǒng)中采用的眾包數(shù)據(jù)，該賽道不僅訓練數(shù)據(jù)缺乏，而且數(shù)據(jù)噪音大，這對正確理解用戶信息并保持高質量的回復是一項極大的挑戰(zhàn)。

知識型任務口語對話賽道ASR錯誤示例：灰色字體為專家根據(jù)對話內容恢復的準確文本。紅色字體為ASR錯誤內容

那么在激烈的競爭中，百度是如何在這一賽道拿下兩項任務全部冠軍的呢？

對話狀態(tài)追蹤任務大幅領先創(chuàng)新提出多層級數(shù)據(jù)增強框架

在任務1對話狀態(tài)追蹤任務中，參賽系統(tǒng)需要完成多領域對話狀態(tài)追蹤，正確識別出用戶意圖和槽位。首先，針對訓練數(shù)據(jù)匱乏的難題，百度團隊創(chuàng)新地提出了多層級數(shù)據(jù)增強方法，通過對已有對話進行實體替換、基于對話動作隨機游走、口語模擬增強等技術，自動構造了數(shù)十萬的多輪口語對話。然后，依托對話生成預訓練模型PLATO，進行對話追蹤任務端到端建模，即根據(jù)多輪對話上文自動生成意圖和槽位，大幅提升模型魯棒性。最終聯(lián)合目標準確率（Joint Goal Accuracy）達到 0.4616，超越第二名十個百分點，以絕對的優(yōu)勢奪得第一。

對話狀態(tài)追蹤任務示例：將用戶的口語文本轉為結構化的對話狀態(tài)描述同時，還需要修復相關ASR錯誤

對話狀態(tài)追蹤任務榜單（前五名）， A11為百度團隊。

知識對話任務奪冠實體增強輔助知識精準定位

第二項任務為知識對話。傳統(tǒng)任務型對話以知識為基本支撐，一旦用戶的訴求超出知識范疇，對話系統(tǒng)就無法做出正確的回復。針對該問題，通常會在對話系統(tǒng)中引入大量的外部知識，來進一步提升對話系統(tǒng)的能力。在該背景下，第二項任務設置了三個級聯(lián)的子任務：

• 判斷當前對話是否需要使用外部知識；

• 選擇跟當前對話內容匹配的知識；

• 根據(jù)選取的知識進行回復生成。

針對這些子任務，百度創(chuàng)新地提出了知識增強的對話策略：首先，在多領域任務對話的復雜場景下，準確識別定位與對話意圖相關的知識需求；然后，知識召回輔助模型從大規(guī)模知識庫中高效召回合適的知識；最后，利用PLATO-XL的靈活可擴展性，基于對話上下文內容以及召回的外部知識，自動生成回復。從系統(tǒng)回復的人工評估結果來看，百度在回復的準確性和合適性兩個指標都取得最好成績。

值得一提的是，任務結果評估也引入了人工標注的結果（Ground-truth）。百度提交的結果與人工標注結果差距最?。ò俣认到y(tǒng)得分 3.4235 vs 人工標注結果得分 3.5291），驗證了上述知識增強的對話策略更接近人的認知過程，相比于其他系統(tǒng)，具有更好的可解釋性。

如同人在回答一些不了解的專業(yè)問題也需要查閱資料，知識增強的方法使對話系統(tǒng)具備了“臨時查閱”的能力，能夠更加專業(yè)、更加精準地回答問題。知識增強的對話不僅成功應用于知識對話任務，在百度近期發(fā)布的PLATO-KAG等相關的工作上也取得了不錯進展?？梢哉f，知識增強已經(jīng)成為對話系統(tǒng)的必備能力。

知識對話任務示例：系統(tǒng)需要判斷是否需要引入外部知識庫，并利用外部知識（External Knowledge）來準確響應用戶需求

知識對話任務榜單（前五名），B10為百度團隊。第一行（Ground Truth）為人類標注。對話從準確性（Accuracy）, 合適性（Appropriatenesss）兩個角度進行評估。

對話系統(tǒng)是自然語言處理領域最具挑戰(zhàn)性的技術之一，尤其是實際應用場景下，數(shù)據(jù)高噪聲、多歧義，比學術研究數(shù)據(jù)更復雜、更具挑戰(zhàn)性。通過此次DSTC10競賽，百度再次錘煉了PLATO模型的魯棒性，同時驗證了知識增強策略的應用效果，并為解決產(chǎn)業(yè)應用中的實際問題提供了全新思路。未來，百度AI還將持續(xù)技術創(chuàng)新與突破，實現(xiàn)讓對話更有知識、有情感、有邏輯的目標。

百度 PLATO 系列模型完全基于百度自主研發(fā)的深度學習平臺飛槳。DSTC10的冠軍解決方案也會陸續(xù)開源到 GitHub，對智能對話感興趣的小伙伴千萬別錯過。同時，百度也推出了”百度PLATO”的微信公眾號，大家可以體驗基于PLATO的中文對話效果。

GitHub 鏈接：https://github.com/PaddlePaddle/Knover

責任編輯：張誠來源：互聯(lián)網(wǎng)

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<s id="wn65s"><li id="wn65s"></li></s>

<sub id="wn65s"></sub>