自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI 怎么知道人類對話在說什么?微軟研究團隊告訴你

新聞 人工智能
近期,微軟研究團隊通過對上下文建模加以研究得出一種新的方法,這種方法能夠讓 AI 模型通過上下文的歷史記錄來改寫對話中的最后話語,那么,這是一種怎樣的研究方法呢?

[[280027]]

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。

近期,微軟研究團隊通過對上下文建模加以研究得出一種新的方法,這種方法能夠讓 AI 模型通過上下文的歷史記錄來改寫對話中的最后話語,那么,這是一種怎樣的研究方法呢?

KYLE WIGGERS 對此做了詳細(xì)的介紹,雷鋒網(wǎng)將其文章進行了不改變愿意的編譯,具體如下。

在一份預(yù)先出版的論文中,微軟研究團隊詳細(xì)地介紹了他們的工作——為開放領(lǐng)域的對話進行無監(jiān)督的上下文重寫。他們聲稱,在重寫質(zhì)量和多輪響應(yīng)生成方面,他們的實驗結(jié)果已經(jīng)達(dá)到了最新基準(zhǔn)。

正如研究人員所解釋的那樣,對話上下文提出了句子建模中所沒有的挑戰(zhàn),比如主題轉(zhuǎn)換、共同引用(像他、她、它、他們這種)、長期依賴。大多數(shù)系統(tǒng)解決這些問題的方法是在最后一段話中添加關(guān)鍵字,或者用 AI 模型學(xué)習(xí)數(shù)字表示,但這種方法往往會遇到障礙,比如無法選擇正確的關(guān)鍵詞、無法處理較長的上下文等。

這時候,就是微軟研究團隊的方法的用武之地了。它通過對語境信息的考量,重新制定了對話中的最后一句話;這么做是為了生成一個獨立的話語,既不存在相互參照,也不依賴過去對話的其它話語。

雷鋒網(wǎng)注:【 圖片來源:Microsoft  所有者:Microsoft  】

舉個例子,如果將“我討厭喝咖啡。- - 為什么?它挺好喝的啊。”轉(zhuǎn)化成“為什么會討厭喝咖啡呢?它挺好喝的啊。”,這就借用了“它”和“為什么”。其中,“它”指代的是對話中提到的咖啡,“為什么”則是“為什么討厭喝咖啡”的縮寫形式。

對此,研究人員設(shè)計了一個機器學(xué)習(xí)系統(tǒng)——上下文重寫網(wǎng)絡(luò)(雷鋒網(wǎng)按:context rewriting network, CRN),來實現(xiàn)端到端的流程自動化。這個系統(tǒng)是由一個序列到序列模型組成的,它能夠?qū)⒐潭ㄩL度的話語映射到固定長度的重寫句子上。并且,它還具有一個獨立的注意力機制,這個機制能夠通過最后話語中的不同單詞來幫助它從上下文中復(fù)制單詞。

那么,這個系統(tǒng)是如何被設(shè)計出來的呢?

首先,微軟研究團隊使用偽數(shù)據(jù)對模型進行了訓(xùn)練,這些偽數(shù)據(jù)是通過提取上下文的關(guān)鍵字,將這些關(guān)鍵字插入到原始對話中的最后話語中來生成的。然后,為了讓最后的響應(yīng)影響重寫過程,他們利用了強化學(xué)習(xí)去推動系統(tǒng)朝著目標(biāo)前進。

雷鋒網(wǎng)注:【 圖片來源:Microsoft  所有者:Microsoft  】

在一系列實驗中,該團隊評估了他們的方法在幾種重寫質(zhì)量,多回合響應(yīng)生成,多回合響應(yīng)選擇以及基于端到端檢索的任務(wù)上的應(yīng)用。他們注意到,由于他們的模型更傾向于從上下文中提取更多的單詞,因此該模型在強化學(xué)習(xí)后偶爾會變得不穩(wěn)定,不過,這也顯著地提升了話語的多樣性。

微軟研究團隊認(rèn)為,他們的工作朝著更易解釋和更易控制的上下文建模中邁進了一步。另外,該研究團隊還表示,他們的模型可以從嘈雜的語境中提取出重要的關(guān)鍵詞,然后將這些關(guān)鍵詞插入到最后的話語中,使其不僅變得易于控制和解釋,還有助于將信息直接傳遞到最后的話語中。

責(zé)任編輯:張燕妮 來源: 雷鋒網(wǎng)
相關(guān)推薦

2011-08-31 13:12:36

2020-09-08 17:47:36

人工智能自然語言處理

2020-11-27 19:08:51

AI 數(shù)據(jù)人工智能

2020-10-24 21:00:24

人工智能AI

2021-10-19 09:21:08

AI人類工具

2022-12-08 08:40:25

大數(shù)據(jù)Hadoop存儲

2014-06-25 09:11:48

技術(shù)

2021-01-27 05:25:44

Go語言函數(shù)

2012-12-10 13:56:20

大數(shù)據(jù)IT云計算

2022-07-20 10:48:55

人工智能AI

2024-11-12 08:59:39

2023-09-05 12:59:33

模型數(shù)據(jù)

2011-03-03 09:34:36

2012-07-03 16:56:12

Hadoop

2020-10-18 18:02:32

AI機器學(xué)習(xí)微軟

2024-06-27 10:51:28

生成式AI領(lǐng)域

2020-09-11 16:17:02

產(chǎn)品定價AI人工智能

2018-10-17 15:10:49

人工智能大數(shù)據(jù)深度學(xué)習(xí)

2021-03-11 09:46:45

人工智能AI神經(jīng)網(wǎng)絡(luò)

2018-08-17 09:35:19

數(shù)據(jù)團隊數(shù)據(jù)科學(xué)工程師
點贊
收藏

51CTO技術(shù)棧公眾號