自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<var id="afs8p"><button id="afs8p"><form id="afs8p"></form></button></var>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

天衍實驗室推薦系統(tǒng)糾偏方法論文入選NeurIPS-2020

作者：佚名 2020-12-01 10:54:52

在我們?yōu)g覽各大網(wǎng)站和APP時，受推薦系統(tǒng)影響，大量相似產(chǎn)品反復(fù)出現(xiàn)的情況屢見不鮮，這不僅會產(chǎn)生視覺疲勞，而且很難讓我們做出理性的判斷和購買決策。究其原因，主要是目前主流的推薦系統(tǒng)采用的都是大數(shù)據(jù)模型篩查方式，會產(chǎn)生較大的路徑依賴。

在我們?yōu)g覽各大網(wǎng)站和APP時，受推薦系統(tǒng)影響，大量相似產(chǎn)品反復(fù)出現(xiàn)的情況屢見不鮮，這不僅會產(chǎn)生視覺疲勞，而且很難讓我們做出理性的判斷和購買決策。究其原因，主要是目前主流的推薦系統(tǒng)采用的都是大數(shù)據(jù)模型篩查方式，會產(chǎn)生較大的路徑依賴。

對此，騰訊天衍實驗室近期另辟蹊徑推出推薦系統(tǒng)糾偏方法，與傳統(tǒng)方法相比，該方法無需執(zhí)行隨機(jī)流量實驗以進(jìn)行無偏估計，大大減小了無偏推薦算法的訓(xùn)練成本，降低了系統(tǒng)的路徑依賴。目前，騰訊已經(jīng)就研究成果發(fā)表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》，且成功入選NeurIPS-2020。

傳統(tǒng)推薦系統(tǒng)易導(dǎo)致路徑依賴致使推薦質(zhì)量下降

作為現(xiàn)代互聯(lián)網(wǎng)領(lǐng)域的重點研究方向，推薦系統(tǒng)具有相當(dāng)高的商業(yè)價值。推薦系統(tǒng)模型需要在大量的候選項目中(通常為廣告、商品、短視頻等)尋找到用戶所喜愛的，從而提高曝光率或者點擊廣告收入。

傳統(tǒng)推薦系統(tǒng)研究一般著眼于設(shè)計更好的特征交叉方法以提高CTR預(yù)估的準(zhǔn)確性，從而給出更好的排序結(jié)果，提高廣告收入。通常，用戶看到的物品是推薦系統(tǒng)挑選出來的，它們在系統(tǒng)中產(chǎn)生了存儲記錄，推薦模型在該記錄上進(jìn)行離線更新。然而已有的研究顯示，這種推薦方式會產(chǎn)生路徑依賴，即模型會在得到曝光的項目上嚴(yán)重高估其對每個用戶的偏好程度，而會在未得到曝光的項目中低估其對每個用戶的偏好程度。長此以往，推薦結(jié)果的多樣性將會急劇降低，從而危害推薦的質(zhì)量和用戶留存度。

如下圖所示，橙色表示來源于MNAR數(shù)據(jù)的用戶評分分布，藍(lán)色表示MAR的評分。可以看到，MNAR上用戶的評分要大大偏高，多集中在5分，而MAR的數(shù)據(jù)較為平均的分布在1到5分之間。隨著時間推進(jìn)，MNAR的評分分布會越來越集中，加大和MAR評分的差距。

圖 1 隨機(jī)缺失數(shù)據(jù)和非隨機(jī)缺失數(shù)據(jù)上用戶反饋的偏差

為了解決這個問題，傳統(tǒng)方法多基于inverse propensity score (IPS) 來對在MNAR數(shù)據(jù)上進(jìn)行模型訓(xùn)練的目標(biāo)函數(shù)進(jìn)行加權(quán)糾偏。這類方法需要相當(dāng)數(shù)量的隨機(jī)試驗 (Randomized Controlled Trials, RCTs)，即隨機(jī)地將項目推薦給用戶以獲得反饋，從而得到一個無偏的點擊率的估計。而另外，IPS方法需要收集一定數(shù)量的RCTs，即對用戶展示相當(dāng)數(shù)量的隨機(jī)項目來收集反饋，從經(jīng)濟(jì)效益上來說，會造成大量的收入上的損失。而且，這種施加權(quán)重的方法也使得訓(xùn)練的方差增大，有時候反而會對結(jié)果造成副影響。

借鑒信息理論構(gòu)建模型推薦系統(tǒng)糾偏方法呈現(xiàn)創(chuàng)新優(yōu)勢

騰訊天衍實驗室借鑒了信息論中的理論來構(gòu)建模型。模型的原始輸入會先經(jīng)過一個編碼器 (Encoder) 得到表示 (Representation)，隨后經(jīng)過解碼器 (Decoder) 將表示解碼成為最終的預(yù)測結(jié)果。此后，目標(biāo)函數(shù)分為兩部分：輸入和表示之間的互信息，表示和輸入目標(biāo)之間的互信息。在優(yōu)化這個目標(biāo)函數(shù)時，騰訊天衍實驗室團(tuán)隊采用了盡可能攜帶更多的目標(biāo)信息和壓縮輸入信息的方法。

圖 2 信息瓶頸的流程和定義形式

首先把原始的輸入 (在此處是user-item對) 分為事實域 (factual) 和反事實域 (counterfactual) 。當(dāng)在counterfactual中發(fā)現(xiàn)無法得到用戶對項目的反饋，無法對模型進(jìn)行監(jiān)督學(xué)習(xí)時，選擇將該問題用信息瓶頸建模，由此得到一個無需反饋也可以在counterfactual上進(jìn)行學(xué)習(xí)的目標(biāo)函數(shù)。

圖 3 基于信息瓶頸理論的反事實學(xué)習(xí)框架流程圖

factual和counterfactual的事件分別是和，相對應(yīng)的表示為和。在此基礎(chǔ)上將原有的互信息項拆分，并引入一個超參數(shù)，可以得到一個新的考慮counterfactual的信息瓶頸：

這一新的瓶頸將原有的項拆分成了兩個域的對比項加上factual的信息項。源于上式中的互信息項無法直接優(yōu)化，在將其經(jīng)過進(jìn)一步拆解變?yōu)榭蓛?yōu)化的形式后，最終的目標(biāo)函數(shù)形式為：

這一目標(biāo)函數(shù)具有很廣泛的適用范圍，領(lǐng)域內(nèi)絕大部分的模型均可以適用該目標(biāo)函數(shù)來進(jìn)行模型糾偏而無需對現(xiàn)有模型結(jié)構(gòu)進(jìn)行修改，比如MF模型等。

為驗證其應(yīng)用潛力，騰訊天衍實驗室使用領(lǐng)域內(nèi)的benchmark Yahoo R3! 和 Coat 公開數(shù)據(jù)集進(jìn)行測試，使用MNAR的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)，使用MAR作為測試數(shù)據(jù)，從而能有效反映不同方法對于推薦模型的糾偏效果，最終實驗結(jié)果如下表所示。

表格 1 實驗結(jié)果(AUC和MSE指標(biāo))

表格 2 實驗結(jié)果 (nDCG指標(biāo))

在模型的魯棒性測試中，該方法表現(xiàn)出較強的穩(wěn)健性。對超參數(shù)變化敏感性不強，非常適用于實際場景的部署。相比于傳統(tǒng)推薦系統(tǒng)，這種基于信息理論的推薦系統(tǒng)糾偏方法呈現(xiàn)出幾大創(chuàng)新點：其一，基于信息論和反事實理論學(xué)習(xí)方法，無需執(zhí)行線上隨機(jī)流量試驗，節(jié)省了大量訓(xùn)練成本;其二，模型參數(shù)魯棒性較好，適合工業(yè)場景實際部署;其三，目標(biāo)函數(shù)具有很廣泛的適用范圍，領(lǐng)域內(nèi)絕大部分的模型均可以適用該目標(biāo)函數(shù)來進(jìn)行模型糾偏，而無需對現(xiàn)有模型結(jié)構(gòu)進(jìn)行修改，兼容性較強。

商業(yè)應(yīng)用無處不在推薦系統(tǒng)糾偏方法重拾內(nèi)容多樣性

放眼當(dāng)下，推薦系統(tǒng)的商業(yè)應(yīng)用無處不在，不少主流APP都應(yīng)用到了推薦系統(tǒng)。例如，旅游出行類中，攜程、去哪兒等會推薦機(jī)票、酒店等;外賣平臺類中，餓了么、美團(tuán)等會推薦飯店;電商購物類中，京東、淘寶、亞馬遜等會推薦“可能喜歡”的物品;新聞資訊類中，今日頭條、騰訊新聞等會推送用戶感興趣的新聞....幾乎所有APP或網(wǎng)站都在應(yīng)用推薦系統(tǒng)。

騰訊天衍實驗室作為騰訊布局醫(yī)療領(lǐng)域背后的技術(shù)提供者，主要專注于醫(yī)療健康領(lǐng)域的AI算法研究及落地，并且不斷研究與拓展AI醫(yī)療技術(shù)發(fā)展的邊界。目前，騰訊天衍實驗室主要將算法能力輸出到微信支付九宮格的騰訊健康小程序、QQ瀏覽器、微信搜一搜等。例如在疫情期間，天衍實驗室運用AI大數(shù)據(jù)技術(shù)，通過騰訊健康疫情問答推薦版塊，為用戶帶來關(guān)于疫情的多方面的內(nèi)容和咨詢服務(wù)，而不僅僅關(guān)注用戶個人和集體偏好，基于信息理論模型，快速進(jìn)行模型訓(xùn)練對推薦系統(tǒng)進(jìn)行糾偏，極大的節(jié)省了時間和經(jīng)濟(jì)成本。

同時，在騰訊覓影的AI導(dǎo)輔診平臺上，日常的醫(yī)療資訊推薦上也應(yīng)用了該方法為用戶推薦相關(guān)內(nèi)容，大大提升了推薦內(nèi)容的多樣性和公平性，同時也增強了用戶體驗。比如對于患有糖尿病的患者，其日常關(guān)注的內(nèi)容可能都與糖尿病相關(guān)，如果不對推薦系統(tǒng)進(jìn)行糾偏，系統(tǒng)會越來越傾向于推薦糖尿病相關(guān)內(nèi)容給到用戶，而經(jīng)過系統(tǒng)糾偏之后，還會給患者推薦一些運動、睡眠等其他健康知識，幫助用戶更加全面的了解自身健康。可以見得，推薦系統(tǒng)糾偏方法具有非常廣泛的應(yīng)用價值，未來，騰訊天衍實驗室還將繼續(xù)擴(kuò)大其應(yīng)用范圍，以期為用戶提供更優(yōu)質(zhì)的服務(wù)。

責(zé)任編輯：武曉燕來源： 51CTO

天衍實驗室系統(tǒng)推薦

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="aw3io"><p id="aw3io"></p></sub>