自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<legend id="qt1mi"><abbr id="qt1mi"><dfn id="qt1mi"></dfn></abbr></legend>

<em id="qt1mi"></em>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比

發(fā)布于 2024-9-25 12:27

瀏覽

0收藏

在CTR預(yù)估中，主流都采用特征embedding+MLP的方式，其中特征非常關(guān)鍵。然而對于相同的特征，在不同的樣本中，表征是相同的，這種方式輸入到下游模型，會限制模型的表達(dá)能力。

為了解決這個問題，CTR預(yù)估領(lǐng)域提出了一系列相關(guān)工作，被稱為特征增強(qiáng)模塊。特征增強(qiáng)模塊根據(jù)不同的樣本，對embedding層的輸出結(jié)果進(jìn)行一次矯正，以適應(yīng)不同樣本的特征表示，提升模型的表達(dá)能力。

最近，復(fù)旦大學(xué)和微軟亞研院聯(lián)合發(fā)布了一篇特征增強(qiáng)工作的總結(jié)，對比了不同特征增強(qiáng)模塊實現(xiàn)方法的效果。下面給大家介紹一下幾種特征增強(qiáng)模塊的實現(xiàn)方法，以及本文進(jìn)行的相關(guān)對比實驗。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

論文標(biāo)題：A Comprehensive Summarization and Evaluation of Feature Refinement Modules for CTR Prediction

下載地址：https://arxiv.org/pdf/2311.04625v1.pdf

1.特征增強(qiáng)建模思路

特征增強(qiáng)模塊，旨在提升CTR預(yù)估模型中Embedding層的表達(dá)能力，實現(xiàn)相同特征在不同樣本下的表征差異化。特征增強(qiáng)模塊可以用下面這個統(tǒng)一公式表達(dá)，輸入原始的Embedding，經(jīng)過一個函數(shù)后，生成這個樣本個性化的Embedding。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

這類方法的大致思路為，在得到初始的每個特征的embedding后，使用樣本本身的表征，對特征embedding做一個變換，得到當(dāng)前樣本的個性化embedding。下面給大家介紹一些經(jīng)典的特征增強(qiáng)模塊建模方法。

2.特征增強(qiáng)經(jīng)典方法

An Input-aware Factorization Machine for Sparse Prediction（IJCAI 2019）這篇文章在embedding層之后增加了一個reweight層，將樣本初始embedding輸入到一個MLP中得到一個表征樣本的向量，使用softmax進(jìn)行歸一化。Softmax后的每個元素對應(yīng)一個特征，代表這個特征的重要程度，使用這個softmax結(jié)果和每個對應(yīng)特征的初始embedding相乘，實現(xiàn)樣本粒度的特征embedding加權(quán)。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction（RecSys 2019）也是類似的思路，為每個樣本學(xué)習(xí)一個特征的個性化權(quán)重。整個過程分為squeeze、extraction、reweight三個步驟。在squeeze中，將每個特征embedding通過pooling得到一個其對應(yīng)的統(tǒng)計標(biāo)量。在extraction中，將這些標(biāo)量輸入到MLP中，得到每個特征的權(quán)重。最后，使用這個權(quán)重和每個特征embedding向量相乘，得到加權(quán)后的embedding結(jié)果，相當(dāng)于在樣本粒度做一個特征重要性篩選。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

A Dual Input-aware Factorization Machine for CTR Prediction（IJCAI 2020）和上一篇文章類似，也是利用self-attention對特征進(jìn)行一層增強(qiáng)。整體分為vector-wise和bit-wise兩個模塊。Vector-wise將每個特征的embedding當(dāng)成序列中的一個元素，輸入到Transformer中得到融合后的特征表示；bit-wise部分使用多層MLP對原始特征進(jìn)行映射。兩部分的輸入結(jié)果相加后，得到每個特征元素的權(quán)重，乘到對應(yīng)的原始特征的每一位上，得到增強(qiáng)后的特征。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

GateNet: Gating-Enhanced Deep Network for Click-Through Rate Prediction（2020）利用每個特征的初始embedding過一個MLP和sigmoid函數(shù)生成其獨(dú)立的特征權(quán)重分，同時也使用MLP對所有特征進(jìn)行映射生成bit-wise的權(quán)重分，兩者融合對輸入特征進(jìn)行加權(quán)。除了特征層外，在MLP的隱層，也利用類似的方法，對每個隱層的輸入進(jìn)行加權(quán)。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

Interpretable Click-Through Rate Prediction through Hierarchical Attention（WSDM 2020）也是利用self-attention實現(xiàn)特征的轉(zhuǎn)換，但是增加了高階特征的生成。這里面使用層次self-attention，每一層的self-attention以上一層sefl-attention的輸出作為輸入，每一層增加了一階高階特征組合，實現(xiàn)層次多階特征提取。具體來說，每一層進(jìn)行self-attention后，將生成的新特征矩陣經(jīng)過softmax得到每個特征的權(quán)重，根據(jù)權(quán)重對原始特征加權(quán)新的特征，再和原始特征進(jìn)行一次點積，實現(xiàn)增加一階的特征交叉。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

ContextNet: A Click-Through Rate Prediction Framework Using Contextual information to Refine Feature Embedding（2021）也是類似的做法，使用一個MLP將所有特征映射成一個每個特征embedding尺寸的維度，對原始特征做一個縮放，文中針對每個特征使用了個性化的MLP參數(shù)。通過這種方式，利用樣本中的其他特征作為上下位增強(qiáng)每個特征。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

Enhancing CTR Prediction with Context-Aware Feature Representation Learning（SIGIR 2022）采用了self-attention進(jìn)行特征增強(qiáng)，對于一組輸入特征，每個特征對于其他特征的影響程度是不同的，通過self-attention，對每個特征的embedding進(jìn)行一次self-attention，實現(xiàn)樣本內(nèi)特征間的信息交互。除了特征間的交互，文中也利用MLP進(jìn)行bit級別的信息交互。上述生成的新embedding，會通過一個gate網(wǎng)絡(luò)，和原始的embedding進(jìn)行融合，得到最終refine后的特征表示。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

3.實驗效果

文中進(jìn)行了各類特征增強(qiáng)方法的效果對比，整體結(jié)論為，在眾多特征增強(qiáng)模塊中，GFRL、FRNet-V、FRNetB 表現(xiàn)的最好，并且效果要優(yōu)于其他的特征增強(qiáng)方法。

一文總結(jié)特征增強(qiáng)&個性化在CTR預(yù)估中的經(jīng)典方法和效果對比-AI.x社區(qū)

本文轉(zhuǎn)載自??圓圓的算法筆記??，作者： Fareise ????

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

?ICLR 2024 | UTS提出全新聯(lián)邦推薦算法：從全面個性化過渡到加性個性化

laokugonggao ? 3528瀏覽 ? 0回復(fù)
一文回顧常見圖像融合方法

angel ? 4689瀏覽 ? 0回復(fù)
一文匯總：時序預(yù)測中的多頻率建模方法

海因斯DK ? 3095瀏覽 ? 0回復(fù)
統(tǒng)一單ID和多ID個性化框架！阿里發(fā)布UniPortrait:質(zhì)量和多樣性超越現(xiàn)有方法

angel ? 2603瀏覽 ? 0回復(fù)
一文總結(jié)擴(kuò)散模型（Diffusion Model）在時間序列中的應(yīng)用

海因斯DK ? 9303瀏覽 ? 0回復(fù)
《自然》期刊發(fā)布最新科學(xué)報告：人工智能技術(shù)在個性化醫(yī)療中的創(chuàng)新與挑戰(zhàn)

xuxiangda ? 1.1w瀏覽 ? 0回復(fù)
一文梳理Transformer在時間序列預(yù)測中的發(fā)展歷程代表工作

海因斯DK ? 6581瀏覽 ? 0回復(fù)
突破個性化圖像生成局限！MagicTailor：組件可控個性化圖像生成創(chuàng)新框架！

angel ? 2565瀏覽 ? 0回復(fù)
一文讀懂LLMs的幻覺問題和對策

數(shù)字化助推器 ? 2288瀏覽 ? 0回復(fù)
賈佳亞團(tuán)隊新作MagicMirror：生成身份一致且高質(zhì)量個性化視頻，效果驚艷！

angel ? 2165瀏覽 ? 0回復(fù)
面向統(tǒng)一的單、多主體個性化文生圖框架！阿里通義發(fā)布AnyStory！

angel ? 1697瀏覽 ? 0回復(fù)
使用語義模型和場景感知NLP的個性化搜索優(yōu)化以改進(jìn)搜索結(jié)果

51CTO內(nèi)容精選 ? 2602瀏覽 ? 0回復(fù)
個性化大語言模型：PPlug——讓AI更懂你

AIGC前沿技術(shù)追蹤 ? 1736瀏覽 ? 0回復(fù)
一文搞懂 DeepSeek - 強(qiáng)化學(xué)習(xí)和蒸餾

玄姐聊AGI ? 2768瀏覽 ? 0回復(fù)
一文讀懂 RAG 中的 embedding model

鴻煊的學(xué)習(xí)筆記 ? 2370瀏覽 ? 0回復(fù)
探究PEPNet模型：多任務(wù)多領(lǐng)域推薦的個性化建模！

南夏的算法驛站 ? 1778瀏覽 ? 0回復(fù)
零階優(yōu)化的擴(kuò)散模型個性化方法；合成圖像檢測；舞蹈動作音樂同步生成

AI研究前瞻 ? 1130瀏覽 ? 0回復(fù)
FlashFace: 具有高保真身份保存的人像個性化方法，效果超越InstantID，人臉定制化更逼真了！

AIGCStudio ? 1078瀏覽 ? 0回復(fù)
一文讀懂其在AI評估中的現(xiàn)狀與挑戰(zhàn)

Halo咯咯 ? 733瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

ICLR'25 | 基于記憶網(wǎng)絡(luò)和混合Prototype的時間序列異常檢測方法 22h前發(fā)布
大模型系列：一文匯總16個深度語言模型代表工作 2025-04-08 01:03:28發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：時序預(yù)測中的多類型模型組合建模方案

下一篇：普林斯頓大學(xué)提出首個基于MoE的稀疏時序預(yù)測大模型，參數(shù)量擴(kuò)展到2.4billion

社區(qū)精華內(nèi)容

目錄

<style id="znfdw"></style>

<blockquote id="znfdw"><p id="znfdw"></p></blockquote>

<sup id="znfdw"></sup>