自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

京東搜索EE鏈路演進(jìn)

人工智能 算法
本文將從搜索EE近期的全量迭代出發(fā),展現(xiàn)其鏈路演進(jìn)的整體脈絡(luò),包含:EE自適應(yīng)動態(tài)探測模型——EE場景建模方式升級——打分與穿插兩階段一致性升級——探測與自然流量全局聯(lián)動優(yōu)化四個階段,梳理對搜索EE的思考與下一步迭代方向。

搜索系統(tǒng)中容易存在頭部效應(yīng),中長尾的優(yōu)質(zhì)商品較難獲得充分的展示機會,如何破除系統(tǒng)的馬太效應(yīng),提升展示結(jié)果的豐富性與多樣性,助力中長尾商品成長是電商平臺搜索系統(tǒng)的一個重要課題。其中,搜索EE系統(tǒng)在保持排序結(jié)果基本穩(wěn)定的基礎(chǔ)上,通過將優(yōu)質(zhì)中長尾商品穿插至排序結(jié)果中將優(yōu)質(zhì)商品動態(tài)展示給用戶,提升用戶體驗與搜索結(jié)果豐富性,是破除馬太效應(yīng)的一大助力。

本文將從搜索EE近期的全量迭代出發(fā),展現(xiàn)其鏈路演進(jìn)的整體脈絡(luò),包含:EE自適應(yīng)動態(tài)探測模型——EE場景建模方式升級——打分與穿插兩階段一致性升級——探測與自然流量全局聯(lián)動優(yōu)化四個階段,梳理對搜索EE的思考與下一步迭代方向。

一、EE自適應(yīng)動態(tài)探測模型

傳統(tǒng)EE模型從商品曝光置信度、打分置信度等角度出發(fā),決策EE商品的展示位置以及穿插位置,較少從用戶瀏覽意圖與探索意愿的差異化角度,來考量探測力度。其可能導(dǎo)致用戶在寬泛瀏覽與挑選商品時,缺少豐富的商品選擇,在決策購買時反而穿插了探索商品的誤判情景,影響用戶的搜索體驗,不能充分發(fā)揮搜索EE系統(tǒng)的探索和利用(Explore & Exploit)兩大能力。

針對以上探測錯配情況,可嘗試在EE模型中顯式建模用戶的“逛”、“買”探索偏好,進(jìn)一步結(jié)合偏好,自適應(yīng)調(diào)整搜索EE的利用與探索力度。對于偏“逛”用戶增強EE探索力度,提供更豐富的探索展示;對于購買意愿明顯的用戶,提供更直接的購買選擇。通過對用戶探索偏好的顯式建模,能夠在提升用戶的轉(zhuǎn)化效率的同時提升搜索結(jié)果豐富性。

1、自適應(yīng)探索模型優(yōu)化

相較于原有EE模型,自適應(yīng)探索對EE模型的自適應(yīng)探索能力進(jìn)行了升級,主要體現(xiàn)在如下三點:(1)對用戶探索偏好進(jìn)行差異化建模:"逛" "買"用戶提供動態(tài)差異化探測力度,在轉(zhuǎn)化效率和搜索豐富性中取得平衡。(2)以用戶瀏覽深度為子任務(wù)建模到EE模型中:以瀏覽深度作為用戶意愿的重要指標(biāo),并建模到EE模型中,顯式增強模型對用戶瀏覽意愿的感知。(3)提升模型對探索性特征利用性:對探索偏好的顯式建模,提升探索性特征在模型中的學(xué)習(xí)權(quán)重,在EE過程中對探索特征進(jìn)行充分利用。

2、方案實踐

為了增強EE模型的自適應(yīng)探索能力,針對原有EE模型進(jìn)行如下升級:

(1)探索偏好網(wǎng)絡(luò)Explore-Net

在保持原有的EE模型主網(wǎng)絡(luò)Exploit-Net基礎(chǔ)上,添加了探索偏好網(wǎng)絡(luò)Explore-Net(圖中左下綠色部分),提升模型對用戶探索意圖的差異化建模。

①輸入特征優(yōu)化

考慮到用戶的探索意圖只與個人特性、搜索詞相關(guān),因此Explore-Net的輸入特征僅使用用戶側(cè)、Query側(cè)中相關(guān)特征。

為進(jìn)一步度量特征與探索偏好的關(guān)聯(lián)性,統(tǒng)計不同瀏覽深度下各特征的分布差異,剔除了未與瀏覽深度明顯相關(guān)特征,如搜索詞長度等,精簡特征空間提升預(yù)估精度。

②模型顯性建模

EE原模型的輸入中包含探索性特征,但在進(jìn)行搜索排序任務(wù)中易被其他特征掩蓋導(dǎo)致利用率不強,在探索偏好建模中顯式構(gòu)建了探索偏好網(wǎng)絡(luò)Explore-Net,對用戶探索意圖進(jìn)行獨立建模構(gòu)建,增強探索性特征的重要性。

優(yōu)化后的EE模型具有Exploit-Net與Explore-Net雙塔結(jié)構(gòu),Exploit-Net對商品進(jìn)行精準(zhǔn)化打分,對候選商品進(jìn)行充分利用;Explore-Net對用戶探索意愿進(jìn)行建模,根據(jù)用戶偏好動態(tài)調(diào)整探索力度,共同構(gòu)成商品探索與利用的完整機制。

(2)用戶瀏覽深度回歸任務(wù)構(gòu)建

在原有的訓(xùn)練過程基礎(chǔ)上,添加了用戶瀏覽深度回歸任務(wù)(圖中左上紅色部分),提升模型對用戶瀏覽意愿的感知性,增強EE模型的自適應(yīng)探索能力。

①輔助任務(wù)選擇

瀏覽深度作為用戶瀏覽意愿的直觀體現(xiàn),表現(xiàn)了用戶的探索意愿,因此使用瀏覽深度預(yù)估任務(wù)作為模型訓(xùn)練的輔助任務(wù),對用戶偏好進(jìn)行顯式建模。

在輔助任務(wù)類型的考量上,綜合考慮了將瀏覽深度劃分不同區(qū)間進(jìn)行預(yù)測的分類任務(wù),以及對瀏覽深度的回歸任務(wù)。在實驗中分類任務(wù)體現(xiàn)出較為明顯的頭尾傾向性,輸出值分布不均勻,實踐中最終選用了回歸任務(wù)作為輔助任務(wù)。

②回歸任務(wù)設(shè)計

在樣本數(shù)據(jù)分析中,發(fā)現(xiàn)用戶的瀏覽深度差異化極大。為了平衡瀏覽深度的差異,保障模型輸出值的均勻性與差異性,對瀏覽深度標(biāo)簽進(jìn)行了log平滑放縮,并選用RMSE-loss作為輔助任務(wù)的損失函數(shù)對瀏覽深度任務(wù)進(jìn)行構(gòu)建。

在模型訓(xùn)練中頭尾樣本相對較少,對過淺和過深的兩類樣本預(yù)測準(zhǔn)確性偏低。為平衡樣本間差異,在損失函數(shù)的樣本權(quán)重設(shè)計中,對由淺到深相應(yīng)樣本,其權(quán)重為先減小后增大的 “凹形”權(quán)重,平衡頭尾和腰部樣本的準(zhǔn)確性。

(3)Explore-Net與主網(wǎng)絡(luò)的二次融合

Explore-Net 和 Exploit-Net 進(jìn)行了融合(圖中中上紅色部分),增強模型整體對探索性特征的利用,提升EE隱層embedding豐富性,對探索偏好較強的用戶提升了不確定性打分,提升探索商品的范圍和豐富度。

圖片

①特征融合

由于在用戶瀏覽深度回歸任務(wù)上對用戶的探索偏好進(jìn)行了顯式建模,Explore-Net的輸出embedding對探索性特征進(jìn)行了高維抽取,能夠?qū)τ脩羝眠M(jìn)行自適應(yīng)建模。

為讓探索偏好特征更好地參與到整體任務(wù)訓(xùn)練中,平衡打分的精準(zhǔn)性與差異化,將Explore-Net的深層表征與Exploit-Net的深層表征進(jìn)行拼接融合,提升EE模型隱層embedding的豐富性和表征能力,提升模型打分能力。

②不確定性預(yù)估融合

用戶的探索偏好與商品的不確定性預(yù)估有直接的相關(guān)關(guān)聯(lián)。對于探索意圖較強的用戶,提升商品打分的不確定性,助力更豐富的商品穿插到搜索結(jié)果中,反之亦如此。因此在不確定性預(yù)估模塊中,設(shè)計在探索表征層面進(jìn)行融合。

在不確定性預(yù)估(SVGP)模塊中,將瀏覽深度回歸網(wǎng)絡(luò)輸出值與方差預(yù)估部分進(jìn)行了二次融合,對于探索偏好較強的用戶,顯式強化了商品不確定性打分,提升探索力度。

3、升級效果

(1)探索利用效果分析

①EE模型打分結(jié)果分析:

在相同的預(yù)測集上,統(tǒng)計了平均打分探測力度隨瀏覽深度變化情況

結(jié)論:相比原模型,自適應(yīng)探索模型的平均探測力度,隨瀏覽深度增大而逐漸增大,體現(xiàn)出session維度的顯著差異化。

②EE實驗位下穿插商品位置分析:

在各實驗位下,統(tǒng)計平均插入位置與瀏覽深度的變化情況。

圖片

結(jié)論:Test桶結(jié)果,隨著瀏覽深度增大,商品的平均插入位置相比原模型有所前移,探索力度增強。

核心結(jié)論:通過以上對探索利用的效果分析,自適應(yīng)探索模型符合設(shè)計預(yù)期,在瀏覽深度較低的session下插入商品較少,探索力度較弱;在瀏覽深度較深的session下,EE模型的探索意愿更強,模型探索力度更大,穿插商品位置有所前移。

(2)線上效果

保持搜索效率持平的情況下,EE核心指標(biāo)提升明顯并全量上線,流動性、探索成功率提升近 0.5%。

商品建模方式思考:

差異化建模用戶探索意圖后,EE模塊實現(xiàn)了對不同用戶自適應(yīng)調(diào)整探索并取得了一定收益。用戶側(cè)建模方式優(yōu)化后,對商品側(cè)建模方式進(jìn)行升級改造,將是進(jìn)一步提升EE探測模型的合理切入點。

二、EE場景建模方式升級

原主網(wǎng)絡(luò)建模方式為點擊率單任務(wù),點擊作為轉(zhuǎn)化的前置行為,建模點擊行為實現(xiàn)對潛力中長尾的探索助力。同時在實踐中,通過樣本label進(jìn)行動態(tài)權(quán)重調(diào)整,隱式建模轉(zhuǎn)化屬性,兼顧轉(zhuǎn)化效率。

僅建模點擊對高轉(zhuǎn)化屬性商品并不友好,同時是對標(biāo)題黨行為的潛在鼓勵,和EE模塊優(yōu)化整體生態(tài)環(huán)境、打造搜索長期價值的初衷有所偏差。因此升級思路不再局限于僅關(guān)注曝光后獲得點擊這一前置鏈路行為,而是對整體轉(zhuǎn)化鏈路進(jìn)行建模,關(guān)注商品的多維度屬性。

1、EE場景建模方式優(yōu)化

在原有基礎(chǔ)上引入轉(zhuǎn)化行為的顯式建模任務(wù),將主網(wǎng)絡(luò)結(jié)構(gòu)從點擊單任務(wù)升級為點擊轉(zhuǎn)化多任務(wù),以多任務(wù)方式增強不同行為的建模質(zhì)量,實現(xiàn)對商品的更全面、更準(zhǔn)確建模。

2、方案實踐

在EE自適應(yīng)探索機制基礎(chǔ)上,EE場景建模方式升級對原有模型進(jìn)行了如下優(yōu)化與升級:

(1)SVGP模塊交互方案設(shè)計

原模型中主網(wǎng)絡(luò)和輔助模塊在SVGP模塊中交互,新版方案中輔助任務(wù)是否需要與SVGP模塊進(jìn)行交互? 即隨機高斯過程是否需要同樣作用于建模轉(zhuǎn)化任務(wù),是方案設(shè)計首要考慮的問題。

具體實驗中,發(fā)現(xiàn)SVGP會導(dǎo)致收斂后AUC指標(biāo)在千分位級別降低,即其在引入不確定性功能的同時,會輕微降低模型效果。考慮到目前SVGP模塊已帶來所需的探索能力,難以通過多SVGP堆疊方式帶來收益。因此升級方案選擇將輔助任務(wù)構(gòu)建成純凈任務(wù),其僅建模商品屬性而不構(gòu)建對應(yīng)的SVGP模塊。

(2)多任務(wù)網(wǎng)絡(luò)框架實現(xiàn)

EE探測線上耗時較低,建模方式升級后需延續(xù)這一目標(biāo)。雖然主流多任務(wù)結(jié)構(gòu)MMOE性能更為優(yōu)越,但線上耗時將有增加風(fēng)險,因此選擇更輕量級的share bottom方式,在基本不增加線上耗時的情況下完成多任務(wù)建模。升級方案把多任務(wù)被設(shè)計為雙任務(wù)模型,使用低層網(wǎng)絡(luò)進(jìn)行表征抽取,在高層維度使用兩個tower分別建模主任務(wù)和輔助任務(wù)。

①任務(wù)組合選取

選擇雙任務(wù)為ctr任務(wù)+ctcvr任務(wù),考慮到點擊樣本比訂單樣本更豐富, ctr正樣本更多,對于需要大量引導(dǎo)點的SVGP模塊更為友好。同時點擊相對購買行為的不確定性更高,在點擊預(yù)測上引入不確定性打分更為合理,因此將ctr作為主任務(wù)、ctcvr為輔助任務(wù)進(jìn)行配置。

②模型結(jié)構(gòu)迭代

前述迭代過程中模型結(jié)構(gòu)如圖中間所示,低層網(wǎng)絡(luò)編碼輸入信息后使用兩個淺層tower分別學(xué)習(xí)不同任務(wù), 該結(jié)構(gòu)潛在缺點為一方面可能導(dǎo)致低層網(wǎng)絡(luò)梯度被某個任務(wù)主導(dǎo)(例如ctr任務(wù)),另一方面上層tower過淺可能導(dǎo)致任務(wù)學(xué)習(xí)不夠充分。

進(jìn)一步探索僅共享特征、增加任務(wù)tower深度的網(wǎng)絡(luò)結(jié)構(gòu)。在多任務(wù)分?jǐn)?shù)融合方式相同的情況下,新結(jié)構(gòu)線上表現(xiàn)更佳,因此最終結(jié)構(gòu)如上圖最右所示,使用較深的tower head建模各自任務(wù),彼此間僅共享特征。

③融合方式迭代

上述模型在離線指標(biāo)上取得了不錯的收益且線上表現(xiàn)更優(yōu),但遇到了大盤效率和EE相關(guān)指標(biāo)無法同時提升的問題。分析梳理現(xiàn)有方案實驗后,認(rèn)為目前多任務(wù)融合方式相對樸素、存在改善提升空間。

選取帶權(quán)相加、直接相乘和冪次指數(shù)相乘三種方式。由于缺乏合適的理論量化分析工具,因此選擇從實驗結(jié)果出發(fā)選取最優(yōu)融合方式和融合系數(shù),為此開發(fā)了離線融合尋參模塊,將predict時各head打分結(jié)果保存后,通過網(wǎng)格搜索方式選取最優(yōu)參數(shù)。

通過在多組數(shù)據(jù)上遍歷尋優(yōu)確定不同融合方式的最優(yōu)系數(shù),并基于此開展線上實驗選取表現(xiàn)最優(yōu)方式,最終我們選取帶權(quán)相加方式,在EE指標(biāo)提升的同時保持大盤效率指標(biāo)持平。

3、升級效果

(1)模型建模升級效果分析

①EE模型打分區(qū)分度分析:

在相同的預(yù)測集上,統(tǒng)計了離線打分分布情況

結(jié)論:分布由橙色線條(原版)變?yōu)樗{(lán)色線條(升級后版本),整體更加平緩,保證不同商品彼此更具備區(qū)分度。

②EE探測次數(shù)分析:

統(tǒng)計線上打分分布情況,對線上探測情況進(jìn)行分析

結(jié)論:橫軸為曝光數(shù)量大于等于N,縱軸為distinct sku數(shù)量,下圖表明模型升級后在僅探索一次的dst sku數(shù)量上有所下降,減少偏隨機的一次性探測,但在多次探索商品上有所提升,表明test更傾向于探索中腰部商品。

(2)線上效果

搜索效率持平情況下,流動性指標(biāo)、探索成功率提升顯著并全量上線。

鏈路一致性思考:

完成EE打分模型優(yōu)化后,能夠一定程度實現(xiàn)探索力度隨用戶探索意愿的動態(tài)調(diào)整。但從整體EE鏈路上看 (候選集生成 → EE打分 → 動態(tài)展示),EE動態(tài)穿插決策與打分階段相互獨立,其結(jié)果由一個xgb回歸模型決定,兩個階段的聯(lián)動關(guān)系和一致性程度弱。如何跟隨用戶瀏覽意愿,將 EE打分→ 動態(tài)展示 兩個環(huán)節(jié)能夠同步、一致性地調(diào)整,是進(jìn)一步的優(yōu)化方向。

三、打分與穿插端到端一致性升級

打分與穿插展示兩個階段一致性未能對齊,可能導(dǎo)致激進(jìn)的模型打分無法匹配上豐富的穿插展示,無法同步放大EE的探測效果。此外,兩個階段分別由兩個模型獨立控制,也增加了維護(hù)和迭代成本。

面對此一致性問題,升級了端到端打分與穿插方案。EE模型中建模的用戶瀏覽意圖,不僅影響EE探測的力度大小,也同時決定動態(tài)穿插展示的策略強弱。兩階段的決策過程端到端實現(xiàn),將流量進(jìn)行更合理分配,寬泛意圖的用戶能夠達(dá)到探測更激進(jìn)、穿插更多的共振。

1、端到端動態(tài)穿插機制優(yōu)化點

端到端動態(tài)穿插機制在原有自適應(yīng)探索基礎(chǔ)上,升級點主要體現(xiàn)在如下三點:

(1)瀏覽深度預(yù)估精準(zhǔn)度升級:在EE探索偏好建模網(wǎng)絡(luò)Explore-net基礎(chǔ)上,提升瀏覽深度預(yù)測精準(zhǔn)度。

(2)EE流量精準(zhǔn)化分配:根據(jù)session瀏覽深度分布,動態(tài)分配各深度下穿插商品量,提升EE穿插商品占比調(diào)控可操作性。

(3)模型打分與動態(tài)穿插數(shù)量端到端一致性增強:采用EE主模型的瀏覽深度,映射得到當(dāng)前session下穿插商品數(shù)量,端到端解決EE穿插商品數(shù)量與EE商品打分兩個任務(wù),提升兩階段一致性。

2、方案實踐

圖片

在EE自適應(yīng)探索機制基礎(chǔ)上,端到端動態(tài)穿插機制對原有動態(tài)穿插機制進(jìn)行了如下優(yōu)化與升級:

(1)動態(tài)穿插機制端到端建模

①瀏覽深度預(yù)估任務(wù)優(yōu)化

瀏覽深度代表了用戶在session下的瀏覽意愿,是EE流量進(jìn)行合理分配的基礎(chǔ)性指標(biāo)。在不同瀏覽深度的session下,匹配適合數(shù)量的EE商品能在保障效率的前提下提升搜索結(jié)果豐富性。

進(jìn)一步優(yōu)化了自適應(yīng)探索模型中Explore-Net對瀏覽深度預(yù)估子任務(wù)的準(zhǔn)確性,對其輸出的瀏覽深度預(yù)估值進(jìn)行評估,其準(zhǔn)度明顯高于原有xgb模型,可以對原有xgb模型進(jìn)行替換。

②端到端建模瀏覽深度與模型打分

自適應(yīng)探索實驗中使用Explore-Net對模型打分進(jìn)行差異化探索,其中的瀏覽深度預(yù)估任務(wù)可以沿用到穿插商品數(shù)量任務(wù)中,使模型具有端到端建模兩個子任務(wù)的能力。

(2)合理設(shè)計瀏覽深度與穿插商品數(shù)量映射

在準(zhǔn)確預(yù)估瀏覽深度的情況下,通過將瀏覽深度預(yù)估值映射到穿插數(shù)量中,保障穿插數(shù)量與模型打分一致性,在更深的session下有更多的商品穿插數(shù)量和更強的探測力度。

3、升級效果

(1)動態(tài)穿插效果分析

①瀏覽深度預(yù)測準(zhǔn)度分析:

對比兩模型的瀏覽深度預(yù)估準(zhǔn)確性,使用均方根對數(shù)誤差(Root Mean Squared Logarithmic Error, RMSLE)指標(biāo)進(jìn)行衡量

指標(biāo)

XGB模型

Explore-net網(wǎng)絡(luò)

RMSLE

0.2053

0.0903

結(jié)論:在同樣的驗證集下,Explore-net模型的預(yù)估精度明顯優(yōu)于原模型。

②探索打分、動態(tài)穿插一致性效果分析:

檢查各瀏覽深度下base與test兩個機制下各瀏覽深度下預(yù)設(shè)的插入商品曲線和穿插商品數(shù)量分布圖。

圖片

結(jié)論:

  • 比較藍(lán)色(test)與黃色(base)兩根實線,在較淺的session下,新舊機制穿插商品數(shù)量基本持平;在較深的session下,新機制相較于舊機制插入商品數(shù)量更多,體現(xiàn)了探索較強時新的穿插機制會探索更多商品。
  • 通過藍(lán)色實線與虛線,黃色實線與虛線兩組曲線對比,新穿插機制下預(yù)期插入數(shù)量曲線與實際插入數(shù)量曲線更貼合,說明穿插數(shù)量設(shè)定更為合理,新的穿插機制與商品打分一致性更強。

(2)線上效果

搜索效率持平情況下,EE核心指標(biāo)有一定提升并全量上線。

流量整體聯(lián)動優(yōu)化思考:

在對EE流量進(jìn)行整體優(yōu)化后,商品探索力度與EE流量分配能夠隨用戶瀏覽意愿進(jìn)行自適應(yīng)調(diào)整,但從全局商品展示結(jié)果中看,EE探測流量與自然流量相互獨立,兩者之間并未建立充分的聯(lián)動與結(jié)合。

將視角逐漸放寬到整個排序鏈路,如何做好EE流量與自然流量的聯(lián)動,發(fā)揮EE在搜索排序鏈路后置位的優(yōu)勢充分補充與優(yōu)化自然流量是下一個關(guān)心的問題。

四、感知上下文的品牌店鋪維度探測

在搜索鏈路中,EE處于相對后置的位置,然而原EE系統(tǒng)未充分利用這一感知優(yōu)勢,對前序排序結(jié)果感知能力較弱。在一些強勢品牌、店鋪主導(dǎo)的關(guān)鍵詞下,存在頭部品牌、店鋪扎堆現(xiàn)象,優(yōu)質(zhì)新品、中長尾商品無法露出,馬太效應(yīng)明顯。

對此問題,嘗試跳出僅考慮商品維度探測的局限,從更高的品牌、店鋪維度視角,對排序結(jié)果進(jìn)行全局性聯(lián)動優(yōu)化,建立感知上下文的多維度探測能力。其設(shè)計旨在增強對上下文排序結(jié)果的感知能力,并在自然流量中對商品分布進(jìn)行聯(lián)動優(yōu)化,系統(tǒng)性緩解排序鏈路的馬太效應(yīng)。

1、感知上下文的多維度探測機制優(yōu)化點

感知上下文的多維度探測機制在原有EE探測能力基礎(chǔ)上,進(jìn)行了如下三個方面的優(yōu)化:

(1)新增EE探測系統(tǒng)對上下文感知能力:對EE前的排序上下文結(jié)果進(jìn)行充分的感知,對自然流量下原有搜索排序結(jié)果進(jìn)行自適應(yīng)的穿插優(yōu)化。

(2)實現(xiàn)EE探測維度的擴展:除了現(xiàn)有支持的商品粒度探測,從更宏觀的品牌、店鋪等維度視角對排序生態(tài)進(jìn)行優(yōu)化。

(3)EE流量與自然流量聯(lián)動全局性優(yōu)化:緩解部分詞下頭部品牌和店鋪扎堆現(xiàn)象,提升排序多樣性,避免對頭部品牌、店鋪商品進(jìn)行更多探測、加劇馬太效應(yīng)。

2、方案實踐

本次升級在原有的搜索EE穿插機制下進(jìn)行了如下能力的增強與優(yōu)化:

(1)新增上下文感知能力

在原有搜索EE穿插機制基礎(chǔ)上,新增加上下文感知能力,對搜索詞屬性和上下文排序結(jié)果的商品分布進(jìn)行計算,指導(dǎo)后續(xù)的穿插過程

①感知query詞屬性

為保障搜索排序結(jié)果合理性,避免產(chǎn)生體驗性問題,感知上下文能力將判斷query詞是否是品牌詞(如:華為)或型號詞(如:iphone),決定是否開啟品牌維度探測;判斷query詞是否是精準(zhǔn)店鋪詞,決定是否開啟店鋪維度探測。

②排序結(jié)果商品分布

新增上下文排序結(jié)果感知能力,通過統(tǒng)計上鏈路搜索結(jié)果排名前k的商品中的品牌和店鋪的分布情況,判斷是否存在品牌或店鋪的集中現(xiàn)象,進(jìn)而決定是否開啟多維度探測能力。

(2)優(yōu)化原有穿插機制

在感知能力作為多維度探測啟動開關(guān)基礎(chǔ)上,優(yōu)化了原有的穿插機制,通過EE展示效果與自然流量結(jié)果聯(lián)動提升搜索結(jié)果豐富性與多樣性,對搜索結(jié)果進(jìn)行直接高效的影響。

①由感知能力模塊判斷用戶搜索意圖和商品分布,決定是否進(jìn)行多維度探測

對用戶搜索意圖直接的搜索詞動態(tài)開啟多維度探測功能,如query為品牌詞或型號詞則不應(yīng)進(jìn)行品牌維度探測,如query為店鋪詞則不進(jìn)行店鋪維度探測,避免影響搜索結(jié)果的準(zhǔn)確性??剂克阉鹘Y(jié)果的前k個商品的品牌/店鋪分布,判斷是否存在頭部品牌/店鋪扎堆的問題,當(dāng)同一品牌/店鋪下商品占比超過p%后,不再插入該類型EE商品。

②穿插結(jié)果優(yōu)化

如不再插入該類型EE商品,在候選商品中剔除該類型,其余商品按照EE打分結(jié)果插入到排序結(jié)果中,不影響EE穿插過程與穿插數(shù)量,保障EE穿插位置和展現(xiàn)效果合理性。

3、升級效果

(1)多維度探測效果分析

①EE穿插曝光占比分析:

在EE穿插過程中,由于部分EE模型打分較高的頭部品牌/店鋪的商品在EE候選商品中被剔除,剩余商品模型打分稍低導(dǎo)致穿插位置發(fā)生后移或無法穿插進(jìn)排序結(jié)果中,為了避免EE穿插曝光占比降低,提升了各瀏覽深度下EE穿插商品的配額。實驗期間EE曝光占比base與test基本持平。

②多維度探測體驗分析:

下面對比了多款熱詞下EE穿插商品情況。

Query

現(xiàn)狀

Base穿插效果

Test穿插效果

燃?xì)鉄崴?/span>

燃?xì)鉄崴麝P(guān)鍵詞下,前30個商品中美的占13個,海爾9個,其余品牌露出少。

base EE機制穿插入5個商品,其中美的3個,萬和、蘇泊爾各一個,加劇頭部集中問題。

test EE機制穿插入6個商品,其中蘇泊爾2個,萬和、京東京造、奧克斯、阿詩丹頓各一個,搜索結(jié)果多樣性改善明顯。

洗碗機

洗碗機關(guān)鍵詞下,前30個商品中美的占15個,其余品牌露出少。

base EE機制穿插入5個商品,均為美的產(chǎn)品,加劇頭部集中問題。

test EE機制穿插入6個商品,其中華帝、小米各2個,科勒、HYUNDAI各一個,搜索結(jié)果多樣性改善明顯。

結(jié)論:在多組query詞下,test機制相較于base機制在穿插的過程中減少了頭部品牌/店鋪的插入,增強了展示結(jié)果的豐富性,緩解馬太效應(yīng);同時注意到test機制由于部分頭部品牌/店鋪商品被濾除,穿插位置相對有所后移,在排序靠后的位置受配額影響多插入1-2個商品,整體曝光量與base基本一致,與分析一的結(jié)論一致。

(2)線上效果

在保持搜索效率持平的情況下,多樣性指標(biāo)大幅提升并全量上線。

五、總結(jié)與展望

本文重點闡述了在搜索EE機制迭代過程中的思考與演進(jìn)歷程,搜索EE作為優(yōu)化搜索生態(tài)與緩解搜索馬太效應(yīng)的重要工具,在演進(jìn)過程中也圍繞搜索結(jié)果豐富性和體驗性進(jìn)行了系統(tǒng)性優(yōu)化。

在優(yōu)化思路上,不斷尋找EE系統(tǒng)的瓶頸問題,在自適應(yīng)探索機制和建模方式升級提供差異化商品探索力度;將商品打分與穿插商品個數(shù)進(jìn)行聯(lián)動,端到端優(yōu)化EE流量分配問題;之后將視野擴展到全局流量,通過多維度探索機制聯(lián)動自然流量,使EE流量作為自然流量的互相補充。整體思路體現(xiàn)出從商品間探索打分優(yōu)化——EE流量個性化分配——與自然流量全局優(yōu)化的迭代進(jìn)程。

搜索EE后續(xù)還將面臨更多的問題和挑戰(zhàn),后續(xù)會繼續(xù)沿用這樣的迭代思路在更多方面進(jìn)行探索與深入:

  • 擴展EE模型的訓(xùn)練樣本空間,優(yōu)化現(xiàn)有任務(wù)建模方案。
  • 搜索EE向更廣鏈路輻射,打造全鏈路EE探索能力。
  • EE覆蓋更廣商品建模,打造更完善的中長尾商品泛化表征。
責(zé)任編輯:姜華 來源: DataFunTalk
相關(guān)推薦

2022-06-24 14:42:52

京東搜索

2023-05-08 07:19:07

2019-08-30 12:30:25

京東到家訂單查詢數(shù)據(jù)存儲

2022-05-23 08:23:24

鏈路追蹤SleuthSpring

2015-12-09 15:16:03

架構(gòu)師京東架構(gòu)

2018-12-20 06:04:02

京東到家訂單中心Elasticsear

2016-11-09 18:07:00

京東

2014-09-10 09:49:49

OSPF

2014-07-23 15:35:41

鏈路狀態(tài)

2023-05-30 07:58:01

谷歌搜索算法

2022-09-14 09:21:41

監(jiān)控系統(tǒng)

2023-01-30 22:34:44

Node.js前端

2011-04-01 11:32:09

OSPF

2014-06-03 17:29:48

PPP路由器

2010-09-06 12:50:09

PPP鏈路

2010-05-10 17:00:38

鏈路負(fù)載均衡

2025-03-11 14:16:09

2009-03-23 09:27:00

光纖布線鏈路

2022-05-25 08:23:32

ZipKinTwitter開源項目

2010-09-06 13:57:38

點贊
收藏

51CTO技術(shù)棧公眾號