中科院深圳先進(jìn)院:全新知識增強圖神經(jīng)網(wǎng)絡(luò)實現(xiàn)可解釋性推薦
近年來,以大數(shù)據(jù)和深度學(xué)習(xí)為基礎(chǔ)的人工智能展示了卓越的計算能力和學(xué)習(xí)能力。但深度學(xué)習(xí)模型通常包含深度嵌套的非線性結(jié)構(gòu),很難確定具體哪些因素使它做出這樣的決定,缺乏決策的可解釋性和透明度。
與此同時,由于可解釋的建議不僅提高了推薦系統(tǒng)的透明度、可解釋性和可信度,而且還提高了用戶滿意度,可解釋性推薦任務(wù)受到越來越多研究人員的關(guān)注[1]。
而隨著深度學(xué)習(xí)方法和語言處理技術(shù)的發(fā)展,在提供個性化推薦時,很多方法利用自然語言生成技術(shù)生成自然文本解釋[2-3]。但是由于數(shù)據(jù)稀疏性,難以生成高質(zhì)量的文本解釋,可讀性差。
另外,因為知識圖可以包含更多的事實和聯(lián)系,一些研究人員利用知識圖進(jìn)行推薦,并通過圖推理路徑增強推薦的可解釋性[4-5]。但基于圖路徑的方法需要一些前提條件或定義,例如預(yù)先定義路徑或數(shù)據(jù)集存在多種類型的關(guān)聯(lián),同時知識圖譜可能包含冗余實體,從而導(dǎo)致同質(zhì)化推薦結(jié)果。
論文鏈接:https://ieeexplore.ieee.org/abstract/document/9681226
為此,作者提出了一種新的知識增強圖神經(jīng)網(wǎng)絡(luò)(KEGNN)實現(xiàn)可解釋性推薦。
KEGNN利用外部知識庫中的語義知識,從用戶、商品和用戶-商品交互三個方面學(xué)習(xí)知識增強語義嵌入。
從用戶-商品交互的角度出發(fā),構(gòu)造用戶行為圖,并利用知識增強的語義嵌入對用戶行為圖進(jìn)行初始化。
然后提出基于圖神經(jīng)網(wǎng)絡(luò)的用戶行為學(xué)習(xí)和推理模型,該模型通過傳遞用戶的偏好信息,對用戶行為圖進(jìn)行多跳推理,從而全面理解用戶行為。
最后設(shè)計了層次化協(xié)同過濾層進(jìn)行推薦預(yù)測,并將拷貝機制與GRU的生成器相結(jié)合,生成高質(zhì)量、人類可讀的語義解釋。作者已經(jīng)在三個真實數(shù)據(jù)集上進(jìn)行了廣泛的實驗。實驗結(jié)果表明,KGNN優(yōu)于現(xiàn)有方法。
方法
作者提出了知識增強的圖神經(jīng)網(wǎng)絡(luò)實現(xiàn)可解釋性,所提出的方法的體系結(jié)構(gòu)如圖1所示。
它主要包括四個模塊:知識增強語義表示學(xué)習(xí)、基于圖形神經(jīng)網(wǎng)絡(luò)的用戶行為學(xué)習(xí)與推理、層次化協(xié)同過濾和文本解釋生成。
模塊1:為了學(xué)習(xí)用戶、商品和用戶-商品交互的語義表示學(xué)習(xí),作者按照時間順序池化聚集了用戶和商品評論文檔,形成三種類型的文本文檔,分別表示為用戶、商品和用戶-商品交互。
對三種文檔進(jìn)行了進(jìn)一步的知識增強語義表示學(xué)習(xí),圖2給出了知識增強語義表示學(xué)習(xí)模塊的結(jié)構(gòu)。
首先,上下文表示部分中先學(xué)習(xí)詞級嵌入表示和語義上下文表示,利用BiLSTM對詞級嵌入的頂層進(jìn)行全局化捕捉,得到層次化語義表示。其次在知識感知中作者利用知識庫來增強語義表征學(xué)習(xí)。
此外,作者用one-hot代表用戶/商品編碼,采用全連接層映射將稀疏的one-hot表示轉(zhuǎn)換為密集表示作為用戶/商品的固有表示,最后,采用多頭注意力進(jìn)一步融合知識感知表示和用戶/商品的固有表示輸出知識增強的用戶/商品/用戶-商品交互表示。
模塊2:為了全面了解用戶偏好,作者設(shè)計了一個基于圖神經(jīng)網(wǎng)絡(luò)的用戶行為學(xué)習(xí)和推理模塊,包括用戶行為圖構(gòu)建、信息傳播層和多跳推理三個步驟,如圖3所示。
首先,從用戶-商品交互關(guān)系,作者構(gòu)造用戶行為圖,并且利用知識增強的語義表示初始化用戶行為圖的節(jié)點表示和邊表示。
其次,基于圖神經(jīng)網(wǎng)絡(luò)的架構(gòu),作者設(shè)計了基于GNN信息傳播層捕捉用戶行為間的一階鄰接網(wǎng)絡(luò)(ego-network)的信息傳播及信息融合。
最后,采用遞歸方式利用多跳(multi-hop)推理對圖結(jié)構(gòu)的高階連接信息進(jìn)行建模。
模塊3:作者基于神經(jīng)協(xié)同過濾框架設(shè)計層次化神經(jīng)協(xié)同過濾算法,如圖4(a)所示,主要包括三層神經(jīng)協(xié)同過濾層實現(xiàn)用戶-商品交互預(yù)測。
在第一個神經(jīng)協(xié)同層是全連接層,用戶行為圖學(xué)習(xí)和推理中獲得的用戶表示商品表示拼接起來作為輸入,輸出第一層用戶-商品交互表示,如公式1:
(公式1)
在第二層,我們設(shè)計了一個關(guān)系感知神經(jīng)網(wǎng)絡(luò)層,融合用戶-商品關(guān)系表示和第一層的輸出。
采用兩種融合方式,分別為阿達(dá)瑪乘積(如公式2)和全連接層非線性融合(如公式3),分別輸出關(guān)系感知的用戶-商品交互表示和高層次交互表示:
(公式2)
(公式3)
第三層采用關(guān)系感知用戶-商品交互表示和高層次交互表示作為輸入,實現(xiàn)評分預(yù)測,如公式4所示:
(公式4)
模塊4:結(jié)合生成模型和拷貝機制(生成模式和拷貝模式),作者設(shè)計一個新穎的文本解釋生成模塊,生成高質(zhì)量的人類可讀解釋。
圖4的右側(cè)部分演示了此模塊的詳細(xì)信息。應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)GRU作為解釋生成器;另外引入拷貝機制從用戶原有評論中抽取信息,結(jié)合兩種模式(生成模式和拷貝模式)生成直觀文本解釋(詞序列),易于用戶閱讀理解。
實驗
數(shù)據(jù)集選擇
本文使用Amazon5 core的三個數(shù)據(jù)集,分別是電子、家庭-廚房以及音樂-設(shè)備。評級范圍為[0,5]。對于所有數(shù)據(jù)集,作者隨機選擇每個數(shù)據(jù)集中80%的用戶-商品交互作為訓(xùn)練集,10%的用戶-商品交互作為測試集,剩余的10%的用戶-商品交互被視為驗證集。
評分預(yù)測性能
方法對比中,作者將KEGNN與CTR、PMF、NARRE、NRT、GCMC、LightGCN、RippleNet進(jìn)行對比(計算各個方法的RMSE和MAE),如圖所示。
從結(jié)果可以看出,對于所有數(shù)據(jù)集,作者的方法KEGNN在MAE和RMSE上都優(yōu)于所有比較方法。
解釋生成質(zhì)量
從結(jié)果中可以看出,作者方法在精度和F1指標(biāo)上有著最好的表現(xiàn),但是召回率卻不如CTR或者NARRE。質(zhì)量評估結(jié)果表明,作者生成的文本解釋類似于與處理行為相關(guān)的基本事實評論,并揭示了處理行為背后的隱含用戶意圖。作者還在接下來在案例分析中對可解釋性進(jìn)行了進(jìn)一步調(diào)查。
案例分析
作者選擇一些案例展示生成解釋的可解釋性,所選案例均來自測試集,因此,在解釋生成過程中隱藏了真實文本,三個數(shù)據(jù)集的典型案例如上表格所示,Ground表示用戶給出的真實評論。
從案例研究中,我們可以看到作者的方法生成的解釋說明了用戶對評級商品的選擇和購買原因。可解釋的概念和方面以粗體斜體突出顯示,表示用戶行為的潛在意圖,并展示推薦結(jié)果的可解釋性。
結(jié)論
本文提出了一種基于知識增強圖神經(jīng)網(wǎng)絡(luò)(KEGNN)的可解釋推薦方法,該方法利用外部知識庫中的語義知識來增強用戶、商品和用戶-商品交互三方面的表示學(xué)習(xí)。
作者構(gòu)造了一個用戶行為圖,并設(shè)計了一個基于圖神經(jīng)網(wǎng)絡(luò)的用戶行為學(xué)習(xí)和推理模塊,用于全面理解用戶行為。
最后,利用GRU生成器和拷貝機制相結(jié)合生成語義文本解釋,利用層次化神經(jīng)協(xié)同過濾實現(xiàn)精準(zhǔn)推薦。詳細(xì)內(nèi)容請參見論文細(xì)節(jié)。