MovieMat:如何利用場景數(shù)據(jù)進行基于場景的電影推薦
原創(chuàng)【51CTO.com原創(chuàng)稿件】推薦系統(tǒng)是發(fā)展了數(shù)十年的技術體系,被廣泛應用于電商、新聞APP、流媒體等領域。推薦系統(tǒng)的技術脈絡多種多樣,從主流的準確率等技術指標的提升和優(yōu)化,到近年來流行的基于公平性的推薦,吸引了成千上萬的研究者和從業(yè)者。
推薦系統(tǒng)的一個非常重要的子領域是基于場景的推薦?;趫鼍暗耐扑],顧名思義,就是利用用戶所在場景的信息輔助給用戶推薦感興趣的物品。一些著名的企業(yè),比如 Burger King 就在自己的服務中增加了基于場景的推薦。
基于場景的推薦的技術有許多, 然而并沒有形成一個主要的演化脈絡。比較著名的基于場景的推薦思路包括線性模型和張量分解。然而線性模型不利于處理復雜的關系,而張量分解本身又消耗大量的存儲空間,都存在著許多可以優(yōu)化之處。
在2021 年的國際學術會議 ICISCAE 2021,有學者發(fā)表了一篇題為 MatMat: Matrix Factorization by Matrix Fitting 的論文。提出了利用矩陣擬合的方式近似求解包含場景信息的評分矩陣。
首先,作者回顧了基于矩陣分解的推薦系統(tǒng)的框架:
???
我們可以觀察到,矩陣分解的本質其實就是用向量的點乘去擬合標量值。如果我們將矩陣分解的算法框架進行推廣,用矩陣的乘法代替向量的點乘,用矩陣代替標量進行擬合。我們將得到 MatMat 框架:
???
矩陣的每個元素都是矩陣,矩陣元素的對角線對應原始矩陣分解框架的標量值,而矩陣對角線之外的元素是場景信息。
基于場景的推薦系統(tǒng)的研究難點之一是如何獲得開放的數(shù)據(jù)集合。由于場景信息本身難以獲取,可用的數(shù)據(jù)集合就顯得尤為珍貴。難能可貴的是國外的高校公開了一個名為 LDOS-CoMoDa 的數(shù)據(jù)集合,包含了大量的觀看電影的場景信息,使得基于場景的推薦系統(tǒng)的研究成為可能。
在 2021 年 12 月舉辦的國際學術會議 ICCC 上,有學者利用 LDOS-CoMoDa 數(shù)據(jù)集合和 MatMat 算法框架,提出了名為 MovieMat 和 MovieMat+ 的電影推薦算法。MovieMat 算法設定的用戶評分矩陣如下:
???
而 MovieMat+ 算法設定的用戶評分矩陣如下:
???
作者隨后利用 LDOS-CoMoDa 數(shù)據(jù)集合做實驗,對比了 MovieMat v.s 經(jīng)典矩陣分解,和 MovieMat+ v.s 經(jīng)典矩陣分解的結果。實驗比較了 MAE 和 Degree of Matthew Effect 兩個指標。其中 MAE 指代 Mean Absolute Error,用來衡量評分預測的準確性; 而 Degree of Matthew Effect 用來衡量算法的公平性。
實驗的結果如下:
???
???
根據(jù)觀察, 我們發(fā)現(xiàn) MovieMat 和 MovieMat+ 在測評數(shù)據(jù)上的表現(xiàn)都要優(yōu)于經(jīng)典矩陣分解的模型,最優(yōu) MAE 在 0.6 - 0.7 的水平。
MovieMat 和 MovieMat+ 都是依托于 MatMat 框架的電影推薦系統(tǒng)。MovieMat 和 MovieMat+ 表現(xiàn)都優(yōu)于沒有場景信息的推薦系統(tǒng),是非常有前景的技術。在下一代的電影院中,如果電影院可以利用傳感器和人臉識別算法記錄下用戶的場景信息,將會有效提升電影院產(chǎn)業(yè)的利潤,而 MovieMat 和 MovieMat+ 將在這一波的技術革新中大方異彩。
參考文獻地址:
1. ??MatMat: Matrix Factorization by Matrix Fitting??
2. ??MovieMat: Context-aware Movie Recommendation with Matrix Factorization by Matrix Fitting??
【51CTO原創(chuàng)稿件,合作站點轉載請注明原文作者和出處為51CTO.com】