?作者 | 汪昊
審校 | 孫淑娟
推薦系統(tǒng)公平性是 2017 年以來爆火的人工智能研究領(lǐng)域。知名的人工智能公司比如 Twitter, Google, IBM和百度,都創(chuàng)立了人工智能倫理團隊或研發(fā)了人工智能倫理產(chǎn)品。然而讓人遺憾的是,人工智能倫理研究在國內(nèi)起步較晚,跟國外相比,目前仍然存在著一定差距。
排序?qū)W習是在 2010 年左右爆發(fā)的機器學習技術(shù),在推薦系統(tǒng)和信息檢索領(lǐng)域都得到了廣泛的應(yīng)用。在最近幾年,排序?qū)W習成為了熱門的人工智能倫理研究算法基準。
本文將要介紹的是 2022 年在國際學術(shù)會議 CISAT 2022 (International Conference on Computer Information Science and Application Technology) 發(fā)表的論文 Pareto Pairwise Ranking for Fairness Enhancement of Recommender Systems。本文主要講解了如何結(jié)合帕累托分布和排序?qū)W習實現(xiàn)公平的排序?qū)W習推薦算法。
圖1. MovieLens 數(shù)據(jù)集觀影評分差概率分布
我們根據(jù)觀察(圖1)和統(tǒng)計學理論(齊夫分布的統(tǒng)計估計)可以得到如下結(jié)論: 同一個用戶對不同物品的評分差的概率分布正比于評分差。我們修改概率矩陣分解的損失函數(shù),得到我們發(fā)明的新算法帕累托排序?qū)W習(Pareto Pairwise Ranking)的損失函數(shù)公式:
把我們剛才的觀察帶入到損失函數(shù)公式中,我們得到如下?lián)p失函數(shù)公式:
我們把 L 取對數(shù),得到如下公式:
我們利用隨機梯度下降公式求解損失函數(shù)對數(shù),得到如下公式:
帕累托排序?qū)W習的算法流程如下:
圖2和圖3顯示的是帕累托排序?qū)W習在 MovieLens 1 Million Dataset 數(shù)據(jù)集上的測試結(jié)果。論文作者對比了 10 種推薦系統(tǒng)算法,發(fā)現(xiàn)帕累托排序?qū)W習算法在公平性指標上表現(xiàn)最好。
圖 4 和圖 5 顯示的是帕累托排序?qū)W習在 LDOS-CoMoDa 數(shù)據(jù)集上的測試結(jié)果。帕累托排序?qū)W習算法在公平性指標上的表現(xiàn)依然最好。
帕累托排序?qū)W習算法是國內(nèi)少見的基于公平性的排序?qū)W習推薦系統(tǒng)算法。算法原理簡單,實現(xiàn)簡便,運行速度快。作者在 16G RAM 和 Intel Core i5 的聯(lián)想筆記本上測試,執(zhí)行速度飛快。人工智能倫理研究在國際上目前是研究熱點,希望引起大家的足夠重視。
作者簡介
汪昊,前 Funplus 人工智能實驗室負責人,在 ThoughtWorks, 豆瓣,新浪,網(wǎng)易等公司有超過 11 年的研發(fā)和管理經(jīng)驗。在推薦系統(tǒng)、聊天機器人、風控反欺詐領(lǐng)域有豐富的技術(shù)經(jīng)驗。在國際學術(shù)會議和期刊上發(fā)表論文 30 篇,獲得最佳論文獎/最佳論文報告獎3次。2006 年 ACM 區(qū)域賽金牌。本科和碩士畢業(yè)于美國猶他大學。對外經(jīng)貿(mào)大學在職 MBA。