數(shù)據(jù)泄露?為什么互聯(lián)網(wǎng)產(chǎn)品總能“猜你喜歡”
1.個(gè)性化推薦的應(yīng)用的實(shí)現(xiàn)原理
個(gè)性化推薦的核心在于聯(lián)系用戶和信息(包括商品、內(nèi)容、服務(wù)等),對(duì)于用戶而言,幫助用戶找到感興趣的信息;對(duì)于企業(yè)而言,幫助企業(yè)將信息推送到可能感興趣的用戶面前,增加用戶黏性,提升營收。據(jù)數(shù)據(jù)分析,Netflix上三分之二被觀看的電影來自個(gè)性化推薦,Google新聞上38%的點(diǎn)擊來自個(gè)性化推薦。個(gè)性化推薦被廣泛運(yùn)用于各個(gè)互聯(lián)網(wǎng)業(yè)務(wù)場(chǎng)景,包括音樂推薦、信息流推薦、商品推薦、外賣店鋪推薦等。如圖1所示,某音樂平臺(tái)根據(jù)用戶的過往聽歌記錄,提供了每日推薦、私人FM、推薦歌單、私人定制等功能。
▲圖1 某音樂平臺(tái)的個(gè)性化推薦
個(gè)性化推薦的實(shí)現(xiàn)原理簡(jiǎn)單來說,是通過用戶畫像來設(shè)定人群特征,再加上算法模型,決策選出相應(yīng)的該用戶感興趣的信息。以圖2為例,根據(jù)該用戶的畫像標(biāo)簽:90后、喜歡傷感歌曲和喜歡周杰倫,選出其感興趣的歌曲,結(jié)合點(diǎn)擊率預(yù)估模型(即預(yù)測(cè)提供給用戶的歌曲用戶會(huì)不會(huì)點(diǎn)擊),就形成了每日推薦等推薦欄目。算法模型的類型比較多,包括基于相似的人、基于相似的信息等??偠灾?,個(gè)性化推薦是用戶畫像和算法模型相結(jié)合,以個(gè)性化展示為結(jié)果。
▲圖2 個(gè)性化推薦音樂的原理示意
2.個(gè)性化推薦的合規(guī)指引
個(gè)性化推薦在我國相關(guān)立法以及國家標(biāo)準(zhǔn)中的描述不一致,例如《關(guān)于開展App違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》中的定向推送、《信息安全技術(shù) 個(gè)人信息安全規(guī)范》中的個(gè)性化展示以及《個(gè)人信息保護(hù)法》中的自動(dòng)化決策。
(1)透明度
除了用戶行為追蹤、用戶畫像需要滿足透明性要求外,個(gè)性化展示也需要滿足。按照《信息安全技術(shù) 個(gè)人信息告知同意指南(2020年1月征求意見稿)》附錄E中個(gè)性化推薦場(chǎng)景下的告知同意,應(yīng)當(dāng)告知用戶如下信息:
1)個(gè)性化推薦功能是否會(huì)對(duì)個(gè)人信息主體的權(quán)益或自主決策造成影響。
2)個(gè)性化推薦功能的原理或?qū)崿F(xiàn)方式。
3)個(gè)性化推薦功能的提供方。
4)告知管理個(gè)性化推薦功能的方式。
5)如提供采用非個(gè)性化推薦的同類功能,則可以告知進(jìn)入或開啟該功能的方式。
以圖3為例,在隱私政策中說明了使用了什么類型的個(gè)人信息,展示了為推薦算法建模、進(jìn)行用戶行為分析及用戶畫像,提取數(shù)據(jù)主體的瀏覽記錄、搜索偏好、行為習(xí)慣等相關(guān)特征,同時(shí)告知管理個(gè)性化推薦、非個(gè)性化推薦的方式。
▲圖3 某網(wǎng)絡(luò)音樂產(chǎn)品的隱私政策中關(guān)于個(gè)性化展示的描述
(2)顯著區(qū)分個(gè)性化展示和非個(gè)性化展示
應(yīng)當(dāng)顯著區(qū)分個(gè)性化展示的內(nèi)容和非個(gè)性化展示的內(nèi)容,顯著區(qū)分的方式包括但不限于:標(biāo)明“定推”等字樣,或通過不同的欄目、版塊、頁面分別展示等。
(3)退出機(jī)制
針對(duì)電子商務(wù)服務(wù),根據(jù)消費(fèi)者的興趣愛好、消費(fèi)習(xí)慣等特征向其提供商品或者服務(wù)的搜索結(jié)果的,應(yīng)當(dāng)同時(shí)向該消費(fèi)者提供不針對(duì)其個(gè)人特征的選項(xiàng),尊重和平等保護(hù)消費(fèi)者的合法權(quán)益。如圖4所示,電子商務(wù)平臺(tái)提供了個(gè)性化內(nèi)容推薦的開關(guān),以及搜索時(shí)可選擇通用排序。
▲圖4 某電子商務(wù)平臺(tái)提供的個(gè)性化內(nèi)容推薦開關(guān)
針對(duì)新聞信息推送服務(wù),在向個(gè)人信息主體推送新聞信息服務(wù)的過程中使用個(gè)性化展示的,應(yīng):
1)為個(gè)人信息主體提供簡(jiǎn)單直觀的退出或關(guān)閉個(gè)性化展示模式的選項(xiàng)。
2)當(dāng)個(gè)人信息主體選擇退出或關(guān)閉個(gè)性化展示模式時(shí),向個(gè)人信息主體提供刪除或匿名化定向推送活動(dòng)所基于的個(gè)人信息的選項(xiàng)。
需要注意的是,雖然《信息安全技術(shù) 個(gè)人信息安全規(guī)范》僅對(duì)電子商務(wù)服務(wù)和新聞信息推送服務(wù)做出了個(gè)性化展示退出機(jī)制的明確規(guī)定,但是《個(gè)人信息保護(hù)法》對(duì)于通過自動(dòng)化決策方式向個(gè)人進(jìn)行信息推送、商業(yè)營銷的,都要求同時(shí)提供不針對(duì)其個(gè)人的選項(xiàng),或者向個(gè)人提供更便捷的拒絕方式。
更進(jìn)一步地說,自動(dòng)化決策方式做出對(duì)個(gè)人權(quán)益有重大影響的決定,如貸款申請(qǐng)時(shí),個(gè)人有權(quán)要求數(shù)據(jù)控制者予以說明,且有權(quán)拒絕僅通過自動(dòng)化決策的方式做出決定。
(4)畫像維度等自主控制機(jī)制
在向個(gè)人信息主體提供業(yè)務(wù)功能的過程中使用個(gè)性化展示的,宜建立個(gè)人信息主體對(duì)個(gè)性化展示所依賴的個(gè)人信息(如標(biāo)簽、畫像維度等)的自主控制機(jī)制,保障個(gè)人信息主體調(diào)控個(gè)性化展示相關(guān)程度的能力。如圖5所示,某電子商務(wù)平臺(tái)提供了長按商品后可選擇對(duì)商品不感興趣和屏蔽更多同類,來實(shí)現(xiàn)后臺(tái)畫像維度管理。
▲圖5 某電子商務(wù)平臺(tái)提供的畫像維度控制功能
部分平臺(tái)以用戶標(biāo)簽管理平臺(tái)的方式來控制畫像關(guān)聯(lián)維度,用戶可以查看并自主添加。如圖6所示,Twitter根據(jù)用戶的行為標(biāo)記出用戶興趣愛好等特征。
▲圖6 Twitter提供的畫像標(biāo)簽管理功能
(5)自動(dòng)化決策的公平、公正
自動(dòng)化決策應(yīng)當(dāng)保證結(jié)果的公平、公正,不得進(jìn)行大數(shù)據(jù)殺熟等不合理的差別待遇。個(gè)性化推薦更類似于第一方定向廣告,更多地使用自有平臺(tái)收集的用戶行為,形成用戶畫像,結(jié)合算法模型,實(shí)現(xiàn)其業(yè)務(wù)內(nèi)的內(nèi)容、產(chǎn)品、服務(wù)等推薦。因此,個(gè)性化推薦在合規(guī)上應(yīng)當(dāng)考慮用戶行為追蹤的收集合規(guī)性、形成畫像以及個(gè)性化推薦的使用限制、自動(dòng)化決策的要求,保障透明性與用戶可控制權(quán)。
本文摘編于《數(shù)據(jù)合規(guī):入門、實(shí)戰(zhàn)與進(jìn)階》,經(jīng)出版方授權(quán)發(fā)布。(書號(hào):9787111705369)轉(zhuǎn)載請(qǐng)保留文章出處。