自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

新聞 人工智能
該研究還提出了一個(gè)預(yù)測(cè)模型,預(yù)測(cè)準(zhǔn)確率相比其他方法有所提升。目前,該論文已發(fā)表在《IEEE Transactions on Knowledge and Data Engineering》(TKDE) 期刊上。

微信點(diǎn)「看一看」最活躍用戶竟是爸媽輩,小年輕最「安靜」…… 清華大學(xué)唐杰等人最近的一項(xiàng)研究透過微信「看一看」的數(shù)據(jù)分析了用戶點(diǎn)擊閱讀文章和點(diǎn)「在看」的行為模式,并從人口統(tǒng)計(jì)情況、二元和三元關(guān)聯(lián)、自我中心網(wǎng)絡(luò)結(jié)構(gòu)這些不同方面進(jìn)行了分析。

該研究還提出了一個(gè)預(yù)測(cè)模型,預(yù)測(cè)準(zhǔn)確率相比其他方法有所提升。目前,該論文已發(fā)表在《IEEE Transactions on Knowledge and Data Engineering》(TKDE) 期刊上。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律
  • 論文鏈接:https://arxiv.org/pdf/2103.02930.pdf
  • GitHub 鏈接:https://github.com/zfjsail/wechat-wow-analysis

微信文章的「在看」按鈕,想必大家都不陌生。在發(fā)現(xiàn)頁點(diǎn)開「看一看」,微信用戶就能看到朋友點(diǎn)過「在看」的文章,也可以點(diǎn)擊這些文章進(jìn)行閱讀,或者點(diǎn)個(gè)「在看」。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

微信「看一看」頁面示例。(「wow button」是「在看」按鈕。)

那么,哪些因素會(huì)影響用戶點(diǎn)擊閱讀這些文章和點(diǎn)「在看」的行為呢?

哪些因素影響了「看一看」用戶的行為

該研究從三個(gè)層面進(jìn)行了分析。

  • 從用戶人口統(tǒng)計(jì)信息來看,不同性別和年齡段的用戶「在看」和點(diǎn)擊行為的變化很大,在考慮跨屬性因素時(shí),情況更加復(fù)雜;
  • 就二元關(guān)聯(lián)來看,當(dāng)其活躍朋友是結(jié)構(gòu)洞和意見領(lǐng)袖時(shí),用戶的行為可能截然不同;
  • 而對(duì)于自我中心網(wǎng)絡(luò)(Ego Network),「在看」和點(diǎn)擊閱讀文章的概率于用戶活躍朋友構(gòu)成的連通分支(connected component)數(shù)量強(qiáng)相關(guān)。

下面是具體分析結(jié)果。

用戶人口統(tǒng)計(jì)信息

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

表 1、圖 2 和圖 3 給出了不同性別和年齡的用戶在「看一看」中點(diǎn)「在看」和點(diǎn)擊閱讀文章的概率。從中,我們可以發(fā)現(xiàn):

  • 男性的點(diǎn)擊概率明顯高于女性,女性點(diǎn)「在看」的概率略高于男性(參見表 1);
  • 20+ 和 30+ 的年輕人是線上社交圈的中流砥柱,但他們點(diǎn)「在看」和點(diǎn)擊閱讀文章的概率在所有年齡段中是最低的(參見圖 2);
  • 當(dāng)同時(shí)考慮性別和年齡屬性時(shí),情況又有所不同:不到 20 歲的人中,男性比女性更活躍;但超過 40 歲的人中女性點(diǎn)「在看」的比例更大,超過 60 歲的人中女性點(diǎn)擊閱讀文章的比例更大(參見圖 3)。

二元和三元關(guān)聯(lián)

為了方便起見,該研究在二元關(guān)聯(lián)中僅考慮用戶與一個(gè)活躍朋友的互動(dòng),在三元關(guān)聯(lián)中僅考慮用戶與兩個(gè)活躍朋友的互動(dòng)。研究者從人口統(tǒng)計(jì)屬性與社會(huì)角色兩個(gè)方面進(jìn)行分析。

1. 二元關(guān)聯(lián)與人口統(tǒng)計(jì)屬性

下表 2 展示了用戶性別和朋友性別對(duì)用戶活躍率的影響。從中可以看到,就點(diǎn)擊行為而言,當(dāng)二人性別相同時(shí),用戶的點(diǎn)擊概率更高;但對(duì)于「在看」行為而言,當(dāng)朋友是女性時(shí),用戶點(diǎn)「在看」的概率更高。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

從年齡來看,下圖 4 展示了用戶年齡與朋友年齡對(duì)用戶「在看」行為概率的影響。從中我們可以發(fā)現(xiàn),當(dāng)用戶比較年輕(< 40 歲)時(shí),相比于同齡人,他們更易受年齡較大朋友的影響;年齡較大用戶則更易受同齡朋友的影響。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

2. 二元關(guān)聯(lián)與社會(huì)角色

下表 4 展示了用戶與朋友具備不同社會(huì)角色——意見領(lǐng)袖 (OL) 和普通人 (OU) 時(shí),對(duì)用戶活躍率的影響。從中可以發(fā)現(xiàn),當(dāng)活躍朋友并非意見領(lǐng)袖時(shí),用戶點(diǎn)「在看」和點(diǎn)擊閱讀文章的概率更高。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

下表 5 展示了結(jié)構(gòu)洞 (SH) 和普通人 (OU) 這兩種社會(huì)角色對(duì)用戶活躍率的影響。(「結(jié)構(gòu)洞」指社會(huì)網(wǎng)絡(luò)中的空隙,即社會(huì)網(wǎng)絡(luò)中某個(gè)或某些個(gè)體和有些個(gè)體發(fā)生直接聯(lián)系,但與其他個(gè)體不發(fā)生直接聯(lián)系,即無直接關(guān)系或關(guān)系間斷,從網(wǎng)絡(luò)整體看好像網(wǎng)絡(luò)結(jié)構(gòu)中出現(xiàn)了洞穴。)

可以看出,當(dāng)朋友是結(jié)構(gòu)洞時(shí),普通用戶的活躍率更高。而對(duì)于本身是結(jié)構(gòu)洞的用戶,當(dāng)朋友非結(jié)構(gòu)洞時(shí)其點(diǎn)擊概率更高,但差別并不顯著。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

3. 三元關(guān)聯(lián)與人口統(tǒng)計(jì)屬性

下圖 5 展示了用戶性別和朋友性別對(duì)用戶活躍率的影響。可以看出,當(dāng)兩個(gè)朋友的性別與用戶性別相同時(shí),用戶的活躍率最高。這顯示出很強(qiáng)的同質(zhì)偏好性(homophily)。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

下圖 6 展示了用戶年齡與朋友年齡對(duì)用戶活躍率的影響。從中我們可以發(fā)現(xiàn),如果一個(gè)朋友與用戶同齡另一個(gè)較小,則用戶的活躍率高;年長用戶更關(guān)注年輕用戶。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

自我中心網(wǎng)絡(luò)屬性

此外,研究者還探討了用戶活動(dòng)與其自我中心網(wǎng)絡(luò)屬性的關(guān)聯(lián),發(fā)現(xiàn)用戶的線上行為(點(diǎn)擊閱讀和「在看」)受朋友圈(自我中心網(wǎng)絡(luò)中的朋友)影響很大。自我中心網(wǎng)絡(luò)指用戶的活躍朋友的誘導(dǎo)子圖(induced subgraph)。

該研究從自我中心網(wǎng)絡(luò)中的朋友數(shù)量、連通分支 (#CC) 數(shù)量、cleaned 自我中心網(wǎng)絡(luò)(k 核子圖)中的 #CC 這三個(gè)方面分析自我中心網(wǎng)絡(luò)的屬性。

下圖 8 展示了活躍朋友數(shù)量增加對(duì)用戶活躍率的影響。從圖中可以看出,對(duì)于點(diǎn)擊和「在看」行為而言,趨勢(shì)完全不同。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

通過這些分析,研究者得到以下發(fā)現(xiàn):

  • 男性更喜歡點(diǎn)擊閱讀文章,女性更喜歡點(diǎn)「在看」,年輕人在「看一看」中的活躍度最低;
  • 在二元或三元關(guān)聯(lián)方面,用戶和其朋友之間存在有趣的「同質(zhì)相吸」現(xiàn)象(如性別),但當(dāng)不止一個(gè)活躍朋友時(shí),屬性多樣性(如區(qū)域)與用戶的活動(dòng)呈正相關(guān);
  • 根據(jù)自我中心網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),「在看」和點(diǎn)擊行為的模式差異極大。例如,在活躍朋友數(shù)量固定的情況下,用戶點(diǎn)「在看」的概率與活躍朋友構(gòu)成的連通分支呈負(fù)相關(guān),但點(diǎn)擊行為卻相反。當(dāng)自我中心網(wǎng)絡(luò)得到清理后,這一模式更加明顯。

預(yù)測(cè)模型

既然發(fā)現(xiàn)了一些模式或規(guī)律,我們可以利用它們預(yù)測(cè)用戶的線上行為嗎?該研究創(chuàng)建了一個(gè)預(yù)測(cè)模型 DiffuseGNN。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

如上圖所示,DiffuseGNN 模型包含五步:預(yù)處理自我中心網(wǎng)絡(luò)、輸入層、特征平滑層、層級(jí)圖表示學(xué)習(xí)和輸出層。

該模型的核心組件和基礎(chǔ) idea 如下所示:

  1. 對(duì)于輸入用戶特征,研究者考慮了不同的用戶特征,如用戶人口統(tǒng)計(jì)信息(性別、年齡等)和預(yù)訓(xùn)練用戶嵌入,并試圖建模特征交互;
  2. 然后通過在可訓(xùn)練的調(diào)整后頻譜域(trainable modulated spectral domain)中傳播初始特征,來學(xué)習(xí)用戶嵌入,這樣學(xué)得的用戶嵌入就可以捕捉自我中心網(wǎng)絡(luò)中的有用信息,并過濾噪聲;
  3. 接下來,研究者進(jìn)一步將學(xué)得的中間表示輸入到層級(jí)圖表示模型中,該模型通過迭代聚類節(jié)點(diǎn)來學(xué)習(xí)子圖嵌入;
  4. 該研究還使用新型注意力模型建模用戶特征與朋友特征之間的相互作用。

實(shí)驗(yàn)

研究者在其收集的微信「看一看」數(shù)據(jù)和公開的微博數(shù)據(jù)集上測(cè)試了該模型對(duì)用戶行為的預(yù)測(cè)效果,并選取了多類方法進(jìn)行對(duì)比,包括:1)傳統(tǒng)分類器:LR 和 RF;2)建模特征交互的深度學(xué)習(xí)方法:xDeepFM;3)基于自我中心網(wǎng)絡(luò)的 SOTA 用戶行為預(yù)測(cè)方法:DeepInf 和 Wang et al.;4)層級(jí)圖表示學(xué)習(xí)方法:SAGPool、ASAP 和 StructPool。其中第 3 和第 4 類都是基于 GNN 的方法。

下表 7 展示了實(shí)驗(yàn)結(jié)果,從中可以看出 DiffuseGNN 模型的性能持續(xù)優(yōu)于基線方法。

你的「在看」有人看,清華研究者從微信「看一看」發(fā)現(xiàn)了這些規(guī)律

此外,該研究還探討了不同模型組件對(duì)用戶行為預(yù)測(cè)的影響,參見表 7 底部數(shù)據(jù)。從中我們可以發(fā)現(xiàn),移除預(yù)訓(xùn)練嵌入和特征平滑步會(huì)導(dǎo)致較大的性能下降;增加二階特征對(duì)基于微信數(shù)據(jù)的用戶行為預(yù)測(cè)略有幫助,對(duì)基于微博數(shù)據(jù)集的用戶行為預(yù)測(cè)效果較好;該模型在不使用人工制作用戶特征的情況下也取得了不錯(cuò)的性能。

 

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2020-03-06 09:00:31

微信看一看質(zhì)量

2018-12-29 13:53:19

微信今日頭條

2010-01-27 13:54:52

IT電影

2019-11-15 08:46:16

MySQLMVCC表讀鎖

2018-08-28 12:07:42

微信數(shù)據(jù)分析

2021-05-28 11:30:39

物聯(lián)網(wǎng)互聯(lián)網(wǎng)IoT

2019-05-23 10:46:53

深度學(xué)習(xí)代碼算法

2020-04-14 15:30:00

微信群管理朋友圈

2018-03-16 10:07:30

霍金預(yù)言人工智能

2019-04-26 09:16:51

存儲(chǔ)

2024-03-07 08:22:32

CSS變量代碼

2011-03-23 09:33:51

HTML 5

2018-03-08 11:10:33

分布式存儲(chǔ)Ceph

2020-02-14 08:00:00

WindowsLinuxSamba

2021-05-22 07:27:14

程序員專業(yè)術(shù)語編程

2024-05-20 08:25:55

2021-04-28 07:34:09

電腦軟件ArcTime

2020-09-01 10:32:52

iOS微信新功能

2009-05-19 10:18:00

機(jī)房網(wǎng)絡(luò)管理

2023-10-16 15:41:14

WebCSS
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)