自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

認識每一個“你”:微博中的用戶模型

原創(chuàng)
開發(fā) 架構(gòu)
微博經(jīng)歷了6年的發(fā)展,已經(jīng)成為了國內(nèi)社交媒體的中堅力量。本文從微博的角度出發(fā),對微博中用戶模型的目的、維度和建模任務(wù)進行描述,并作為后續(xù)微博用戶模型相關(guān)文章的總述。

社交媒體(Social Media)相對于傳統(tǒng)互聯(lián)網(wǎng)媒體的最大區(qū)別是通過建立人與人之間的聯(lián)系,極大提升了信息生產(chǎn)量以及傳播效率。身處社交媒體中的每個人或組織同時扮演著信息生產(chǎn)者、傳播者與接受者的角色。

在社交媒體背景下,用戶生產(chǎn)、傳播和接收信息更加便捷,使得之前相對集中的用戶興趣和行為變得更加碎片化和離散,因此社交媒體中的用戶模型的構(gòu)建和應(yīng)用也發(fā)生了巨大的變化。

微博經(jīng)歷了6年的發(fā)展,已經(jīng)成為了國內(nèi)社交媒體的中堅力量。本文從微博的角度出發(fā),對微博中用戶模型的目的、維度和建模任務(wù)進行描述,并作為后續(xù)微博用戶模型相關(guān)文章的總述。

1 構(gòu)建用戶模型的目的

刻畫每個用戶,是任何一家社交類型的服務(wù)都需要面對的問題。不同的公司針對各自業(yè)務(wù)會有不同的需求,構(gòu)建用戶模型的動機和目標也會存在一定差異。從微博自身的角度來講,構(gòu)建用戶模型的目的包括:

(1) 完善及擴充微博用戶信息

用戶模型的首要動機就是了解用戶,這樣才能夠提供更優(yōu)質(zhì)的服務(wù)。但是在微博中用戶的信息提供得不盡完整,有些是因為平臺的引導(dǎo)機制造成的(例如填寫公司學(xué)校信息的時候,相應(yīng)的機構(gòu)名或者學(xué)校名并不在列表內(nèi)),有時候又是用戶不愿意或懶得提供(例如針對一些非必選項),而且對于用戶自行輸入的內(nèi)容又很難進行規(guī)范化……此外,一些隱性或變化頻繁的信息(例如用戶的興趣、商業(yè)偏好、地理位置的變化等等)也需要通過用戶的行為挖掘出來。

(2) 分析微博生態(tài)

除了了解用戶,還需要了解自己。在掌握用戶信息的基礎(chǔ)上,平臺就可以對自身的狀況進行分析,從相對宏觀的基礎(chǔ)上把握微博的生態(tài)環(huán)境,為后續(xù)的優(yōu)化和發(fā)展提供方向性。例如通過對用戶信息的聚類,能夠?qū)ξ⒉┯脩暨M行人群的劃分,掌握不同人群的活躍程度,信息的傳播和引爆方式,行為及興趣偏好等等。

(3) 支撐微博業(yè)務(wù)

在微博中的各項業(yè)務(wù)都與用戶模型有著直接與間接的關(guān)系,無論是基于興趣的推薦提升用戶價值,精準的廣告投放提升商業(yè)價值,還是針對特定群體的內(nèi)容運營,用戶模型都是其必不可少的基礎(chǔ)支撐。直接地,用戶模型可以用于興趣匹配、關(guān)系匹配的推薦和投放;間接地,可以基于用戶模型中相似的興趣、關(guān)系及行為模式去推動信息及賬號的傳播和成長。

#p#

2 微博用戶模型的維度劃分

一個用戶可以從多個方面去刻畫,也就是說用戶模型可以從多個維度來考慮和構(gòu)建。

作為社交媒體,微博用戶在平臺上通過某些行為(如發(fā)微博、點擊圖片、播放視頻、瀏覽信息流……)生產(chǎn)或獲取信息,也通過其它一些行為(如轉(zhuǎn)發(fā)、評論、贊……)將信息傳播出去,信息的傳播是通過用戶之間的社交關(guān)系所進行的,并且在生產(chǎn)、消費、傳播信息的過程中對信息的選擇和過濾體現(xiàn)了用戶在興趣方面的傾向性。由此,我們可以將微博用戶模型按照圖1所示的四個維度進行劃分,即屬性維度、興趣維度、社交維度和行為維度。 

圖1 微博用戶模型的維度劃分

用戶屬性和用戶興趣是通常用戶畫像中包含的兩個維度。前者刻畫用戶的靜態(tài)屬性特征,例如用戶的身份信息(性別、年齡、受教育程度、學(xué)校、工作單位……),后者則用于刻畫用戶在信息篩選方面的傾向(例如用戶的興趣標簽、能力標簽等)。

社交維度是從社交關(guān)系及信息傳播的角度來刻畫用戶的。在社交媒體中,用戶不在僅僅是一個個體,用戶以及用戶之間的社交關(guān)系構(gòu)成了一張網(wǎng)絡(luò),信息在這張網(wǎng)絡(luò)中高速流動,但是這種流動并不是無差別的,信息的起始點,所經(jīng)歷的關(guān)鍵節(jié)點以及這些節(jié)點構(gòu)成的關(guān)系圈都是影響信息流動的重要因素。社交維度就是要量化這些因素以及其影響程度。

行為維度是一個比較新的研究方向,目的是發(fā)現(xiàn)影響用戶屬性、信息變化的行為因素,分析典型用戶群體的行為模式。一方面可以通過行為模式的復(fù)用來促進用戶在微博平臺的成長;另一方面也有利于平臺認識用戶,和發(fā)現(xiàn)新的或異常的用戶行為。

#p#

3 用戶建模的任務(wù)

3.1 屬性和興趣維度(用戶畫像)

屬性和興趣維度的用戶模型都可以歸入用戶畫像(User Profile)的范疇,即對用戶的信息進行標簽化。一方面,標簽化是對用戶信息進行結(jié)構(gòu)化,方便計算機的識別和處理;另一方面,標簽本身也具有準確性和非二義性,也有利于人工的整理、分析和統(tǒng)計。

用戶屬性指相對靜態(tài)和穩(wěn)定的人口屬性,例如:性別、年齡區(qū)間、地域、受教育程度、學(xué)校、公司……這些信息的收集和建立主要依靠產(chǎn)品本身的引導(dǎo)、調(diào)查、第三方提供等,在此基礎(chǔ)上需要進行補充和交叉驗證。

用戶興趣則是更加動態(tài)和易變化的特征,首先興趣受到人群、環(huán)境、熱點事件、行業(yè)……等方面的影響,一旦這些因素發(fā)生變化,用戶的興趣容易產(chǎn)生遷移;其次,用戶的行為(特指在互聯(lián)網(wǎng)上的行為)多樣且碎片化,不同行為反映出來的興趣差異較大,在用戶興趣分析的過程中,主要考慮如下幾個方面:

(1) 標簽來源:不是所有的詞都適合充當(dāng)用戶標簽,這些詞本身應(yīng)該具有區(qū)分性和非二義性;此外,還需要考慮來源的全面性,除了用戶主動提供的興趣標簽外,用戶在使用微博的過程中的行為,構(gòu)建的用戶關(guān)系等也能夠反應(yīng)用戶的興趣,因此也要將其考慮在內(nèi)。

(2) 權(quán)重計算:得到了用戶的興趣標簽,還需要針對用戶給這些標簽進行權(quán)重賦值,用來區(qū)分不同標簽對于該用戶的重要程度。

(3) 時效性:隨著時間的變化,用戶的興趣會發(fā)生轉(zhuǎn)移,有些興趣會貫穿用戶使用社交媒體的全過程,而有些興趣則是受熱點時間、環(huán)境因素等的影響。

(4) 興趣和能力的區(qū)分:用戶具有某方面的興趣,只代表了他愿意接受這方面的信息,并不能代表他具有產(chǎn)生相關(guān)內(nèi)容的能力。區(qū)分興趣和能力,能有助于預(yù)測興趣相關(guān)內(nèi)容潛在的生產(chǎn)者和傳播者。

3.2 社交維度

如果將微博中的用戶視作節(jié)點,用戶之間的關(guān)系視作節(jié)點之間的邊,那么這些節(jié)點和邊將構(gòu)成一個社交的網(wǎng)絡(luò)拓撲結(jié)構(gòu),或稱作社交圖譜。微博中的信息就是在這個圖譜上進行傳播。

從社交的維度建立用戶模型,需要從不同的角度細致和全面地描述這個社交圖譜的特征,反應(yīng)影響信息傳播的各層面上的因素,尋找節(jié)點之間的關(guān)聯(lián)想,以及刻畫圖譜本身的結(jié)構(gòu)特征。其中包括:

(1) 用戶個體對信息傳播的影響:不同用戶在信息傳播過程中的重要性不一樣,影響大的用戶對于信息的傳播較影響小的用戶更具有促進作用。

(2) 量化用戶關(guān)系的遠近:衡量存在直接關(guān)聯(lián)(關(guān)注、被關(guān)注、互粉……)用戶之間的關(guān)系遠近,關(guān)系越近的用戶之間越容易產(chǎn)生信息傳播行為。

(3) 延伸用戶之間的關(guān)系:通過用戶之間的直接關(guān)系(關(guān)注、被關(guān)注、互粉……),讓本身并不存在直接關(guān)系的用戶產(chǎn)生關(guān)聯(lián)。

(4) 尋找相似的用戶:微博中非對等的關(guān)系本身可以認為是一種認證,用戶基于興趣、線下關(guān)系、或某種其它原因反應(yīng)到線上的一種關(guān)聯(lián)。那么在關(guān)系維度上的相似用戶至少能反應(yīng)他們在某種因素上的一致性。

(5) 識別關(guān)系圈:從關(guān)系圖譜的本身的結(jié)構(gòu)出發(fā),從中發(fā)掘關(guān)聯(lián)緊密的群體,有助于信息的精準投放和推廣。

以上關(guān)于關(guān)系建模的任務(wù)可以看作是逐步深入的,從“個體”-->“關(guān)聯(lián)”-->“相似”-->“群體”的逐漸深入。

3.3 行為維度

分析用戶的行為,建立行為模式有兩個任務(wù):針對典型個體行為進行時序分片,分析用戶成長的相關(guān)因素;針對典型群體的行為進行統(tǒng)計,構(gòu)建其行為模型。

(1) 典型個體的行為時序分析

所謂典型個體是指某段時間內(nèi),成長比較突出的微博用戶。例如從一個新用戶從新注冊到粉絲過百、過千需要有一個積累過程,有些用戶積累較快,有些較慢,而這些積累較快的用戶可以作為典型個體;或者某些用戶在某一階段傳播力有限,但在某時刻傳播力激增,無論是互動還是內(nèi)容傳播覆蓋面都變化很大,這種也可以作為典型個體。

針對典型個體,需要挖掘與其用戶成長相關(guān)的行為因素?;痉椒ㄊ菍r間進行分片,獲取用戶在不同時間片上的行為統(tǒng)計,以及在各個時間分片上的用戶成長指標(粉絲數(shù)、互動率、傳播力等),如圖2所示。在此基礎(chǔ)上針對用戶行為的統(tǒng)計量的變化,利用關(guān)聯(lián)性分析或回歸來分析用戶成長與哪些因素有關(guān)。

圖2 時間分片上的用戶行為統(tǒng)計

(2) 典型群體行為模式分析

針對典型個體,從用戶的基本信息、人口信息、興趣維度,可以將相似的典型用戶劃分為同一的群體,稱作典型群體,針對典型群體中的用戶按照成長程度進行劃分,按不同的成長階段統(tǒng)計用戶行為,即建立了該典型群體的行為模型。

例如,對于“北京,年齡在20~30歲,女性,電商領(lǐng)域,普通賬號”這樣的典型群體,從粉絲數(shù)、傳播力、互動率等維度將其劃分到初創(chuàng)、成長、快速提升、成熟……等階段,針對不同成長階段內(nèi)的行為組合進行統(tǒng)計,結(jié)果構(gòu)成該群體的行為模式。

4 小結(jié)

構(gòu)建用戶模型是社交媒體中的基礎(chǔ)工作,涉及到數(shù)據(jù)、統(tǒng)計、挖掘等各方面的技術(shù)和手段。本文針對微博的特點和業(yè)務(wù)需要,針對其中的用戶模型構(gòu)建的目標和任務(wù)進行了簡述。全文并沒有涉及具體的方法和原理,后續(xù)會有相應(yīng)的技術(shù)文章進行介紹。

需要指出的是,不同于傳統(tǒng)互聯(lián)網(wǎng)媒體,微博作為社交媒體最大的優(yōu)勢在于引入了非對等的用戶關(guān)系,這種關(guān)系不僅令傳播更加高效,也令考慮關(guān)系因素成為了用戶建模中(無論是在屬性、興趣、社交還是行為維度上)非常重要手段。

想要進一步了解相關(guān)內(nèi)容可關(guān)注——微博:wbrecom    公眾號:微博推薦平臺

責(zé)任編輯:王雪燕 來源: 51CTO
相關(guān)推薦

2016-03-17 16:00:51

新浪微博用戶模型

2013-07-09 10:44:05

PowerShell

2020-06-02 16:38:24

華為

2015-10-10 11:09:48

NFVNFVI網(wǎng)絡(luò)虛擬化

2021-04-07 15:55:35

微信朋友圈技巧

2021-08-22 15:02:51

Windows 10Windows微軟

2021-07-18 22:31:29

微信功能手機

2011-06-02 16:04:34

URL權(quán)重

2023-04-23 09:28:00

模型開源

2011-12-12 13:26:37

新浪微博

2010-12-06 14:53:26

博雅英杰

2013-08-19 15:00:53

微信易信

2009-10-27 09:05:44

Windows 7進程查看

2024-03-12 09:34:01

2023-04-26 07:56:45

大模型機器學(xué)習(xí)

2022-07-05 11:16:47

企業(yè)數(shù)字化安全陋習(xí)

2019-08-09 14:20:46

微信軟件手機

2013-07-01 18:34:47

個推案例新浪微博

2020-12-25 10:55:13

Windows軟件辦公

2020-12-18 09:17:31

電腦軟件工具
點贊
收藏

51CTO技術(shù)棧公眾號