張華平:微博的大數(shù)據(jù)分析
2013年4月26日-27日,由51CTO傳媒集團(tuán)旗下WOT(World Of Tech)品牌主辦的2013大數(shù)據(jù)全球技術(shù)峰會(huì)在北京富力萬麗酒店召開。本次峰會(huì)將圍繞大數(shù)據(jù)基礎(chǔ)架構(gòu)與上層應(yīng)用的生態(tài)系統(tǒng),解決大規(guī)模數(shù)據(jù)引發(fā)的問題,探索大數(shù)據(jù)基礎(chǔ)的解決方案,激發(fā)數(shù)據(jù)挖掘帶來的競(jìng)爭(zhēng)力,讓數(shù)據(jù)發(fā)出聲音。51CTO作為本次峰會(huì)的主辦方,將全程視頻、圖文直播報(bào)道這場(chǎng)數(shù)據(jù)的盛宴,更多內(nèi)容請(qǐng)點(diǎn)擊專題:2013大數(shù)據(jù)全球技術(shù)峰會(huì)。
2013大數(shù)據(jù)全球技術(shù)峰會(huì)專題
在4月27日的互聯(lián)網(wǎng)與大數(shù)據(jù)專場(chǎng)論壇中,北理工網(wǎng)絡(luò)搜索挖掘與安全實(shí)驗(yàn)室主任張華平先生表了主題為“微博特征與行為的大數(shù)據(jù)挖掘分析”的演講。
張華平首先做了一段基本經(jīng)歷的描述,然后講述了隨著社交網(wǎng)絡(luò)的飛速發(fā)展,社交網(wǎng)絡(luò)大數(shù)據(jù)對(duì)人們生活的影響以及大數(shù)據(jù)的實(shí)際作用。張華平通過“見微”、“知著”、“曉意”三個(gè)層面舉出了人們對(duì)于“大數(shù)據(jù)”的片面的理解,并表達(dá)了自己對(duì)于“大數(shù)據(jù)”的觀點(diǎn)。
他指出社交網(wǎng)絡(luò)對(duì)人們的生活的影響,其中包括授課、購(gòu)物等等各個(gè)方面。
然后張華平又談到了他之前做過的對(duì)于新浪微博做過的具體的數(shù)據(jù)的調(diào)查。當(dāng)談到了微博數(shù)據(jù)的獲取,張華平稱4億微博用戶只有5%的用戶資料為有價(jià)值資料,并且分析了這些用戶中不同類型的用戶的不同的價(jià)值。然后分析了不同地區(qū)的微博用戶數(shù)量,其中各地區(qū)微博用戶數(shù)量與當(dāng)?shù)谿DP的增長(zhǎng)有正比關(guān)系。并逐步分析了微博的發(fā)布規(guī)律、粉絲規(guī)律、關(guān)注數(shù)規(guī)律等等。
通過一種影響力計(jì)算算法,并羅列了性別、是否加V認(rèn)證等具體數(shù)據(jù),對(duì)不同類型用戶的影響力進(jìn)行了分析。
然后又對(duì)許多具體的方面進(jìn)行了詳盡的分析,其中包括自我介紹文本挖掘,微博個(gè)性行為與建模 ,微博個(gè)性分析的交叉原理,微博博主的個(gè)性化分析,以及他對(duì)自己的微博個(gè)性化分析,原創(chuàng)與轉(zhuǎn)發(fā)的不同 ,張華平通過各種各樣的具體用戶數(shù)據(jù)分析,點(diǎn)透了大數(shù)據(jù)時(shí)代的點(diǎn)點(diǎn)滴滴,話題與情感,微博話題跟蹤,明碼暗語(yǔ)”識(shí)別,微博博主情緒感知。
張衛(wèi)平演講期間詼諧幽默,內(nèi)容通俗易懂,很大程度上調(diào)動(dòng)了現(xiàn)場(chǎng)觀眾的情緒,獲得了觀眾很高的反響。
以上是51CTO.com記者從一線為您帶來的精彩報(bào)道。后續(xù)我們還有更加精彩的獨(dú)家報(bào)道,敬請(qǐng)關(guān)注。