自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

老王帶你搞定社交網(wǎng)絡分析

大數(shù)據(jù)
其實,人與人之間的關系往往錯綜復雜,何不讓數(shù)據(jù)模型幫你挖掘一下,找出打入阿花朋友圈的最短路徑?

 [[173563]]

 

 

程序員老王對隔壁公司的美女經(jīng)理阿花十分仰慕,雖然他們常常在寫字樓電梯間偶遇,最多也就是點頭問好,但怎樣才能名正言順和阿花在工作以外的時空產(chǎn)生交集?其實,人與人之間的關系往往錯綜復雜,何不讓數(shù)據(jù)模型幫你挖掘一下,找出打入阿花朋友圈的最短路徑?本期就讓老王帶你了解社交網(wǎng)絡分析(SNA)。

社交網(wǎng)絡分析究竟是干嘛的

社交網(wǎng)絡分析(Social Network Analysis) 最早是由英國著名人類學家拉德克利夫-布朗(Radcliffe-Brown)在對社會結構的分析關注中提出,是理解人類(可延展為任意主體)各種關系的構成、交互模式以及信息傳播規(guī)律的分析方法,使用技術包括離散數(shù)學、隨機過程、社會學、管理學、心理學等多學科的融合理論和方法。

上面這段太玄乎了,我們實在點,搞懂了SNA,你可以解決這幾種問題:

可達性問題

如果你有全城人的電話通訊錄,SNA可以告訴你某人和阿花是否認識,即使TA的電話本里沒有阿花的電話;

老王到阿花可能有多種聯(lián)系方式,找到途徑節(jié)點最少的那條。

傳播問題

老王的朋友圈里,有三個是Fintech精英,年薪百萬,還有兩個賭徒,他還有一個叔叔是被法院通告的老賴;能否估計老王經(jīng)濟狀況,信用風險?

廣告投放給誰傳播效率***?你關注的大V是真的傳播力驚人還是八十萬水軍教頭?公司里誰是八卦源頭?

演進問題

你在Linkedin 上更新了職位,是不是收到了很多新的人脈介紹?Linkedin 是怎樣優(yōu)化推薦算法幫你打入新圈子?

公司從10人打拼到500人,人事結構經(jīng)歷怎樣變化?如何優(yōu)化組織的人力結構?怎樣從郵件交互中識別誰是拍板的,誰是跑腿的,誰是活稀泥的?

社交網(wǎng)絡基本要素

為完成以上目標,我們要用圖語言來描述問題和建模,不用擔心,大部分是非常符合直覺的概念。

  • 節(jié)點(Node):節(jié)點是指要分析的物體,每一個物體就是一個節(jié)點,比如在Social Network中每個人就是一個節(jié)點。
  • 邊(Edge):Graph中兩個節(jié)點間的連線,用于表示兩個節(jié)點的關系。比如在Social Network中兩個人的關注關系,微博傳播中轉(zhuǎn)發(fā)關系。
  • 圖(Graph):圖是用來表示一組物體之間的關系的方式。有向圖(Directed Graph):邊代表的關系具有方向的圖。比如微博的關注關系,電話撥入呼出,銀行轉(zhuǎn)賬收賬就是有方向的。無向圖(Undirected Graph):邊代表的關系沒有方向的圖。
  • 度(Degree):節(jié)點的度是指與其相連的邊數(shù),你通訊錄的名單長度就是你的聯(lián)絡人度數(shù)。
  • 輸入度(In-degree):有向圖中一個節(jié)點收到的邊。
  • 輸出度(Out-degree):有向圖中一個節(jié)點發(fā)出的邊。
  • 路徑(Route): 兩個節(jié)點之間經(jīng)過的邊和節(jié)點序列,路徑有長度,通常衡量兩個點之間的距離。

社交網(wǎng)絡分析的應用

小世界(六度分隔):找對人

在日常生活中,有時你會發(fā)現(xiàn),某些你覺得與你隔得很“遙遠”的人,其實與你“很近”。小世界網(wǎng)絡就是對這種現(xiàn)象(也稱為小世界現(xiàn)象)的數(shù)學描述。用數(shù)學中圖論的語言來說,小世界網(wǎng)絡就是一個由大量頂點構成的圖,其中任意兩點之間的平均路徑長度比頂點數(shù)量小得多。除了社會人際網(wǎng)絡以外,小世界網(wǎng)絡的例子在生物學、物理學、計算機科學等領域也有出現(xiàn)。二十世紀60年代,美國哈佛大學社會心理學家斯坦利·米爾格倫(Stanley Milgram)做了一個連鎖信實驗。他將一些信件交給自愿的參加者,要求他們通過自己的熟人將信傳到信封上指明的收信人手里,他發(fā)現(xiàn),20%的信件最終送到了目標人物手中。而在成功傳遞的信件中,平均只需要6.5次轉(zhuǎn)發(fā),就能夠到達目標。也就是說,在社會網(wǎng)絡中,任意兩個人之間的“距離”是6。這就是所謂的“六度分隔”理論。

三元閉包:弱聯(lián)系會變成強聯(lián)系

這個是對網(wǎng)絡穩(wěn)定性的探討,是關于網(wǎng)絡演進非常基礎也很重要的一個認識。如果存在 a <-> b, b <-> c, 那 a <-> c 的期望會非常高 。在時間序列上對很多網(wǎng)絡的動態(tài)演進過程分析都驗證了這個觀點。對它的解讀也非常符合我們的日常認識:近墨黑,近朱赤; 愛屋及烏 等。

三元閉包在很多線上線下場景都有很多的應用。比如你在 Linkedin 上更新一下聯(lián)系人,會得到后臺很多聯(lián)系人推送,你會發(fā)現(xiàn)Linkedin 的推送節(jié)制而高效,既沒過分打擾,又能打開你的人脈,這種推送是基于三元閉包理論的。

[[173564]]

三種重要結構:環(huán)、簇、樹

環(huán)

三元閉包構成了一個最小的穩(wěn)定結構:包含3個節(jié)點的環(huán)(Loop)。 對一般社交網(wǎng)絡來說,環(huán)形結構不算特別。在有些場景,環(huán)形意味著風險和欺詐。

比如收集一個年度所有車輛受損和理賠案件信息,構成一個理賠網(wǎng)絡。因為車輛事故是低概率事件, 這個網(wǎng)絡必定是節(jié)點數(shù)量遠遠超過邊的數(shù)量的稀疏圖。如果在這樣的網(wǎng)絡里你能找到這樣的撞車-理賠鏈條:

這個鏈條就非??梢?,往往和團伙騙保相關。

除了環(huán)形(Loop),還有一種結構特別重要:聚集(Clique)。根據(jù)小世界理論,微弱的關聯(lián)可以讓全世界構成一個大的網(wǎng)絡,如果以路徑可達作為‘認識’ 的判斷標準,看起來感覺誰都認識,但是誰都不熟。 Clique 就是一個強連接的小網(wǎng)絡:如果一群人兩兩直接認識,這一群人構成一個Clique。舉個例子,產(chǎn)品部的同學們彼此認識,整個部門是一個Clique;產(chǎn)品部的小洪因為參加足球隊認識了開發(fā)部一眾兄弟,通過小洪同學,整個產(chǎn)品部都可以和開發(fā)部傳遞需求,但是產(chǎn)品部+開發(fā)部不是一個Clique,因為兩邊只要有一對人不能直接溝通就不算是Clique了。 說到這里Clique 的重要性就很明了。

樹形結構代表是人力資源圖,對大部分公司來說這都是僅限HR訪問的資源,有檢驗的人在公司結構圖中可以窺見很多信息:公司發(fā)展處于那個階段, 結構是否健康,資源傾斜在那個業(yè)務線,人力交叉情況,信息流通成本。

 

 

 

多數(shù)樹形結構都不是嚴格樹,存在環(huán)形和共享葉節(jié)點。嚴格樹形暗示這是個不同尋常的人事組織,比如邪教和傳銷組織,教主為了保持神秘性,傳銷頭目為了掌控自己的下線資源,往往有意控制人事網(wǎng)絡的結構,行成金字塔形, 并讓底部網(wǎng)絡盡可能隔離,避免下線自由交換信息,保持自己的控制力。這種網(wǎng)絡結構非常不自然,在正常的社交壓力下非常容易崩潰變形,只有通過洗腦,精神/金錢控制才能存在。

 

 

 

社交網(wǎng)絡分析難點在哪里

簡單說,非線性的模型都很難,而SNA玩的就是網(wǎng)絡,肯定難上加難。以上問題除了能一階判斷的可達性,沒有一個是簡單的。原因如下:

圖分析最壞情況通常很壞

考慮最簡單的可達判斷,如果原始關系是點對存儲 (a -> b), 想得到 (x -> y) 的結果需要遍歷完成。因為圖的結構特點,遍歷圖比遍歷列表,遍歷字典更難以預期。一個經(jīng)典的例子是小世界網(wǎng)絡(也叫六度分割),大意是地球上任意兩個人的社交距離不會大于6。反過來想就是:從一個人出發(fā),只要六次深度遍歷迭代就要訪問所有人的信息!為了判斷阿明是否認識阿花,如果我們不走運,可能要遍歷全城的人信息才能得出一個肯定的答案,而這差不多是SNA中最簡單的問題了(圖中右下方紅色路徑)!

[[173568]]

結構不穩(wěn)定

這也是和非線性結構相關的。拿身邊的例子說,滴滴 和 uber突然合并前,管理層一對姐妹花是認識的,少量員工可能在挖角中互換陣營也是認識的,但兩家公司構成的人員網(wǎng)絡大體上是分開的。隨著突然并購,兩家公司網(wǎng)絡迅速融合,任意兩個節(jié)點的可達性,關系路徑長度都發(fā)生了極大的變化。如果用臨時表存儲上述信息,這張大表在一天之內(nèi)的有效性就降低為零了。牽一發(fā)動全身形容網(wǎng)絡對微小變化的敏感實在太貼切了。

總結

由于在線社交網(wǎng)絡具有的規(guī)模龐大、動態(tài)性、匿名性、內(nèi)容與數(shù)據(jù)豐富等特性,近年來以社交網(wǎng)站、博客、微博等為研究對象的新興在線社交網(wǎng)絡分析研究得到了蓬勃發(fā)展,在社會結構研究中具有舉足輕重的地位。

今天說了這么多和社交網(wǎng)絡分析有關的原理和概念,想必老王這樣的老司機早就在碼代碼了。別著急!下期讓老王接著講講,如何規(guī)避上述社交網(wǎng)絡分析的難點,并著重講講其在現(xiàn)實場景中的應用。

責任編輯:趙寧寧 來源: 36大數(shù)據(jù)
點贊
收藏

51CTO技術棧公眾號