自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用Python對(duì)微博熱搜做輿情分析

開(kāi)發(fā) 后端
通過(guò)詞云圖可以看出,人們圍繞這寒暑假這個(gè)詞討論的非常熱烈,學(xué)生和取消、行業(yè)等詞也被大量提及,我翻了翻評(píng)論,發(fā)現(xiàn)大部分人都是不想取消的。當(dāng)然志斌也覺(jué)得不要取消。

[[409639]]

大家好,我是志斌~

今天志斌看微博熱搜的時(shí)候,發(fā)現(xiàn)這樣一條熱搜。

我尋思,這要真的改了,真的炸鍋!所以志斌爬取了這條微博下的數(shù)據(jù),進(jìn)行了一個(gè)簡(jiǎn)單的輿情分析!

需要源碼的同學(xué),加志斌微信獲取哈~

一、數(shù)據(jù)采集

志斌在之前的兩篇文章中,詳細(xì)的介紹了如何獲取微博評(píng)論,有興趣的讀者可以看看這兩篇文章。這里志斌直接展示核心代碼了,代碼如下:

  1. for page in range(1,10000): 
  2.   if page == 1 : 
  3.       params = ( 
  4.           ('id''4654152979845247'), 
  5.           ('mid''4654152979845247'), 
  6.           ('max_id_type''0'), 
  7.       ) 
  8.   #s = requests.Session() 
  9.   response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params) 
  10.   a = response.json()['data']['max_id'
  11.   b = response.json()['data']['max_id_type'
  12.  
  13.   for i in response.json()['data']['data']: 
  14.       pinglunshijian = i['created_at'
  15.       neirong = re.sub(r'<[^>]*>''', i['text']) 
  16.       id = i['user']['id'
  17.       yonghumingcheng = i['user']['screen_name'
  18.       with open(r'71.txt''a', encoding='utf-8'as f: 
  19.           f.write(f'{neirong}\n'
  20.   params = ( 
  21.       ('id''4654152979845247'), 
  22.       ('mid''4654152979845247'), 
  23.       ('max_id', str(a)), 
  24.       ('max_id_type', str(b)), 
  25.        ) 
  26.   print(f'爬取第{page}頁(yè)數(shù)據(jù)......'
  27.   time.sleep(random.randint(1,3)) 

二、可視化分析

我們來(lái)對(duì)這些數(shù)據(jù)進(jìn)行可視化分析。本次繪圖使用的是Excel和Tableau兩款軟件。

1.點(diǎn)贊數(shù)top10用戶

我們發(fā)現(xiàn)橢圓圓子這個(gè)用戶所發(fā)表的評(píng)論點(diǎn)贊數(shù)最多,有9.5w+,下面讓我們看看它的評(píng)論是什么,竟然讓用戶這么喜歡。

這是一句純吐槽的話,點(diǎn)贊數(shù)這么多,可能是因?yàn)榘l(fā)的時(shí)間早,或者是引起了老師們的共鳴。

2.評(píng)論日期分布

從圖中我們可以清晰的看出,7.6號(hào)發(fā)表評(píng)論的人數(shù)最多,可能跟今天上熱搜有關(guān)系的原因,畢竟上了熱搜,曝光度就高了!

3.評(píng)論時(shí)間分布

對(duì)6號(hào)評(píng)論發(fā)布時(shí)間進(jìn)行分析,我們發(fā)現(xiàn)19點(diǎn)發(fā)表的評(píng)論數(shù)量最多,我當(dāng)時(shí)看到這條熱搜的時(shí)候,基本也是這個(gè)時(shí)間,看來(lái)熱搜對(duì)一個(gè)消息的影響還是很大的。

4.詞云圖

通過(guò)詞云圖可以看出,人們圍繞這寒暑假這個(gè)詞討論的非常熱烈,學(xué)生和取消、行業(yè)等詞也被大量提及,我翻了翻評(píng)論,發(fā)現(xiàn)大部分人都是不想取消的。當(dāng)然志斌也覺(jué)得不要取消。

三、小結(jié)

1. 通過(guò)分析我們可以看出,熱搜對(duì)每條微博的影響是巨大的。

2. 大家都不太愿意取消寒暑假。 

3. 本文僅供學(xué)習(xí)參考,不做它用。

 

責(zé)任編輯:武曉燕 來(lái)源: 志斌的python筆記
相關(guān)推薦

2021-08-09 14:47:44

微信表情移動(dòng)應(yīng)用

2019-07-12 10:20:45

海量數(shù)據(jù)搭建

2019-07-15 16:02:30

大數(shù)據(jù)數(shù)據(jù)分析輿情系統(tǒng)

2015-08-10 10:13:09

大數(shù)據(jù)

2017-08-09 09:19:30

2019-07-16 08:51:03

熱搜新浪微博數(shù)據(jù)

2021-06-02 22:18:11

Python關(guān)鍵詞微博

2023-08-31 07:30:09

AIGC代碼監(jiān)測(cè)

2023-05-22 09:42:12

AI檢測(cè)

2019-03-29 09:24:36

國(guó)內(nèi)程序員微博GitHub

2020-03-12 17:00:33

中科曙光

2014-07-18 09:51:05

挖掘數(shù)據(jù)分析

2019-11-17 22:40:35

AI 數(shù)據(jù)人工智能

2011-10-21 09:43:28

Python

2015-09-21 09:33:47

大數(shù)據(jù)數(shù)據(jù)分析

2020-12-28 10:30:06

微信移動(dòng)應(yīng)用

2011-08-30 14:48:02

2017-02-24 19:32:39

微博數(shù)據(jù)Python

2017-02-23 10:50:32

Python微博數(shù)據(jù)

2022-06-30 13:11:56

蘋(píng)果GPU處理器5G技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)