自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分最低的演員原來是……

大數(shù)據(jù) 數(shù)據(jù)分析
今天我們通過爬取豆瓣上近5000部有評分的國產(chǎn)電視劇(不包括港臺劇),對比一下劇集以及參演演員的評分情況。本次我們爬取的數(shù)據(jù)來源主要分為三個(gè)部分:分別是有評分的劇集列表、劇集評分及其他信息、演員信息。

前言:

隨著社會(huì)的發(fā)展,越來越多的電視劇出現(xiàn)在了電視的熒幕或是視頻網(wǎng)站。其中有許多的精品,例如經(jīng)久不衰的《西游記》《紅樓夢》,亦或是近年來口碑十分不錯(cuò)的《瑯琊榜》《白夜追兇》,然而也有一些電視劇,因?yàn)榉N種原因,并不是很盡如人意。

今天我們通過爬取豆瓣上近5000部有評分的國產(chǎn)電視劇(不包括港臺劇),對比一下劇集以及參演演員的評分情況。

01數(shù)據(jù)來源

本次我們爬取的數(shù)據(jù)來源主要分為三個(gè)部分:分別是有評分的劇集列表、劇集評分及其他信息、演員信息,對應(yīng)如下三個(gè)頁面:

PART1:劇集列表

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

PART2:劇集信息

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

PART3:演員信息

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

通過爬取以上三個(gè)頁面的數(shù)據(jù),我們可以獲得完整的電視劇評分及演員信息數(shù)據(jù),用于之后的數(shù)據(jù)對比及可視化,我們以爬取***部分的代碼為例,展示整體爬取思路:

  1. driver = webdriver.Chrome() 
  2. driver.maximize_window()     
  3. driver.close()  
  4. driver.switch_to_window(driver.window_handles[0])   
  5. url = 'https://movie.douban.com/tag/#/?sort=U&range=2,10&tags=%E7%94%B5%E8%A7%86%E5%89%A7,%E4%B8%AD%E5%9B%BD%E5%A4%A7%E9%99%86' 
  6. js='window.open("'+url+'")' 
  7. driver.execute_script(js) 
  8. driver.close()  
  9. driver.switch_to_window(driver.window_handles[0]) 
  10. while True
  11.   try:  
  12.     js="var q=document.documentElement.scrollTop=10000000"   
  13.     driver.execute_script(js) 
  14.     driver.find_element_by_class_name('more').click() 
  15.     time.sleep(2) 
  16.   except
  17.     break  
  18.  
  19. name = [k.text for k in driver.find_elements_by_class_name('title')]    
  20. score = [k.text for k in driver.find_elements_by_class_name('rate')]    
  21. url = [k.get_attribute('href'for k in driver.find_elements_by_class_name('item')]   
  22. pd.DataFrame({'name':name,'score':score,'url':url}).to_excel('電視劇名稱.xlsx'

02劇集對比

我們在劇集對比部分主要展示兩部分?jǐn)?shù)據(jù),首先是***5以及BOTTOM15的劇集評分及拍攝年代:

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

 

 


 

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

可以看到十分鮮明的對比,評分較高的劇集大多拍攝年份劇集都有一定的年頭,并且歷經(jīng)時(shí)間的考驗(yàn),愈發(fā)展示其獨(dú)特的魅力。相反,一些評分較低的劇集,往往都是近年來拍攝的,可能這也與劇集增多有關(guān)。需要提醒的是榜單中的《尋秦記》不是古天樂版本,那是經(jīng)典中的經(jīng)典,至于榜單中出現(xiàn)的版本,大家可以有機(jī)會(huì)親自去了解一下

正所謂沒有無緣無故的愛,也沒有無緣無故的恨,我們也選取了豆瓣當(dāng)中對于劇集的一些有意思的點(diǎn)評。通過點(diǎn)評,讓我們了解這些評分產(chǎn)生的原因:

TOP篇:

  • 許多年以后觀看發(fā)現(xiàn),其中造型與性格塑造***,準(zhǔn)確把握原著,時(shí)代影響力巨大,印象極其深刻。------《西游記》
  • 老一代影藝人是以一種虔誠的態(tài)度對待紅樓夢的,87版之后,世間再無真人版紅樓。------《紅樓夢》
  • 這就是我的圣經(jīng),思想啟蒙之作 ------《我愛我家》
  • 鞋兒破 帽兒破 身上的袈裟破 你笑我 他笑我 一把扇兒破 經(jīng)典 ------《活佛濟(jì)公》
  • 絕對是國產(chǎn)情景喜劇無法超越的***之作!其中每個(gè)角色都是無法復(fù)制的! ------《武林外傳》

BOTTOM篇:

  • 沒見到甜蜜,倒是這個(gè)演技每一秒都是暴擊 ------《甜蜜暴擊》
  • 現(xiàn)在還是有這么多粗糙的偶像劇,玩了幾十年的老套橋段還在用 ------《極光之戀》
  • 瞟了半集被嚇?biāo)懒?,演技跟癡呆似的= = ------《路跑甜心》
  • 劇情奇葩,演技浮夸,特技粗糙。一劇融合了以上的所有元素,導(dǎo)演簡直就是演藝圈的火鍋店老板 ------《來自星星的繼承者們》
  • 于媽拍的那版.....其實(shí)還挺好看的! ------《新笑傲江湖》

03演員對比

我們此次根據(jù)演員參演的劇集評分,考慮演員在其中角色的重要性進(jìn)行賦權(quán),結(jié)合劇集評論數(shù)量,加權(quán)平均得到每個(gè)演員的評分情況。首先是我們評選的評分靠前的演員及其出生年份:

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

估計(jì)大部分年輕的讀者,可能對這些名單中的演員很多都不是很熟悉,在此小編建議各位可以去看一下這些老戲骨的劇集,感受他們所散發(fā)的魅力。同時(shí)我們也專門對比了下80后、90后(包含00后)的評分,找尋其中的佼佼者:

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……


 

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

劉昊然在評分中領(lǐng)跑其他的90后,考慮到其今年只有20歲出頭,我們也期望他在未來能給我們帶來更多經(jīng)典的作品。

可能很多讀者對TOP20的演員并不是很熟悉,其實(shí)大可不必,因?yàn)橄旅娴陌駟沃邢嘈糯蠖喽紩?huì)是你所熟悉的:

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

想必看到這里,各位會(huì)找到熟悉的感覺,我們相信榜上的各位演員其實(shí)也是***潛力的演員。只要努力雕琢演技,未來一定會(huì)受到觀眾對其演技的認(rèn)可,我們同時(shí)分別對比了一下男、女演員:

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

在此需要指出的是,余文樂和趙又廷上榜并不是因?yàn)槠鋭〖u分真的偏低,主要是其參與的大陸制作劇集評分較低,并且我們此次沒有統(tǒng)計(jì)港臺劇。我們也希望榜單中的各位演員未來更加精彩的表現(xiàn)。

04星座分布

感謝豆瓣給我們提供了演員星座的數(shù)據(jù),小編周圍也有許多對星座十分感興趣的朋友,不妨我們看一下星座的分布情況:

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

看來星座整體分布還是比較平均的,只是天秤座和天蝎座略多于其他星座,關(guān)于星座,至于你信不信,反正小編是不怎么信的

關(guān)于矩形樹圖的實(shí)現(xiàn),可以參考以下代碼:

  1. from pyecharts import TreeMap 
  2. star_stat = actor_data.groupby('xingzuo').agg({'name':'count'}).reset_index().sort_values('name' 
  3.                              ,ascending=False)[0:12].reset_index() 
  4.  
  5. data = [{'value':star_stat['name'][i], 
  6.         'name':star_stat['xingzuo'][i]+' '+str(star_stat['name'][i])} for i in range(star_stat.shape[0])] 
  7.  
  8. treemap = TreeMap("星座分布圖", width=1200, height=600) 
  9. treemap.add("星座分布", data, is_label_show=True, label_pos='inside'
  10. treemap.render('星座分布.html'

05城市分布

我們在看完了星座分布之后,再繼續(xù)來看一下演員的城市分布,看看有多少自己的老鄉(xiāng)在參演著電視?。?/p>

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

不出意外,北京和上海兩大中心城市的演員數(shù)量也是最多的,而第三名就是小編的家鄉(xiāng)青島了。之前每當(dāng)小編提及青島,總是會(huì)提起青島的明星多,這次的數(shù)據(jù)更加使得小編未來有了交流(chuixu)的底氣。

我們下面分別來看一下TOP5的各個(gè)城市明星名單:

北京

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

上海

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

青島

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

哈爾濱

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

西安

縱觀30年5000多部國產(chǎn)電視劇,豆瓣評分***的演員原來是……

責(zé)任編輯:未麗燕 來源: Python與數(shù)據(jù)分析
相關(guān)推薦

2010-07-20 10:38:08

求伯君雷軍

2017-06-06 15:13:07

2022-12-14 07:32:40

InnoDBMySQL引擎

2014-03-12 07:23:36

掌閱iReader

2021-02-07 08:13:18

@DateTimeFo@NumberFormSpring

2024-03-04 12:32:04

2020-12-14 12:39:43

數(shù)據(jù)分析Netflix詞匯

2024-02-06 09:30:25

Figma矩形矩形物理屬性

2022-05-05 08:55:12

工業(yè)物聯(lián)網(wǎng)IIoT

2023-05-22 15:58:11

2018-04-02 15:13:21

網(wǎng)絡(luò)

2024-04-30 08:22:51

Figma圖形編輯變換矩陣

2023-02-15 08:17:38

2025-02-17 09:22:16

MySQLSQL語句

2021-02-02 09:13:11

索引SQL數(shù)據(jù)庫

2020-05-26 08:52:36

Java JVM多態(tài)

2009-03-10 12:42:45

2020-11-24 06:20:02

Linux日志文件系統(tǒng)

2015-12-25 11:34:25

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號