自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

豆瓣的電影評分靠譜嗎? —— 一點數(shù)據(jù)分析的視角

企業(yè)動態(tài)
在我們選擇觀看電影時,很多人是靠評分去選擇,那么豆瓣電影的評分是否可靠?會不會存在一些國內(nèi)外評價差異比較大的電影?

不知道有沒有同學(xué)看過白日夢想家這部電影?之前看了這部片子,但覺得并不好看,8.3應(yīng)該是有些偏高了??戳薎MDB,評分也只有7.3 ,并不像豆瓣這樣高(下圖),似乎國內(nèi)外評價差別還挺大的。

[[188870]]

而且,在爛番茄上還能看到截然相反的短評,有的人覺得這是導(dǎo)演“令人滿意的答卷”,有的卻說這部電影"令人失望(disappointing)" (下圖)

白日夢想家影評

另一方面,豆瓣上同樣8.3分的電影,比如國王的演講,她,我都覺得挺好看的,IMDB也都達到了8分的水平。于是就想問,豆瓣電影的評分是否可靠?會不會存在一些國內(nèi)外評價差異比較大的電影?

 

一、數(shù)據(jù)概況

對Movieinsider 2008-2014國外上映的電影的榜單(北美為主)做了抓取,拿到豆瓣和IMDB的評分, 總共2000+部,包含了很多我們耳熟能詳?shù)碾娪? ,比如蝙蝠俠黑暗騎士、星際穿越、觸不可及等等(下圖)。不過這次我們不做一般性的電影分析,所以這里就先略過啦

對Movieinsider 2008-2014國外上映的電影的榜單(北美為主)

二、豆瓣和IMDB的整體比較

1. 整體分布比較

做出兩者評分的的頻數(shù)直方圖如下,

豆瓣和IMDB的整體比較

可以發(fā)現(xiàn)

 

  • 豆瓣和IMDB的整體分布相似,大致呈正態(tài)分布,說明使用的數(shù)據(jù)量基本足夠。
  • 豆瓣的高分區(qū)偏高,在8-10分的電影比IMDB多許多。

另外,我們還拿到了Metacritic (國外另外一個比較有名的電影評分網(wǎng)站,區(qū)別是有專門的電影評論家打分)的評分,

Metactritic的評分

可以發(fā)現(xiàn)Metactritic的評分是關(guān)于5完全對稱的,這是因為他們的分數(shù)是經(jīng)過后期調(diào)整、加權(quán)的原因,而豆瓣和IMDB就很接近。

 

接下來,選取豆瓣和IMDB評分人數(shù)同時大于5000的電影進行比較 ,盡量保證評分具有參考性,不會因為打分的人太少,而使分數(shù)不客觀。

2. 分數(shù)比較

用X-Y散點圖比較會較為直觀,橫坐標是豆瓣評分,縱坐標是IMDB評分,并做出兩者的回歸線和1:1直線(下圖)。這里,回歸線代表IMDB和豆瓣評分的大致關(guān)系。1:1線以上,為豆瓣評價低于IMDB的;1:1線以下,為豆瓣評價高于IMDB的,

IMDB和豆瓣評分的大致關(guān)系

散點圖為交互式的,地址:http://lab.wentu.io/movie/wentu_movie_study.htm

 

可以發(fā)現(xiàn)

  • 豆瓣和IMDB的評分高度相關(guān)。從回歸線可以看出,兩者評分高度相關(guān),一個評分高,另一個也會高。也就是說,盡管電影評分是非常個人化的事情,每個人對電影的評價會有所差別,但是放到豆瓣和IMDB的大用戶量下,評分的大眾性很強,國外和國內(nèi)是很接近的。
  • 存在一個低分區(qū)。從圖中可以看出,確實有一些電影豆瓣評分偏高,圖中已經(jīng)標出,集中在[4, 6分]區(qū)間

然而,不可忽略的是,豆瓣和IMDB的打分機制是不同的 ——

  • IMDB: 10星制
  • 豆瓣: 5星制

當面對10分滿分的時候,碰到一部好電影,我們很難直接給出10分的滿分,給8分就很高了。而在豆瓣上,面對5分的滿分時,給4、5分都是很容易做到的。因此,豆瓣的8.5+有可能和IMDB上的7.5+是對等的,兩者的分數(shù)并不能像上面這樣簡單的相比,怎么辦?

3. 分位數(shù)(排名)比較

為了減小評分機制的影響,我們比較分位數(shù)(下圖),即將電影按照分數(shù)排名,最高為100%,最低為0%,重新繪圖如下。陰影部分為排名差值小于20%的區(qū)域,落在這個區(qū)域內(nèi)的電影,可以認為豆瓣和IMDB的評價差異較小。

交互式圖表地址: http://lab.wentu.io/movie/wentu_movie_study.htm

 

可以發(fā)現(xiàn)

  • 兩者評分依然高度相關(guān), 回歸線的變化在10%以內(nèi)。也就是說,兩者實際很接近,豆瓣的評分還是挺靠譜的。像最開始提到的白日夢想家,排名分別為89%和80%, 差別存在但是并不大。
  • 盡管從回歸線來看,兩者接近,但有不少電影分布在陰影兩側(cè),存在不少評價差異大的電影。比如美食祈禱戀愛、賽車總動員,里約大冒險等電影(下圖),這是我們感興趣的東西,下面我們具體分析。
  • 美食祈禱戀愛、賽車總動員,里約大冒險等電影

三、深入分析

1. 電影類別的影響

像上面說的,發(fā)現(xiàn)美食祈禱戀愛、賽車總動員,里約大冒險的評價差異挺大。那么,有沒有可能因為豆瓣上的用戶比較文藝、小清新,所以對于愛情、動畫類的電影,評價比較高?

交互式圖表地址: http://lab.wentu.io/movie/wentu_movie_study.htm

我們將電影按類別分析,如上圖??梢园l(fā)現(xiàn)劇情、動作、愛情等等的差別其實都不大,但很明顯,動畫類電影的回歸線較1:1線整體向右偏移了不少。這里,我們可以計算每個類別的豆瓣和IMDB的平均差距 (下圖),可以發(fā)現(xiàn)動畫類電影平均排名高了10%,豆瓣和IMDB的評價確實有較大差異。

每個類別的豆瓣和IMDB的平均差距

2. 國家的影響

 

我們也可以看一看國產(chǎn)電影和國外電影的差距(下圖)。不過,由于在海外上映的中國電影很少,這個時候的回歸線已經(jīng)失去了意義,這里我們只討論電影個體??梢园l(fā)現(xiàn)中國電影的分散程度,較英法德日等國家要大得多。

(1) 文化差異可能是一個很大的影響因素

 

可以看到新少林寺, 赤壁IMDB的評分比豆瓣高不少,而讓子彈飛, 一代宗師IMDB的評價卻比豆瓣要低不少(下圖)。這是一個很有意思的現(xiàn)象,畢竟,在國內(nèi)很少會有人說赤壁比讓子彈飛好看,一代宗師也比新少林寺出名多了。

交互式圖表地址: http://lab.wentu.io/movie/wentu_movie_study.htm

 

這可能是文化差異的原因。對于外國觀眾,由于東方文化的異域魅力,所以分數(shù)會有加成(比如新少林寺);但同樣,由于文化隔閡,一些國外觀眾不理解的電影(比如讓子彈飛、一代宗師),也不會給出特別高的分數(shù)。類似的現(xiàn)象,也出現(xiàn)在以前的英雄、十面埋伏等電影中。當然,不單單是外界對國內(nèi)的電影理解有差異,我們對國外的電影評價也有不同。比如007天幕殺機,我們由于文化背景的不同,也很難給出同樣高的評價(下圖)。

英雄、十面埋伏等電影

其實這也說明了,IMDB或者豆瓣的評分,也不是絕對客觀的。對于不同的文化、受眾群體,會有不同的偏好。

(2) 好電影始終會有好分數(shù)

說了這么多評價差異大的電影,很容易誤以為咱們的電影評價差異都很大。其實像金陵十三釵、葉問、投名狀等電影,雖然國內(nèi)外的評價差別稍大,但在兩者的排名中,始終都是好電影(下圖)。也就是說,好電影,始終會有好分數(shù)。

好電影始終會有好分數(shù)

四、評價差異最大的電影是什么?

好電影始終會有好分數(shù)

最后,留一個小小的競猜環(huán)節(jié)。賈斯汀·比伯:永不言敗(Justin Bieber: Never Say Never, 上圖)豆瓣的評分是6.3, 請猜一下,這部粉絲電影的IMDB的評分是多少呢? IMDB鏈接

 

這不由得讓我想到了郭敬明同學(xué)的小時代,看來國內(nèi)外網(wǎng)友,在這點上還是挺類似的,嘿嘿

五、結(jié)論

(1) 豆瓣和IMDB評分的分布很接近。在弱化產(chǎn)品評分機制的影響后,兩者差別很小。

(2) 對于動畫類電影,豆瓣評分存在相對IMDB偏高的現(xiàn)象

(3) 對于國內(nèi)的電影,國內(nèi)外評價確實有差別,文化差異可能是主要的原因,但總體也是好片較好,差片較差。同時,也不能因為IMDB的評分高低,直接去否定某些電影的價值。

【本文為51CTO專欄作者“數(shù)據(jù)冰山”的原創(chuàng)稿件,轉(zhuǎn)載請通過作者微信公眾號(shujubingshan)獲取聯(lián)系】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2018-03-20 14:40:58

Python爬蟲豆瓣影評

2017-01-05 18:39:35

數(shù)據(jù)分析大數(shù)據(jù)時代分析報告

2023-11-05 15:09:35

模型AI

2024-01-29 00:33:15

數(shù)據(jù)分析業(yè)務(wù)

2024-05-20 13:20:35

數(shù)據(jù)分析業(yè)務(wù)程序

2024-01-23 08:00:00

區(qū)間評分法電影評分算法

2021-04-19 14:18:17

數(shù)據(jù)分析互聯(lián)網(wǎng)運營大數(shù)據(jù)

2018-01-29 16:29:35

數(shù)據(jù)開發(fā)從業(yè)

2012-10-22 11:14:05

SDNOpenFlow網(wǎng)絡(luò)管理

2023-05-08 00:01:29

數(shù)據(jù)分析指標標簽

2015-12-29 10:10:04

私有云虛擬化公共云

2013-07-19 10:29:54

大數(shù)據(jù)數(shù)據(jù)挖掘

2015-06-17 14:44:36

大數(shù)據(jù)填高考志愿

2020-07-27 15:01:59

大數(shù)據(jù)人工智能高考志愿

2017-09-27 13:42:42

數(shù)據(jù)庫MySQL斷電恢復(fù)

2014-12-30 10:20:24

飛機WiFi

2019-03-21 12:10:56

騰訊管理年輕化

2014-02-11 09:25:09

2015-09-21 13:39:30

2019-06-28 15:54:49

大數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號