豆瓣的電影評分靠譜嗎? —— 一點數(shù)據(jù)分析的視角
不知道有沒有同學(xué)看過白日夢想家這部電影?之前看了這部片子,但覺得并不好看,8.3應(yīng)該是有些偏高了??戳薎MDB,評分也只有7.3 ,并不像豆瓣這樣高(下圖),似乎國內(nèi)外評價差別還挺大的。
而且,在爛番茄上還能看到截然相反的短評,有的人覺得這是導(dǎo)演“令人滿意的答卷”,有的卻說這部電影"令人失望(disappointing)" (下圖)
另一方面,豆瓣上同樣8.3分的電影,比如國王的演講,她,我都覺得挺好看的,IMDB也都達到了8分的水平。于是就想問,豆瓣電影的評分是否可靠?會不會存在一些國內(nèi)外評價差異比較大的電影?
一、數(shù)據(jù)概況
對Movieinsider 2008-2014國外上映的電影的榜單(北美為主)做了抓取,拿到豆瓣和IMDB的評分, 總共2000+部,包含了很多我們耳熟能詳?shù)碾娪? ,比如蝙蝠俠黑暗騎士、星際穿越、觸不可及等等(下圖)。不過這次我們不做一般性的電影分析,所以這里就先略過啦
二、豆瓣和IMDB的整體比較
1. 整體分布比較
做出兩者評分的的頻數(shù)直方圖如下,
可以發(fā)現(xiàn)
- 豆瓣和IMDB的整體分布相似,大致呈正態(tài)分布,說明使用的數(shù)據(jù)量基本足夠。
- 豆瓣的高分區(qū)偏高,在8-10分的電影比IMDB多許多。
另外,我們還拿到了Metacritic (國外另外一個比較有名的電影評分網(wǎng)站,區(qū)別是有專門的電影評論家打分)的評分,
可以發(fā)現(xiàn)Metactritic的評分是關(guān)于5完全對稱的,這是因為他們的分數(shù)是經(jīng)過后期調(diào)整、加權(quán)的原因,而豆瓣和IMDB就很接近。
接下來,選取豆瓣和IMDB評分人數(shù)同時大于5000的電影進行比較 ,盡量保證評分具有參考性,不會因為打分的人太少,而使分數(shù)不客觀。
2. 分數(shù)比較
用X-Y散點圖比較會較為直觀,橫坐標是豆瓣評分,縱坐標是IMDB評分,并做出兩者的回歸線和1:1直線(下圖)。這里,回歸線代表IMDB和豆瓣評分的大致關(guān)系。1:1線以上,為豆瓣評價低于IMDB的;1:1線以下,為豆瓣評價高于IMDB的,
散點圖為交互式的,地址:http://lab.wentu.io/movie/wentu_movie_study.htm
可以發(fā)現(xiàn)
- 豆瓣和IMDB的評分高度相關(guān)。從回歸線可以看出,兩者評分高度相關(guān),一個評分高,另一個也會高。也就是說,盡管電影評分是非常個人化的事情,每個人對電影的評價會有所差別,但是放到豆瓣和IMDB的大用戶量下,評分的大眾性很強,國外和國內(nèi)是很接近的。
- 存在一個低分區(qū)。從圖中可以看出,確實有一些電影豆瓣評分偏高,圖中已經(jīng)標出,集中在[4, 6分]區(qū)間
然而,不可忽略的是,豆瓣和IMDB的打分機制是不同的 ——
- IMDB: 10星制
- 豆瓣: 5星制
當面對10分滿分的時候,碰到一部好電影,我們很難直接給出10分的滿分,給8分就很高了。而在豆瓣上,面對5分的滿分時,給4、5分都是很容易做到的。因此,豆瓣的8.5+有可能和IMDB上的7.5+是對等的,兩者的分數(shù)并不能像上面這樣簡單的相比,怎么辦?
3. 分位數(shù)(排名)比較
為了減小評分機制的影響,我們比較分位數(shù)(下圖),即將電影按照分數(shù)排名,最高為100%,最低為0%,重新繪圖如下。陰影部分為排名差值小于20%的區(qū)域,落在這個區(qū)域內(nèi)的電影,可以認為豆瓣和IMDB的評價差異較小。
交互式圖表地址: http://lab.wentu.io/movie/wentu_movie_study.htm
可以發(fā)現(xiàn)
- 兩者評分依然高度相關(guān), 回歸線的變化在10%以內(nèi)。也就是說,兩者實際很接近,豆瓣的評分還是挺靠譜的。像最開始提到的白日夢想家,排名分別為89%和80%, 差別存在但是并不大。
- 盡管從回歸線來看,兩者接近,但有不少電影分布在陰影兩側(cè),存在不少評價差異大的電影。比如美食祈禱戀愛、賽車總動員,里約大冒險等電影(下圖),這是我們感興趣的東西,下面我們具體分析。
三、深入分析
1. 電影類別的影響
像上面說的,發(fā)現(xiàn)美食祈禱戀愛、賽車總動員,里約大冒險的評價差異挺大。那么,有沒有可能因為豆瓣上的用戶比較文藝、小清新,所以對于愛情、動畫類的電影,評價比較高?
交互式圖表地址: http://lab.wentu.io/movie/wentu_movie_study.htm
我們將電影按類別分析,如上圖??梢园l(fā)現(xiàn)劇情、動作、愛情等等的差別其實都不大,但很明顯,動畫類電影的回歸線較1:1線整體向右偏移了不少。這里,我們可以計算每個類別的豆瓣和IMDB的平均差距 (下圖),可以發(fā)現(xiàn)動畫類電影平均排名高了10%,豆瓣和IMDB的評價確實有較大差異。
2. 國家的影響
我們也可以看一看國產(chǎn)電影和國外電影的差距(下圖)。不過,由于在海外上映的中國電影很少,這個時候的回歸線已經(jīng)失去了意義,這里我們只討論電影個體??梢园l(fā)現(xiàn)中國電影的分散程度,較英法德日等國家要大得多。
(1) 文化差異可能是一個很大的影響因素
可以看到新少林寺, 赤壁IMDB的評分比豆瓣高不少,而讓子彈飛, 一代宗師IMDB的評價卻比豆瓣要低不少(下圖)。這是一個很有意思的現(xiàn)象,畢竟,在國內(nèi)很少會有人說赤壁比讓子彈飛好看,一代宗師也比新少林寺出名多了。
交互式圖表地址: http://lab.wentu.io/movie/wentu_movie_study.htm
這可能是文化差異的原因。對于外國觀眾,由于東方文化的異域魅力,所以分數(shù)會有加成(比如新少林寺);但同樣,由于文化隔閡,一些國外觀眾不理解的電影(比如讓子彈飛、一代宗師),也不會給出特別高的分數(shù)。類似的現(xiàn)象,也出現(xiàn)在以前的英雄、十面埋伏等電影中。當然,不單單是外界對國內(nèi)的電影理解有差異,我們對國外的電影評價也有不同。比如007天幕殺機,我們由于文化背景的不同,也很難給出同樣高的評價(下圖)。
其實這也說明了,IMDB或者豆瓣的評分,也不是絕對客觀的。對于不同的文化、受眾群體,會有不同的偏好。
(2) 好電影始終會有好分數(shù)
說了這么多評價差異大的電影,很容易誤以為咱們的電影評價差異都很大。其實像金陵十三釵、葉問、投名狀等電影,雖然國內(nèi)外的評價差別稍大,但在兩者的排名中,始終都是好電影(下圖)。也就是說,好電影,始終會有好分數(shù)。
四、評價差異最大的電影是什么?
最后,留一個小小的競猜環(huán)節(jié)。賈斯汀·比伯:永不言敗(Justin Bieber: Never Say Never, 上圖)豆瓣的評分是6.3, 請猜一下,這部粉絲電影的IMDB的評分是多少呢? IMDB鏈接
這不由得讓我想到了郭敬明同學(xué)的小時代,看來國內(nèi)外網(wǎng)友,在這點上還是挺類似的,嘿嘿
五、結(jié)論
(1) 豆瓣和IMDB評分的分布很接近。在弱化產(chǎn)品評分機制的影響后,兩者差別很小。
(2) 對于動畫類電影,豆瓣評分存在相對IMDB偏高的現(xiàn)象
(3) 對于國內(nèi)的電影,國內(nèi)外評價確實有差別,文化差異可能是主要的原因,但總體也是好片較好,差片較差。同時,也不能因為IMDB的評分高低,直接去否定某些電影的價值。
【本文為51CTO專欄作者“數(shù)據(jù)冰山”的原創(chuàng)稿件,轉(zhuǎn)載請通過作者微信公眾號(shujubingshan)獲取聯(lián)系】
戳這里,看該作者更多好文