大数据解读《流浪地球》豆瓣评分为何从8.5分降至7.9分

截止到今天,《流浪地球》总票房已经突破40亿,成为中国影史票房第二的作品。与此同时,流浪地球在豆瓣上的评分也从8.5下降到7.9,两者的背离引发的讨论,其热度完全不亚于《流浪地球》内容本身的讨论。

但事实上,这个下跌,从8.5到现在的7.9,或许并没有什么特殊的。

1,许多电影上映后都出现了豆瓣分数逐渐下跌的现象。四部春节档电影,分数下跌也都不比《流浪地球》少。

抓取的豆瓣数据,在2018年的电影里,《唐人街探案2》、《超人总动员2》、《李茶的姑妈》、《神奇动物:格林德沃之罪》、《无敌破坏王2:大闹互联网》,都在上映一周内分数下降0.5。更别说我最喜欢的《海王》了,人家从8.5下降到了7.7,嘤嘤嘤(拜托可别在本答案下刷海王真难看的评论了)。

2,《流浪地球》的分数下降,和其他分数下降的电影一样,主要是由三星和四星的比例上升导致的。一星比例高达2%,而虽然偏离同等电影的正常水平,却对总分影响甚小。如下图所示,在当前的分数结构下,即使把2%的一星全部扔掉,平均分也只能增加0.1分。

500

事实上,豆瓣的抨击者并不是对这些数字一无所知。一开始,他们说豆瓣分数下跌不正常;过几天,他们承认分数下跌幅度或许正常,但一星比例高得不正常;再到后来,发现2%的一星比例对总分影响不大,但又认为豆瓣热评首页里差评太多……

总之,这个板子,是一定要打到豆瓣身上去了。

【已经花了300块钱购买了3张IMAX影票带全家去观看了《流浪地球》的】我觉得,因为对网站的评价不满意,就把板子打在豆瓣这个app身上,似乎也有些莫名其妙。毕竟一星的评分是用户自己去打的。热评首页中差评排序居多,那几万票「有用」也是用户自己投上去的。

比如豆瓣到现在还排名第一的左丘失明的长评——

500

人家确实有5.6万个踩,但也有4万多个赞,这不是一个小数字吧?

500

再比如对《流浪地球》的短评。上图是热评的前三名,第二和第三名都打了一星,加起来有10万个赞。其中排名第二的「嘟嘟熊之父」,现在有6.5万个赞,比一星期前增加了4万多个。

而《流浪地球》的一星评价数量,在同期只增加了1.5万个。

对「嘟嘟熊之父」的一星短评的赞同增量,远远多于实际的一星评价的增量。这意味着什么?

这意味着——很多人确实没有发表评论,也没有给《流浪地球》打一星,也许是因为打一星会显示在页面上。他们只是静悄悄地找到符合自己想法的评论,然后点了一个不能被别人看到的赞。

这让我想到2016年的美国总统大选,公开场合下大家都不喜欢特朗普,所有的民调都不看好特朗普,媒体也说特朗普这不好那不好,看上去希拉里民心所向……

然后特朗普赢了。

在大选时,因为不喜欢一个人而选择另外一个人是常见的现象,但对电影来说,不存在直接的反对机制。我不喜欢看这个电影,也没法卖空,也不会拼命去看另一部电影,这没意义。所以要是不喜欢一部电影,除了评论和在软件上打分,其他也啥都做不了。

因此,战场才汇聚到了豆瓣身上。

但正如希拉里败选后没法去怪罪大选制度一样,因为豆瓣上的差评在首页排名很高就去怪罪豆瓣的话,还不如去想一下,那些让你们看不顺眼的一星差评,为啥会拿到6.5万个、4万个、3万个【有用】

把这几万个点赞全部当成【牧羊犬】【跪久了】,说几句【尔曹身与名俱灭】之类的漂亮话,对理解这个问题,有帮助吗?

短评第一名是5.6万个【爱国者】,短评第二名是6.5万只【牧羊犬】,很让人高兴吗?

这篇文章从这里才真正开始。我们想要研究的一个问题是——豆瓣的用户,和真正去看电影的用户,究竟有什么不一样?为什么会不一样?这样的差异会造成什么?

首先,我们给每一部电影做一个用户画像。

电影的用户画像并不好做,首先,在线购票的比例虽然到了九成,但并不知道这些票都是给谁买的。其次,对在线购票者本人来说,他们的画像也不一定准确。


因此,我们使用人口普查分区县数据和各区县的票房和人次数据来完成这个画像,步骤如下:

500

500

500

选取2012到2018年所有观影人次在1000万以上的电影,将三个数值分别作为一个三维空间的x、y和z轴作图,可得下图:

500

在上面的三维坐标中,大于零的部分表示性别越偏男性/教育越高/年龄越小 越偏好于这部电影。用观影人次排名前20的电影举例,具体表格如下:

这个算法准不准呢?我们可以做一个检验,看每一个点的最近的邻居分别是谁——两个在三维空间里距离较短的点,说明两者的观影人群十分类似。我们实验了四部不同类型的电影,分别找到离这四部电影最近的5个点,结果如下:

500

可以看到,在空间上最接近的几个影片有相同的观众偏好,一般也处在同一个范畴内。比如到《复仇者联盟2》距离最近的5部电影,有4部是漫威出品;在距离《熊出没·变形记》最近的5部电影中,有4部都是熊出没的系列片。

从直觉上看,这个算法还是能非常准确地将电影给划分开来的。

特别有趣的是《战狼2》,距离他最近的五个点分别是——

1,小时代3:刺金时代

2,小时代4:灵魂尽头

3,美人鱼

4,捉妖记

5,小时代:青木时代。

这说明《战狼2》的观影人群画像,和《小时代》系列是十分类似的。特别让人惊讶的是,和我们的印象不同,《小时代》的性别系数和《战狼2》一样,都是正的,说明男性越多的地区,反而越偏好《小时代》。

而且我们可以看到一个现象——和战狼2最接近的几部电影,都创造了票房佳绩。

每一部小时代都是当年票房的佼佼者,到了《美人鱼》和《捉妖记》,这个偏好的观众人群创造了当年的票房冠军,更别提《战狼2》了,他创造了中国影史票房冠军。

这个现象也提出了本文的第二个问题——我们应该拍摄什么样的影片,吸引什么画像的人群,才能尽可能吸引更多观众来观影?


我们将性别、教育和年龄这三个指标分别和观影人次的对数作图,可以得到下面三张图:

500500500

从上面三张图中,我们可以看到:

1,过于偏向某一种性别的电影,不会有很好的票房,只有性别处在中间的时候,票房才更高。

2,让年龄太低或者年龄太高的人特别喜欢的电影,票房也不会很高,也需要针对中间值来确定观众的偏好。

3,和性别、年龄的图中出现的先上升、再下降的图不同,教育水平的偏好关系和观影人次似乎并没有一个明显的峰值,而是随着教育提升,单调下降——越让高教育人口喜欢的电影,票房越低

我们将上面的第三张图分成2015、2016、2017和2018年,可以看到一个更明显的趋势——

500

上面四条线的斜率,一年比一年大,这意味着低教育偏好的电影,带来的观影人次一年比一年高。

2015年和2016年时,低教育偏好的电影和高教育偏好的电影,在观影人次上还差不多,从2017年开始两者的关系变为显著负相关,系数为-0.17,在5%水平上显著。

2018年,低教育偏好能带来更高票房,系数已经达到-0.22,在1%水平上显著。

这意味着电影的目标观众教育水平越低,该电影的票房越高,而且两者的相关程度还在不断上升。

为什么会这样?答案非常简单——高教育人口,已经不能贡献增量票房了

我们将中国3000多个区市县按照其平均教育水平分为四个部分,分别是平均教育年限大于12年(全国前百分之1%水平)、10.9年到12年之间(全国前1%到全国前10%)、9.6年到10.9年之间(全国前10%到全国前25%)、9.6年以下(全国后75%水平),他们在2012到2018年的观影人次如下图所示:

500

从上图可以看到,在教育水平最高的地区,观影人次从2015年到2018年已经下降了6%!

教育水平次高的地区也有同样的现象,从2015到2018年只上升了5%。

而平均教育年限在9.6年以下的地区,从2015到2018年的观影人次上升了55%

随着中国的电影院在发达地区饱和,并向三四线城市蔓延,未来如果有人能够对电影票房产生新的贡献,那么他们一定是三四线城市的人群。

因此,新的卖座电影,必然是为这批观众量身定做的电影。


回到一开始的问题——为什么会许多电影的豆瓣电影评分逐渐降低?那些豆瓣评分逐渐降低的电影,和电影本身的目标人群特征有什么关系?

我们将豆瓣分数动态变化数据和我们用票房数据计算出的每一部电影的偏好链接在一起,看哪一个维度的指标和豆瓣的评分降低有关。

结果,只有一个指标有显著相关性,他就是一部电影目标人群的教育水平和电影偏好的系数。

500

上图是豆瓣评分和电影倾向观众的教育年限之间的关系。可以看到,越倾向于高教育地区的电影,在豆瓣上都有越高的评分。

500

上图是豆瓣开分和十天后的评分差额与电影倾向观众的教育年限之间的关系。散点图的相关性在1%的水平上显著,说明电影的目标观众人群越倾向于低教育人口,豆瓣给他的评分下降就越多。

其中,位置在最上方,分数提高最多的电影是《无问西东》,豆瓣开画6.7分,到第十天是7.7分(目前是7.5分),票房为7.5亿。

而分数降低最多的是《后来的我们》,豆瓣分数从一开始的7.1,降低到第十天的5.9(目前仍为5.9),票房为13.6亿。

最后理顺所有的故事:

1,从2015年开始,那些比较发达、平均教育水平比较高的地区,观影人次达到饱和,出现增长停滞,甚至下降。而那些欠发达、平均水平比较低的地区,观影人次持续增长。

2,欠发达地区人口偏好度更高的电影,能够带来更高的票房,且两者关系逐年增加。而豆瓣对这批欠发达地区偏好的电影更为苛刻,他们虽然常常拿到很高的票房,但是豆瓣评分却往往逐渐降低。

3,电影的提供者当然会优先满足快速需求的增长。在这种趋势下,我们未来将看到更多为这批快速增长的欠发达地区观影人群量身打造的电影。

4,除非豆瓣的构成和中国观影人群的构成一样快速转变,否则,随着电影供给向欠发达地区的偏好逐渐倾斜,豆瓣评分走低但票房又同时走高的现象,将会越来越频繁地出现。

站务

全部专栏