【数据侦探】双11天猫数据的争议

由于天猫双十一的全天销售额,几乎完美地分布在三次回归曲线上,网上有质疑:阿里对销售额数据进行了人工修饰,存在造假。

500

这个拟合度0.9996,确实非常高。

即使采用线性拟合,拟合度也比较高。

500

对此,阿里方面也给出了一些解释,比较有代表性的是蚂蚁金服陈龙的说法:

500

这里是陈龙给出的美国GDP数据拟合的放大图:

500

验证一下,确实如此:

500

不过,美国GDP这个例子很好解释,数据的体量大,增长率的波动小,数据接近平滑的直线,所以容易拟合。但双11的天猫销售数据,就不是这样了。

这是美国GDP的增长率:

500

而双11的天猫销售数据,按每年增量来看,消除基数后,依然有着较高的拟合度:

500

很难从散乱的宏观经济数据中,找到双11天猫这样平滑的增长曲线。因此,陈龙这个解释,说服力是不够的。

不过,如果要咬定阿里数据造假,目前没有任何凭据。

但一些观点指出,销售量是一定范围内可控的,可通过促销节奏、流量分配、客户压货、员工买单等方式进行过程控制,从而带来必然的结果把控。

这种观点是有道理的,如果这是真的,证明阿里的运营控制力,确实非常厉害,令人敬畏。

但如果要通过阿里的数据看中国经济,关键是天猫每年交易额的数据,而不是双11一天的数据,如果只考核这一天的KPI,就太形式化了。双11这一天,通过优惠、红包等方式促销,销售数字保持大幅增长,并不足以证明消费能力提高。年度数据才更说明问题。

因此,尽管“阿里数据造假”的观点毫无根据,但认为质疑这个数据就是唱衰中国经济,恐怕也不成立。

双11销售额的增长,总会遇到一个上限,迎来拐点的。希望阿里等中国电商,能摆脱形式化的考核目标,避免复杂难懂的促销,把更多直接的实惠带给消费者。

站务

全部专栏