【数据侦探】双11天猫数据的争议
由于天猫双十一的全天销售额,几乎完美地分布在三次回归曲线上,网上有质疑:阿里对销售额数据进行了人工修饰,存在造假。
这个拟合度0.9996,确实非常高。
即使采用线性拟合,拟合度也比较高。
对此,阿里方面也给出了一些解释,比较有代表性的是蚂蚁金服陈龙的说法:
这里是陈龙给出的美国GDP数据拟合的放大图:
验证一下,确实如此:
不过,美国GDP这个例子很好解释,数据的体量大,增长率的波动小,数据接近平滑的直线,所以容易拟合。但双11的天猫销售数据,就不是这样了。
这是美国GDP的增长率:
而双11的天猫销售数据,按每年增量来看,消除基数后,依然有着较高的拟合度:
很难从散乱的宏观经济数据中,找到双11天猫这样平滑的增长曲线。因此,陈龙这个解释,说服力是不够的。
不过,如果要咬定阿里数据造假,目前没有任何凭据。
但一些观点指出,销售量是一定范围内可控的,可通过促销节奏、流量分配、客户压货、员工买单等方式进行过程控制,从而带来必然的结果把控。
这种观点是有道理的,如果这是真的,证明阿里的运营控制力,确实非常厉害,令人敬畏。
但如果要通过阿里的数据看中国经济,关键是天猫每年交易额的数据,而不是双11一天的数据,如果只考核这一天的KPI,就太形式化了。双11这一天,通过优惠、红包等方式促销,销售数字保持大幅增长,并不足以证明消费能力提高。年度数据才更说明问题。
因此,尽管“阿里数据造假”的观点毫无根据,但认为质疑这个数据就是唱衰中国经济,恐怕也不成立。
双11销售额的增长,总会遇到一个上限,迎来拐点的。希望阿里等中国电商,能摆脱形式化的考核目标,避免复杂难懂的促销,把更多直接的实惠带给消费者。