淘宝数据问题 我从曲线拟合角度简单说说

我就是余亮说的工业情怀党,工程师出身,一贯不喜欢现在媒体,小编,还有文科生。

淘宝数据这个事情,大家一看到什么三次项拟合度达到99.99%,第一反应就是数据造假,这就是不懂数学建模,不懂函数拟合,不懂S曲线的毛病了,这就是为什么我一贯讨厌现在很多煽动型自媒体及其追随者,蠢还不学习,一被忽悠就上当,精神世界一点点辨别力和防线都没有。

S曲线,是一个常用的曲线模型,可以用于用户预测,收入预测,产品生命周期,技术周期,城镇化水平,甚至人的体能等等好多东西。简单来说,就是一个事物的发展,有几个时期,缓慢成长期,加速期,降速冲顶期,衰退期,比如你以小黄车为例子,按照天为单位,把用户数画一个曲线,你会发现一个正态曲线,左半部分就是S曲线,右半部分的衰退可能很快甚至是断崖,但左半部分,一定是S曲线。

500

500

那么从成长期到加速器,迅猛增长的东西,很多可以呈现指数函数,包含有自然常数e,而e的本质物理意义就是最高效率的增长,不同指数函数,不同在e与时间轴的在函数式里面的不同位置,还有参数的不同。

任何一系列历史数据,都可以做函数拟合,画出一条吻合度非常高的曲线来,尤其这种比如收入增长,用户增长,带有一致特征的数据。然后你就得到一个曲线函数,里面有几个参数。

这几个参数,就包容了过去这段时间各种因素,比如宏观环境,经济,竞争,人的需求,政策等等吧,全部被参数包容了。

然后你就可以预测了, 就是把时间轴拉长,继续用这个函数和你已经得到的参数来计算。

那么,假如未来几年,宏观环境没太大变化,继续保持这个势头增长,那么很当然的,你的预测和实际达成吻合度会非常高,这一点都不奇怪,而且你计算的东西,样本数越大,基数越大,越容易准确,所以你会看到今天阿里的人出来澄清,提到了美国GDP和生猪, 这两个例子都不错。

那么是不是参数就一直准确呢? 不是, 当宏观环境大幅度变化,趋势就会变化,这就是S曲线的拐点,过了拐点,就变成幂函数或者对数函数, 就不能再用原来的指数函数预测了。但是很明显,阿里现在还没到拐点,从一个侧面也说明,在电商需求这块,仍然在迅猛增长,再深一层,说明我国内生动力还很充足,没有受贸易战很大冲击以至于影响到需求变化。

就这些吧,希望文科生能看懂。以后不要想当然的瞎下结论了。

顺及, 指数增长,S曲线, 正态曲线,再向下就是正弦曲线,这个世界,有很多客观规律的。

正如易经所言,潜龙勿用、见龙在田、终日乾乾、或跃在渊、飞龙在天、亢龙有悔,任何事物的发展都有阶段的。

20191113

全部专栏