其实今年一直稳定运行的阿里云也出现两次崩溃了,应该都是大规模裁员的结果

【本文来自《滴滴:初步确定27日夜间发生的系统故障起因是底层系统软件发生故障》评论区,标题为小编添加】

优化裁员太多。把关键岗位的人弄没了,不能第一时间解决问题,结果导致服务互相调用,塌方式崩溃。然后就是崩溃12小时。注意不是简单上不了线,而是出错了。算错里程和金额。滴滴公司自己的运维晚上打不到车去公司解决问题。最后集体拉微信群。

其实今年一直稳定运行的阿里云也出现两次崩溃了。具体问题可能不同,但应该都是大规模裁员的结果。

大公司的程序代码都是一年一年积累下的屎山。底层一般是绝对不会动的,只能一层一层往上加。不是以前的代码多高级,而是代码结构是一座倒立金字塔,你动了下面一块砖,然后上面整个金字塔就塌了。

而且技术是不断迭代进化的,5年前的底层用的是水泥砖,现在上层用的是钢筋混凝土。新的工程师对怎么在钢筋混凝土上雕花很熟悉,但是对加强底层水泥砖就不熟了。

所以有些人,不是管理技术不行平常也没事做就是简单维护一下,公司营收跟他们毫无关系。就是资历老,工资高。等裁员时这些人当然首当其冲。不过这些人有一个优势,底层代码是他们自己写的,或者是师傅写的,或者负责维护了很长时间。出现问题能迅速定位快速解决,但是都是小毛病。

等大规模裁员时,他要正常传授经验要半年,交接要一个月,你让人两个星期滚蛋。谁还管你。

比较玄学的是,谁也不知道关键岗位在哪里。也许维护的100个人里,99个是混日子,关键的只有1个。但没人知道,能知道早就优化了,何必等到压缩收支时集体裁员。但就是这关键的一个人消失,导致系统崩了。

全部专栏