赶超亚马逊微软,阿里云这次的底气是什么?

500

谁都能看出,时隔两年没在云栖大会线下亮相的阿里云,又憋了多少新招。

即使天公不作美,2021年云栖大会还是在10月末的杭州开幕了。在四个大场馆和论坛里,元宇宙、液态金属、太空采矿、深时地球等新鲜概念被推向舞台与展台。

而真正的重头戏,当属芯片。10月19日上午,阿里云旗下平头哥在主论坛上发布阿里第一颗通用芯片“倚天710”。相比上一次在2019年云栖上发布的AI芯片含光800,通用芯片的研发难度和成本翻倍,所以也更加瞩目。

紧随云芯片“倚天”而来的,是一系列战略新产品:比如首款自研云原生服务器“磐久”、新一代计算架构“神龙4.0”;再往上走——数据库:首次实现内存与计算存储解耦的自研数据库PolarDB;AI:全球最大规模的多模态预训练模型M6大模型等等。

500

2021年云栖大会发布的重点产品与技术汇总

纵观下来,无论是“底层建筑”的云芯片,还是基础软件层、应用层,阿里这两年间可谓是憋住了劲,终于在全民讨论硬科技的时代里发了个大招。

以阿里的风格,每次的科技创新必将与商业化与实用场景紧密结合。实际上,更早推出的“玄铁”系列处理器已有25亿颗的出货量,两年前的“含光800”也在搜索推荐、视频直播等客户场景中大规模商用。这次的“倚天710”,则会先以公司内部客户着手,为云上的客户使用场景提供差异化的顶级算力。

据Gartner历年报告,阿里云全球市场份额连续五年上涨,从2016年的3.7%涨至2020年的9.5%,与谷歌云的6.1%拉开差距,排名全球第三,仅次于微软Azure;第一名亚马逊AWS的份额则有所被挤压,从原先2016年的53.7%降到40.8%。

摸爬滚打12年后,阿里云终于实现盈利,并在今年8月公布的财报中显示出连续三个季度增长的盈利曲线。作为亚马逊AWS后全球第二朵宣布盈利的云,在底层技术多面开弓的阿里云,也终于有了更独特的发展步调和规划。

“更像亚马逊,还是微软?”——曾经的“3A云“中,很多人对阿里云会追随谁的步调议论纷纷。如今看来,这已不再是个问题。软硬兼修、双向生长,阿里云自身创新的赶超路径已经明晰。

01 三部曲:竞争压力下的多面开弓

对于曾经的阿里云,想要有朝一日追上市场份额,至少在“军备”产品上不能输。

此过程无法短时间一蹴而就。回溯阿里云突破自身边界的历史,可以看见一个“三部曲”的故事:第一次是2017年,阿里云推出初代神龙架构,解决了困扰云计算多年的虚拟化性能损耗问题,突破云服务器的性能极限;第二次是给人以“再造一个微软Azure+Teams”想象的钉钉。

比起微软,要在生态成熟度更底的中国做SaaS,钉钉附加了“应用平台”的属性,身兼“云和业务间的桥梁”之功用。在“钉云一体”启发了诸如制造业在内的新场景后,2021年的几个月时间里,钉钉主推“低代码”开发工具“宜搭”,平台上冒出百万量级的钉应用、近86万个低代码应用。

2020年疫情的特殊时期,又给了阿里云更多在云的应用创新上反超亚马逊的机会。其高性能计算结合药物设计研发,最早参与到新冠药物研发筛选的行列中。随后,基于钉钉的复工解决方案很快进入各个工厂、车间,维持了有序生产。“在线课堂”、“云问诊”等中国数字经济下独特的场景因云而生。

第三次的突破点,正是在今天“技惊四座”的倚天芯片。对比全球的头部云厂,亚马逊虽然缺少直接对标钉钉和Teams的产品,但在服务器自研芯片起步较早,从2018年到现在一共发布两代名为Graviton的服务器芯片,第二代Graviton2芯片采用的最前沿工艺为7nm。而另一边,微软与高通从合作到挖人,其2018年宣布计划的芯片至今还不见踪影。

奋起直追的阿里云,连发两代芯片。先有“云钉一体”,后有倚天,在芯片一角的补全,让阿里云终于变成了“六边形战士”——能力的雷达图,不再缺边少角。“这或许也意味着,阿里云科技大厦的地基已打造完备,今后发展创新更看自己。阿里云不能再是想着追平,而是得想着引领潮流。”云栖现场,一位前来参展的云行业工作者向Tech星球分析道。

平头哥成立的三年后,国内互联网大厂们无论是否涉足云计算,都接连开始造芯。2021年6月,小米传出招聘芯片团队,准备重启手机芯片研发;7月,腾讯开始招募专注AI加速和视频编解码领域的芯片设计工程师,8月,百度宣布其第二代昆仑芯实现量产。

长期专注云计算行业招聘的猎头Ben告诉Tech星球:“从2016到2020年间,阿里云在技术侧的招聘需求和声量在国内市场最为响亮。而近两年里,腾讯云、华为云开始步步紧追,开挖阿里。”

他尤其发现,阿里云内有不少十几、二十年经验的半导体稀缺人才,可见其在人才储备上的超前性与厚度。

02 炼芯之路:“六边形战士”初长成

“今天我们做的很多工作,都是为了完善云计算,而不是为了完善芯片半导体产业。”阿里云总裁张建锋(行癫)在回答Tech星球提问时强调。

对阿里来说,芯片是计算系统的核心——张建锋称之为“新型计算体系结构”的硬件核心,是软件和上层应用的基座。自研芯片的益处,首先是进一步降低云服务的成本。自研是帮助科技大厂打开资深能力边界的必经之路。十年前的飞天操作系统、盘古存储系统便是如此,它们支撑了十年来“双十一”狂欢节量级的系统流量。

为什么这次的发力是芯片?在5nm制程工艺的倚天710发布之前,最先进的工艺仍为7nm。放眼2020年半导体行业的市场空间,有两成是通用型CPU及SoC芯片。服务器芯片能提供的算力,是未来科技、创新想法的底层保障。平头哥成立之初背负的使命之一,就是背靠阿里集团生态内广泛的应用场景,“为中国新数字经济的运营需求,量身打造一款通用高性能芯片”。

500

10月19日下午,阿里云智能总裁张建锋(行癫)携阿里云高层接受媒体采访

“‘含光’、‘玄铁’、‘倚天’,都是神兵利器的名字。”阿里云内部人士解释道,兵器的意义在于打下更大的天下,追求单一芯片产品售卖时的商业回报,也就不是平头哥做布局时的首要目的和依据。

“之所以一上来就采用产能排期紧张的台积电5nm,因为这是提升性能最直接有效的方式。”但直接有效并不意味着没有走弯路的风险。整个研发过程,平头哥团队需要调度多达30种以上的EDA软件,对时钟网络和IP技术深度定制,并采用先进的多芯片堆叠技术,和ARM团队一起克服其非成熟的新核心的技术难题,才保证了最终芯片性能与功耗达到最优平衡。

虽然在当下的职场环境中,加班加点的故事并不足够“正确”,但用一位平头哥的技术员工的话来讲:“不艰苦奋斗,怎么可能这么短时间内设计出全球最好的ARM服务器芯片?”就连完成设计后,2021年7月倚天710回片时,研发中心里的兄弟们也不时要连轴转三天,办公室里堆满了外卖盒。

“我们对平头哥成立到现在所取得的成绩非常满意,这次绝对是超出期望,”张建锋告诉Tech星球,“一是需要大型工程的管理能力:去掉流片回来测试的时间,平头哥真正开发的时间只有短短一年;二是考验了技术判断——不只是买了很多东西堆在一起生产就可以,有很多架构决定和配合的工作,令设计到交付之间的环节有很多问题需克服。通常这样的芯片,都得到第二次流片才能成功。我们第一次流片1000套回来,到目前为止,都没发现再送二次流片的必要。”

自研的同时,选择开源的路径也能看出一家科技企业的气度。在“玄铁”处理器的产品线上,针对发展中的RISC-V架构,阿里云的逻辑是:只有越多企业和开发者使用,生态才能更丰富;日后在芯片和操作系统的技术领域里,“玄铁”才能在这一架构上继续更新技术和服务,并离“云端一体”的商业愿景更近一步。

钉钉作为“三部曲”中的第二次突破,也和刚迭代到4.0版的“神龙”一样,继续翻新“云与客户之间最后一公里”的服务体验。近期的未来组织者大会上,钉钉又提出“两个数字化”的新方向:即组织数字化、业务数字化。其统一云平台/移动入口/开发工具的能力,主导了整个国内的软件开发朝着“民主化”趋势发展。

500

到2021年8月,钉钉在非营销手段主导的情况下增长3倍月活数,达到1.93亿的市场王座,是第二名企业微信(8364万)的近乎2倍。而背后过去的整整一年里,钉钉经历了新CEO叶军(不穷)上任的换帅磨合,战略目标也从规模指标向价值指标调整。“外有企业微信+飞书来势汹汹、内有组织变革”的驶船环境下,钉钉依然守住了国内企业服务最大的一块流量池。

03 如何书写被云覆盖的未来?

当芯片补全了版图的最后一角,阿里云形成了独特的竞争优势,从最初的分布式技术出发,实现存算分离、高效网络,基于云原生、钉钉定义核心软件与应用,向下定义芯片、服务器等核心硬件。如果要再对标“全球三朵云”中的另外两朵,就会发现其版图已经比亚马逊、微软更完整。

到这一阶段“做深基础”趋于完善,也意味着阿里云要着眼于下一个阶段的挑战。

在张建锋看来,芯片领域的探索远不能懈怠:“到芯片领域里推进下去,要看你能不能对所有的IP,在满足规范的情况下,全部自己来实现,这是接下去我们一个新的挑战。”

首次宣布盈利的2020年,阿里云营收超过600亿元,在全球市场占接近10%的份额;近两个季度里,盈利的数字分别升为3.08亿元和3.4亿元——这也意味在盈利能力上,阿里云当前保持了能让市场信服的持续性。

新产品的发布,无疑给了销售侧更强的信心和想象力。今年6月,阿里云宣布加码海外市场,并新增印尼和菲律宾两大数据中心,再次拓宽了市场的落脚点。

和一些大公司不同,盈利后的阿里云并没有降低研发支出来提高利润率。早在2020年,阿里云便宣布未来三年继续投入2000亿元,其投入方向包括:云操作系统、服务器、芯片、网络等重大核心技术的研发,和超级数据中心建设。

在2020年云栖线上发布、2021年云栖线下展出的“无影”,是另一个给未来留下变革窗口的toC级产品。在展区的体验中,通过一张“卡片”,观众已经能在一体机/卡片/盒子形态的轻便屏幕上,获得大型软件即点即用的“次世代电脑”使用体验。据阿里云的现场介绍,无影已在5月启动大规模商用,个人版软终端也将于11月启动免费试用计划。

“无影”的本质在于因为数据都在云端,不在本地电脑存储,开发者不用再担心核心代码的泄露,也不用再购置高配硬件,就能随时随地使用无限算力,处理各种复杂计算需求。张建锋因此得出结论:未来不管是企业还是个人,计算会进一步往云端迁移。云计算的市场空间远不止于当下。

“一个新型的以云为核心的计算体系结构正在出现。”对于技术发展的大图景规划,张建锋在云栖大会的公开演讲中如此分享总结。所谓新的体系,分为三个层次演进:基础设施的云化,被云原生重塑的软件开发,应用层的新物种爆发。

500

2021年云栖大会主论坛现场,底层技术的自研和升级后,阿里云保护客户数据安全能力再加固(Tech星球摄)

在云栖大会的论坛现场,一位阿里云的政企客户告诉Tech星球,他能从近期的服务和产品升级中感受到今年阿里云对政企市场的重视度提升。“政企客户本身就很看重底层技术自研和数据安全方面的能力,本轮包括芯片在内的自研技术大爆发,或对未来政企线的开拓带来正面影响。”

同时,“行癫在今年云栖的演讲内容,能看到重心更集中于技术,发言中干货居多。”这一边界感也在传统型合作客户心中促生了更多的信任感。

可预见的未来里,和亚马逊、微软的比较声依然会持续;但“六边形云计算战士”的未来,似乎已在十年的寻找和引领未来的野心里,自我生长出了独有的答案。

全部专栏