DeepSeek和国产机器狗之后,华为云超节点也来了

  关于中国科技的发展,我最近听到一个观点,那就是在这两年,中国科技的发展在从以前的追赶式开始进步到原创并跑阶段。

  以前是西方有的,我们也要有,西方封锁我,那么我们一定要把西方封锁的技术搞出来,带有一种头悬梁锥刺股,破釜沉舟式的“悲壮”意味,比如我们在中国工业发展的不少领域,都听到过“争气机”的说法,

  一般都是我们没有这项技术,然后我们去买人家不卖,或者故意出高价,还讽刺我们永远做不出来,最终我们奋发图强,一举做出了这项技术。

  这样的故事相信大家一定看到过类似的版本。

  在以前我们想的也是更多是先填补技术国内空白,先把这个东西做出来,但现在情况不一样了,中国科技已经开始有原创领先科技爆发的态势。

  正如DeepSeek创始人梁文锋说“中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”

  国内新一代科技人才已经有了这个觉悟。

  过去的几个月,从DeepSeek到宇树科技国产机器狗等国产新技术不断的涌现,而且都是世界级的创新成果。

  前几天我看美国财政部长当地时间4月2日接受采访的视频,他说美国科技七巨头(英伟达,亚马逊,谷歌,特斯拉,苹果,微软,Meta)的股价大跌是因为deepseek的发布,而不是美国政府的贸易保护主义。

  不管他说的对不对,

  能被美国人拿来当成美国科技企业股价大跌的理由,说明了至少两点,

  一是中国AI技术进步是得到了对手肯定的,

  二是AI技术真的非常重要

  其实对应美国的科技七巨头的话,我们也可以列出国内的科技七巨头,我脑子里最先冒出来的是华为,大疆,DeepSeek三个,

  当然不管怎么列举,华为肯定会是其中之一,

  另外就是不管怎么列举,国产科技七巨头也肯定都在AI方面有不少研究和投入。

  到2025年的今天, AI已经是确定性的趋势,日常生活中已经有大量想不到的AI应用。

  1:AI在让人类生活更方便

  我看到一个有意思的事就是烧烤店数签子算钱,不需要服务员一根根的去数了还容易数错,直接拿手机拍照就能自动识别有多少根签子。

  2:AI在创造更多的娱乐方式

  在过去的一年,你有没有在不知不觉中发现在短视频平台,在AI大模型APP里面,让图片里人物动起来跳个舞之类的特效已经越来越多了?这其实也是AI技术在你不知不觉中进步,在之前就没有这个功能。

  现在各种大模型APP里面有很多可以对话的智能体,还可以克隆你的声音,很有意思。

  3:AI在增加人类的安全性和存活概率

  再比如汽车的自动驾驶,华为发布的尊界都已经是按照L3来设计了,安全性又上了一个台阶,就看国家法律法规什么时候跟进L3了。

  其实尽管不要过分依赖智驾一直是个社交媒体上面的热门话题,但是常识告诉我们,过去的几年智驾其实拯救了不少生命,尤其是在智驾车型普及很高的中国,这个数量我相信是全球最高的。

  4:AI关系到国家安全和生存

  原因很简单,因为AI可以用于军事和武器,

  举个例子,下图是《终结者4》电影里面携带武器,可实现无人驾驶和自主攻击摩托车,这个电影是2009年上映的,当时觉得这一幕很科幻,

  但是我们现在再看的话,已经从思想上并不觉得这是科幻片了,而是觉得这已经是在当前的技术上可以实现的东西。

500

  因此我们更进一步,正因为AI关系到我们生活的方方面面,所以AI技术的进步与否就直接关系到一个公司乃至一个国家财富的多少,上面美国财政部长说DeepSeek直接影响了美国科技七巨头的股价就是例子,那可是实打实的钱啊。

  由于AI技术如此重要,因此我们自然也会关心国产AI技术的进步,那就是一个AI应用(大模型),一个AI软硬件基础设施。

  我们先说大模型部分,大模型其实可以看成是应用,

  2024年年底和2025年初deepseek陆续发布了V3和R1,火爆了全球,代表的是成本的下降,可以说在deepseek之前,人类的算力需求增长和成本是可怕的规模,以致于市场给了类似英伟达极高的预期,英伟达的市值在2025年1月7日这天创下了3.75万亿美元的历史巅峰。

  而有了降成本的deepseek之后,使得市场终于降低了对英伟达的预期,

  注意我并不认为算力总需求会下降,只是会从爆发增长走向正常增长。

  举个例子,在其他因素不变的情况下,参数量多少和算力需求是成正比的,Deepseek 发布的V3和R1满血版都是671B的参数,也就是6710亿个参数,而上一代版本,2024年5月发布的V2的参数量就只有2360亿,总体还是增长的,而Deepseek更为复杂的下一代参数量还会更大,

  再比如deepseek 开源大模型展现出来的良好性能,将会刺激千行百业进行部署基于deepseek的推理应用,刺激对算力的需求。

  所以Deepseek的出现使得AI算力需求增长进入更为良性的轨道,更低的成本将大大推动AI的普及,总算力需求仍然是增长的。

  这就跟所有的产业发展是轨迹一样的,

  当年九十年代的大哥大一部就得上万元人民币,后来随着成本降低,单台价格下降了90%以上,普通人也逐渐买得起了,市场的总规模并没有缩减,是不断增长的。

  再说AI基础设施部分,这部分我不得不说,华为扛起了中国AI基础设施技术发展的重任。

  强大的AI社会需要强大的AI基础设施,在美国这个基础设施供应商是英伟达和亚马逊云,英伟达提供底层硬件,亚马逊以云的形式提供算力服务。

  在中国的话,最大的能对标英伟达的厂家就是华为了,同时华为云也是中国最大的云服务供应商之一,为政府和千行百业提供算力服务。

  美国政府一直在为自家企业保驾护航,所以早早的就盯着华为,

  2019年6月把华为列入实体清单;

  又在2020年9月就禁止了全球芯片代工厂家为华为代工。

  当然华为在自己努力下,终于实现了芯片制造的自主供应,

  但芯片工艺制程的限制,还是影响了中国AI硬件的单卡算力进步,所以论单卡算力,华为的昇腾目前比不上英伟达。

  也正是因为如此,所以美国从2022年底开始逐渐禁售了英伟达的H100/H800/A100/A800等高端算力芯片。

  但是华为并没有放弃,而是采取多路径的方式进行技术攻关,

  一方面是在半导体设备研发制造方面有所动作,今年3月底在上海召开的SEMICON China 2025半导体展会上公开亮相的某半导体生产设备公司,其各种以“山”命名的设备,加上含有“凯旋归来”意味的名字,让广大网友一下子就猜出了其血统。

  另一方面华为也在AI基础设施技术方面不断探索进步,

  华为云在4月10日发布了CloudMatrix 384超节点技术,成功实现超节点技术商用,在当下先进工艺制程尚未突破的情况下,这也是华为持续追赶英伟达的关键。

  同时通过云服务的形式,向国内各行各业提供超节点技术算力,

  因为随着企业对AI应用需求的规模越来越大,那么需要的算力就会增加,企业会走向千卡甚至万卡数据中心算力集群,

  而这个集群内各个节点的通信就成为发挥性能的瓶颈,这就好比一支庞大的军队,如果各个单位之间不能及时有效的通信,那么战斗力就会大打折扣。

  想象一下,如果算力集群中一张算力卡已经完成了计算任务,但是数据却不能快速地流动到其他算力卡进行计算,导致大量算力卡在闲置和等待,这就让集群性能不能充分发挥。

  什么是超节点?

  当前业界一台算力服务器通常是8张算力卡,这一台服务器就称为一个节点,在一台服务器以内的8张卡之间的通信速度是非常快的,

  而相比之下服务器与服务器之间的通信速度则慢的多,其速度相差甚至能够达到10倍以上,也就是说一张算力卡和同一个服务器里的另一张算力卡,以及和另一个服务器的算力卡通信速度是天壤之别。

  不仅仅是算力卡之间,算力卡和内存之间的通信也是一样的,

  和同一个服务器节点里面的内存通信,速度要比和跨服务器的内存通信要快的多。

  所以如果能用高速通信技术把更多张算力卡,内存融合在一起,成为一个超节点,超节点内的算力卡,内存都可以实现高速互联和通信,这就能大大的提高算力集群的性能。

  当然,这不仅需要有深厚的通信技术积累,也需要有软件来进行大规模协同。

  英伟达已经率先在2024年3月发布了NVL72超节点,可以把72张训练卡组成一个超节点。

  而华为云在4月10日发布的CloudMatrix 384超节点技术则更进一步,可以实现384张昇腾算力卡成为一个超节点,这不仅是中国最大的商用超节点,而且超节点规模比英伟达的NVL72更大,算力更强,性能比NVL72更优。

  或者换句话说,它是目前已商用的超节点中,单体规模全球最大,有效算力全球最高。

  超节点充分发挥了华为在通信领域的技术积累和优势,使其能在国内率先突破和领先,毕竟华为是全球领先的通信厂家。

  目前国内在AI基础设施的赶超方向我认为是比较明确的,

  那就是近两年朝超节点方向发展,未来则单卡算力会发力,原因如下:

  其一随着算力的增长,国内需求千卡集群,万卡集群的数量越来越多,而大规模集群必然会涉及到高速通信互联,以及网络负载算法等通信相关的技术,在这些技术方面中国目前是没有限制的,尤其对华为而言这还是强项,超节点会符合国内算力需求增长的需要。

  其二单卡算力主要和芯片工艺制程相关,因此在生产设备突破后会迎来一个跃升,但这个突破的时间会在未来几年,到时候单卡算力的提升会比现在更快。

  对于国内千行百业的企业而言,除了少数具备极强IT技术和运维能力的头部客户,大部分企业都会选择类似华为昇腾云服务这样的云厂家,而非选择自建数据中心。

  原因很简单,可以总结为四点:

  1:超节点在提升性能的同时,也有更大的算力规模,自建的话一次性投入成本高,而在使用云服务时,你既可以选择租用一个超节点,也可以选择只租用超节点的一部分,相比自己购买更为灵活。

  2:超节点更为复杂的技术架构也意味着对运维团队的技术能力要求更高,需要解决的各种故障和运维问题更复杂,

  对于一般企业而言,显然没有必要维持一个高成本的运维专家团队,还是直接把底层软硬件的运维和稳定性直接交给云服务厂家比较简单。

  例如华为的昇腾云服务可以实现万亿参数模型长达40天的长稳训练,远优于业界平均无中断2.8天的水平,故障实现从业界平均的60分钟恢复缩短到10分钟内恢复,不需要从头重新训练。

  3:现在国内云服务厂家是算力节点在地理布局上已经非常完善

  例如华为云在全国就有3+N+X云数据中心,其中这个三是指内蒙乌兰察布,贵州贵安,安徽芜湖三个最大的数据中心,部署了几万张昇腾卡的算力,需要超节点服务时可以分钟级开通昇腾云服务,

  而华为云其余N+X数据中心也是遍布全国,在服务时延和数据传输成本上都可以就近,从而得到低成本的良好体验。

  4:国产AI硬件的进步速度将会加速

  这是我的一个判断,因为从2018年以来的七年,在美国在半导体领域的强力狙击下,中国半导体产业不得不开始补短板,强基础的艰难过程,因此国产硬件性能的进步也放缓了。

  而在七年后的今天,基础实力已经大大增强,国产半导体生产设备,材料技术已经不可同日而语,可以说有一种已经在突破前夜的感觉。

  以华为云为代表的国产超节点技术今年的率先商用,其他国内厂家预计也迟早会跟进,因此可以预期的是国产AI硬件的技术进步将会加速。

  而选择云服务则不会面临技术快速进步下,出现硬件过时的问题,

  你需要多少算力云服务厂家就给你多少,你不需要去关心底层的硬件资源,这也省去了若自建可能会导致硬件资源因为过时而闲置的烦恼。

  从目前的情况看,华为在外部压力下,成功的实现了两个重要的成果:

  在国内人工智能需求猛增的情况下确保了AI软硬件基础设施的交付,使得国内的算力需求方可以快速的获得华为云提供的算力服务,避免了国内的算力短缺,我们今天在国内能够大量的享受和使用各种AI应用带来的好处,华为是做了很大贡献的;

  另一个重要成果就是在实现了国内AI基础设施技术的持续进步,今年华为云超节点技术的商用就让国内的算力基础设施服务进入了更高性能的时代。

  而展望未来,我可以比较确定的说,超节点之后的下一次国产AI基础设施技术的进步,也会是来自华为。

站务

全部专栏