为世界构建新的选择,AI原生计算正在重塑算力底座

500

一个月前的数字中国建设峰会上,华为展台呈现出了一种极具张力的科技图景。

一边是围绕云、计算、数据通信、光网络、存储等核心能力构建的硬核产品和前沿技术,一边是AI使能政务、经济、社会、文化、生态文明等行业的数智化鲜活案例。

穿梭在两大展区间,有一个直观的感受:AI已经彻底告别“对话玩具”属性,全面嵌入到了千行万业的“生产系统”中。

由表及里的智能化跃升,绝非简单的软件升级。当AI应用深入工业制造、电网调度、航空决策等复杂场景,传统的算力堆叠模式开始暴露出明显的局限性,算力产业再次站在了十字路口。

01 Agent新范式改写了算力供求

要理解底层算力为何需要重构,必须先厘清上层应用的演变。

在第九届数字中国建设峰会上,传递出了一个不应被忽视的产业共识:2026年是Agent应用的爆发元年。

直接的例子就是“龙虾”类产品的流行。无论是OpenClaw、Hermes,还是各种套壳的“Claw”,新产品的不断涌现,标志着企业IT的开发范式正在从传统的SOP(标准作业程序)向Agent体系迁移。

在传统的企业IT架构中,业务逻辑的实现高度依赖SOP:通常需要懂业务的人员提炼出确定的业务流,再由IT技术人员转化为AI能执行的语言。在处理确定性任务时效率极高,但面对复杂、动态且充满不确定性的生产环境时,往往会显得僵化且难以实时响应。

500

而OpenClaw代表的Agent框架,最大的特点就是具备自主执行、多轮推理和自我进化的能力,让AI可以处理不确定性的业务流和格式复杂的数据源,在行业中引发了剧烈的连锁反应。

比如对业务创新的根本性驱动。

在Agent框架下,即使是不懂底层技术的业务人员,也能用自然语言编写和调度Skills,转化为AI可以准确执行的语言,大幅降低了AI参与不确定性复杂业务的门槛,让数字员工与真实员工的协同办公成为可能。

再比如推理需求的指数级跃升。

根据中信证券的测算,智能体执行任务时整体Token消耗可能提升十倍以上,对应的算力需求得涨百倍以上。高盛追踪的数据显示,中国市场整体AI日均Token消耗已经从2024年5月的0.12万亿次,爆增至2026年3月的140万亿次,不到两年时间增长超过1000倍。

一旦Agent规模化进入生产系统,面对多轮推理和长序列的调用,Token的需求量还将发生量级跨越。

应用侧的狂飙默默改写了算力产业的账本。

过去算力资源主要向大模型的训练侧倾斜,但中国信通院等权威机构的预测数据显示,2026年推理侧算力将首次追平甚至超过训练侧算力。算力需求的结构性变化,意味着传统以大规模并行训练为核心的计算中心,必须向更具弹性、更低时延、更高吞吐的方向转型。

也就是说,Agent新范式不仅改变了我们使用AI的方式,正深刻影响整个算力底座的供求逻辑。

02 AI原生计算正重塑算力底座

因为Agent驱动的新范式,绝不限于推理算力需求的增长数字,已经像一把手术刀切入IT架构的深水区。

在传统的IT架构中,高度依赖操作系统与数据库,聚焦于CPU、硬盘和内存的协同,现在发生了“山呼海啸”的变化:2024年由人创建的数据库实例占7-8成,到了2025年,Agent建立的数据库实例占比已达7成,并呈现出了即时拉起、即时消亡的高频特征,传统的服务器形态已无法满足。

华为计算Marketing与解决方案销售部总裁常成在演讲中提出了一个判断:我们已经站在第三次计算架构变革的前夜。

如果说第一次是大机和小机的封闭时代,第二次是分布式虚拟化和云主导的时代,第三次将是AI原生的计算架构时代。怎么理解AI原生的计算架构呢?答案可以归纳为四个核心维度。

一是性能更高,全面迈入“超节点”时代。

进入2025年后,全球头部厂商均走向了“超节点”,最直接的驱动因素无疑是性能。以华为最新的超节点产品Atlas 950为例,可支持8192张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先同类产品,用极高的算力密度回应了AI对极致性能的渴求。

500

二是大通量,跨越光电物理瓶颈。

在超节点的技术路线上,业界一直存在“光电悖论”:电连接稳定性高,但传输距离极短;光连接能实现长距传输,但时延难以保证,且故障率相对较高。华为给出的答案是——光电融合,通过灵衢总线实现了大带宽且时延、长距离且高可靠的目标,“超节点”的跨柜光电传输已经成为可能。

三是高扩展,七大组件的底层协议统一。

仅仅解决物理连接还不够,逻辑层面的通信壁垒同样致命。当前业界的部分方案只解决了局部问题,比如CPU与GPU的互通,而华为自研的“灵衢”互联协议,已经实现了去中心化与多组件协议统一,可将NPU、CPU、GPU、Memory、硬盘、内存、交换机彻底打通,消除了协议转换的时延。

四是多样性算力的融合。

在Agent时代,不单单需要NPU、GPU等智能算力,还需要CPU承接海量的业务流转。AI原生计算的基础设施,将不再按“PU”区分任务类型,数据在哪里,算力就在哪里。直接的例子就是华为推出的通用计算超节点TaiShan 950 SuperPoD,在数据库、大数据等高算力场景下的性能提升显著。

做一个判断的话:AI原生算力底座的竞赛,早已从“产品能力”跃迁为“系统能力”,并将进一步演进为“生态能力”。

03 高效创新的开放算力新生态

底层算力的重塑铺就了坚实的轨道,想让AI列车在千行万业跑出加速度,还需要一个高效、开放、标准化的繁荣生态。

摆在面前的问题在于:尽管算力部署呈现出了规模化和专业化的趋势,但产业生态布局相对分散,多厂商间的异构兼容能力偏弱,导致软硬件适配碎片化、应用端在算力选型上面临高门槛,而且大规模集群扩展缺乏统一规范,严重制约了产业效率的提升。

乐观的是,行业渐渐涌现出了两条明确的破局路径。

第一个是前沿模型与基础软硬件的强耦合。

很长一段时间里,模型与算力底座的适配多为滞后的“被动适配”,周期往往长达数月。现在,模型与算力开始“双向奔赴”。

以DeepSeek V4为例,在研发阶段就与昇腾在内的国产算力进行了深度协同,结合精度量化等机制,实现了高吞吐、低时延的极速推理部署。在DeepSeek V4开源当天,多家算力企业宣布实现了Day0适配,标志着行业已经跨越被动适配的分水岭,迈入了以周甚至以天为单位的“原生敏捷适配”新阶段。

第二个是标准牵引下的集群生态网络化。

就在第九届数字中国建设峰会的计算产业峰会上,中国信息通信研究院联合产业各方发起了“1+N”CANN生态网络计划。

500

以人工智能软硬件协同创新与适配验证中心为“1”个核心节点,汇聚区域生态创新中心、ISV合作伙伴及行业领军企业等“N”个节点,旨在通过标准化的适配验证,打通技术到应用的关键环节,解决“点对点”适配难题,加速自主智算解决方案的规模化应用与标杆案例推广,进而构建出一个开放、协同的智算产业生态网络。

在软硬协同与生态网络的推动下,产业界不断将算力转化为可落地的生产力,持续涌现出了不少标杆实践。

在航空领域,南航依托昇腾打造的国产智算底座,研发出了“天策航空求解器”。面对极端天气下的航班恢复难题,通过自主算子库和AI运筹算法,将原本数小时的决策时间压缩至约20分钟。

在能源电力领域,南方电网与华为联合研发“妙算”系列高能效服务器,提出了“算电协同”的理念:通过CPU动态调频、智能风扇温控预测及高效电源优化,实现整机功耗降低13%-15%。

隐藏在上述实践背后的,是产业界合力打造新质生产力的现在进行时,一个开放、协同、高效创新的生态渐行渐近。

04 写在最后

在Token需求爆炸、技术迭代以日计的时代,算力基础设施早已超越了单纯的IT设备,成为了产业向上的核心引擎。

正如我们所看到的:中国计算产业没有选择在旧有架构上修修补补,勇敢地踏入了AI原生计算的“深水区”。从“灵衢”总线打通七大组件的底层协议,到“1+N”CANN生态网络打破算力孤岛,再到昇腾、鲲鹏在千行万业复杂场景中的试炼与智变,为全球产业界提供了可复制、可落地的新选择,也让世界看到了另一种可能。

站务

全部专栏