为世界构建新的选择，AI原生计算正在重塑算力底座

Alter

昨天 10:38

500

一个月前的数字中国建设峰会上，华为展台呈现出了一种极具张力的科技图景。

一边是围绕云、计算、数据通信、光网络、存储等核心能力构建的硬核产品和前沿技术，一边是AI使能政务、经济、社会、文化、生态文明等行业的数智化鲜活案例。

穿梭在两大展区间，有一个直观的感受：AI已经彻底告别“对话玩具”属性，全面嵌入到了千行万业的“生产系统”中。

由表及里的智能化跃升，绝非简单的软件升级。当AI应用深入工业制造、电网调度、航空决策等复杂场景，传统的算力堆叠模式开始暴露出明显的局限性，算力产业再次站在了十字路口。

01 Agent新范式改写了算力供求

要理解底层算力为何需要重构，必须先厘清上层应用的演变。

在第九届数字中国建设峰会上，传递出了一个不应被忽视的产业共识：2026年是Agent应用的爆发元年。

直接的例子就是“龙虾”类产品的流行。无论是OpenClaw、Hermes，还是各种套壳的“Claw”，新产品的不断涌现，标志着企业IT的开发范式正在从传统的SOP（标准作业程序）向Agent体系迁移。

在传统的企业IT架构中，业务逻辑的实现高度依赖SOP：通常需要懂业务的人员提炼出确定的业务流，再由IT技术人员转化为AI能执行的语言。在处理确定性任务时效率极高，但面对复杂、动态且充满不确定性的生产环境时，往往会显得僵化且难以实时响应。

500

而OpenClaw代表的Agent框架，最大的特点就是具备自主执行、多轮推理和自我进化的能力，让AI可以处理不确定性的业务流和格式复杂的数据源，在行业中引发了剧烈的连锁反应。

比如对业务创新的根本性驱动。

在Agent框架下，即使是不懂底层技术的业务人员，也能用自然语言编写和调度Skills，转化为AI可以准确执行的语言，大幅降低了AI参与不确定性复杂业务的门槛，让数字员工与真实员工的协同办公成为可能。

再比如推理需求的指数级跃升。

根据中信证券的测算，智能体执行任务时整体Token消耗可能提升十倍以上，对应的算力需求得涨百倍以上。高盛追踪的数据显示，中国市场整体AI日均Token消耗已经从2024年5月的0.12万亿次，爆增至2026年3月的140万亿次，不到两年时间增长超过1000倍。

一旦Agent规模化进入生产系统，面对多轮推理和长序列的调用，Token的需求量还将发生量级跨越。

应用侧的狂飙默默改写了算力产业的账本。

过去算力资源主要向大模型的训练侧倾斜，但中国信通院等权威机构的预测数据显示，2026年推理侧算力将首次追平甚至超过训练侧算力。算力需求的结构性变化，意味着传统以大规模并行训练为核心的计算中心，必须向更具弹性、更低时延、更高吞吐的方向转型。

也就是说，Agent新范式不仅改变了我们使用AI的方式，正深刻影响整个算力底座的供求逻辑。

02 AI原生计算正重塑算力底座

因为Agent驱动的新范式，绝不限于推理算力需求的增长数字，已经像一把手术刀切入IT架构的深水区。

在传统的IT架构中，高度依赖操作系统与数据库，聚焦于CPU、硬盘和内存的协同，现在发生了“山呼海啸”的变化：2024年由人创建的数据库实例占7-8成，到了2025年，Agent建立的数据库实例占比已达7成，并呈现出了即时拉起、即时消亡的高频特征，传统的服务器形态已无法满足。

华为计算Marketing与解决方案销售部总裁常成在演讲中提出了一个判断：我们已经站在第三次计算架构变革的前夜。

如果说第一次是大机和小机的封闭时代，第二次是分布式虚拟化和云主导的时代，第三次将是AI原生的计算架构时代。怎么理解AI原生的计算架构呢？答案可以归纳为四个核心维度。

一是性能更高，全面迈入“超节点”时代。

进入2025年后，全球头部厂商均走向了“超节点”，最直接的驱动因素无疑是性能。以华为最新的超节点产品Atlas 950为例，可支持8192张昇腾卡，在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先同类产品，用极高的算力密度回应了AI对极致性能的渴求。

500

二是大通量，跨越光电物理瓶颈。

在超节点的技术路线上，业界一直存在“光电悖论”：电连接稳定性高，但传输距离极短；光连接能实现长距传输，但时延难以保证，且故障率相对较高。华为给出的答案是——光电融合，通过灵衢总线实现了大带宽且时延、长距离且高可靠的目标，“超节点”的跨柜光电传输已经成为可能。

三是高扩展，七大组件的底层协议统一。

仅仅解决物理连接还不够，逻辑层面的通信壁垒同样致命。当前业界的部分方案只解决了局部问题，比如CPU与GPU的互通，而华为自研的“灵衢”互联协议，已经实现了去中心化与多组件协议统一，可将NPU、CPU、GPU、Memory、硬盘、内存、交换机彻底打通，消除了协议转换的时延。

四是多样性算力的融合。

在Agent时代，不单单需要NPU、GPU等智能算力，还需要CPU承接海量的业务流转。AI原生计算的基础设施，将不再按“PU”区分任务类型，数据在哪里，算力就在哪里。直接的例子就是华为推出的通用计算超节点TaiShan 950 SuperPoD，在数据库、大数据等高算力场景下的性能提升显著。

做一个判断的话：AI原生算力底座的竞赛，早已从“产品能力”跃迁为“系统能力”，并将进一步演进为“生态能力”。

03 高效创新的开放算力新生态

底层算力的重塑铺就了坚实的轨道，想让AI列车在千行万业跑出加速度，还需要一个高效、开放、标准化的繁荣生态。

摆在面前的问题在于：尽管算力部署呈现出了规模化和专业化的趋势，但产业生态布局相对分散，多厂商间的异构兼容能力偏弱，导致软硬件适配碎片化、应用端在算力选型上面临高门槛，而且大规模集群扩展缺乏统一规范，严重制约了产业效率的提升。

乐观的是，行业渐渐涌现出了两条明确的破局路径。

第一个是前沿模型与基础软硬件的强耦合。

很长一段时间里，模型与算力底座的适配多为滞后的“被动适配”，周期往往长达数月。现在，模型与算力开始“双向奔赴”。

以DeepSeek V4为例，在研发阶段就与昇腾在内的国产算力进行了深度协同，结合精度量化等机制，实现了高吞吐、低时延的极速推理部署。在DeepSeek V4开源当天，多家算力企业宣布实现了Day0适配，标志着行业已经跨越被动适配的分水岭，迈入了以周甚至以天为单位的“原生敏捷适配”新阶段。

第二个是标准牵引下的集群生态网络化。

就在第九届数字中国建设峰会的计算产业峰会上，中国信息通信研究院联合产业各方发起了“1+N”CANN生态网络计划。

500

以人工智能软硬件协同创新与适配验证中心为“1”个核心节点，汇聚区域生态创新中心、ISV合作伙伴及行业领军企业等“N”个节点，旨在通过标准化的适配验证，打通技术到应用的关键环节，解决“点对点”适配难题，加速自主智算解决方案的规模化应用与标杆案例推广，进而构建出一个开放、协同的智算产业生态网络。

在软硬协同与生态网络的推动下，产业界不断将算力转化为可落地的生产力，持续涌现出了不少标杆实践。

在航空领域，南航依托昇腾打造的国产智算底座，研发出了“天策航空求解器”。面对极端天气下的航班恢复难题，通过自主算子库和AI运筹算法，将原本数小时的决策时间压缩至约20分钟。

在能源电力领域，南方电网与华为联合研发“妙算”系列高能效服务器，提出了“算电协同”的理念：通过CPU动态调频、智能风扇温控预测及高效电源优化，实现整机功耗降低13%-15%。

隐藏在上述实践背后的，是产业界合力打造新质生产力的现在进行时，一个开放、协同、高效创新的生态渐行渐近。

04 写在最后

在Token需求爆炸、技术迭代以日计的时代，算力基础设施早已超越了单纯的IT设备，成为了产业向上的核心引擎。

正如我们所看到的：中国计算产业没有选择在旧有架构上修修补补，勇敢地踏入了AI原生计算的“深水区”。从“灵衢”总线打通七大组件的底层协议，到“1+N”CANN生态网络打破算力孤岛，再到昇腾、鲲鹏在千行万业复杂场景中的试炼与智变，为全球产业界提供了可复制、可落地的新选择，也让世界看到了另一种可能。

科技举报

Alter

501篇文章 | 125人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

为世界构建新的选择，AI原生计算正在重塑算力底座

Alter

Alter

热点

站务

观察者网评论

2026年十大预测，这些期待是否会发生？

风闻社区小助手_小风

全场景数码消费指南：风闻「数码情报局」邀你当消费裁判！

最近更新的专栏

风闻最热

全部专栏