英特尔数据中心首次亮相288核CPU、480GB显存GPU!18A来了!

500

英特尔数据中心全线产品“秀肌肉”。

数据中心眼下是整个科技行业最热闹的赛道。

英伟达数据中心业务连续多个季度创纪录,AMD EPYC系列增长强劲,AI推理需求正在引爆一场算力军备竞赛。而在这个时间节点,英特尔Intel 18A工艺正走向成熟,代工业务转型进入深水区。

今日,英特尔首次集中展示数据中心领域的全线产品——CPU、GPU、网卡,一样不缺。这不只是产品的展示,更是战略方向的发布。三件事交织在一起,让这次发布会变成了一个观察英特尔战略走向的绝佳窗口。

500

至强6+:288核怪兽登场,18A工艺首秀

500

本次最重磅的产品,当属至强6+。

这是英特尔首次将Intel 18A制程工艺应用于数据中心处理器。更重要的是,它采用了Foveros Direct 3D封装技术,将基于18A的计算晶片堆叠在Intel 3的基底晶片之上,再用EMIB技术完成互联。整个封装由29个组件构成:12个计算晶片、3个Active基底晶片、2个I/O晶片、12个EMIB互联Tile。

500

单处理器最多288个能效核。这是业界目前最高的核心密度。配合高达576MB的末级缓存(LLC,较上一代提升超过5倍)和8000 MT/s的DDR5内存,内存子系统实现了大幅升级。在主流工作负载下,整体性能最高提升至2.26倍,每瓦性能最高提升至1.55倍。与竞品横向比较,至强6+的每线程性能高出1.3倍,每线程每瓦性能同样高出1.3倍。

18A工艺带来了两项关键技术升级:PowerVia实现更短、更直接的供电路径,有效降低功耗;RibbonFET则在降低待机功耗的同时增强性能一致性。

500

一个比较直观的数据:与第二代至强相比,至强6+可实现9:1的服务器整合比,减少近80%的机架空间占用,同时降低73%的能耗。对于正在头疼数据中心能耗和散热问题的运营商来说影响巨大。爱立信在真实运营商部署中测试了至强6+的分组核心网:与上一代E-core相比,相同内核数量下性能提升30%,机架功耗降低38%,每瓦性能提升超过60%。

英特尔还带来了一个全新的硬功能:Intel AET(应用能效遥测技术)。它可以在工作负载层级实时监测CPU功耗,让数据中心运营商实现更精细的能效优化和成本分摊。对云服务提供商和大型企业数据中心来说,这意味着更可控的TCO和更精准的资源调度。

首款数据中心GPU,480GB显存降维打击

500

如果说至强6+是英特尔守住了基本盘,那Crescent Island就是他们第一次正式进入数据中心GPU战场。这是首款基于Xe3P架构的数据中心GPU,专为AI推理和Agent工作负载优化。它的核心参数非常炸裂:480GB LPDDR5内存,350W TDP。

480GB这个数字有特殊含义。以DeepSeek-V4(1.6T参数)为例,在FP8量化精度下仅需4张Crescent Island即可支持部署。更长的上下文窗口、更多的模型切换,这些在Agent工作流中频繁发生的场景,因为超大容量内存而变得更具操作性。LPDDR而非HBM的选择,让功耗降至350W,意味着它可以在现有风冷数据中心中直接运行,不需要液冷改造。

同时,Crescent Island支持原生FP64。这让它不仅仅是一款AI推理卡,也为未来进入HPC市场埋下了伏笔。英特尔内部正在推进CPU与Crescent Island联合的软件栈,以支持更好的HPC应用。英特尔显然在刻意控制产品边界。他们去掉了对部分通用场景不必要的能力,把晶体管面积释放出来给AI性能。

软件层面,英特尔围绕四个原则构建统一的Xe软件栈:开放、规模化性能、优秀的用户体验、支持异构基础设施。英特尔选择了上游优先的策略:PyTorch、vLLM、SGLang等主流框架,都会在Day 0就获得支持。他们还与SambaNova达成合作,后者侧重大型系统级的高吞吐、低延迟集中式推理,而Crescent Island则主攻端侧和企业级的小规模部署(如8卡或16卡一体机)。

目前已有超过20家OEM和ODM厂商在针对Crescent Island进行开发。这个数字背后,是英特尔生态正在加速扩张的信号。

500

除去CPU和GPU,本次一同发布的还有全新的E835以太网网卡。高达200GbE吞吐量,支持RDMA和动态设备个性化(DDP),在满载200G双向线速运行时,功耗比同类产品低28%至47%,能效比达到竞品的1.4至1.9倍。内置硅芯片信任根和固件证明等硬件级安全能力,超过10年的产品生命周期,让数据中心在长期运营中拥有更稳定的技术投资保障。

Agentic AI时代,CPU重回C位

过去两三年,AI推理几乎等同于GPU的工作。但随着Agentic AI的崛起,游戏规则正在被改写。英特尔公司执行副总裁兼数据中心事业部(DCG)总经理Kevork Kechichian表示:“CPU现在处于所有这些流程的中心,试图去编排和调度整个大局。”

Agent工作流是多步骤、多推理、多计算的,需要维持极长的上下文窗口,多个专家Agent会繁衍出多个子Agent协同完成复杂任务,这导致Token消耗量呈指数级增长。在这种场景下,GPU负责思考(推理、代码生成),而CPU负责执行(编排、调度、模拟、上下文管理)。两者的关系从传统的1:8配比,正在向1:4、1:2甚至1:1演进,在强化学习场景中甚至出现反转。

这解释了为什么至强6+的高内核密度变得如此重要。英特尔实测,基于288核心的Clearwater Forest,可以轻松部署400到500个以上的Agent并发运行。更重要的是,CPU内置的加速器(矩阵引擎、向量引擎)和机密计算能力(TDX、SGX),正好契合Agent场景对数据隐私和安全隔离的严格要求。当多个Agent并行运行、多租户并行调度时,TDX和SGX可以在可信平台上确保隐私信息在安全可控范围内运行。

x86仍将统治2030年

x86架构在数据中心的影响力,并没有因为AI浪潮而削弱,反而在某些关键场景下被重新强化。

英特尔将工作负载分为三大类:需要高密度计算的横向扩展(Scale-out)场景、平衡性能和数据吞吐量的通用场景,以及计算密集型的AI训练场景。但在这些传统分类之外,一个新的中间地带正在形成。推理侧的混合场景:GPU级加速,但主体仍以CPU为核心。

这个第三类场景的崛起,意义远超表面。AI推理与训练存在显著差异,训练需要大规模并行计算,GPU是绝对主力;但推理阶段,尤其是企业级的Agent工作流,涉及多步骤推理、上下文管理、调度和模拟,这些恰恰是CPU的强项。当Token消耗量呈指数级增长,当多个Agent并行运行、当极长上下文窗口需要被持续维持,CPU不再是旁观者,而是整个系统的编排中枢。

500

500

英特尔在发布会上给出了一个数字:预计到2030年,全球超过8000万台在网服务器中,80%仍将基于x86架构。当前,推理和Agent AI,几乎完全运行在x86上。

广泛x86软件生态与开发者社区的积累、多年打磨的硬件加速能力(IAA内存压缩、CXL内存扩展等)、以及成熟的可管理性和安全特性,这些积累在过去或许只是“基本功”,但在Agent AI时代,它们突然变成了宝藏。内存成本高企、容量需求激增,让IAA技术重新进入客户视野;CXL内存池的能力,使得跨CPU共享缓存层级成为可能。

英特尔也在通过架构层面的精细化应对这种分化。针对不同工作负载,他们同时推进P-core(性能核)和E-core(能效核)两条路线:P-core在通用计算中性能优势突出,客户反馈积极;而E-core在高密度、低功耗的Agent场景中正变得越来越不可或缺。两种核心并行推进,而非非此即彼,为x86在AI时代的市场定位提供了更弹性的支撑。ARM在服务器领域布局多年,但x86的生态壁垒和成熟度,在可预见的未来依然难以撼动。

从芯片到机架级,英特尔的野望

500

英特尔数据中心的布局不止于此,从路线图来看,英特尔下一步会推出Diamond Rapids,预计2027年推出,采用18A P工艺,比至强6+的18A更进一步的制程节点。它采用Scalable SOC架构,引入统一内存延迟(Uniform Memory Latency)设计。在关键的内存和I/O上,Diamond Rapids的通道数量相比前代增加2倍,内存速度全面提升,PCIe支持到Gen6,为带宽受限和I/O密集型应用提供更强的支撑。

500

从应用场景来看,Diamond Rapids瞄准的是高需求IaaS环境、高性能计算、带宽密集型应用和I/O密集型工作负载,这些正是AI推理和Agent工作流正在倒逼的基础设施升级方向。

从至强6+到Diamond Rapids,制程节点、产品密度、内存带宽、I/O性能,每一代都在系统性提升。值得一提的是,支撑英特尔数据中心产品的,是Intel 18A工艺的快速成熟。从至强6+开始,所有核心产品均基于18A工艺,这不仅意味着更高的性能和能效比,更意味着英特尔的产品规划和制程节点,终于回到了同频共振的状态。

2026年的数据中心市场,正在经历一场深刻的变革。AI工作负载的爆发,改变了CPU与GPU的关系,重塑了数据中心的设计逻辑。

英特尔又站回了舞台中央。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

站务

全部专栏