陈立武:英特尔将在AI硬件上与英伟达竞争

500

本文由半导体产业纵横(ID:ICVIEWS)综合

陈立武瞄准了英伟达。

据报道,英特尔新任CEO陈立武在最新提交的年报中表示,“我们无疑须开发具竞争力的机柜级系统解决方案,借此强化云端AI数据中心的市场地位,这将是我跟团队的优先要务。”

据悉,陈立武瞄准的竞争产品,是英伟达目前最顶级的GB200 NVL72 Blackwell AI系统。一名英特尔前高层曾表示,英伟达这套系统是AI计算领域的“终极掠食者”(apex predator)。GB200 NVL72在一台服务器机柜内部连接了72颗GPU,远多于上一代的8颗GPU,能在有限空间内提供前所未见的算力密度。

目前,英伟达在AI数据中心市场居于霸主地位,占据接近90%的AI芯片市场份额。AMD在2024年也实现了超过50亿美元的AMD Instinct加速器收入。相比之下,英特尔在AI市场的表现却欠佳。

2024年10月,英特尔公司就曾坦承旗下Gaudi系列AI加速器无法达成之前设定的2024年5亿美元营收目标。今年1月,英特尔新一代AI数据中心产品“Falcon Shores”被传难产,将转而研发另一款AI数据中心解决方案“Jaguar Shores”。

无法达成预期营收的Gaudi

Gaudi 系列AI加速器是英特尔推出的用于人工智能计算的产品。2024年4月,英特尔宣布将推出Gaudi 3 AI加速器,其在芯片架构和性能提升方面的表现受到外界关注。

相较于上一个版本 Gaudi 2,Gaudi 3制造工艺从台积电7nm升级到台积电5nm,MME(矩阵乘法引擎)从2个增加到8个,虽然每个MME内部的TPC(张量处理核心)从12个减少到8个,但是总数从24个大幅增加到了64个,媒体解码器差从8个增至14个,内置SRAM缓存容量翻番至96MB,带宽翻倍至12.8TB/s。

核心性能方面,MME BF16/FP8都是1835 TFlops,矢量BF16则是28.8 TFlops,分别提升了3.2倍、1.1倍、1.6倍。HBM2E高带宽内存容量从96GB增加到128GB(八颗),带宽也顺应增加来到惊人的3.7TB/s。24个200Gb RDMA网络接口,双向网络互连带宽1.2TB/s,主机接口峰值双向带宽128GB/s,系统总线升级为PCIe 5.0 x16。

按照官方说法,Gaudi 3对比NVIDIA H100,LLM大模型推理性能领先50%、训练时间快40%,性价比则是对手的2倍。在产品推出的同时,英特尔就宣布Supermicro 和 Dell 等主流服务器供应商已经开始支持 Gaudi 3 系统,并且与IBM展开全球合作,IBM的watsonx AI和数据平台中将率先支持Gaudi 3。

英特尔对Gaudi 3未来发展充满信心。同月,英特尔发布财报预计 Gaudi AI芯片产品线将带来5亿美元销售收入。但可惜结果并不乐观,稍后在2024 年第三季度财报电话会议上,英特尔首席执行官帕特・盖辛格表示,尽管 Gaudi 3 加速器已于本季度推出,但因产品从Gaudi 2向Gaudi 3的过渡以及软件易用性问题影响了采用率,整体市场接受度低于预期,无法实现2024年Gaudi收入达到5亿美元的目标 。

永远停留在实验室阶段的Falcon Shores

Falcon Shores 是英特尔下一代 GPU,并将整合英特尔Gaudi的技术。但Falcon Shores从设计到量产,一路都很坎坷,最后甚至被取消。

起初,Falcon Shores设计规划是XPU,集成x86架构CPU与GPU,但是这一设计面临致命缺陷,CPU 模块性能不足且功耗过高,无法与AMD Instinct MI300A等竞品竞争。2023年,英特尔被迫放弃XPU方案,转向纯GPU架构,导致开发周期延长。

Falcon Shores与台积电合作,运用3nm和5nm工艺生产,并结合CoWoS先进封装技术,这既提升了芯片性能与集成度,又提高了生产效率与产品质量。该 GPU 预计集成 288GB 的 HBM3 内存,运行速度可达 9.8TB/s 吞吐量,还支持 FP8 和 FP16 浮点精度,能满足 AI 及其他工作负载的不同精度计算需求。

Falcon Shores原本计划于2024年推出,但后来推迟到2025年。2025年2月,在财报电话会议上,英特尔临时联合 CEO Michelle Johnston Holthaus 透露,原计划于今年推出、旨在结合Intel Xe图形能力和Gaudi AI性能优势的 Falcon Shores项目将永远停留在实验室阶段。“我们计划仅将Falcon Shores用作内部测试芯片,不会推向市场。”

全力押注机架级解决方案Jaguar Shores

在经历一系列挫折之后,英特尔重新评估了其战略,认为与其推出单一芯片,不如整合Gaudi加速器、Xeon CPU和网络技术,打造Jaguar Shores机架级解决方案。

Jaguar Shores由Habana Labs主导开发,采用Intel 18A 工艺与背面供电技术,强调机架级优化。其放弃了Falcon Shores 的纯 GPU 路线,转向混合架构,可能集成Gaudi ASIC与Xe-HPC GPU技术,兼顾通用性与 AI 加速。其中,Falcon Shores部分技术(如液冷设计、CoWoS 封装)将被移植到 Jaguar Shores。

根据规划,英特尔将在2025 年推出Jaguar Shores样品,2026 年量产,未来Jaguar Shores会替代Gaudi 3成为英特尔AI数据中心主力产品,与英伟达GB200 NVL72 展开竞争。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

站务

全部专栏