争锋CPU,角逐PC!黄仁勋台北炸场,英特尔、AMD该慌了

英伟达发布个人电脑超级芯片RTX Spark,狠狠冲击PC市场。
刚刚,英伟达GTC Taipei 2026大会上,黄仁勋身穿标志性的皮衣再次登场。
开场第一句就定调:“两年前我来这里的时候,开始和你谈论AI的下一波浪潮。今天我可以告诉你,代理式AI已经到来,实用性AI已经到来(Agentic AI has arrived. That useful AI has arrived.)。”
本次英伟达GTC Taipei 2026大会上,黄仁勋说了六大重点:
第一,Token经济学,Token现在是盈利的单位。芯片便宜不代表你赚了,芯片贵不代表你亏了
第二,Agent架构五大核心组件:模型(Model)、线束(Harness)、工具(Tools)、技能(Skills)、运行时组件(Runtime)。
第三,Vera Rubin现在正在全面生产中,秋季开始发货。
第四,发布智能体时代的CPU Vera;与x86 CPU相比,任务完成速度提高了1.8倍。
第五,发布个人电脑超级芯片RTX Spark,黄仁勋表示“30年来我们所学的一切精华,都凝聚在这一块芯片中。
第六,芯片设计进入Agent时代,和Cadence、西门子、Synopsys等构建自主AI工程师。
Token经济学:多买多赚
Token如今成了硅谷、中国台湾、深圳所有科技从业者嘴里最热的词。黄仁勋说:“Token现在是盈利的单位。每个Token都是收入。AI公司想建更多Token,建更多AI工厂。”
一个1吉瓦的AI工厂项目,起步价200-300亿美元。很快会到600亿,800亿。每吉瓦一百亿美元。全球科技巨头正在疯狂建设AI基础设施,中国台湾的计算机厂商最近忙得飞起。黄仁勋在现场对着产业链说:“你们都如此忙碌,(中国台湾)企业们做得很好。”这句话背后是整个半导体供应链的狂欢。

这就是Token经济学。传统IT时代,买服务器是成本,计算是消耗。AI时代,买GPU是投资,计算是收入。黄仁勋直接画了一条线:芯片便宜不代表你赚了,芯片贵不代表你亏了。选错架构的代价,从未如此高昂。如果你的AI工厂每瓦吞吐量不够高,你买得越多亏得越多。如果每瓦吞吐量足够高,你买得越多赚得越多。

两年前黄仁勋说下一波是Agent AI。今天他说:“自主性AI已经到来,实用性AI已经到来”。
黄仁勋给出了一组数据:GitHub提交次数从2023年的3亿次飙升至2026年的5亿次。两年翻将近两倍。全球3000万软件开发者,用3万亿美元薪资,创造了9万亿美元生产力。
黄仁勋反驳了AI会导致失业的说法:“有人说AI会让程序员失业。纯属无稽之谈。工程师数量在增加。因为每个工程师能创造三倍产出,企业当然想招更多。”AI的价值不在于替代,在于放大。它让每个开发者、每个企业的产出能力呈指数级增长。当每个软件工程师能创造三倍价值时,企业没有理由减少招聘,反而会扩招。这就是黄仁勋看到的未来:生产力革命正在发生,而且这个革命的速度比任何人预期的都快。
Agent架构:五大核心组件
过去四十年,计算机的工作模式从未改变:启动应用程序,点击输入,等待结果。Agent时代完全不一样。用户只需要描述意图,AI自动生成代码或使用工具,产生必要输出。
在传统计算中,软件是一个二进制包,运行在操作系统内部,受限于操作系统的调度和约束。Agent的计算模式是异构分布的——模型、线束、工具、技能、运行时分布在数据中心的不同位置,由CPU统一协调。

黄仁勋详细拆解了Agent的五大核心组件:
黄仁勋明确指出:"This agent consists of model, harness, tools and skills, and a runtime."
模型(Model):充当“大脑”,负责理解、观察、推理、规划。大型语言模型融合了同步转换能力,如今已能出色完成思考任务。
线束(Harness):连接一切的“操作系统”。每次上下文处理时,精确路由信息,理解正在发生的事情,协调各组件协同工作。工作记忆和长期记忆的区分在这里变得至关重要。
工具(Tools):可以是电子表格、网络浏览器、数据处理引擎、数据库引擎、C编译器、Python解释器、JavaScript引擎,甚至加速计算库。每当Agent使用工具时,CPU被调用处理这些请求。
技能(Skills):这是黄仁勋特别强调的突破。技能本质上是工具的使用手册,AI读取后说“这就是它的使用方法”。英伟达的所有CUDA X库现在都将配备AI可学习的技能。Agent使用这些库的能力将远超人类程序员。
运行时(Runtime):协调所有组件的执行环境。安全控制装置在CPU和DPU安全处理器上运行,对整个过程进行监控。记忆管理是其中最困难的部分——工作记忆类似KV缓存,需要处理压缩、检索、结构化和非结构化数据。
Agent的计算是分布式异构的。这带来巨大的技术挑战:当计算被分解后,CPU核心之间、CPU与存储设备之间、CPU与GPU之间的带宽成为瓶颈。数据在芯片内外流动时,不能有三重态损耗,不能穿越芯片边界。跨芯片通信延迟必须极低。
Agent的新应用程序与过去应用程序的运行方式有着本质区别。过去应用程序的约束来自操作系统,而Agent的约束来自架构本身——分布式计算的特性决定了它必须在异构环境中高效运行。
正是这个异构计算问题,促使英伟达开发了Vera Rubin。

Vera Rubin全面投产,秋季开始发货
今天,黄仁勋宣布Vera Rubin 正在加速全面投产,产品将于今年秋季开始发货。
Vera Rubin是 NVIDIA 迄今为止规模最大的 POD 级平台——五个专用机架组成一个庞大的 AI 超级计算机,专为代理工作负载而设计。该平台将Vera Rubin NVL72 系统、 Vera CPU、Groq 3 LPX、 Vera BlueField-4 STX 存储和 Spectrum-6 SPX 以太网机架整合到一个完全集成的系统中。与上一代 NVIDIA Grace Blackwell 平台相比,Vera Rubin 的大规模代理吞吐量提高了 10 倍。

黄仁勋说:“Vera Rubin正是为这一时刻而生——它是一个人工智能工厂引擎,能够大规模地提供智能,并具备推动下一轮工业革命所需的性能、效率和安全性。”
过去组装一个Grace Blackwell机架需要两小时,现在只需5分钟。没有电缆,没有软管,没有风扇,中间只有一块PCB连接两侧。黄仁勋展示这段对比时,语气里藏不住的得意:“上次我给你看这个的时候花了多少时间,我们到处都是电缆。但现在中间有一块PCB,连接两侧的部分。过去需要两小时完成的事情,现在只需五分钟。”

不仅是更高的产能,更是AI工厂部署速度的质变。更重要的是可靠性提升,没有线缆就没有线缆故障的风险。黄仁勋说:“Rubin的可靠性和韧性,将会高得离谱。
顶级系统集成商、基础设施软件和存储合作伙伴正在全面生产Vera Rubin产品,其中包括戴尔科技、HPE、联想和超微,以及AIC、仁宝、富士康、技嘉、英业达、和硕、广达云科技(QCT)、纬创资通和Wiwynn等中国台湾代工巨头。
Vera Rubin平台引入了NVIDIA Spectrum-X以太网光子技术,这是世界上首款基于共封装光器件(CPO)的交换机,具有200Gb/s SerDes,现已投入生产。
同时,Vera Rubin平台采用全栈式NVIDIA机密计算技术,旨在打造机架级可信执行环境。Vera Rubin NVL72将Vera CPU、Rubin GPU、NVIDIA NVLink网络和安全功能集成于统一平台,并通过高速互连加密数据。这提供了硬件级认证,确保系统防篡改。
NVIDIA DSX平台为Vera Rubin人工智能工厂提供了完整的设计和运营基础——统一了参考设计、仿真、基础设施软件、设施和生态系统技术,以帮助构建和运营节能型人工智能工厂,从而实现最低的Token成本。

黄仁勋专门花时间感谢了微软、戴尔、CoreWeave,因为它们已经搭建了Vera Rubin的工程机架。这意味着代工伙伴不再只是生产零部件,它们在帮英伟达验证整个系统。芯片、散热、网络、存储全部打通。这才是真正的一站式交付。
Vera CPU:首款为Agent打造的处理器
本次演讲中另一个发布,是英伟达首款专为AI Agent时代打造的处理器:Vera CPU。
黄仁勋提出了一个深刻的问题:过去所有CPU都是为人类设计的,人类使用CPU的方式是在一个以秒计数的世界里生活。人类可以等待,可以点击关闭弹窗,可以适应各种不便。但Agent不一样。Agent缺乏耐心。它们并非生活在分秒必争的世界里,它们生活在一个以纳秒为单位的世界里。当Agent使用工具时,希望响应时间尽可能快。当它访问数据库时,必须尽快回来。Agent等待的每一刻都会使其无法进入下一步。
这就是为什么需要全新的CPU架构。传统CPU的设计假设用户可以容忍一定的延迟,但Agent的要求完全不同。

在Vera Rubin机架中,Vera CPU承担着三种关键职责:第一,编排与管理。Vera CPU用于协调和管理GPU的工具,管理KV缓存,处理机架中运行的所有软件。在复杂的Agent工作流程中,这些CPU是整个系统的指挥中心。第二,安全与隔离。通过Vera BlueField,CPU负责安全和隔离功能,确保不同工作负载之间不会相互干扰。第三,线束与入口。Vera CPU用于AI模型的工具使用编排,访问数据库。
黄仁勋指出了Vera CPU的架构设计围绕四个关键特性展开:一是单线程性能必须极致;二是每核带宽必须极致;三是芯片内外总带宽必须极致;四是能效必须极致。

与x86 CPU 相比,Vera任务完成速度提高了 1.8 倍,可驱动各行各业的各种工作负载,包括智能体AI、强化学习和数据处理,从而产生更多的数据中心代币收入。黄仁勋还提到了几个关键数据:芯片内带宽达3.6TB/s,无三重态损耗,无芯片边界穿越;首款支持PCIe 6.0首款搭载LPDDR5X且带宽达1.2TB/s;88个Olympus内核。

黄仁勋说:“这是很长时间以来首款真正达到极限的CPU。”目前,云服务提供商方面,字节跳动、CoreWeave、Lambda、Nebius、Nscale和Oracle云基础设施(OCI)都已计划部署Vera CPU。Vera 系统将于今年秋季开始通过系统构建商和云合作伙伴提供。
黄仁勋指出了一个根本性的趋势:“过去我们为人类制造了CPU。这是一个新市场的开端,一个前所未有的市场。这不会对旧市场造成冲击,这是一个新市场——智能体的CPU。这个市场肯定会比上一个更大。其原因在于,Agent的数量将远远超过人口数量。”
AI PC芯片RTX Spark,40年来PC的首次全面革新
本次最重磅的发布,也是最具消费电子属性的产品——RTX Spark。
黄仁勋的开场白充满历史感:“四十年前Windows开启了PC时代。四十年后,微软和英伟达将重塑PC。”


过去四十年,PC的工作方式从未改变——用户启动应用程序,点击鼠标,输入文字。而现在,一个能够理解你、为你提供帮助的Agent将直接接管你的电脑。你可以和它说话,它可以看着你,你可以让它帮你重新提交文件,帮你做研究。新的操作系统是旧操作系统加上大型语言模型。在很多方面,这就是现代版的DirectX。它具备输入输出能力,理解提示,具备计算机视觉理解能力。

黄仁勋说:“30年来我们所学的一切精华,都凝聚在这一块芯片中。”
具体看RTX Spark核心规格:6144 个 CUDA 核心;具备 1 petaflop 的 AI 性能;并通过NVLink-C2C芯片间互连技术连接到高性能的 20 核Grace CPU;128GB统一内存;台积电3nm工艺;700亿晶体管。英伟达与联发科合作开发了定制CPU设计,实现了同类最佳的能效、性能和连接性。
RTX Spark笔记本电脑采用全尺寸高端设计,厚度仅为14毫米,重量仅为3磅,提供14至16英寸多种尺寸选择。精密加工的铝合金机身兼具耐用性和简洁现代的设计感。配备色彩精准的双OLED显示屏,并搭载NVIDIA G-SYNC技术,可为创意工作和沉浸式游戏带来惊艳的视觉体验。

目前,各大硬件厂商纷纷加入RTX Spark阵营,包括华硕、戴尔、惠普、联想、微软Surface和微星在内的领先制造商将在今年秋季推出产品,宏碁和技嘉的机型随后也将推出。黄仁勋激动地宣布:“这是40年来PC产品系列的首次全面革新。我感到无比荣幸,全球100%的PC行业都已加入我们,共同重塑PC。”

黄仁勋展示了新的路线图。每一代架构,英伟达都将提供一台台式电脑、一台笔记本电脑和一台工作站。黄仁勋说:“我们有一个路线图,这对我们来说是一个全新的产品系列。”
芯片设计进入Agent时代
黄仁勋宣布Cadence和英伟达正合作开发芯片设计Agent。
但这次不只是合作,而是真实的生产系统。Cadence使用NVIDIA OpenShell来保护其ChipStack AI超级代理——这是一个完全自主的AI工程师,能够执行芯片设计和验证。而英伟达是首个使用ChipStack自主验证其芯片设计的客户。
每块芯片都始于一系列架构规范,然后翻译成RTL(芯片设计的语言)。RTL必须在仿真中进行验证,一个漏洞可能导致芯片延迟数月。在英伟达,数千名工程师每年数十亿计算小时、数百万次测试已编写、运行并调试,一个周期需要团队数周时间来压缩其节奏。

现在,这个流程正在被Agent颠覆。Cadence、Dassault Systèmes、Siemens、Synopsys、Flexcompute、Luminary、Neural Concept、nTop、P-1 AI、PhysicsX和Synera等公司率先利用NVIDIA NemoClaw构建自主AI工程师。通过将这些任务委托给始终在线的自主AI工程师,企业可以将原本需要数周才能完成的工程周期压缩到数小时。
西门子正在将NVIDIA NemoClaw和OpenShell集成到Fuse EDA AI Agent中,这是一个专门构建的自主代理,用于规划和协调半导体、3D集成电路和印刷电路板系统设计中的多工具工作流程。Synopsys正在与NVIDIA合作,为芯片设计构建始终在线的自主AI工程师,重点是实现完全的工作流程自主性。
Nematron 3 Ultra:重新定义开放模型
在模型层面,黄仁勋发布了Nematron 3 Ultra,英伟达最新的开放模型系列。
这是一款拥有5500亿参数的混合专家模型,可为编码、研究和企业工作流程中的长时间运行Agent提供前沿智能。与同类开放式前沿模型相比,Ultra的推理速度提升高达5倍,成本降低高达30%,使Agent能够以更低的成本更快地完成任务。
这是世界上首个基于SSM状态空间模型与混合专家系统混合架构的模型。这种架构意味着什么?黄仁勋说:“我们快速行动,是为了让你在快速思考时能够敏捷思考。同样的成本,更深入的思考。”
更重要的是,英伟达提供的不只是模型,还有完整训练数据、训练脚本、长时间运行工具。这才是真正的开放模型——不只是给你一个黑盒,而是给你整个训练流程,让你能够复现和微调。
Nemotron 3 Ultra经过后训练,可用于领先的Agent平台和工具,包括Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands和OpenCode。CrowdStrike正在使用NVIDIA Nemotron模型为其专用Agent持续识别、确定优先级并修复漏洞和策略配置错误。Palantir将NVIDIA Nemotron模型集成到其AI FDE(前沿部署工程师)平台中,以自主执行复杂任务。
黄仁勋宣布完全致力于Nematron 3的生产,并已经在开发Nematron 4。
英特尔、AMD该慌了吗?
有人说,英伟达现在就是AI时代的“卖铲人”。只要AI还在发展,就离不开英伟达的芯片。这话对了一半。英伟达确实在卖铲子,但黄仁勋显然不满足于此。他要卖的不只是铲子,而是整套的矿场——从GPU到CPU,从网络到存储,从软件栈到AI模型。他想把整个AI时代都装进自己的盒子里。
回顾整个发布会,今天的CPU和RTX Spark将狠狠冲击PC市场。
Vera CPU这款芯片的定位非常精准,它不是用来替代你台式机上的x86处理器,而是为AI工厂场景量身打造。英伟达很清楚自己的边界在哪里:他们不会去抢消费级CPU市场,因为那没有意义。Vera CPU的价值在于,它是Vera Rubin整个系统里不可或缺的一环。所以黄仁勋其实今天一直在强调,这是“全新的市场”。
再说RTX Spark。这是一个完全不同量级的产品,因为它直接杀进了消费级市场。40年来,PC的核心架构没有本质变化:x86处理器加Windows操作系统。但RTX Spark 的笔记本电脑改变了这个公式:英伟达RTX Spark加Windows加Agent。英伟达第一次用自家芯片完整定义了PC的架构,而且是从底层到应用层的垂直整合。
这对市场的冲击不只是“又多了一个芯片选择”那么简单。它意味着PC的评判标准被重新定义了。过去你看PC看的是主频、核心数、内存大小;现在你看的是AI算力、统一内存容量、本地Agent运行能力。
也就是说,是英伟达正在做的事:用自己开发的芯片,替代传统芯片厂商在PC市场的位置。
这种自我颠覆的可怕之处在于,英伟达在GPU市场已经是绝对王者,他有能力承担转型的成本。当他决定进军CPU市场时,他带过来的不只是芯片,还有CUDA生态、开发者社区、整套的软件优化。这是任何新进入者都不具备的优势。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。



半导体产业纵横官方账号



