争锋CPU，角逐PC！黄仁勋台北炸场，英特尔、AMD该慌了

半导体产业纵横
半导体产业纵横官方账号

探索IC产业无限可能。7小时前

500

英伟达发布个人电脑超级芯片RTX Spark，狠狠冲击PC市场。

刚刚，英伟达GTC Taipei 2026大会上，黄仁勋身穿标志性的皮衣再次登场。

开场第一句就定调：“两年前我来这里的时候，开始和你谈论AI的下一波浪潮。今天我可以告诉你，代理式AI已经到来，实用性AI已经到来（Agentic AI has arrived. That useful AI has arrived.）。”

本次英伟达GTC Taipei 2026大会上，黄仁勋说了六大重点：

第一，Token经济学，Token现在是盈利的单位。芯片便宜不代表你赚了，芯片贵不代表你亏了

第二，Agent架构五大核心组件：模型（Model）、线束（Harness）、工具（Tools）、技能（Skills）、运行时组件（Runtime）。

第三，Vera Rubin现在正在全面生产中，秋季开始发货。

第四，发布智能体时代的CPU Vera；与x86 CPU相比，任务完成速度提高了1.8倍。

第五，发布个人电脑超级芯片RTX Spark，黄仁勋表示“30年来我们所学的一切精华，都凝聚在这一块芯片中。

第六，芯片设计进入Agent时代，和Cadence、西门子、Synopsys等构建自主AI工程师。

Token经济学：多买多赚

Token如今成了硅谷、中国台湾、深圳所有科技从业者嘴里最热的词。黄仁勋说：“Token现在是盈利的单位。每个Token都是收入。AI公司想建更多Token，建更多AI工厂。”

一个1吉瓦的AI工厂项目，起步价200-300亿美元。很快会到600亿，800亿。每吉瓦一百亿美元。全球科技巨头正在疯狂建设AI基础设施，中国台湾的计算机厂商最近忙得飞起。黄仁勋在现场对着产业链说：“你们都如此忙碌，（中国台湾）企业们做得很好。”这句话背后是整个半导体供应链的狂欢。

500

这就是Token经济学。传统IT时代，买服务器是成本，计算是消耗。AI时代，买GPU是投资，计算是收入。黄仁勋直接画了一条线：芯片便宜不代表你赚了，芯片贵不代表你亏了。选错架构的代价，从未如此高昂。如果你的AI工厂每瓦吞吐量不够高，你买得越多亏得越多。如果每瓦吞吐量足够高，你买得越多赚得越多。

500

两年前黄仁勋说下一波是Agent AI。今天他说：“自主性AI已经到来，实用性AI已经到来”。

黄仁勋给出了一组数据：GitHub提交次数从2023年的3亿次飙升至2026年的5亿次。两年翻将近两倍。全球3000万软件开发者，用3万亿美元薪资，创造了9万亿美元生产力。

黄仁勋反驳了AI会导致失业的说法：“有人说AI会让程序员失业。纯属无稽之谈。工程师数量在增加。因为每个工程师能创造三倍产出，企业当然想招更多。”AI的价值不在于替代，在于放大。它让每个开发者、每个企业的产出能力呈指数级增长。当每个软件工程师能创造三倍价值时，企业没有理由减少招聘，反而会扩招。这就是黄仁勋看到的未来：生产力革命正在发生，而且这个革命的速度比任何人预期的都快。

Agent架构：五大核心组件

过去四十年，计算机的工作模式从未改变：启动应用程序，点击输入，等待结果。Agent时代完全不一样。用户只需要描述意图，AI自动生成代码或使用工具，产生必要输出。

在传统计算中，软件是一个二进制包，运行在操作系统内部，受限于操作系统的调度和约束。Agent的计算模式是异构分布的——模型、线束、工具、技能、运行时分布在数据中心的不同位置，由CPU统一协调。

500

黄仁勋详细拆解了Agent的五大核心组件：

黄仁勋明确指出："This agent consists of model, harness, tools and skills, and a runtime."

模型（Model）：充当“大脑”，负责理解、观察、推理、规划。大型语言模型融合了同步转换能力，如今已能出色完成思考任务。

线束（Harness）：连接一切的“操作系统”。每次上下文处理时，精确路由信息，理解正在发生的事情，协调各组件协同工作。工作记忆和长期记忆的区分在这里变得至关重要。

工具（Tools）：可以是电子表格、网络浏览器、数据处理引擎、数据库引擎、C编译器、Python解释器、JavaScript引擎，甚至加速计算库。每当Agent使用工具时，CPU被调用处理这些请求。

技能（Skills）：这是黄仁勋特别强调的突破。技能本质上是工具的使用手册，AI读取后说“这就是它的使用方法”。英伟达的所有CUDA X库现在都将配备AI可学习的技能。Agent使用这些库的能力将远超人类程序员。

运行时（Runtime）：协调所有组件的执行环境。安全控制装置在CPU和DPU安全处理器上运行，对整个过程进行监控。记忆管理是其中最困难的部分——工作记忆类似KV缓存，需要处理压缩、检索、结构化和非结构化数据。

Agent的计算是分布式异构的。这带来巨大的技术挑战：当计算被分解后，CPU核心之间、CPU与存储设备之间、CPU与GPU之间的带宽成为瓶颈。数据在芯片内外流动时，不能有三重态损耗，不能穿越芯片边界。跨芯片通信延迟必须极低。

Agent的新应用程序与过去应用程序的运行方式有着本质区别。过去应用程序的约束来自操作系统，而Agent的约束来自架构本身——分布式计算的特性决定了它必须在异构环境中高效运行。

正是这个异构计算问题，促使英伟达开发了Vera Rubin。

500

Vera Rubin全面投产，秋季开始发货

今天，黄仁勋宣布Vera Rubin 正在加速全面投产，产品将于今年秋季开始发货。

Vera Rubin是 NVIDIA 迄今为止规模最大的 POD 级平台——五个专用机架组成一个庞大的 AI 超级计算机，专为代理工作负载而设计。该平台将Vera Rubin NVL72 系统、 Vera CPU、Groq 3 LPX、 Vera BlueField-4 STX 存储和 Spectrum-6 SPX 以太网机架整合到一个完全集成的系统中。与上一代 NVIDIA Grace Blackwell 平台相比，Vera Rubin 的大规模代理吞吐量提高了 10 倍。

500

黄仁勋说：“Vera Rubin正是为这一时刻而生——它是一个人工智能工厂引擎，能够大规模地提供智能，并具备推动下一轮工业革命所需的性能、效率和安全性。”

过去组装一个Grace Blackwell机架需要两小时，现在只需5分钟。没有电缆，没有软管，没有风扇，中间只有一块PCB连接两侧。黄仁勋展示这段对比时，语气里藏不住的得意：“上次我给你看这个的时候花了多少时间，我们到处都是电缆。但现在中间有一块PCB，连接两侧的部分。过去需要两小时完成的事情，现在只需五分钟。”

500

不仅是更高的产能，更是AI工厂部署速度的质变。更重要的是可靠性提升，没有线缆就没有线缆故障的风险。黄仁勋说：“Rubin的可靠性和韧性，将会高得离谱。

顶级系统集成商、基础设施软件和存储合作伙伴正在全面生产Vera Rubin产品，其中包括戴尔科技、HPE、联想和超微，以及AIC、仁宝、富士康、技嘉、英业达、和硕、广达云科技（QCT）、纬创资通和Wiwynn等中国台湾代工巨头。

Vera Rubin平台引入了NVIDIA Spectrum-X以太网光子技术，这是世界上首款基于共封装光器件（CPO）的交换机，具有200Gb/s SerDes，现已投入生产。

同时，Vera Rubin平台采用全栈式NVIDIA机密计算技术，旨在打造机架级可信执行环境。Vera Rubin NVL72将Vera CPU、Rubin GPU、NVIDIA NVLink网络和安全功能集成于统一平台，并通过高速互连加密数据。这提供了硬件级认证，确保系统防篡改。

NVIDIA DSX平台为Vera Rubin人工智能工厂提供了完整的设计和运营基础——统一了参考设计、仿真、基础设施软件、设施和生态系统技术，以帮助构建和运营节能型人工智能工厂，从而实现最低的Token成本。

500

黄仁勋专门花时间感谢了微软、戴尔、CoreWeave，因为它们已经搭建了Vera Rubin的工程机架。这意味着代工伙伴不再只是生产零部件，它们在帮英伟达验证整个系统。芯片、散热、网络、存储全部打通。这才是真正的一站式交付。

Vera CPU：首款为Agent打造的处理器

本次演讲中另一个发布，是英伟达首款专为AI Agent时代打造的处理器：Vera CPU。

黄仁勋提出了一个深刻的问题：过去所有CPU都是为人类设计的，人类使用CPU的方式是在一个以秒计数的世界里生活。人类可以等待，可以点击关闭弹窗，可以适应各种不便。但Agent不一样。Agent缺乏耐心。它们并非生活在分秒必争的世界里，它们生活在一个以纳秒为单位的世界里。当Agent使用工具时，希望响应时间尽可能快。当它访问数据库时，必须尽快回来。Agent等待的每一刻都会使其无法进入下一步。

这就是为什么需要全新的CPU架构。传统CPU的设计假设用户可以容忍一定的延迟，但Agent的要求完全不同。

500

在Vera Rubin机架中，Vera CPU承担着三种关键职责：第一，编排与管理。Vera CPU用于协调和管理GPU的工具，管理KV缓存，处理机架中运行的所有软件。在复杂的Agent工作流程中，这些CPU是整个系统的指挥中心。第二，安全与隔离。通过Vera BlueField，CPU负责安全和隔离功能，确保不同工作负载之间不会相互干扰。第三，线束与入口。Vera CPU用于AI模型的工具使用编排，访问数据库。

黄仁勋指出了Vera CPU的架构设计围绕四个关键特性展开：一是单线程性能必须极致；二是每核带宽必须极致；三是芯片内外总带宽必须极致；四是能效必须极致。

500

与x86 CPU 相比，Vera任务完成速度提高了 1.8 倍，可驱动各行各业的各种工作负载，包括智能体AI、强化学习和数据处理，从而产生更多的数据中心代币收入。黄仁勋还提到了几个关键数据：芯片内带宽达3.6TB/s，无三重态损耗，无芯片边界穿越；首款支持PCIe 6.0首款搭载LPDDR5X且带宽达1.2TB/s；88个Olympus内核。

500

黄仁勋说：“这是很长时间以来首款真正达到极限的CPU。”目前，云服务提供商方面，字节跳动、CoreWeave、Lambda、Nebius、Nscale和Oracle云基础设施（OCI）都已计划部署Vera CPU。Vera 系统将于今年秋季开始通过系统构建商和云合作伙伴提供。

黄仁勋指出了一个根本性的趋势：“过去我们为人类制造了CPU。这是一个新市场的开端，一个前所未有的市场。这不会对旧市场造成冲击，这是一个新市场——智能体的CPU。这个市场肯定会比上一个更大。其原因在于，Agent的数量将远远超过人口数量。”

AI PC芯片RTX Spark，40年来PC的首次全面革新

本次最重磅的发布，也是最具消费电子属性的产品——RTX Spark。

黄仁勋的开场白充满历史感：“四十年前Windows开启了PC时代。四十年后，微软和英伟达将重塑PC。”

500

过去四十年，PC的工作方式从未改变——用户启动应用程序，点击鼠标，输入文字。而现在，一个能够理解你、为你提供帮助的Agent将直接接管你的电脑。你可以和它说话，它可以看着你，你可以让它帮你重新提交文件，帮你做研究。新的操作系统是旧操作系统加上大型语言模型。在很多方面，这就是现代版的DirectX。它具备输入输出能力，理解提示，具备计算机视觉理解能力。

500

黄仁勋说：“30年来我们所学的一切精华，都凝聚在这一块芯片中。”

具体看RTX Spark核心规格：6144 个 CUDA 核心；具备 1 petaflop 的 AI 性能；并通过NVLink-C2C芯片间互连技术连接到高性能的 20 核Grace CPU；128GB统一内存；台积电3nm工艺；700亿晶体管。英伟达与联发科合作开发了定制CPU设计，实现了同类最佳的能效、性能和连接性。

RTX Spark笔记本电脑采用全尺寸高端设计，厚度仅为14毫米，重量仅为3磅，提供14至16英寸多种尺寸选择。精密加工的铝合金机身兼具耐用性和简洁现代的设计感。配备色彩精准的双OLED显示屏，并搭载NVIDIA G-SYNC技术，可为创意工作和沉浸式游戏带来惊艳的视觉体验。

500

目前，各大硬件厂商纷纷加入RTX Spark阵营，包括华硕、戴尔、惠普、联想、微软Surface和微星在内的领先制造商将在今年秋季推出产品，宏碁和技嘉的机型随后也将推出。黄仁勋激动地宣布：“这是40年来PC产品系列的首次全面革新。我感到无比荣幸，全球100%的PC行业都已加入我们，共同重塑PC。”

500

黄仁勋展示了新的路线图。每一代架构，英伟达都将提供一台台式电脑、一台笔记本电脑和一台工作站。黄仁勋说：“我们有一个路线图，这对我们来说是一个全新的产品系列。”

芯片设计进入Agent时代

黄仁勋宣布Cadence和英伟达正合作开发芯片设计Agent。

但这次不只是合作，而是真实的生产系统。Cadence使用NVIDIA OpenShell来保护其ChipStack AI超级代理——这是一个完全自主的AI工程师，能够执行芯片设计和验证。而英伟达是首个使用ChipStack自主验证其芯片设计的客户。

每块芯片都始于一系列架构规范，然后翻译成RTL（芯片设计的语言）。RTL必须在仿真中进行验证，一个漏洞可能导致芯片延迟数月。在英伟达，数千名工程师每年数十亿计算小时、数百万次测试已编写、运行并调试，一个周期需要团队数周时间来压缩其节奏。

500

现在，这个流程正在被Agent颠覆。Cadence、Dassault Systèmes、Siemens、Synopsys、Flexcompute、Luminary、Neural Concept、nTop、P-1 AI、PhysicsX和Synera等公司率先利用NVIDIA NemoClaw构建自主AI工程师。通过将这些任务委托给始终在线的自主AI工程师，企业可以将原本需要数周才能完成的工程周期压缩到数小时。

西门子正在将NVIDIA NemoClaw和OpenShell集成到Fuse EDA AI Agent中，这是一个专门构建的自主代理，用于规划和协调半导体、3D集成电路和印刷电路板系统设计中的多工具工作流程。Synopsys正在与NVIDIA合作，为芯片设计构建始终在线的自主AI工程师，重点是实现完全的工作流程自主性。

Nematron 3 Ultra：重新定义开放模型

在模型层面，黄仁勋发布了Nematron 3 Ultra，英伟达最新的开放模型系列。

这是一款拥有5500亿参数的混合专家模型，可为编码、研究和企业工作流程中的长时间运行Agent提供前沿智能。与同类开放式前沿模型相比，Ultra的推理速度提升高达5倍，成本降低高达30%，使Agent能够以更低的成本更快地完成任务。

这是世界上首个基于SSM状态空间模型与混合专家系统混合架构的模型。这种架构意味着什么？黄仁勋说：“我们快速行动，是为了让你在快速思考时能够敏捷思考。同样的成本，更深入的思考。”

更重要的是，英伟达提供的不只是模型，还有完整训练数据、训练脚本、长时间运行工具。这才是真正的开放模型——不只是给你一个黑盒，而是给你整个训练流程，让你能够复现和微调。

Nemotron 3 Ultra经过后训练，可用于领先的Agent平台和工具，包括Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands和OpenCode。CrowdStrike正在使用NVIDIA Nemotron模型为其专用Agent持续识别、确定优先级并修复漏洞和策略配置错误。Palantir将NVIDIA Nemotron模型集成到其AI FDE（前沿部署工程师）平台中，以自主执行复杂任务。

黄仁勋宣布完全致力于Nematron 3的生产，并已经在开发Nematron 4。

英特尔、AMD该慌了吗？

有人说，英伟达现在就是AI时代的“卖铲人”。只要AI还在发展，就离不开英伟达的芯片。这话对了一半。英伟达确实在卖铲子，但黄仁勋显然不满足于此。他要卖的不只是铲子，而是整套的矿场——从GPU到CPU，从网络到存储，从软件栈到AI模型。他想把整个AI时代都装进自己的盒子里。

回顾整个发布会，今天的CPU和RTX Spark将狠狠冲击PC市场。

Vera CPU这款芯片的定位非常精准，它不是用来替代你台式机上的x86处理器，而是为AI工厂场景量身打造。英伟达很清楚自己的边界在哪里：他们不会去抢消费级CPU市场，因为那没有意义。Vera CPU的价值在于，它是Vera Rubin整个系统里不可或缺的一环。所以黄仁勋其实今天一直在强调，这是“全新的市场”。

再说RTX Spark。这是一个完全不同量级的产品，因为它直接杀进了消费级市场。40年来，PC的核心架构没有本质变化：x86处理器加Windows操作系统。但RTX Spark 的笔记本电脑改变了这个公式：英伟达RTX Spark加Windows加Agent。英伟达第一次用自家芯片完整定义了PC的架构，而且是从底层到应用层的垂直整合。

这对市场的冲击不只是“又多了一个芯片选择”那么简单。它意味着PC的评判标准被重新定义了。过去你看PC看的是主频、核心数、内存大小；现在你看的是AI算力、统一内存容量、本地Agent运行能力。

也就是说，是英伟达正在做的事：用自己开发的芯片，替代传统芯片厂商在PC市场的位置。

这种自我颠覆的可怕之处在于，英伟达在GPU市场已经是绝对王者，他有能力承担转型的成本。当他决定进军CPU市场时，他带过来的不只是芯片，还有CUDA生态、开发者社区、整套的软件优化。这是任何新进入者都不具备的优势。

*声明：本文系原作者创作。文章内容系其个人观点，我方转载仅为分享与讨论，不代表我方赞成或认同，如有异议，请联系后台。

科技举报

半导体产业纵横

探索IC产业无限可能。 |

893篇文章 | 177人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

争锋CPU，角逐PC！黄仁勋台北炸场，英特尔、AMD该慌了

半导体产业纵横
半导体产业纵横官方账号

半导体产业纵横

热点

站务

观察者网评论

2026年十大预测，这些期待是否会发生？

风闻社区小助手_小风

全场景数码消费指南：风闻「数码情报局」邀你当消费裁判！

最近更新的专栏

风闻最热

全部专栏

热门搜索

搜索历史

争锋CPU，角逐PC！黄仁勋台北炸场，英特尔、AMD该慌了

半导体产业纵横 半导体产业纵横官方账号

热点

站务

最近更新的专栏

风闻最热

全部专栏

半导体产业纵横
半导体产业纵横官方账号