黄仁勋的“小目标”:2027年先赚1万亿美元,顺便上个天、养个虾

500

五大关键词解读黄仁勋GTC 2026演讲

作者/  IT时报 贾天荣

编辑/  郝俊慧 

黄仁勋的演讲越来越长了,但英伟达的战线也越拉越开。

回顾CUDA二十周年生态、展望一万亿美元营收、发布一堆名字绕口的芯片……老黄在GTC 2026的舞台上站了两个多小时,扔出的每一个关键词都足够让科技圈嚼上好一阵子。

我们帮你划了重点:五大关键词,看懂英伟达的下一站。

500

关键词一

一万亿美元

去年GTC,黄仁勋说看到2026年有5000亿美元的需求,覆盖Blackwell和Rubin。

今年,此时此刻,他把数字翻了个倍:到2027年,至少1万亿美元。

一语惊人,这话说完,英伟达股价一度涨超4.8%,华尔街的反应很诚实。

但老黄自己觉得这已经是保守估计了:“事实上,我们甚至会供不应求。我确定,实际的计算需求会比这高得多。”他直言,如今的英伟达系统已经证明了自己是全球“成本最低的基础设施”。因为能运行几乎所有领域的AI模型,这种通用性让客户投进去的每一分钱都能充分利用并保持长久生命周期。

凭什么敢喊一万亿?因为英伟达在AI算力领域攥着王炸。本次大会上发布的Vera Rubin平台,是由7款芯片、五种机架系统组成的巨型超级计算平台,直指超大规模AI工厂的算力需求——而且这7款新芯片已经全面投产了,不是PPT。

500

Vera Rubin核心的NVL72机架集成了72个Rubin GPU和36个Vera CPU,与上一代Blackwell平台相比,仅需四分之一数量的GPU就能训练大型混合专家模型,每瓦特推理吞吐量最高提升10倍,同时将每Token成本降至原平台的十分之一。

早在2024年Computex上,黄仁勋就首次披露了Rubin架构,并宣布其将接替Blackwell,成为下一代AI GPU架构。随后在2025 GTC上,展示了搭载Vera CPU与Rubin GPU的Superchip原型,但当时仍停留在单板级产品阶段。

Vera Rubin平台的主要芯片和组件包括Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch,也包含了新整合的Groq 3 LPU。七个芯片组成了一台超级AI计算机,相当于把过去只有超大型科技公司才能搭建的AI超算能力,集成到了一套可以直接部署的标准机架中。既能训练更大的模型,也能让AI像人一样持续工作,而且成本低得惊人。

500

500

关键词二

Token经济学

钱从哪来?

黄仁勋给了一个新答案:Token。

未来的数据中心长什么样?黄仁勋认为,是24小时吐Token的工厂。

“每一座数据中心、每一座工厂,都会受到电力限制。一座1GW的工厂永远不会变成2GW,这是物理和原子的定律。”黄仁勋说。

Token正在成为新的基本单位。

500

黄仁勋抛出一个新的指标:“每瓦Token数”。他把未来的AI服务分成五个层级:免费层、中级层、高级层、高速层、超高速层。在固定的功率下,谁的“每瓦Token吞吐量”最高,谁的生产成本就最低;谁的Token成本低,谁就是老大。

每一个Token都是一次智能的生产,就像工厂里生产出的零件一样。所以未来的数据中心,其实就是一座座“Token工厂”。企业的竞争力不再取决于有多少服务器,而取决于生产Token的成本和效率。

为了把Token的单价打下来,英伟达还拉来了外援:和明星初创公司Groq深度合作,把后者的LPU(语言处理单元)架构纳入自己的产品矩阵。Groq 3 LPU是专为大语言模型推理设计的芯片,和GPU形成互补。两者联手开发了“解耦推理”技术:GPU负责处理输入,LPU负责逐字生成,结果是Token的生成速度提升了35倍。

这意味着,未来用户在使用AI助手时,将几乎感受不到延迟,真正做到实时对话。这套系统预计在今年下半年出货,将首先面向需要极低延迟的云服务商和大型企业。

英伟达甚至在大会上正式推出了基于Groq芯片的‌AI推理专用机架系统LPX,Vera Rubin架构通过与LPX的深度协同,将实现单体算力性能的10倍跃升,开启高达3000亿美元的年收入机遇。

500

500

关键词三

太空芯片

地面卷完,英伟达还要上天。

这次发布的Vera Rubin Space Module,是专门面向轨道数据中心(ODC)和太空操作的AI计算模块。

为什么要送芯片上天?

传统卫星的工作模式是拍摄后将海量数据下载到地面处理,但这套流程正被“数据洪流”压垮。一颗地球观测卫星每天可产生高达数TB的数据,而星地通信带宽有限、窗口期短,导致大量数据积压等待传输。从拍摄到分析结果返回可能耗时数小时,错过灾害预警等场景的黄金窗口。

Vera Rubin Space Module的核心思路是边缘智能:让卫星在轨完成目标检测和变化分析,只下传有价值的结果而非原始数据,从而大幅降低传输压力。

英伟达表示,目前像Axiom Space,Planet Labs这些太空赛道的头部公司,已开始用英伟达的加速平台来运行下一代太空任务了。有了这种算力加持,无论是卫星自主运行还是地理空间智能分析,都将从“慢动作”变成实时响应。

黄仁勋的原话是:“相比H100 GPU,Rubin Space Module在太空推理算力上最高可提升25倍,真正将数据中心级AI算力带入太空。”

500

500

关键词四

一键“养虾”

“养龙虾”的风还是吹到了英伟达。

黄仁勋把开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”,说它只用了几个星期就超越了Linux过去30年取得的成就,甚至表示OpenClaw本质上就是智能体计算机的“操作系统”。

他表示,OpenClaw出现得正是时候,在这之后,全球的每一家公司都应该准备“智能体战略”:“每一家IT公司、每一家SaaS(软件及服务)公司,未来都会变成一家GAS(生成式AI服务)公司。”因此,Token将会成为AI时代的未来基石,所有工程师都需要消耗Token来提高生产力。

500

他甚至给工程师们画了个大饼:“未来,我们公司的每一位工程师都需要一个年度Token预算。他们的基础年薪可能是几十万美元,我会在此基础上再拿出大约一半的金额作为Token额度给他们,让他们实现10倍的效率提升。”

为此,英伟达推出专为“龙虾”设计的NemoClaw软件栈,主打“一键安装”体验。据介绍,其重点在于确保代理程序能够安全使用的同时,不会泄露专有数据。用户可以利用其对OpenClaw进行一键优化,内置的OpenShell可提供隔离沙箱环境,确保数据隐私和网络安全。

黄仁勋特别提到,NemoClaw具备极强的硬件普适性。它可运行在消费级RTX PC、工作站、企业级DGX Station,甚至最新的DGX Spark全系列硬件上,并支持24 小时全时在线(Always-on)。这意味着无论是个人开发者还是大型企业,都能在私有环境下部署一套永不离线的“数字雇员”,彻底摆脱对公有云服务的过度依赖。

500

500

关键词五

图形技术领域的GPT时刻

别忘了,英伟达是靠显卡起家的。

黄仁勋在演讲中专门感谢了GeForce系列,说它是“英伟达最伟大的营销活动”。当年为了打游戏而开发的CUDA,如今成了AI的基石。那些最初为GeForce开发的功能,最终引发了“AI的大爆炸”。

所以这次,他带来了图形领域的“GPT时刻”——DLSS 5神经渲染技术。

全新的DLSS 5把传统3D数据和生成式AI糅合在一起,让AI预测并补全图像内容,GPU不用再从头渲染每一个像素,却能生成细节炸裂的场景和角色。黄仁勋说,这是自2018年实时光线追踪推出以来,英伟达在图形领域最重要的一次突破。

效果有多强?色彩信息加上每帧的运动向量,AI直接给你注入照片级的光照和材质,帧与帧之间还保持稳定。实时运行,最高支持4K分辨率,游戏体验直接起飞。以前只有好莱坞视觉特效才能做到的逼真效果,现在游戏开发者也能搞定了。

“未来将会发生的事情是,这些数据结构将被AI广泛利用,而且AI的运行速度会远远超过人类。未来的AI智能体将同时使用结构化数据库以及非结构化数据库。而后者代表着世界上绝大多数的信息。”

DLSS 5预计将在“今年秋季”推出。支持DLSS 5的名单已经拉得很长:Bethesda,CAPCOM、网易、腾讯、Ubisoft、Warner Bros.Games……首批游戏包括《永恒之塔2》《刺客信条:影》《三角洲行动》《霍格沃茨之遗》《逆水寒》《永劫无间》《异环》《星空》《燕云十六声》等。

从一万亿美元的营收野心,到Token经济学对产业的重新定义;从Vera Rubin平台的超级算力,到太空芯片和“一键养虾”;再到DLSS 5让图形领域迎来GPT时刻……黄仁勋的演讲在告诉世界,算力就是新的电力,而英伟达,正在把它铺到每一个角落,包括太空。

500

排版/ 季嘉颖

图片/ 英伟达

来源/《IT时报》公众号vittimes

E N D

站务

全部专栏