揭晓英伟达最强芯片!Blackwell Ultra、Rubin芯片亮相
电子发烧友网报道(文/莫婷婷)北京时间3月19日晚间,NVIDIA 创始人兼首席执行官黄仁勋在2025年GTC开发者大会上发表了主题演讲,介绍了英伟达在AI、机器人、加速计算等领域的最新进展,包括新一代芯片Blackwell Ultra(GB300)、数据中心超级芯片Grace Blackwell NVLink72、NVIDIA Dynamo开源推理软件、DGX Spark和DGX Station两款个人AI电脑/计算机,首款开源人形机器人功能模型——GR00T N1等解决方案,还有新机器人亮相。
黄仁勋表示,AI发展的过程中涉及三个基本问题,第一个问题是如何解决数据的问题,第二个问题是如何在没有人工的参与下,训练数据,第三个问题如何找到一种算法让AI变得更加聪明。显然,在AI技术发展的过程中,AI正在经历一个拐点,当下处于生成式 AI 阶段,接下来将迈向代理式 AI 时代,随后是物理 AI(Physical AI),也就是机器人登场的时候到了。
它变得更有用、更聪明,训练这些模型和推理这些模型所需的计算量已经大幅增长,对于算力的需求也随着AI的发展到达新的拐点。
Blackwell Ultra GB300亮相
英伟达在财报会议上提到,Blackwell AI 超级计算机已实现大规模生产,并且在第一季度实现了数十亿美元的销售额。会议上,黄仁勋展示了使用 Grace Blackwell 的联想、戴尔、微软、亚马逊等各厂商数据中心机架,Grace Blackwell NVLink72 超级芯片。
黄仁勋表示大规模推理是英伟达解决的最为复杂的计算问题,而这正是英伟达 Blackwell系统的目标之一。黄仁勋表示Blackwell 拥有如此强劲的需求,这是因为推理型 AI 引入了新的扩展定律,即增加训练算力可以使模型变得更智能,而增加长思考算力则可以让答案变得更精准。
为了满足市场不断增加的算力需求,英伟达在此次会议上正式推出了新一代芯片Blackwell Ultra(GB300)。作为英伟达下一代GPU架构的代表,Blackwell Ultra实现了设计到性能上的全方位升级,其量产能力也备受关注。
Blackwell Ultra包括NVIDIA GB300 NVL72机架级解决方案和NVIDIA HGXT B300 NVL16系统。GB300 NVL72与上一代NVIDIA GB200 NL72相比,AI的性能提升5倍。GB300 NVL72连接了72个Blackwell Ultra GPU与36个基于Arm Neoverse的Grace CPU;NVIDIA HGX B300 NVL16与上一代相比,在大型语言模型上具有11倍推理速度、4倍内存,可以为AI推理等复杂的工作负载提供突破性的性能。
GTC 2025上,英伟达还发布了数据中心超级芯片——Grace Blackwell NVLink72。它配备了72个Blackwell GPU、具有两倍的带宽和、1.5 倍更快的内存,将于 2025 年下半年推出。
Rubin性能是Hopper的900 倍,下一代架构命名“Feynman”
英伟达还展示下一代AI芯片Rubin架构的进展,作为继Hopper、Blackwell的下一代架构,Rubin 有着令人难以置信的性能,其性能是 Hopper 的 900 倍,新的CPU的性能是grace 的两倍,且更多的内存,更多的带宽,基本上除了机箱以外,所有东西都是全新的,引入 NVL144 和 NVL288 机架结构。
黄仁勋表示,公司将在下半年过渡到Blackwell Ultra芯片,再是Vera Rubin。不过Vera Rubin NVL144 将在2026 年下半年推出,而 Rubin Ultra NVL576则要在 2027 年下半年推出。
英伟达通常都会提前两到三年公布技术路线图,这是因为建设AI工厂和AI基础设施、需要多年的计划,必须准备资本支出、组建工程团队,这样就不会在公布时让您感到惊讶。黄仁勋表示,在Rubin架构之后,下一代命名Feynman架构,取自美国物理学家理查德・费曼。将于2028年登场。
NVIDIA Dynamo开启AI工厂的性能、成本革命
英伟达带来了 NVIDIA Dynamo开源推理软件,可以以最低的成本和最高的效率在人工智能工厂中加速和扩展人工智能推理模型。“它本质上是一个AI工厂的操作系统,而在过去,在我们运行数据中心的方式中,我们的操作系统将类似于VMware,但在未来,应用程序不是企业应用,而是代理。操作系统不像VMware,这有点像发电机。而且这个操作系统不是在数据中心上运行,而是在一个AI工厂上运行。”黄仁勋表示。
发电机是开启上一次工业革命、能源工业革命的第一个仪器,也是这一切的起点。英伟达正在凭借其技术先进性开启一场AI革命。
NVIDIA Dynamo是NVIDIA Triton推理服务器的升级版,黄仁勋表示NVIDIA Dynamo将为部署推理AI模型的AI工厂实现最大化代币收益,推动了AI工厂的成本节约和效率。NVIDIA Dynamo协调并加速GPU之间的推理通信,并使用分解服务来分离不同GPU上的大型语言模型的处理和生成阶段,由此实现最大限度的GPU资源利用率。
NVIDIA Dynamo集成了提高吞吐量和降低成本的功能。能够实现AI大模型推理性能的改进在相同数量的图形处理器的情况,NVIDIA Dynamo在GB200 NL72机架的大型集群上运行DeepSeek-R1模型时,NVIDIA Dynamo的智能推理优化还增加了每个GPU生成的令牌数量超过30倍。
人形机器人通用基础模型发布,机器人Blue首发出场
作为算力霸主,英伟达寄希望于机器人,期望机器人为其带来新的增长动力。英伟达机器人技术业务副总裁Deepu Talla曾表示,“物理人工智能和机器人技术的ChatGPT时刻即将到来。”可以看到,英伟达在机器人领域动作频频,其定位为机器人技术平台的供应商,推出了NVIDIA Isaac机器人开发平台、Jetson Orin NX系列芯片等。
人形机器人和物理AI的发展正在加速,英伟达也在为机器人市场做准备。在此次的GTC 2025大会上推出了全球首款开源人形机器人通用基础模型——GR00T N1,以及用于加速机器人开发的Simulation Frameworks。“互联网规模的数据提供了共同的感知和推理,但机器人需要动作和控制数据,而这些数据是难以获取的,基于英伟达全宇宙的蓝图,开发人员可以生成大量的各种合成数据来训练机器人。”
英伟达还宣布与DeepMind 和 Disney 合作开发名为 Newton 的机器人平台。
在演讲最后,机器人Blue走向舞台,黄仁勋尝试与其进行互动。机器人Blue配有英伟达最新的GR00T N1机器人通用基础模型。
GTC 2025上,英伟达宣布通用汽车已选择与英伟达合作,将英伟达 AI 技术应用于自动驾驶汽车中。英伟达还发布了汽车安全的 AI 解决方案 NVIDIA Halos。黄仁勋表示,“英伟达是世界上第一家对每一行代码进行安全评估的公司,我们有700万行代码的安全评估,评估芯片、系统软件、算法等,均由第三方进行评估,以确保未来的汽车在智能又安全”。
小结
在AI行业,英伟达凭借其深厚的技术积累、广泛的市场应用以及强大的软件生态系统,在当前阶段仍然是AI芯片领域的领导者。英伟达GTC 2025大会展示的新技术、新产品和新平台将为整个产业带来新的创新思路和方向。这些创新将推动全球科技行业的快速发展,特别是在人工智能、高性能计算和自动驾驶等领域。英伟达正通过生态整合与技术迭代,重新定义算力的边界。
声明:本文由电子发烧友原创