NVIDIA、宇树、银河通用三巨头聚首,共话人形机器人发展

2025年世界机器人大会(WRC)如火如荼,人形机器人成为全场焦点,吸引无数目光。“AI与机器人技术将像电力和蒸汽机一样,推动人类文明迈上新台阶!”宇树科技创始人王兴兴在NVIDIA媒体沟通会上掷地有声。

作为半导体行业的领军者,NVIDIA以其强大计算平台架起数字与物理世界的桥梁。而中国企业,凭借顶尖AI人才与制造优势,正加速推动人形机器人从梦想走向现实。在本次WRC上,NVIDIA Omniverse和仿真技术的副总裁Rev Lebaredian联手宇树科技创始人王兴兴、银河通用创始人王鹤,分享了物理人工智能(Physical AI)与人形机器人领域的最新突破。他们的对话不仅展现了技术前沿,更点燃了对未来智能生活的无限畅想。

从信息空间到物理智能:NVIDIA的战略视野

过去40年,IT产业规模达5万亿美元,主要处理数字化内容,如语言和编码信息。互联网进一步放大其影响力,但与全球100万亿美元的经济总量相比,IT仅占一小部分。剩余价值多源于物理领域,如交通、制造和医疗,这些涉及真实“原子”的操作。Rev Lebaredian强调到:“计算技术正从“信息世界”向“物理世界”跃迁。”

人工智能的兴起改变了这一格局。Lebaredian指出,AI赋予机器“物理智能”,将计算扩展到物理世界,而机器人正是这一桥梁。通过机器人,AI可理解并改造环境,潜在市场从5万亿美元激增至100万亿美元。这不仅是技术跃迁,更是经济转型的机遇。

中国在此进程中占据先机。Lebaredian列举三大优势:全球近一半AI人才集中于此,包括顶尖大学毕业生;电子制造产业链全球领先;庞大的制造业提供海量部署场景,便于数据迭代。WRC的活力正源于此,中国已成为物理AI的理想孵化地。

NVIDIA的使命聚焦于“最难问题”的专用计算机。机器人便是典型挑战,需要“三台计算机”:

机器人本体计算机:嵌入式系统,如Jetson Thor,用于人形机器人或自动驾驶。WRC展会上,Galbot等机器人已集成该芯片。

AI工厂计算机:DGX和HGX系统处理海量数据,生成物理AI模型后部署。

仿真计算机:通过物理定律生成数据,避免真实世界采集的伦理与成本问题。仿真还支持超实时测试,确保安全。

500

NVIDIA Omniverse和仿真技术的副总裁Rev Lebaredian

Isaac平台整合这些元素,提供运行时环境、仿真工具和训练框架。Jetson Thor作为“实时推理机器”,性能跃升:计算能力较Orin提升近10倍,每瓦性能增3.5倍,CPU提升3.1倍,I/O吞吐量增10倍。这满足高带宽感知需求,推动机器人从实验室走向现实。

Isaac Sim、Isaac Lab和NVIDIA Cosmos进一步强化仿真。Cosmos作为世界基础模型框架,与Omniverse结合,生成精确数据。尽管基础模型尚处起步,但已为机器人注入新能力。

宇树科技:从娱乐到实用,人形机器人的成本突破

宇树科技创始人王兴兴对人形机器人的未来充满信心。他认为,通用人工智能(AI)是全球科技的焦点,而机器人,尤其是人形机器人,是实现通用AI的理想载体。虽然人形机器人看起来复杂,但其核心不过是一系列关节电机和连杆的组合,设计简洁高效。相比履带式或其他形态机器人,人形结构反而更简单。未来,随着AI能力飞跃,硬件门槛将大幅降低,就像今天组装电脑一样,每个人都能轻松打造一台人形机器人。

500

宇树科技创始人王兴兴

2023年5月,宇树发布了一款售价9.9万元的机器人,其关节数量与灵活性表现优异,架构迅速成为全球主流设计,至今保持强劲市场竞争力。2024年,新版本将价格降至3.9万元,性能更优,现货供应,计划年底量产。这款机器人不仅性价比高,还支持外观定制——客户可以喷涂颜色、添加装饰,甚至为机器人穿衣戴帽,户外直播时打造独特造型。这种个性化设计极大提升了用户体验,让机器人更贴近生活。

宇树的产品线远不止人形机器人。A2机器狗自重仅37公斤,却能持续负载30公斤,空载续航达20公里。其科幻感外观、防尘防水设计,专为工业场景打造,可替代人类完成危险或重复性任务。在公益项目中,A2已实现24小时不间断巡逻,配备自动充电功能,展现了极高的可靠性。

轮式机器人也有新突破。去年底的升级版虽自重70-80公斤,但灵活性稍显不足。为此,宇树推出更小巧的防尘防水版本,兼顾室内外场景。尽管体型较大,运动性能依然出色,打破了“大体型灵活性差”的刻板印象。

2024年央视春晚,宇树16台机器人以全自动编队舞蹈惊艳全场。它们利用头部三个激光雷达实时建图,变换队形,与舞台音乐毫秒级同步。后台服务器无缝接入舞台系统,攻克了多机协作与复杂编程的挑战。如今,这些机器人每天在澳门美高梅表演,展现了中国科技的魅力。

宇树的动作学习结合人体数据与深度强化学习,主要依托NVIDIA的Isaac Sim平台。舞蹈、跳跃、空翻等动作已不在话下,但更复杂动作受限于硬件物理极限。例如,将奔跑速度从3-4米/秒提升到10米/秒,需要大幅改进硬件,而非仅靠算法优化。

上肢研发同样亮眼。宇树自主开发的20自由度灵巧手,目标是让机器人完成日常任务,如无需预设直接倒水,预计一两年内实现自然交互。2024年5月,宇树与央视合作的机器人格斗赛进一步展现技术实力。1.5小时的比赛中,4支团队的机器人随机组合动作,算法复杂度远超舞蹈,朝“任意动作实时生成”的目标迈进。

宇树还推出了R1四足机器人,重25公斤,兼顾轻便与安全。虽然体积小,动力强劲,特别适合工业场景。相比人形机器人,四足设计稳定性更强,能完成剧烈动作且不易损坏,越障能力出色。其算法与人形机器人相通,但更适应高强度任务。

王兴兴强调,AI与机器人技术的发展离不开全球协作。NVIDIA等伙伴的支持至关重要。宇树的目标不仅是技术突破,更是推动通用智能与实用机器人普及。他将AI与机器人比作电力和蒸汽机,坚信其将引领人类文明迈向新高度。

银河通用:合成数据驱动的具身智能落地

王鹤认为通用机器人将开启万亿市场,核心要素包括本体、具身模型和数据。

500

​银河通用创始人王鹤

与传统人形机器人不同,银河通用G1机器人采用轮式双臂设计,兼顾高续航、工业级安全性和大规模交付能力。2024年5月首秀后,经过一年多迭代,G1在自动充电、运行流畅度和稳定性上已达商用标准。特别值得一提的是,银河通用率先在中国部署NVIDIA Jetson Thor芯片,成为全球首批应用该芯片的公司。在WRC现场,G1凭借丝滑的运动性能和实时货箱视觉处理,赢得“最快人形机器人”的赞誉。这背后,Jetson Thor的强大算力功不可没。

银河通用的核心竞争力在于其具身智能大模型VLA。导航方面,TrackVLA模型只需一句话指令,就能让机器人在复杂环境中自主移动。2024年“六一”前夕,TrackVLA全球首发,无需预先建图,即可在人流干扰下稳定跟随,轻松穿梭障碍物,展现了自然语言交互的魅力。

在抓取能力上,Grasp VLA同样全球领先。它实现零样本抓取,无需预训练即可应对各种光照和背景下的50多种物体,从瓶装到软体全覆盖。2024年上海WAIC大会上,李强总理亲测G1的零售抓取功能,无论是袋装、散装还是挂装物品,机器人都能精准抓取与递送。这款端到端零售大模型,开创了“自然语言+即时执行”的先河。

银河通用的快速突破离不开NVIDIA的仿真引擎。其具身大模型所使用的数据中,合成数据占比99%,依托NVIDIA仿真引擎生成百亿级数据集,大大提升了鲁棒性。王鹤指出在大模型扩展过程中,数据瓶颈突出,合成数据关键。具身VLA数据不足,仿真将促进多模态进步”。银河通用还与NVIDIA联合下一代纯双足人形,基于Isaac平台。

银河通用与NVIDIA的合作不止于此。他们联合宣布基于Isaac平台的下一代人形机器人项目,从轮式升级为纯双足设计。利用OpenWBT_Isaac平台,机器人可在仿真和现实环境中训练多种任务,如推车、拾取物体等。这标志着银河通用向更通用、更灵活的方向迈进。

银河通用的技术已转化为实实在在的应用。全球首个24小时无人药房解决方案已在北上深签约超100家药店,用户通过APP下单,机器人完成取药并交付,吸引了众多领导参观。2024年,银河通用还推出无人零售店项目,计划在10城百处商圈和景点部署“太空舱”终端,销售饮品等商品,北京海淀大融城已率先落地。

成立仅两年,银河通用已完成超20亿元融资。王鹤表示,公司将继续与NVIDIA等伙伴合作,打造服务千行百业的通用机器人。

人形机器人机遇和挑战

就当下机器人的发展现状而言,王兴兴表示,硬件成本早已不是机器人商业化的主要障碍。即使价格10万或100万,很多场景仍能用得上。真正的难点是具身智能模型的泛用性和实用性不足。过去一两年,硬件已足够成熟,但模型的通用能力仍需突破。提升可靠性和降低成本是方向,但目前,智能模型的局限才是核心挑战。

王鹤从长远视角探讨了人形机器人的必要性。他认为,从长远看,人形机器人是融入人类生活的终极形态。它能灵活移动、手臂伸展1-2米、触及地面,适应多样环境,非人形难以替代。未来十年,人形占比不会低。相比工业机械臂(全球产值仅1000亿元),人形机器人市场潜力巨大。预计每三年产值增长10倍,从1000台到10万台,届时若单价几十万,市场规模将超千亿,超越机械臂甚至汽车市场。但短期内,达到汽车市场规模不现实,需循序渐进。

王鹤进一步聚焦人形机器人规模化的技术瓶颈:任务能力有限是当前核心障碍。银河通用正集中攻关“抓取、移动、放置”三大能力,背后需要精准的目标识别和定位技术。通过NVIDIA的合成数据技术,银河通用加速模型训练,提升机器人在复杂环境中的鲁棒性。他预测,若精准目标识别和定位突破,千亿市场指日可待。合成数据正加速这一进程,未来五年内,更多技能将解锁,迈向万亿市场。

谈及机器人普及,王兴兴以新能源车为例,提醒大家技术成熟需要时间。新能源车用了十几年才走向大众,而新一代机器人技术仅发展2-3年,却已突飞猛进,展现出惊人潜力。他乐观预计,未来几年,机器人出货量有望每年翻倍,尤其在工业和服务业场景中。更强大的通用AI大模型将降低普及门槛,推动机器人在工厂、物流等领域的广泛应用。然而,家用场景的普及面临更高挑战——伦理和安全要求严格,需更长时间打磨。王兴兴的观点让人既兴奋又理性:机器人正在从娱乐表演走向实用,但通往千家万户的路仍需耐心。

NVIDIA的世界基础模型(如Cosmos)虽处起步阶段,但已展现出为机器人注入新动能的潜力。结合Isaac平台的仿真工具和Jetson Thor的强大算力,NVIDIA帮助伙伴如宇树科技和银河通用快速迭代,从实验室走向商业落地。

结语

从硬件成熟到模型突破,从人形必要性到普及前景,中国正与NVIDIA等全球伙伴携手,探索机器人革命的无限可能。未来十年,千亿市场近在咫尺,万亿蓝图正在成形。

站务

全部专栏