人形机器人中国没戏

一、从"机器人"到"人形机器人":汉语的累赘

话说"人形机器人"这个词,本身就是一个挺有意思的语言现象,也间接影响了中文世界对这类技术的认知。

中文里本来早有"机器人"这个词,构词逻辑清晰直白——"机器"修饰"人",合起来就是"机器做成的人",自带"模拟人类形态"的语义。

现在倒好,又要在这个词前面加个"人形",变成"人形机器人",这就好比说"方形正方形"、"圆形圆球"、"白色白纸"一样,多此一举,反倒显得累赘。

这个累赘是怎么来的?这个词最早出现在 1920 年捷克作家卡雷尔・恰佩克的科幻剧本《罗素姆万能机器人》(R.U.R.)中。剧中的 “robot” 源自捷克语 “robota”,原意是 “强制劳动、苦工”—— 它强调的是被迫劳作的状态,而不是工具长什么样子。

恰佩克借用这个词根创造 “robot” 时,他笔下的 “robot”不是我们今天理解的机械装置,而是人工合成的有机生命体:它们由哲学家罗素姆用化学方式在实验室里合成,有皮肤、有肌肉、能思考,外形与人类几乎一样。这些生命体被批量制造、当作廉价工具剥削,最终觉醒意识、反抗人类、消灭创造者,并建立起新的社会。

在原著里,“robot” 是人形的 —— 虽然是有机生命,不是金属机械。robot 传入中文,早期译法以“人造人”为主,贴合恰佩克笔下 “有机人造生命” 的原意。1950 年代中后期,中文却把“robot”翻译为“机器人”,作为标准译名固定下来。结果把剧中的"有机人造生命"降格成了"金属/电路/机械装置",把"被奴役的生命"简化成了"像人的机器","有思考有情感的生命觉醒与反抗"的主题换成了"机器程序失控"的技术故障。

而且,“robot” 传入英语后,可以指任何自动执行任务的设备,不管外形:圆盘扫地机、工厂机械臂、仓储搬运车,甚至没有实体的软件机器人(RPA),全都叫 robot。牛津词典的定义也只强调 “能自动执行复杂动作的机器”,完全不提 “人形”。

这一译不要紧,直接给后来的中文世界埋下了巨大的认知陷阱,很多人想当然地认为,"机器人"就必须是"长得像人的机器",一旦出现非人形的自动化设备,反而要特意标注或者另起名字。久而久之,为了纠正认知偏差,又不得不发明"人形机器人"这个新词,专门指代那些模拟人类外形、有头有手有脚的机器人,硬生生添了个累赘。那些整天吹嘘"中文最简洁、最逻辑"的人,这会儿反倒集体沉默了。

人形机器人其实仍处于非常早期的阶段,现阶段我们看到的机器人视频,大多是跳舞、后空翻、伴舞、煎蛋,炫酷但无用——人形机器人很有趣,问题是能否以合理的成本解决真实问题,现在看到的那些人形机器人表演,本质上还是受控演示,核心的电池续航、自主智能决策能力都还存在巨大短板,远未达到商业化应用的标准。

现在那些人形机器人,无论是春晚舞台上的翻跟头、扭秧歌,还是展会上的简单互动,看着挺热闹,但仔细一想——这玩意儿能干嘛?去工厂拧螺丝?直接装个机械臂,成本低、效率高、稳定性强,非要造个两条腿的人形机器人,成本翻十倍不止,效率还得降九成,这不是吃饱了撑的吗?去家庭做家务?续航撑不过两小时,连简单的垃圾分类都做不到,还得专人维护,普通人根本用不起、用不上。

二、春晚舞台上,机器人成了最靓的仔——但只是"表演型靓仔"

说到人形机器人的全民认知,就不能不提春晚。作为全国关注度最高的舞台,春晚几乎成了人形机器人"刷存在感"的最佳阵地,也成了资本炒作的重要抓手,只是很多人没看清,舞台上的热闹,从来都不等于商业上的成功。

2025年蛇年春晚,杭州宇树科技的16台H1"福兮"机器人,亮相于节目《秧BOT》中,和真人演员一起表演,完成了扭秧歌、转手绢、抛接红绢等民俗舞蹈动作。当时的表演核心是靠高精度的机械执行,通过预编程和简单AI训练,让机器人跳出整齐划一的集群舞蹈,本质上还是"机械执行",机器人本身只能按照预设程序完成固定动作,没有任何自主决策能力。即便如此,全国人民看得津津有味,第二天股市一开,人形机器人板块直接涨停,足见春晚舞台对市场预期的巨大影响。

2026年马年春晚更夸张,直接搞了个"机器人天团"——宇树科技、银河通用、松延动力、魔法原子四家公司的机器人组团上阵,覆盖了多个节目环节,有的表演武术,有的参与小品互动,有的给明星伴舞。其中,宇树科技的G1/H1机器人表现最为亮眼,确实完成了"弹射空翻"(最大高度超3米)、"单脚连续空翻"等高难度动作,还实现了"全球首次集群快速跑位",视觉冲击力拉满。但需要明确的是,这些高难度动作,依然是预编程+远程辅助控制的结果,并非机器人自主完成,而且表演场景是完全封闭、可控的,没有任何复杂环境干扰——一旦离开春晚的舞台,换成真实的工厂、家庭环境,这些机器人大概率连正常行走都成问题。

看着确实很酷,甚至有人直呼"未来已来",但问题是,你让机器人上台翻跟头、跳舞蹈,跟让机器人去工厂搬砖、去家庭做家务,完全是两码事。前者是表演,是预设好的程序,是"遥控玩具plus版",追求的是视觉效果,哪怕成本高昂、稳定性差,只要能完成一次完美表演就足够;后者是真刀真枪地解决问题,是要在复杂的真实环境里自主决策、灵活应变,要考虑成本、效率、稳定性、维护难度等一系列实际问题,两者的技术要求、核心目标,完全不在一个维度上。

三、"适配人类环境"?这是个伪命题

支持人形机器人的人,最常挂在嘴边的一个理由是:人类的环境是为人设计的,桌椅板凳、门把手、楼梯、电梯,都是按照人的尺寸和形态设计的,所以机器人也应该造成人形,这样才能无缝接入这些环境,不需要改造现有环境,降低应用成本。

这个逻辑听起来很有道理,甚至有些无懈可击,毕竟"适应现有环境"似乎是最省力、最高效的选择,但细想一下,完全是本末倒置,违背了人类科技发展的规律。历史反复证明:当一种更高效的新事物出现时,从来都不是新事物去适应旧世界,而是世界围绕新事物去调整、去重塑——因为旧环境的设计,本身就是基于旧工具的局限,当新工具足够强大时,改造环境远比改造工具更高效、更具长远价值。

最典型的例子就是汽车。汽车刚发明的时候,路上跑的都是马车,道路也是为马车设计的,狭窄、颠簸,甚至没有专门的车道。按照"适配环境"的逻辑,汽车应该造成马车的样子——四个轮子外面套个车厢,前面再配个车夫座位,这样就能直接在马路上行驶,不需要改造道路。但实际情况是,人们没有去改造汽车,而是专门为汽车修建了柏油路、高速公路、立交桥、停车场,甚至制定了专门的交通规则,重塑了整个城市的格局。世界为汽车改变了,而不是汽车去适应马车的世界,也正因为如此,汽车才能真正普及,成为改变人类生活的核心工具。

再比如说电影行业。以前拍电影,需要演员、摄影机、灯光师、化妆师、场务一大帮人,在实景或者摄影棚里拍摄,流程繁琐、成本高昂。按照"适配环境"的逻辑,如果你想用新技术改造电影行业,应该造一批"人形机器人演员",让它们像真人演员一样站在镜头前表演,然后你拿着摄影机拍下来、剪辑、发行,这样就能适配现有的电影拍摄流程,不需要改变行业模式。但显然不会,现在的趋势是,直接用seedance生成一部电影就好了,不需要真人演员,不需要摄影棚,不需要复杂的拍摄流程,直接跳过旧有的行业模式,重塑了电影的生产方式——这远比造"人形机器人演员"高效得多。

医疗领域也一样。你会造一个人形机器人,像以前的医生那样拿着听诊器给病人看病?像以前的医生那样打开电脑看检测结果?像以前的医生那样两只手拿着手术刀做手术,旁边再配个人形护士递工具?显然不会,也完全没有必要。你完全可以造一个八只手的手术机器人,把诊断、手术、护理全干了,而且干得更快、更准、更稳,不需要适配"人类医生的操作习惯",只需要适配"医疗任务的核心需求"。

自动驾驶更是个典型例子。你会造一个人形机器人来当司机,让它坐在驾驶座上,两只手抓着方向盘,两只脚踩油门刹车,适配现有的汽车设计吗?你当然不会!你直接把汽车改造成自动驾驶的,去掉方向盘、油门、刹车,甚至不需要驾驶座,让汽车自主感知、自主决策、自主行驶,彻底替代"司机"这个职业,而不是让机器人去"模仿司机"。

所以,"人类环境是为人设计的,所以机器人也应该造成人形"这个逻辑,根本站不住脚。真正有效率的做法,是根据任务需求设计最优形态的机器,而不是为了适应旧环境、旧模式,硬造一个人形出来。人形,从来都不是机器人的"优势",反而可能是一种"束缚"——它会增加机器人的制造成本、降低稳定性,还会限制机器人的功能发挥,纯属"为了像人而像人",本末倒置。

四、人形机器人的"全能梦"不切实际

除了"适配环境",支持人形机器人的还有一种说法:"虽然单项功能上人形机器人不一定最优,但如果综合所有功能,还是人形最有效率,一个人形机器人就能完成多种工作,省去多个专用机器人的成本。"

这个说法听起来也很诱人,仿佛人形机器人就是未来的"全能助手",一个就能顶十个、百个专用机器人,但同样经不起推敲。无论是人类社会,还是工业生产,分工越细,专业化程度越高,效率就越高。

我们可以先看看人类社会的分工演变:理发店里,洗头和剪发有分工,剪发的还分总监、高级发型师、普通发型师,甚至还有专门负责吹造型、染烫的;汽车工厂里,有人专门拧螺丝,有人专门装轮胎,有人专门检测质量,每个人只负责一件事,却能做到极致高效;医院里,有医生、护士、药师、检验师,医生里还分内科、外科、儿科、妇科,每个科室的医生只专注于自己的领域,才能提供更专业的医疗服务。

人自身都是越来越分工细密的,怎么可能反倒让机器人去"全能化"呢?这本身就是一种反常识的思维。不妨试想一下:你会造一个人形机器人,早上开车送孩子上学,然后去医院拿起听诊器看病,下午去工厂搬砖,晚上回家辅导孩子作业,半夜还要去餐厅当服务员吗?这听起来很美好,仿佛一个机器人就能解决所有问题,但实际效率会极低——它既要适配开车的需求,又要适配看病的专业,还要适配搬砖的力量、辅导作业的知识,最后还要适配服务的礼仪,结果就是"什么都能干,什么都干不好":开车不如自动驾驶汽车稳,看病不如专业医疗机器人准,搬砖不如工业机械臂高效,辅导作业不如专门的家教AI专业。

与其造一个什么都能干但什么都干不好的"万金油"人形机器人,不如造一堆专门干一件事的专用机器人:自动驾驶汽车负责接送,医疗机器人负责诊断手术,工业机器人负责工厂生产,家教AI负责辅导作业,清洁机器人负责打扫卫生——每个机器人只专注于一件事,不断优化、升级,既能降低成本,又能提高效率和精度,这才是符合规律、符合逻辑的选择。

人形机器人试图"一招鲜吃遍天",追求"全能化",本质上是一种前现代的思维方式,违背了分工协作的基本规律。机器人的价值,从来都不是"像人一样全能",而是"在某一领域超越人类",这才是机器人技术发展的核心方向。

五、项立刚的清醒与拧巴:

说到人形机器人的行业讨论,不能不提项立刚。

先看他清醒的一面,2025年12月3日,特斯拉CEO马斯克转发擎天柱人形机器人跑步的短视频后,

项立刚:擎天柱机器人真要跑起来,还有很长的路要走|宅男财经

”“擎天柱机器人真要跑起来,还有很长的路要走。”中关村信息消费联盟理事长项立刚对宅男财经表示,人形机器人在今天还在展示跳舞、跑步,但机器人是否能在生产线上、在家庭中或者在某个地方做具体的工作,还有很大的难度。

项立刚指出,人形机器人除了要解决移动之外,还需要多关节协同,用电机、感应器等形成强大的整合能力,才能够胜任工作,包括生产线上的工作、搬运工作、家庭护理工作等,而现在技术还存在着很多问题。

马斯克此前称,擎天柱每台生产成本或将降到2万美元至2.5万美元。在项立刚看来,如果一个人形机器人成本2万美元,只做单一工作的成本还是比较高,“还不如在生产线上做一个机械手、机器小车,这样的成本更低,操作起来也会更容易。”“

项立刚2月17日发表:《春晚最大的明星是机器人》,在这篇文章里,项立刚直言不讳:

"其实我自己不是特别看好具身机器人,觉得成本很高,很多的能力是冗余的,要形成商业价值,需要很长的时间,很多的技术要解决,比我们想象的要困难。"

他还拿波士顿机器人举例,吐槽其"十几年前就可以翻跟头,今天依然在翻跟头,进步的速度是很慢的",暗指当下人形机器人的发展陷入了"表演内卷",而非实用化突破。

更难得的是,项立刚在文中细化了人形机器人的技术难点:

"机器人的复杂在于它需要太多的关节,这些关节让机器人变得更加灵活,同时这些关节也让机器人很难控制。要做到平衡控制,保证机器人不倒下,还可以做相关的动作,这件事情远比我们想象的要复杂,需要众多的模块相互协调、进行平衡,保持稳定性。"

除此之外,他还提到,机器人的发展离不开硬件提升和产业配套:

"除了软件的能力和模型的能力,机器人也需要硬件不断地提升,机器人本身需要强大的通信能力,把信息及时传到不同的关节、不同的控制模块;低速伺服电机需要更加稳定,相关的控制模块需要更高的强度,一方面要适应迅速的变化,又要保持稳定性。"

这些言论可以说说到点子上了,点出了人形机器人的核心困境:它的问题不是技术不够炫,不是表演不够精彩,而是性价比太低,不符合市场规律。你花十几万人民币造个人形机器人来搬箱子,不如花几千块买个AGV小车,效率高、维护简单;你花十几万造个人形机器人来拧螺丝,不如花几万块装个机械臂,稳定性强、成本可控。

在商言商,企业追求的是盈利,不会为了"炫酷"、为了"像人",去花大价钱买一个效率低下、实用性差的"玩具"——这也是人形机器人难以实现商业化的核心原因,项立刚在这篇文章中看得很透彻。

但项立刚也有拧巴的一面,这体现在其四天后发布另一篇文章《美国人没有资格讨论机器人》中,与前一篇文章的清醒形成强烈反差。

面对图灵奖获得者杨立昆"机器人常识连猫都不如"的评价,项立刚直接抛出核心观点:

"美国人已经没有资格讨论机器人了。"

这话听着就带劲,但细品之下,只不过是"为了抬杠而抬杠"。

他在文中重新定义人工智能:

"人工智能就是机器模仿人类的智慧,通过智能感应、信息存储、信息传输、信息处理(算力、算法、大模型)、智能终端形成一个完整的系统。"

并以此说:"美国人都在渐渐绕过具体应用,把人工智能理解成一个多模态通用大模型,原因何在?因为美国人已经做不了硬件。"

项立刚还提出了一个形象的比喻:"中国的人工智能是生下来不久的孩子,有手有脚,有嘴有眼,智慧还没有那么强,但是他在慢慢成长;美国的人工智能就是霍金,长了个脑子,手脚都不灵,当然,脑子也没有霍金那么成熟。"

他还强调,人形机器人的核心不仅是软件,更需要"大量的低速伺服电机、多设备协调、强大的通信能力",而这些硬件产业支撑,正是美国所缺失的。

拧巴在哪里?这话听着像是在客观分析技术,问题是,既然项立刚自己都在《春晚最大的明星是机器人》一文中看清了,人形机器人本身就没啥商业逻辑,就是"表演大于实用",

那在另一篇文章中执着于争论中美谁更有资格参与、谁的技术更领先,又有什么意义呢?

这就像两个厨师,争论"谁做的黑暗料理更难吃"一样——不管谁赢,不管谁的黑暗料理相对"好吃"一点,输的都是食客,因为这玩意儿本身就不能吃,争论的意义何在?

人形机器人现阶段的核心问题,不是"中国比美国强还是弱",而是"如何找到实际应用场景、降低成本、提升实用性"。脱离这个核心,去争论中美技术高低,这就是项立刚的拧巴,一边看透了本质,一边又忍不住被情绪裹挟。

六、人形机器人的真正出路:

人形机器人并非一无是处,它也有自己的价值,只是这份价值,不在工厂车间、不在家庭劳务;可能的突破在于情感乃至生理陪伴,也就是”情趣/伴侣机器人“

这是人类最原始、最刚性的需求之一,愿意为这种需求付费的用户基数巨大,且付费意愿强。这恰恰是商业逻辑能够走通的核心关键。

回望历史,VHS 格式之所以能击败 Betamax、在线支付得以最早普及、流媒体视频带动带宽需求爆发,本质上都是精准击中了用户的核心刚性需求,”人形机器人“的商业化突破,恐怕也难以例外。

CES 2026成为情趣/伴侣机器人集中爆发点,美国 RealDoll 公司26年公开销售其升级版机器人Harmony X,鸿蒙也是这个英文单词"Harmony",意为"和谐","和谐"这个词太百搭了,用在哪都说得通。

技术层面,情趣/伴侣机器人的核心,是"能理解人",能精准捕捉人类的情绪变化,能做出恰当的回应,能和人类进行有温度的互动——这需要强大的情感计算技术和大模型支撑,而项立刚把重点放在机械执行、硬件通信上,技术上恰恰搞反了。美国在通用大模型生态,情感计算算法,长期记忆建模,个性化人格训练,仍然领先,这是一个软件主导行业,真正的技术分水岭是:“能否构建持续互动的人格幻觉系统。”

还有另外的层面,这个领域,目前来看,一定是美国领先,中国企业想要追赶,难度极大,这个层面的原因就不多说了。

站务

全部专栏