GPT-5.4深夜突袭:OpenAI真正的棋局,可能是OpenClaw
AI圈又一次在深夜被消息刷屏。
就在很多人准备下线休息的时候,OpenAI突然发布了新模型——GPT-5.4。从表面看,这似乎只是一次常规的模型迭代升级,但如果把时间点、功能变化以及整个AI生态的格局放在一起看,就会发现这一步棋远不止技术更新这么简单。

图源:互联网
很多开发者在第一时间测试后就发现,GPT-5.4最核心的一项变化,并不是单纯的推理能力或编程能力提升,而是它拥有了原生的电脑操作能力。简单来说,它不仅能“思考”和“回答问题”,还可以像真人一样在电脑上完成一系列实际操作:点击按钮、输入内容、导航页面、调用软件,甚至执行复杂的操作流程。
这一变化意味着什么?过去的大模型更多只是“动脑”和“动嘴”的工具,而现在,它开始真正具备“动手”的能力。这也意味着AI从单纯的聊天助手,正在逐步进化为可以独立执行任务的AI Agent(智能代理)。
而如果再仔细观察,就会发现一个耐人寻味的细节——GPT-5.4的很多能力,几乎是围绕一个平台设计的:OpenClaw。
一、AI开始“动手”:大模型进入Agent时代
过去两年,大模型的发展主要集中在两个方向:理解能力和生成能力。从GPT-3到GPT-4,再到各类新模型,大部分技术突破都集中在文本、代码、图像等内容生成上。
但真正限制AI落地的,其实并不是生成能力,而是执行能力。
举个简单的例子:你让AI帮你写一封邮件,它可以完成;你让AI帮你规划一个数据分析流程,它也可以完成。
但如果你希望AI真的帮你把事情做完——比如打开浏览器、登录系统、整理数据、生成报表、发送邮件——过去的大模型其实做不到。
原因很简单:它们没有直接操作电脑的能力。
因此在过去一年里,开发者们普遍采用一种方式来解决这个问题——MCP工具调用体系。通过外部工具接口,大模型可以调用浏览器、代码执行环境、数据库等系统,从而间接完成任务。
但这种方式仍然存在明显限制:
工具配置复杂
系统稳定性不高
操作链条容易断裂
而GPT-5.4最大的变化,就是把这些能力变成了模型原生能力。
换句话说,它不再只是通过外部工具调用,而是直接具备了执行操作的能力。AI可以自己完成点击、输入、页面导航等操作流程,这让它更接近真正的数字助手。
这也是为什么很多开发者认为:GPT-5.4的出现,意味着AI Agent时代正在真正到来。
但问题来了——为什么OpenAI会在这个时间点推出这样的能力?
答案很可能指向一个最近爆火的平台:OpenClaw。

图源:互联网
二、OpenClaw爆火:开发者的新“养龙虾”平台
最近一段时间,如果你经常关注AI社区,可能已经听过一个非常有意思的说法:“养龙虾”。
这个说法其实来自开发者圈的一种调侃。OpenClaw平台允许用户部署AI代理,让AI自动执行任务、写代码、处理项目,开发者们就像“养宠物”一样不断优化这些代理,因此被戏称为“养龙虾”。
OpenClaw之所以能迅速走红,核心原因只有一个:它让AI代理真正可以工作。
在OpenClaw平台上,AI不仅可以生成代码,还可以自己运行代码、调试程序、修改逻辑、继续执行任务。这种持续运行的AI代理模式,让很多开发者第一次真正体验到“自动化编程”。
但随之而来的问题也非常现实——成本。
目前在OpenClaw上表现最强的模型之一是Claude Opus 4.6,由Anthropic提供。这款模型在编程和推理能力上确实非常强,但价格也相当高昂,很多开发者用一段时间就会明显感到成本压力。
于是很多人开始寻找替代方案。
比较常见的选择包括:
ChatGPT Team接入 GPT-5.3 Codex
使用国产大模型作为平替
在国产模型中,表现比较突出的包括:
智谱GLM-5
MiniMax-M2.5
Kimi 2.5
阶跃星辰 Step-3.5 Flash
这些模型在编程能力和Agent任务执行方面表现不俗,但成本往往比海外模型低一个甚至两个数量级,因此迅速获得了开发者的关注。
而从数据来看,这一趋势也非常明显。
根据OpenRouter在2025年2月的统计数据,平台累计模型调用量已经超过45万亿Tokens,其中中国大模型占比约30%。在具体模型排名中,MiniMax-M2.5以6.42万亿Tokens的调用量位居第一,Kimi 2.5的调用量环比增长接近10倍。此外,GLM-5排名第八,阶跃星辰最新开源模型Step-3.5 Flash也迅速进入第12名。

图源:互联网
例如MiniMax背后的公司稀宇科技,据天眼查官网显示,该公司成立于2021年,是一家专注于通用人工智能研发的科技企业,近年来在大模型和AI应用领域持续获得资本与产业关注。

图源:互联网
这组数据说明一件事:国产模型在Agent与编程场景中正在迅速崛起。而这种竞争压力,也显然被OpenAI看在眼里。
三、为什么只有OpenAI支持OpenClaw?
在OpenClaw快速走红之后,一件事情也引起了很多开发者的讨论:Google和Anthropic相继限制了OpenClaw的订阅访问。
换句话说,一些顶级模型并不希望被大量用于这个平台。
但OpenAI的态度却完全相反——不仅没有限制,反而在很多方面提供了支持。甚至在OpenClaw官网上,你可以看到OpenAI的logo入口。
为什么会出现这样的差异?
原因其实并不复杂。
OpenClaw的创始团队中,有成员已经加入了OpenAI体系,两家公司之间存在明显的合作关系。换句话说,从生态角度来看,OpenClaw并不是一个完全独立的平台,而更像是OpenAI未来Agent生态的重要组成部分。

图源:互联网
但问题在于,在GPT-5.4之前,OpenAI的模型在OpenClaw上的体验其实并不算理想。
很多开发者都吐槽过两个问题:
第一,GPT-5.2代码能力不足。在复杂编程任务中,稳定性不如Claude系列。
第二,GPT-5.3 Codex虽然代码能力很强,但对话体验很差。很多人调侃它“不会说人话”,在复杂任务中沟通成本很高。而GPT-5.4的发布,几乎一次性解决了这些问题。
四、GPT-5.4:一枚关键的生态棋子
从开发者的实际体验来看,GPT-5.4在几个方面都有明显提升:
首先是代码能力提升。在复杂编程任务中,GPT-5.4的稳定性明显优于之前版本。
其次是知识与推理能力加强。模型对世界知识的理解更加全面,事实准确率提升,幻觉问题减少。
第三是Agent执行能力增强。通过原生电脑操作能力,GPT-5.4可以更稳定地执行长流程任务。

图源:互联网
除此之外,OpenAI在商业模式上也做了一个关键调整——订阅额度优化。开发者只需要每月20美元,就可以在较高额度下使用模型,这在成本上比一些竞品更加友好。
从技术能力到价格策略,GPT-5.4的定位其实非常清晰:它就是为AI Agent生态准备的。
换句话说,OpenAI不仅仅是在发布一个新模型,而是在围绕一个正在爆发的应用场景——AI代理平台——重新布局自己的生态。
一方面,它通过GPT-5.4稳住原有用户;另一方面,它借助OpenClaw带来的巨大流量,吸引更多开发者进入自己的生态体系。
五、AI代理时代,竞争才刚刚开始
如果把时间线拉长来看,AI行业其实正在发生一次重要转变。
过去的大模型更多是内容生成工具,比如写文章、生成图片、辅助编程等。但未来的大模型,很可能会变成任务执行系统。
AI不仅能回答问题,还可以:
自动编写代码
自己运行程序
自动修复错误
持续执行任务
这种模式,就是所谓的AI Agent生态。而谁能在这个生态中占据核心位置,谁就有机会掌握下一代AI平台。从这个角度来看,GPT-5.4的发布其实非常关键。
它不仅补齐了技术短板,还把OpenAI的模型能力与OpenClaw这样的Agent平台深度绑定。从技术突破到商业布局,这一步棋都非常清晰:抢占AI代理时代的入口。
而对于开发者来说,竞争也正在变得越来越激烈。海外模型、国产模型、开源模型都在不断加入这场竞赛。
所以最后也很好奇问一句:
现在大家在OpenClaw上,都用哪家模型“养龙虾”?







