GPT-5.4深夜突袭:OpenAI真正的棋局,可能是OpenClaw

AI圈又一次在深夜被消息刷屏。

就在很多人准备下线休息的时候,OpenAI突然发布了新模型——GPT-5.4。从表面看,这似乎只是一次常规的模型迭代升级,但如果把时间点、功能变化以及整个AI生态的格局放在一起看,就会发现这一步棋远不止技术更新这么简单。

500

图源:互联网

很多开发者在第一时间测试后就发现,GPT-5.4最核心的一项变化,并不是单纯的推理能力或编程能力提升,而是它拥有了原生的电脑操作能力。简单来说,它不仅能“思考”和“回答问题”,还可以像真人一样在电脑上完成一系列实际操作:点击按钮、输入内容、导航页面、调用软件,甚至执行复杂的操作流程。

这一变化意味着什么?过去的大模型更多只是“动脑”和“动嘴”的工具,而现在,它开始真正具备“动手”的能力。这也意味着AI从单纯的聊天助手,正在逐步进化为可以独立执行任务的AI Agent(智能代理)。

而如果再仔细观察,就会发现一个耐人寻味的细节——GPT-5.4的很多能力,几乎是围绕一个平台设计的:OpenClaw。

一、AI开始“动手”:大模型进入Agent时代

过去两年,大模型的发展主要集中在两个方向:理解能力和生成能力。从GPT-3到GPT-4,再到各类新模型,大部分技术突破都集中在文本、代码、图像等内容生成上。

但真正限制AI落地的,其实并不是生成能力,而是执行能力。

举个简单的例子:你让AI帮你写一封邮件,它可以完成;你让AI帮你规划一个数据分析流程,它也可以完成。

但如果你希望AI真的帮你把事情做完——比如打开浏览器、登录系统、整理数据、生成报表、发送邮件——过去的大模型其实做不到。

原因很简单:它们没有直接操作电脑的能力。

因此在过去一年里,开发者们普遍采用一种方式来解决这个问题——MCP工具调用体系。通过外部工具接口,大模型可以调用浏览器、代码执行环境、数据库等系统,从而间接完成任务。

但这种方式仍然存在明显限制:

工具配置复杂

系统稳定性不高

操作链条容易断裂

而GPT-5.4最大的变化,就是把这些能力变成了模型原生能力。

换句话说,它不再只是通过外部工具调用,而是直接具备了执行操作的能力。AI可以自己完成点击、输入、页面导航等操作流程,这让它更接近真正的数字助手。

这也是为什么很多开发者认为:GPT-5.4的出现,意味着AI Agent时代正在真正到来。

但问题来了——为什么OpenAI会在这个时间点推出这样的能力?

答案很可能指向一个最近爆火的平台:OpenClaw。

500

图源:互联网

二、OpenClaw爆火:开发者的新“养龙虾”平台

最近一段时间,如果你经常关注AI社区,可能已经听过一个非常有意思的说法:“养龙虾”。

这个说法其实来自开发者圈的一种调侃。OpenClaw平台允许用户部署AI代理,让AI自动执行任务、写代码、处理项目,开发者们就像“养宠物”一样不断优化这些代理,因此被戏称为“养龙虾”。

OpenClaw之所以能迅速走红,核心原因只有一个:它让AI代理真正可以工作。

在OpenClaw平台上,AI不仅可以生成代码,还可以自己运行代码、调试程序、修改逻辑、继续执行任务。这种持续运行的AI代理模式,让很多开发者第一次真正体验到“自动化编程”。

但随之而来的问题也非常现实——成本。

目前在OpenClaw上表现最强的模型之一是Claude Opus 4.6,由Anthropic提供。这款模型在编程和推理能力上确实非常强,但价格也相当高昂,很多开发者用一段时间就会明显感到成本压力。

于是很多人开始寻找替代方案。

比较常见的选择包括:

ChatGPT Team接入 GPT-5.3 Codex

使用国产大模型作为平替

在国产模型中,表现比较突出的包括:

智谱GLM-5

MiniMax-M2.5

Kimi 2.5

阶跃星辰 Step-3.5 Flash

这些模型在编程能力和Agent任务执行方面表现不俗,但成本往往比海外模型低一个甚至两个数量级,因此迅速获得了开发者的关注。

而从数据来看,这一趋势也非常明显。

根据OpenRouter在2025年2月的统计数据,平台累计模型调用量已经超过45万亿Tokens,其中中国大模型占比约30%。在具体模型排名中,MiniMax-M2.5以6.42万亿Tokens的调用量位居第一,Kimi 2.5的调用量环比增长接近10倍。此外,GLM-5排名第八,阶跃星辰最新开源模型Step-3.5 Flash也迅速进入第12名。

500

图源:互联网

例如MiniMax背后的公司稀宇科技,据天眼查官网显示,该公司成立于2021年,是一家专注于通用人工智能研发的科技企业,近年来在大模型和AI应用领域持续获得资本与产业关注。

500

图源:互联网

这组数据说明一件事:国产模型在Agent与编程场景中正在迅速崛起。而这种竞争压力,也显然被OpenAI看在眼里。

三、为什么只有OpenAI支持OpenClaw?

在OpenClaw快速走红之后,一件事情也引起了很多开发者的讨论:Google和Anthropic相继限制了OpenClaw的订阅访问。

换句话说,一些顶级模型并不希望被大量用于这个平台。

但OpenAI的态度却完全相反——不仅没有限制,反而在很多方面提供了支持。甚至在OpenClaw官网上,你可以看到OpenAI的logo入口。

为什么会出现这样的差异?

原因其实并不复杂。

OpenClaw的创始团队中,有成员已经加入了OpenAI体系,两家公司之间存在明显的合作关系。换句话说,从生态角度来看,OpenClaw并不是一个完全独立的平台,而更像是OpenAI未来Agent生态的重要组成部分。

500

图源:互联网

但问题在于,在GPT-5.4之前,OpenAI的模型在OpenClaw上的体验其实并不算理想。

很多开发者都吐槽过两个问题:

第一,GPT-5.2代码能力不足。在复杂编程任务中,稳定性不如Claude系列。

第二,GPT-5.3 Codex虽然代码能力很强,但对话体验很差。很多人调侃它“不会说人话”,在复杂任务中沟通成本很高。而GPT-5.4的发布,几乎一次性解决了这些问题。

四、GPT-5.4:一枚关键的生态棋子

从开发者的实际体验来看,GPT-5.4在几个方面都有明显提升:

首先是代码能力提升。在复杂编程任务中,GPT-5.4的稳定性明显优于之前版本。

其次是知识与推理能力加强。模型对世界知识的理解更加全面,事实准确率提升,幻觉问题减少。

第三是Agent执行能力增强。通过原生电脑操作能力,GPT-5.4可以更稳定地执行长流程任务。

500

图源:互联网

除此之外,OpenAI在商业模式上也做了一个关键调整——订阅额度优化。开发者只需要每月20美元,就可以在较高额度下使用模型,这在成本上比一些竞品更加友好。

从技术能力到价格策略,GPT-5.4的定位其实非常清晰:它就是为AI Agent生态准备的。

换句话说,OpenAI不仅仅是在发布一个新模型,而是在围绕一个正在爆发的应用场景——AI代理平台——重新布局自己的生态。

一方面,它通过GPT-5.4稳住原有用户;另一方面,它借助OpenClaw带来的巨大流量,吸引更多开发者进入自己的生态体系。

五、AI代理时代,竞争才刚刚开始

如果把时间线拉长来看,AI行业其实正在发生一次重要转变。

过去的大模型更多是内容生成工具,比如写文章、生成图片、辅助编程等。但未来的大模型,很可能会变成任务执行系统。

AI不仅能回答问题,还可以:

自动编写代码

自己运行程序

自动修复错误

持续执行任务

这种模式,就是所谓的AI Agent生态。而谁能在这个生态中占据核心位置,谁就有机会掌握下一代AI平台。从这个角度来看,GPT-5.4的发布其实非常关键。

它不仅补齐了技术短板,还把OpenAI的模型能力与OpenClaw这样的Agent平台深度绑定。从技术突破到商业布局,这一步棋都非常清晰:抢占AI代理时代的入口。

而对于开发者来说,竞争也正在变得越来越激烈。海外模型、国产模型、开源模型都在不断加入这场竞赛。

所以最后也很好奇问一句:

现在大家在OpenClaw上,都用哪家模型“养龙虾”?

站务

全部专栏