GPT-5.4深夜突袭：OpenAI真正的棋局，可能是OpenClaw

铑科技

1小时前

AI圈又一次在深夜被消息刷屏。

就在很多人准备下线休息的时候，OpenAI突然发布了新模型——GPT-5.4。从表面看，这似乎只是一次常规的模型迭代升级，但如果把时间点、功能变化以及整个AI生态的格局放在一起看，就会发现这一步棋远不止技术更新这么简单。

500

图源：互联网

很多开发者在第一时间测试后就发现，GPT-5.4最核心的一项变化，并不是单纯的推理能力或编程能力提升，而是它拥有了原生的电脑操作能力。简单来说，它不仅能“思考”和“回答问题”，还可以像真人一样在电脑上完成一系列实际操作：点击按钮、输入内容、导航页面、调用软件，甚至执行复杂的操作流程。

这一变化意味着什么？过去的大模型更多只是“动脑”和“动嘴”的工具，而现在，它开始真正具备“动手”的能力。这也意味着AI从单纯的聊天助手，正在逐步进化为可以独立执行任务的AI Agent（智能代理）。

而如果再仔细观察，就会发现一个耐人寻味的细节——GPT-5.4的很多能力，几乎是围绕一个平台设计的：OpenClaw。

一、AI开始“动手”：大模型进入Agent时代

过去两年，大模型的发展主要集中在两个方向：理解能力和生成能力。从GPT-3到GPT-4，再到各类新模型，大部分技术突破都集中在文本、代码、图像等内容生成上。

但真正限制AI落地的，其实并不是生成能力，而是执行能力。

举个简单的例子：你让AI帮你写一封邮件，它可以完成；你让AI帮你规划一个数据分析流程，它也可以完成。

但如果你希望AI真的帮你把事情做完——比如打开浏览器、登录系统、整理数据、生成报表、发送邮件——过去的大模型其实做不到。

原因很简单：它们没有直接操作电脑的能力。

因此在过去一年里，开发者们普遍采用一种方式来解决这个问题——MCP工具调用体系。通过外部工具接口，大模型可以调用浏览器、代码执行环境、数据库等系统，从而间接完成任务。

但这种方式仍然存在明显限制：

工具配置复杂

系统稳定性不高

操作链条容易断裂

而GPT-5.4最大的变化，就是把这些能力变成了模型原生能力。

换句话说，它不再只是通过外部工具调用，而是直接具备了执行操作的能力。AI可以自己完成点击、输入、页面导航等操作流程，这让它更接近真正的数字助手。

这也是为什么很多开发者认为：GPT-5.4的出现，意味着AI Agent时代正在真正到来。

但问题来了——为什么OpenAI会在这个时间点推出这样的能力？

答案很可能指向一个最近爆火的平台：OpenClaw。

500

图源：互联网

二、OpenClaw爆火：开发者的新“养龙虾”平台

最近一段时间，如果你经常关注AI社区，可能已经听过一个非常有意思的说法：“养龙虾”。

这个说法其实来自开发者圈的一种调侃。OpenClaw平台允许用户部署AI代理，让AI自动执行任务、写代码、处理项目，开发者们就像“养宠物”一样不断优化这些代理，因此被戏称为“养龙虾”。

OpenClaw之所以能迅速走红，核心原因只有一个：它让AI代理真正可以工作。

在OpenClaw平台上，AI不仅可以生成代码，还可以自己运行代码、调试程序、修改逻辑、继续执行任务。这种持续运行的AI代理模式，让很多开发者第一次真正体验到“自动化编程”。

但随之而来的问题也非常现实——成本。

目前在OpenClaw上表现最强的模型之一是Claude Opus 4.6，由Anthropic提供。这款模型在编程和推理能力上确实非常强，但价格也相当高昂，很多开发者用一段时间就会明显感到成本压力。

于是很多人开始寻找替代方案。

比较常见的选择包括：

ChatGPT Team接入 GPT-5.3 Codex

使用国产大模型作为平替

在国产模型中，表现比较突出的包括：

智谱GLM-5

MiniMax-M2.5

Kimi 2.5

阶跃星辰 Step-3.5 Flash

这些模型在编程能力和Agent任务执行方面表现不俗，但成本往往比海外模型低一个甚至两个数量级，因此迅速获得了开发者的关注。

而从数据来看，这一趋势也非常明显。

根据OpenRouter在2025年2月的统计数据，平台累计模型调用量已经超过45万亿Tokens，其中中国大模型占比约30%。在具体模型排名中，MiniMax-M2.5以6.42万亿Tokens的调用量位居第一，Kimi 2.5的调用量环比增长接近10倍。此外，GLM-5排名第八，阶跃星辰最新开源模型Step-3.5 Flash也迅速进入第12名。

500

图源：互联网

例如MiniMax背后的公司稀宇科技，据天眼查官网显示，该公司成立于2021年，是一家专注于通用人工智能研发的科技企业，近年来在大模型和AI应用领域持续获得资本与产业关注。

500

图源：互联网

这组数据说明一件事：国产模型在Agent与编程场景中正在迅速崛起。而这种竞争压力，也显然被OpenAI看在眼里。

三、为什么只有OpenAI支持OpenClaw？

在OpenClaw快速走红之后，一件事情也引起了很多开发者的讨论：Google和Anthropic相继限制了OpenClaw的订阅访问。

换句话说，一些顶级模型并不希望被大量用于这个平台。

但OpenAI的态度却完全相反——不仅没有限制，反而在很多方面提供了支持。甚至在OpenClaw官网上，你可以看到OpenAI的logo入口。

为什么会出现这样的差异？

原因其实并不复杂。

OpenClaw的创始团队中，有成员已经加入了OpenAI体系，两家公司之间存在明显的合作关系。换句话说，从生态角度来看，OpenClaw并不是一个完全独立的平台，而更像是OpenAI未来Agent生态的重要组成部分。

500

图源：互联网

但问题在于，在GPT-5.4之前，OpenAI的模型在OpenClaw上的体验其实并不算理想。

很多开发者都吐槽过两个问题：

第一，GPT-5.2代码能力不足。在复杂编程任务中，稳定性不如Claude系列。

第二，GPT-5.3 Codex虽然代码能力很强，但对话体验很差。很多人调侃它“不会说人话”，在复杂任务中沟通成本很高。而GPT-5.4的发布，几乎一次性解决了这些问题。

四、GPT-5.4：一枚关键的生态棋子

从开发者的实际体验来看，GPT-5.4在几个方面都有明显提升：

首先是代码能力提升。在复杂编程任务中，GPT-5.4的稳定性明显优于之前版本。

其次是知识与推理能力加强。模型对世界知识的理解更加全面，事实准确率提升，幻觉问题减少。

第三是Agent执行能力增强。通过原生电脑操作能力，GPT-5.4可以更稳定地执行长流程任务。

500

图源：互联网

除此之外，OpenAI在商业模式上也做了一个关键调整——订阅额度优化。开发者只需要每月20美元，就可以在较高额度下使用模型，这在成本上比一些竞品更加友好。

从技术能力到价格策略，GPT-5.4的定位其实非常清晰：它就是为AI Agent生态准备的。

换句话说，OpenAI不仅仅是在发布一个新模型，而是在围绕一个正在爆发的应用场景——AI代理平台——重新布局自己的生态。

一方面，它通过GPT-5.4稳住原有用户；另一方面，它借助OpenClaw带来的巨大流量，吸引更多开发者进入自己的生态体系。

五、AI代理时代，竞争才刚刚开始

如果把时间线拉长来看，AI行业其实正在发生一次重要转变。

过去的大模型更多是内容生成工具，比如写文章、生成图片、辅助编程等。但未来的大模型，很可能会变成任务执行系统。

AI不仅能回答问题，还可以：

自动编写代码

自己运行程序

自动修复错误

持续执行任务

这种模式，就是所谓的AI Agent生态。而谁能在这个生态中占据核心位置，谁就有机会掌握下一代AI平台。从这个角度来看，GPT-5.4的发布其实非常关键。

它不仅补齐了技术短板，还把OpenAI的模型能力与OpenClaw这样的Agent平台深度绑定。从技术突破到商业布局，这一步棋都非常清晰：抢占AI代理时代的入口。

而对于开发者来说，竞争也正在变得越来越激烈。海外模型、国产模型、开源模型都在不断加入这场竞赛。

所以最后也很好奇问一句：

现在大家在OpenClaw上，都用哪家模型“养龙虾”？

社会生活举报

铑科技

9篇文章 | 1人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

GPT-5.4深夜突袭：OpenAI真正的棋局，可能是OpenClaw

铑科技

铑科技

热点

站务

观察者网评论

2026年十大预测，这些期待是否会发生？

风闻社区小助手_小风

315维权集结号！风闻社区邀你曝光衣食住行里的“坑”与“彩”

最近更新的专栏

风闻最热

全部专栏