Agent2.0升级!MiniMax开始抢夺“工作入口”

Agent 2.0真正想抢的,是“工作入口”而不是“用户时长”。

500

撰文/海月

编辑/嘉平

500

如果把过去两年的大模型应用总结成一句话,大概是:大家都在争夺“你的注意力”,但很少有人真正拿走“你的工作”。

对话框式的产品把 AI 变成了一个随叫随到的顾问——能写、能答、能总结,可真正耗掉你一天八小时的,往往是那些看起来不体面却必须完成的小动作:找文件、改格式、查资料、汇总表格、跑脚本、导出PPT、再把成果交付到某个能分享、能复用的地方。

2026 年开年,Agent 的竞争开始换了主语:AI 不再只“回答你”,而是要“替你做”。

国外 Anthropic 推出 Cowork,让 Claude 获得你电脑上某个文件夹的权限,可以在其中读、改、建文件,朝着“数字同事”迈了一步。国内则是阿里把千问推向“办事闭环”,把淘宝、支付宝、飞猪、高德等生态能力接入千问App,再用“任务助理”去承接复杂任务,试图把 AI 变成新的“意图入口”。

在这个时间点,MiniMax 发布 Agent 2.0,给它起了个更直白的名字——“AI 原生工作台”。桌面端(Windows/Mac)+ Expert Agents(专家分身)两条线并进,它的目标并不是做一个更强的聊天助手,而是把 AI 直接塞进你电脑的工作动线里:让你少点一次按钮,少切一个窗口,少复制一段内容。

从“聊天”到“工作台”,MiniMax押注的是生产力的默认路径

桌面端这件事,外行容易理解成“换了个壳”,但对 Agent 来说,它等于换了核心器官——上下文的获取方式变了。

对话框产品的上下文,来自用户一次次手动输入:你喂什么,它知道什么;你漏什么,它就天然失明。桌面端的上下文,则来自你授权的工作环境:文件夹里有什么、你常用什么格式、你本地装了哪些工具、你手头材料的结构是什么。只要权限边界设计得当,AI 读取环境比反复追问用户更高效,也更接近真实工作。

500

MiniMax 的桌面端设计强调“工作目录”:用户选定一个目录后,Agent 可以在授权范围内读取、分析、批量处理目录中的文件,并可结合网页自动化去完成跨本地与云端的任务。

这类设计的核心价值,不在“能做什么花活”,而在“能不能把零碎摩擦磨平”。因为大多数知识工作并不难,难的是碎:一个任务要跨十几个软件,要复制粘贴几十次,要反复改格式、补链接、核对版本。Agent 只要能把这些碎活接过去,就会显著改变效率感知。

更关键的是 Expert Agents。过去多智能体往往是“临时组队”:系统预设几个角色,遇到任务就拉群讨论,解决的是“视角”问题,但很难解决“规矩”问题。

真正的专业工作不是缺观点,而是有 SOP:报告怎么写、数据口径怎么定、审稿标准是什么、行业黑话怎么用、哪些来源可信、哪些表达不能出现。

MiniMax 的 Expert Agents 试图把这些“规矩”模块化:允许用户上传私有知识、注入行业流程,让 Agent 不仅会拆任务,还能按你的组织方式执行。

这一步一旦成立,产品竞争逻辑会发生变化:聊天产品的护城河是模型能力与交互体验,迁移成本低;工作台产品的护城河是流程沉淀与组织绑定,迁移成本高。

因为当把团队的知识库、模板、SOP、常用数据源都塞进一套专家分身里,你换工具就不再是“换个App”,而是“换一套工作体系”。这才是“承包桌面”四个字真正的商业含义:它要占的不是你刷手机的碎片时间,而是你每天开机后那条最常走的路径。

从行业趋势看,MiniMax并不是孤军。Anthropic 的 Cowork同样强调“给一个文件夹权限,AI 在里面读、改、建”,并举例可以整理下载目录、把截图做成报销表、从零散笔记生成报告初稿。

这说明一个共识正在形成:Agent 的第一块硬骨头,不是更会聊天,而是更会“接触真实材料”,并在材料里持续推进任务。

承包桌面只是开始,真正的门槛在“谁来收钱、谁来背锅、谁来扩张”

把 AI 做进桌面,短期看是体验升级,长期看是把自己推进三个更难的战场:可靠性、数据合规、商业化。它们决定 Agent 能不能从热闹的“演示”走向可持续的“使用”。

第一道坎是可靠性。Agent 的魅力在于自主拆解与工具调用,但也意味着路径不完全可预测:同一任务跑两次,可能因为网页变化、文件结构差异、工具调用失败而得出不同结果。

Cowork 在官方介绍中强调它只访问用户选定的文件夹,并能在其中编辑、创建文件。这种能力越强,错误成本越大:一次误删、一次误改,足以让企业用户把它永久拉黑。桌面 Agent 要进入“真工作”,必须把“可控性”做到产品骨子里——权限边界、关键动作确认、变更可回滚、执行日志可审计,这些比“回答得漂亮”更重要。

第二道坎是数据与合规。Agent 能读你的文件夹,就天然触碰到企业敏感资产:合同、客户、财务、代码、未发布方案。对个人用户来说这是一种便利,对企业 IT 来说这是一份风险清单。

MiniMax 要想把“工作台”卖进企业,就必须回答数据如何流转、权限如何分级、知识库如何隔离、审计如何落地的问题。否则桌面端越强,越容易被安全部门一票否决。

第三道坎是商业化。Agent 的成本结构比聊天更残酷:更长上下文、更频繁工具调用、更复杂的多步骤规划,都会把推理成本抬高。MiniMax 在模型侧的路线,明显在为 Agent 形态铺路——例如其公开的 MiniMax-M1技术报告强调lightning attention 与百万token 级上下文,强调更适合处理长输入、复杂任务与工具使用,并在训练效率上做文章。

这代表它知道 Agent 的核心矛盾:既要能干活,又要干得起活。因为一旦任务需要调用几十次模型、跑一堆工具,价格贵一点就会从“生产力”变成“奢侈品”。

这里就能看出 MiniMax 与阿里千问的分叉:千问走的是“生态闭环”,把外卖、出行、支付、购物等能力接入,AI 负责意图理解与调度,生态负责执行与履约,变现路径天然。

MiniMax走的是“桌面通用”,不靠单一生态,靠接管本地材料与工作流去扩大适用面。前者的优势是闭环和变现更清晰,后者的优势是跨行业可复制、天花板更高,但要付出的代价是更重的可靠性和合规体系。

所以,“承包桌面”不是终点,它只是把 Agent 竞争从“会不会回答”推到了“能不能交付”。交付意味着:结果要能直接用,而不是半成品;流程要可复盘、可审计,而不是一次性魔法;成本要可控,而不是越用越肉疼。

谁能做到这三点,谁才有资格把 Agent 从“潮玩”变成“基础设施”。

结语

MiniMax Agent 2.0 这波动作的意义,不在于又多了多少功能按钮,而在于它选择了一条更难但更值钱的路:抢“工作入口”。当 AI 只存在于对话框里,它永远像顾问;当 AI 进入你的桌面、你的文件夹、你的 SOP,它才有可能变成“同事”,甚至变成“流程本身”。

而入口之争从来都残酷:占住入口的那一方,能决定数据从哪里来、任务往哪里走、价值在哪个环节结算。2026 年的 Agent 竞争,本质正在从“模型能力之争”滑向“入口与系统之争”。

一边是 Cowork 这类把 AI 放进电脑文件夹的路线,推动 AI 变成可操作的数字协作者;另一边是千问这类把 AI 接进超级生态的路线,推动 AI 变成可履约的办事入口。

MiniMax 选择承包桌面,赌的是一个更长期的事实:知识工作者最缺的不是答案,而是把答案变成交付的那条路。它接下来要证明的也很明确——不是“能不能做出惊艳的演示”,而是“能不能在大量真实用户的日常里稳定地跑起来”,并且让企业敢用、愿付费、能规模化。

当 AI 开始承包你的桌面,你交出去的不是几个窗口的切换权,而是工作方式的控制权。谁能把这件事做得足够可靠、足够便宜、足够可控,谁才可能成为下一代生产力系统的默认入口。

站务

全部专栏