千问对决豆包,AI代理大战一触即发

500

本文来自微信公众号:壹番财经(ID:finance_yifan),文|郑亦久。

进入2026年,AI行业的焦点转向现实世界。

本质上来看,再聪明的大模型其实也就是一张嘴,而试图寻找一切机会摸鱼or偷懒的用户真正需要的——还是能自己办事办成的工具。

可以说,当下的字节和阿里几乎不约而同地向前迈了一步。

最近更新的豆包从入口层渗透,试图更多让用户留在对话框里,从答题、音乐、电商、本地生活逐步集中到一个窗口中。

500

图源:豆包网页版

而在1月15日,阿里举集团之力,拿出大版本更新的千问则选择从执行端切入,把点外卖、订酒店、买机票这些复杂任务塞进同一个对话里,让AI负责完整流程。

双方都在回答同一个问题:AI能不能从聊天者变成执行者。不同之处在于,千问直接扎进任务现场,而豆包先占据意图入口。

这场代理大战因此变成两条路径的比赛:一条要通过闭环证明“我能办成事”,另一条则靠习惯养成,等生态慢慢补全。

500

图源:千问App

AI代理本质是一种对产品生态要求极高的形态。算力可以外包,模型可以迭代,但支付、库存、履约、地图、出行、线下服务这些现实世界的系统,很难在短时间内为AI重新设计。

从这个前提出发,千问看上去确实占据了明面上的优势,因为它站在阿里长期搭建的生态之上。但优势能维持多久,并不只是技术问题,而是一场长期的生态工程。

01 千问与豆包想做什么、能做什么

把两家最近的动作摆在一起,可以看出它们大致相同的方向和清晰不同的路径。

千问这次声势浩大的大版本更新,表明其Chatbot服务不仅仅只是满足于给一个“答案”,而是直接接手“任务”执行。

两个基本场景就是办事和生活。前者基本就上上班族日常会做的绝大多数工作内容,如 “整理发票”“做财务报表”“生成PPT”等100多个细分场景,都能通过千问直接代理解决。

500

图源:千问App

当然对于更多普通人来说,工作之外的场景反而是当下AI工具使用更多的情况。而这几乎也是各家大厂的必争之地,同时也是凸显不同产品生态差异度的场景。

像是用户说想点瑞幸、喜茶,千问要做的就是根据其在淘宝闪购这些阿里体系内服务留存下来的习惯,自动下单并完成支付,最后把咖啡、奶茶送到用户手上。

用户说明天一早要去上海,千问则会从飞猪上筛选航班、比较舱位和价格,给出候选列表,再把确认步骤压缩回一条会话。

500

图源:千问App

对用户来说,只是多说了几句;对系统来说,是把原本分散在多个应用里的流程集中到同一个入口里。

在这个过程中,阿里把多年积累的电商、本地生活和出行能力重新打包到千问上,希望让它成为用户处理生活事务的操作层,而不是单纯的聊天入口。千问的方向很直白,就是要证明:AI可以真正办成事。

当然,如果看之前豆包AI手机助手的想法,字节其实已经试图通过豆包在移动端实现这些事。

甚至说其更加激进的试图跳出对话框,直接在手机终端实现上述所有能力。当然结果我们也都知道了,那就是惨遭各家大厂围堵,无疾而终。

500

豆包手机助手

不过这并不意味着豆包就放弃了代理路线,只不过在目前其它大概还没有能力去追求完整闭环,因此更多只能耐心承接更轻量的任务。

像是接入更多已有的生态服务,如今豆包用户说“来点音乐”,豆包直接在对话窗口里播放汽水音乐;用户问嘴唇干怎么办,它先解释原因,再把抖音商城里的润唇膏卡片贴在答案下面;用户问周末去哪玩,它一边给建议,一边顺手挂上本地团购链接。

500

图源:豆包App

这些动作单独看都不算“完成任务”,但每一步都拦住了用户的注意力,把问题和后续行为继续保留在其对话框内。

相对于豆包手机助手的激进,目前豆包这种推进方式基本上还是以我为主,先将字节系内部能力缝合进AI代理的服务流程。

看起来确实不像是一套完整的代理系统,更像一种在缝隙里试探的自动化能力。对于日活过亿的豆包而言,只要问题先落在自己手里,后面的执行就可以有时间慢慢完善。

一条路从执行往入口回流,一条路从入口向执行外扩。说到底其实还是两家在AI之外产品生态的差距问题,而这恰恰也是当下AI代理的命门所在。

02 AI代理的真门槛:生态是基础,但不是终点

真正把这两条路径拉开距离的,与其说是基础模型能力,不如说是生态能力。

模型当然不会自动变成跑腿的,能够调用支付、出行、地图、身份和客服体系的能力才会。1月15日这一天就能实现点一杯奶茶的千问(先别管是不是点贵了),正是因为它站在阿里常年累积下的产品生态上,有着完整的产品闭环,可以说只要接好入口,就能不断扩展场景。

500

图源:千问与淘宝闪购对比

毕竟不论是美团还是闪购,或者支付宝、微信支付都不可能给予豆包这些权限,尤其是在国内的生活核心场景几乎完全围绕移动端展开的情况下。

豆包即便想做,更多也只能在桌面端实现类似Manus这样的能力,但移动优先的国内市场,这一层级的代理能力显然是不够的。

当然,并不是说有了生态,AI代理的无敌于天下了。越往深处看,这种优势也越显得沉重。

每一个新增场景背后,都是一次系统改造。接口需要重写,风控逻辑需要迁移,业务责任需要重新划分。这一时刻千问代理说暴露的问题,最简单就是有部分网友晒出通过其点外卖比闪购还贵,极大可能还是归咎于内部的权限分配问题。

500

图源:千问App发布会

如果所有阿里系的服务都被抽象成可以被AI调用的能力,本质上是千问之外阿里内部其他部门必须出让一部分核心控制权,把行为数据和执行权交给千问。

AI当然可以不分亲疏,但有人的地方就有山头,淘宝闪购去年一年烧掉几百亿换来的市场份额,如今全部给千问这个毛头小子做嫁衣,任谁心里也不会好过吧。

更现实的一点在于,阿里生态并不等于整个互联网。

千问的代理能力再强,就目前而言也只能覆盖阿里体系内能掌控的轨道。但现实世界里用户的生活并不是按生态来划界,第三方是否愿意开放接口,平台是否愿意让AI代替用户操作,监管在其中如何划线,这些都不是千问自己可以决定的变量。

500

图源:网络

就好比大肆强调的点外卖,无法有别家比价的话,对于普通用户来说,究竟是感受所谓智能重要,还是能省钱更重要。

尤其是国内的生态也不仅仅只有阿里。即便豆包和字节在很多方面还有明显,换了AI一号位的腾讯的微信生态显然不会弱于阿里,可以说阿里所谓的生态优势仅仅也只是相对而言。

从这个意义上看,没有什么胜负是已经确定了的,尤其是在AI本身能力依然还在快速迭代的情况下。

500

图源:网络

千问得益于生态,也受制于生态;豆包缺少生态,却握着入口。一方需要解决的是如何长期动员体系、压低改造成本,让体系内的服务更好的存在于在千问名下;另一方需要解决的是如何把入口优势转化为可持续的执行力,寻找更多巨头生态之外的援兵。

AI代理大战接下来会进入拉锯阶段,拼的大概不会是谁最先凭借生态能力做出华丽的功能清单,而是谁打破生态的边界真正让用户通过AIh获得最佳的体验。

站务

全部专栏