霸榜过后,千问回答了那个问题吗?

500

文 | 阑夕

千问上线半个月了,它要回答的问题没有变过:

在AI助手已经琳琅满目的今天,大家为什么要去用千问?

确实,ChatBot这种产品形式没什么网络效应,用户的迁移成本并不算高,但在AI助手已经成为大厂标配之后,千问还是需要找到它的后发优势。

而以千问的定位——会聊天,能办事——来看,千问打进市场的时间差,可能是「刚刚好」。

「刚刚好」的意思,指的是基座模型的发展水平和信任AI的用户心智处于正在双向奔赴的高光时刻。

比如千问评价最高的一项能力,是办公替代,在对话里就能精确控制一份PPT的生成和编辑,并将文件转化成各种场景需要的格式,这对很多手机用户来说是绝对的刚需。

针对有特殊格式要求的文档,千问还能智能识别内容类型,「生成即排版」,排版能力覆盖近千所高校官方格式、120多种公文模板、71类近万份合同模板。

500

要知道,中国的80后和90后,可能是唯一「懂得怎么用电脑」的一代人,上一辈生不逢时就不说了,下一辈因为成长轨迹和移动互联网完全重叠,以致于年轻人也对PC环境尤为陌生。

所以用千问来做PPT并直接交付给上级,成了这波增长里意料之外的亮点,但我要说反倒不是这个在AI助手里内嵌一个Office的想法,而是大模型应用可能已经走到了「Next Level」:

比的是谁能更快且多的将软件OTT化。

细说之前,不妨先来回忆一下2025年的大模型行业,在产品层发生了哪些重大转折:

DeepSeek的横空出世,打破了美国四大AI公司(OpenAI、Anthropic、Google、xAI)的「制空权」,并打响了开源包围闭源的反击战;以Manus为先行者的大量初创公司,开始发力调用而非开发模型的Agent市场,不再重复造轮子,转而尝试为AI接入手脚,接管用户的设备使用权,脱离聊天框的约束;在Scaling Laws濒临失效后,OpenAI成功掀起「万物皆可吉卜力化」的风潮,以多模态能力再次让ChatGPT取得领先,主流大模型进入全尺寸时代;Google凭借雄厚的家底和醒悟的效率,再次回到牌桌当庄,不但破坏了「Sota轮流坐」的规矩,还以全家桶的产品组合,一边走别人的路,一边让别人无路可走;

要知道,这种跌宕起伏的剧本,其实是在不到12个月里轮番上演的,恍惚之间,真有「天上一日,人间一年」的错觉,紧凑尺度下的技术变革,就是如此暴力。

不过,细想这四次转折,其实都留了缺憾:

开源模型的经济回报及其预期严重不足,在创造的产值层面,中美之间的经济差距远高于技术差距;

Agent的实际体验不太乐观,即便每一步都能达到90%的成功率,五步加权下来的成功率就只有不到50%,这会无限放大复杂任务的完成难度;

全尺寸主要起到清场作用,进一步淘汰掉了训练资源不足的对手,但对第一梯队没有太大影响;

Google的收割更是违背了这个行业的「祖训」,毕竟大家当初都是因为不想看到Google赢得一切才合伙起事的⋯⋯

理解了上述种种,就能理解为什么我说千问的进场时机,微妙得「刚刚好」了。

背靠下决心「毕其功于一役」的阿里,千问手握无限弹药的开火权,可以和Google一样承受长期战略的压力,甚至连自造芯片都和Google靠着TPU打掉英伟达财报如出一辙。

更重要的是,将Agent内化到AI助手的射程里,用相对务实的短路径吃掉软件服务的增值业务,比起一步登天的造势和落空,可行性要高太多了。

事实上,用AI工具来帮助用户做PPT,并不是要完全替人完成所有,而是帮他们省去大量的低效率时间。

数据显示,全国有2.6亿的PPT使用人群,高频用户平均每天要花2个多小时在PPT上,但在这2个小时里,真正用在想法创作的时间其实很少,大部分时间都耗在了找模板、调结构、改样式这些工作上。

站在生产力的角度来说,这是相当严重却又得不到解决的浪费,即便有了AI之后,工具与工具之间的割裂,又会新增频繁的切换成本,越用越累。

所以千问能做PPT的价值,也在于一站式的交付成品,除了辅助用户激发思想,还能「顺手」把工作完成,把领导权交到普通人的手上,让掌握技能这件事情不再成为障碍。

之所以写PPT这个能力过于突出,是因为它在某种程度上是办公链路里最为内耗的环节,由此为切入点,千问试图把每个人的工作质量都提上几个档位,让他们专注于重视个人能力的表现,这反而真正把用户从形式主义泥沼里解放了出来,回归人本主义的理念。

这才是AI该做的事情,不是吗?

可以预见的是,模型的内化能力只会越来越强,以前人们还在惊叹无所不知的Chat,如今只会Chat的AI助手就已经落伍了,它所替代的,也不应该只有搜索框,万亿级的生产力工具都在迎来一次巨变。

比如那些「只会说却不能动」的传统AI助手,在很多时候只能起到一个外界大脑的作用,用户需要不断的生成和搬运文本,回到办公软件去做交付。

但在千问这种集成化的下一代AI助手里,软件本身只是被调用的工具之一,用户的交流主体,永远是模型,当模型拥有指哪打哪的办事效率,用户是不是真的需要安装软件,也就并不重要了。

这就是OTT化的意思,软件不存在了——或者说,操作软件成了模型能力的延伸。

「软件吞噬一切」曾是开启互联网繁荣的标志性金句,当时的场面就是依靠足够低廉的边际成本,软件作为一种产品化的服务模式OTT掉了工业化的项目制,时过境迁,AI成为了新的生产力,又开始OTT掉陈旧僵硬的软件生态,就很轮回。

何况千问必然还会将阿里擅长的在线购物场景、生活消费场景全都集成进来,下一代大模型的主场,正在无限接近上限智能+精确行动的套餐。

就像Nano Banana Pro之所以再次刷爆社交媒体,就是因为它好像不只是一个强大的文生图模型,因为有了Gemini 3的「搭手」,Nano Banana Pro的制图过程融入了思维链,这让它能一步到位的生成文字密集的信息图,并理解意图表达。

500

500

这就是会办事的AI,所能突破的边界。

我经常会把时隔十年左右的两幅画面,放在一起对比:

一个是十年前,美团的创始人王兴说开完会需要有人整理会议记录,需要用到visio来画流程图,王兴问年轻的同事会不会用visio,而她毫不犹豫的说「我可以学」,事后王兴表示,「这四个简单的字里有无穷的力量。」

另一个今年,在开发者扎堆的群里,有人分享了GitHub上的一个新项目,认为可能有助于大家的工作,此时有人接茬,说了这么一句话——「OK,我让Claude去学」——在我看来,这句话里的力量感同样震撼。

都说AI削弱了人类的主体性,但辨别真正的主体性,更加重要。

除非有人认为在PPT里像素级对齐线条才是他的存在意义,否则就不可能把吩咐AI代劳视为主体性的丧失,而千问选择的市场,也不在于那日均不到十分钟的聊天机会。

真正有价值的,是即插即用的、All In One的信息处理入口,是需要办事就想到打开千问的自然心智。

最后分享一个非常形象的图示——也是基于思维链和文生图的组合生成的AI作品——用来锚定在这个巨变的时代,我们当前处在的位置,以及即将撞上的未来。

500

站务

全部专栏