苹果AI下半场:年底问世的新Siri,要彻底改变iPhone的交互
从先驱到追赶者,及其救赎之路。
作者|张勇毅
编辑|靖宇
从上周开始,我们就开始看到一些关于苹果在人工智能领域的长期规划开始浮出水面:从名为 AKI、力求在 iPhone 端侧打造「类 ChatGPT 搜索体验」的答案引擎,到本周目标指向 AI Agent 能力的「新 Siri」概念爆出。无数消息都指向了一个目标:「重生」。
从各路消息来看,Siri 的重生不是一次性的「大爆炸」,而是一个精心设计、持续好几年的分步计划。这既是因为技术太复杂,也是一种聪明的风险控制。
第一步 (2025 年底/2026 年初 - iOS 18 的某个更新):
初步的「Apple 智能」会上线。你会体验到更聪明的自然语言理解、初步的屏幕感知,还有和 ChatGPT 的集成。这可以看作是为后面的大招做个预热。
第二步 (2026 年春季 - 可能是 iOS 19.4):
这才是真正的大餐。代号「LLM Siri」的全新架构会正式推出,基于 App Intents 的深度应用控制功能也会全面开放。这标志着「Siri 2.0」的正式诞生,也是苹果兑现承诺的关键一步。
第三步 (2027 年或更晚 - 可能是 iOS 20):
这是拼图的最后一块。苹果的目标是到那时候,推出一个完全由自家模型驱动、真正主动、会深度对话的 Siri,能力上要能赶上甚至超过当时的 ChatGPT,再也不用依赖别人。
说起来,Siri 的故事本身就挺矛盾的。2011 年,它跟着 iPhone 4S 一起亮相,那叫一个惊艳,直接开启了手机语音助手的时代。那时候,我们第一次感觉到,原来跟机器聊天这么有未来感。
伴随过去十余年间 Siri 长期体验的不尽人意,再到 Apple 智能体验的翻车,Siri 甚至成了科技圈里一个怎么说都说不腻的段子。这个反差,就是整个故事最有意思的地方:那个曾经的王者,在今天这个 AI 满天飞的时代,还能不能找回场子,来一出王者归来?
Apple Intelligence 中文版|图片来源:极客公园
看样子,答案是能,而且苹果这次是下了血本了。Siri 即将迎来的这场「大手术」,可不是小修小补,而是要「革自己的命」。这背后是苹果在一个越来越卷的科技和政治环境里,下的一场豪赌,赌的就是 AI 时代的未来。他们的目标很明确:把 Siri 从一个只能听懂简单命令的工具,变成一个能贯穿苹果所有产品、真正有脑子、会聊天的核心。
苹果 CEO 蒂姆·库克前不久在一次内部大会上,话说得特别重:「这事儿苹果必须要做,也一定能做成,这简直就是为我们量身定做的机会。」这话里话外,都能听出苹果对过去十年策略失误的反思,以及对重回巅峰的渴望。
苹果给 Siri 画的这张大饼,说白了就是要让它彻底摘掉「人工智障」这顶帽子,来一次凤凰涅槃。核心玩法不是加几个新功能那么简单,而是要从根上改变技术,让 Siri 能听懂、甚至能动手操作你手机里所有的 App。
这次变革的关键技术,核心是一个叫「App Intents」的框架。有了它,Siri 的角色就全变了——从一个只会帮你「开门」(打开 App)的门童,升级成一个能进到屋里帮你「干活」(操作具体功能)的智能管家。
App Intents 本身并不是一个新概念,但有了 AI 需求让它重焕生机|图片来源:Apple
以前,你想搞点复杂操作,得自己去「快捷指令」里捣鼓半天,设置一套复杂的流程,那门槛高得能把绝大多数人挡在外面,纯粹是少数技术宅的玩具。
而苹果规划中的新 Siri,就是要拆掉这堵墙,把这种多步骤的复杂操作,用一种最自然、最简单的方式带给所有人,啥都不用你提前设置。
App Intents 旨在一站式打通底层接口|图片来源:Apple
理论说得再厉害,还得看实际用起来怎么样。从各路消息来看,新 Siri 的实际使用体验对标的其实已经是 AI Agent 的能力,靠着底层接口的打通,换来前台更流畅的跨应用 AI Agent 在手机上的无缝衔接使用。
你可以想象一下这个画面:你直接对手机说,「把我去年夏天在海边拍的合影找出来,颜色调亮点,然后用微信发给我妈」。换作以前的 Siri,这没四五个步骤根本搞不定。但在新 Siri 的帮助下,一句话就完事了。再比如,直接用嘴在朋友圈下面评论,在淘宝里加购物车,或者叫一辆滴滴,全程手都不用碰一下屏幕。
类似的场景苹果已经演示多次,但实际落地仍然少不了模型能力的支持|图片来源:Apple
虽然在实现效果上,今天的我们都已经对这种 AI Agent 能力不陌生,但与此前在智能手机上智能选择 OCR 识别屏幕内容的实现方式不同,新 Siri 的实现方式是从底层打通这些应用之间的接口。
这背后的「魔法」,其实是苹果给开发者的一套新工具。简单说,开发者可以把他们 App 里的各种功能,比如「调高亮度」、「加个滤镜」,或者内容,比如「照片」、「相册」,都「告诉」系统。开发者这边一弄好,Siri 那边就能像听懂人话一样,直接调动这些 App 的内部功能了。这等于说,苹果给整个 iOS 系统装上了一套「通用语」,让它的 AI 第一次能真正「看懂」每个 App 都会干些什么。
此外,Siri 还会有「屏幕感知」能力,也就是说,它能看懂你屏幕上正显示着什么。比如朋友用短信发你一个新地址,你只要说一句「把这地址加到他的联系人名片里」,Siri 立刻就懂,马上帮你办好。再加上更强的理解能力和能记住上下文的对话记忆,你就可以追着问问题,不用每次都把前因后果说一遍,人机对话会变得前所未有的丝滑。
为了让你看得更明白,我们来比一比新旧 Siri 的差别有多大。我们熟悉的那个老 Siri,技术上就是一堆设定好的指令,主要干的活儿就是设闹钟、查天气,或者帮你打开个 App。你问一句,它答一句,说完就忘。想跨 App 操作?也就消息、支付等少数几类 App 能沾点光,开发者能做的也很有限。
再看即将登场的新 Siri,那完全是两回事了。它的核心是语言模型以及那个革命性的 App Intents 框架。这让它的主要工作,变成了深入控制 App 里的具体功能,还能执行一连串的复杂任务。在聊天方面,它支持连续对话,能看懂屏幕内容,还能结合你的个人情况来理解你的意思。
新 Siri 旨在做端侧更懂你的 ChatGPT|图片来源:Apple
最关键的是,通过 App Intents 框架,它能支持各种第三方 App 的深度功能,给了开发者一个超级灵活的平台,想加什么功能都行。所以你看,Siri 这次升级不是简单的加法,而是彻彻底底的质变。苹果正在打造的,是一个能统一指挥它庞大 App 帝国的智能大脑。它的革命性在于,为整个生态系统建了一个通用的「能力层」。这不光让 Siri 自己变强了,也为苹果未来所有的 AI 功能铺好了一条路,一条任何对手都很难抄作业的路。
从这个角度来讲,除了,也无怪乎 Mark Gurman 甚至直接在社交媒体上呼吁苹果为了更好的挽回用户口碑,应该先给这个「新 Siri」改个名字,彻底摆脱掉此前 Siri 在用户之间的「恶名」。
Mark Gurman 喊话苹果「改个名吧」|图片来源:X
01
平台潜力的「兑现」
在光鲜的发布会背后,苹果内部其实经历了一段充满挣扎、反复试错和巨大压力的「长征」。
苹果软件工程高级副总裁克雷格·费德里吉(Craig Federighi)在一次内部讲话里就很坦白地承认,团队一开始给 Siri 升级选的那条技术路,根本「达不到苹果要求的那种品质」。这个判断让他们做了一个很痛苦但又很果断的决定:放弃原来的方案,把 Siri「彻底推倒重来」。
这番话的潜台词是,苹果终于下决心要还清 Siri 过去十年欠下的巨额「技术债」了。Siri 最早的架构又老又僵硬,就是为简单的指令设计的,根本玩不转现在的大语言模型。推倒重来,意味着之前的投入都打了水漂,还得重新砸钱砸人,但要想建一个面向未来的 AI 基础,这笔学费又非交不可。
虽然苹果在 2024 年的开发者大会上就已经把这些新功能拿出来秀了一圈,但正式上线的时间却一拖再拖。按最新的说法,这些核心功能要等到 2026 年春天才能和大家见面,这意味着连 iPhone 17 都赶不上了。
iPhone 17 系列发布在即,新 Siri 显然是赶不上了|图片来源:MacRumors
等这么久,市场自然会有各种质疑的声音。有人拿它和苹果当年那个最后被砍掉的 AirPower 无线充电板相提并论,觉得「画饼谁不会,关键得拿得出来」。这种怀疑让苹果的信誉压力山大。所以,费德里吉才会说「最终交付的东西,会比我们最初想的要强大得多」。他这么说,一方面是解释为啥要等这么久,另一方面也是在给大家重新画一条更高的期待线,意思是「好饭不怕晚,我们必须要卧薪尝胆地等待」。
这种主动承认失败、公开讨论好几年的发布计划,在苹果身上其实不常见。但这恰恰是它在如今这个 AI 竞争白热化的时代,被逼出来的策略。在一个所有人都恨不得天天开发布会的时代,你长时间不吭声,大家就默认你掉队了。所以,主动出来引导舆论,把「跳票」包装成对「品质」的追求,就成了苹果唯一的选择。
新 Siri 能不能成,最后还不完全是苹果自己说了算。它作为一个平台,到底能有多大本事,很大程度上要看第三方开发者们愿不愿意、能不能高质量地用好 App Intents 这个框架。一个功能再牛的 Siri,要是调动不了你手机里最常用的那些 App,那价值也得大打折扣。
所以,苹果正在和一大批战略伙伴搞高强度的内部测试,名单里几乎涵盖了互联网的半壁江山:如 Uber、YouTube、WhatsApp、Facebook 和亚马逊。他们测试的重点不光是功能能不能实现,更重要的是在各种极端情况下靠不靠谱。
据 Mark Gurman 报道,即使苹果内部的工程师都对新功能的可靠性保持怀疑态度,尤其是在牵扯到钱和健康这些高风险领域。万一一个指令搞错了,后果可能「又花钱又害人」。这也解释了为啥苹果打算「小心翼翼地」分阶段上线。刚开始的时候,像银行、医疗这类敏感 App 的功能可能会被限制,甚至不开放,直到苹果有百分百的把握保证它们绝对安全准确。
在今天的市场和技术环境下,Siri 的成功对苹果来说,已经不是「最好能成」,而是「必须得成」的一件大事。
首先,这是苹果在全球 AI 军备竞赛里,必须要打赢的一场仗。新一代 Siri 就是苹果对 OpenAI 的 ChatGPT、谷歌的 Gemini 和 DeepSeek 这些对手的正面回应。苹果必须证明,在这场决定未来的比赛里,自己不但没掉队,还有能力制定下一阶段的规则。
本月发布的 Google Pixel 宣传预热视频直接嘲讽 Siri,表示「你可以在Pixel 上问更多问题」|图片来源:Google
从更深的层面看,这是在争夺未来互联网的入口。有消息说,苹果内部代号叫「答案、知识和信息」的秘密项目,其最终目的就是想搞自己的搜索引擎。
显然,一个真正智能、能深度理解你的 Siri,就是这个「苹果答案引擎」最完美的交互界面。
一旦这事儿干成了,谷歌每年付给苹果几十亿美元的默认搜索引擎费就可能打水漂,整个互联网的流量玩法都可能被彻底改变。
Siri 的复兴,更是苹果为「后 iPhone 时代」做的最重要的准备。一个强大的、以语音为核心的智能助手,是苹果传闻中很多未来新硬件(比如家庭智能显示屏、桌面机器人)能站住脚的绝对前提。这些新设备极度依赖一个能无缝、智能地控制海量应用和服务的 AI 大脑。没有一个脱胎换骨的 Siri,这些新产品就都是空想。
长远来看,这可能会彻底改变我们和电子设备的交互方式——从现在以触摸为主,慢慢变成一种更自然、更无感的语音优先体验。这会从根本上改变用户和苹果生态的互动方式,形成一种比现在更强大、更黏人的平台效应。
你可以把苹果的 AI 战略看成是一出「特洛伊木马」。当全世界都在看谁家的聊天机器人更会写诗画画时,苹果真正的目标是围绕 AI 驱动的「行动」来重新打造它的操作系统。它的核心竞争力,不在于 Siri 会不会说俏皮话,而在于它能不能比任何对手都更可靠、更深入地在海量 App 里帮你「办事」。和 ChatGPT 的合作,更像是一个聪明的战术掩护,暂时满足了大家对顶尖聊天功能的需求,也为苹果在幕后打磨自己的真正王牌——基于 App Intents 的生态控制权——争取了宝贵的时间。
苹果给 Siri 的重生画了张很美的蓝图,但通往未来的路肯定不好走。一个清晰的路线图和对风险的清醒认识,是判断这场变革最终是成是败的关键。
这个路线图很清楚地表明,苹果正在用一种很务实的方法来推进这场高风险的转型。它先拿出自己最有优势的东西(App 整合),同时聪明地利用合作伙伴(OpenAI)来补上自己暂时的短板(顶尖聊天能力),为自家模型的成熟争取了宝贵的两年时间。
ChatGPT 目前在 iPhone 上的状态:可用,但不好用|图片来源:极客公园
蒂姆·库克总说,苹果的目标从来不是「第一个」,而是「最好的」。Siri 的复兴,就是对这句话最严峻的考验。苹果的赌注是,通过一个深思熟虑的、以整合为核心的策略,实现后发制人。但这背后的执行风险非常大。
挑战是全方位的:技术上要做到绝对稳定流畅;生态上要让开发者们都愿意、并且高质量地参与进来;市场上则要赢得用户对于一个能深入你个人数据的 AI 的绝对信任。在这个过程中,任何一个环节出了大问题,比如一次大面积的服务瘫痪,或者一个闹得沸沸扬扬的隐私丑闻,都可能让苹果这么多年的努力白费。
02
新的护城河,还是遥不可及的梦?
最终,Siri 的未来正站在一个高风险、高回报的十字路口。
如果苹果成功了,那么由 App Intents 驱动的这个新 Siri,将成为苹果有史以来最坚固、最宽阔的护城河。
它会是一个深度整合、注重隐私、以行动为核心的智能层,贯穿你数字生活的每个角落。这种能力,任何对手在短期内都复制不了,它会重新定义苹果生态的核心价值,并让它的领导地位再延续十年。
但是,如果执行过程磕磕绊绊,开发者们不买账,或者最终的体验达不到用户对「苹果品质」的苛刻要求,那这将是一次载入史册的、无比公开的失败。它将彻底坐实那个流传已久的说法:在这场本世纪最重要的技术变革中,苹果已经失去了它的魔力。
未来两到三年,就是决定 Siri 乃至苹果命运的关键时期。全世界都会等着看,苹果是能搭起一座通往未来的坚实桥梁,还是最终发现,这只是一个遥不可及的梦。
*头图来源:苹果
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO