亚马逊云科技,如何拒绝让Agent沦为玩具?

“Why not?”在号称“云计算”春晚的2025年亚马逊云科技re:Invent大会上,亚马逊云科技CEO Matt Garman演讲中就抛出一连串问题:“为什么开发者不能专注于构建而非基础设施?为什么实验时间与成本不能趋近于零?为什么不能让每一个想法都成为可能?”
事实上,Matt Garman以上提问,都直指近年AI Agent火热浪潮中,一直困扰企业群体如何真正释放生产力的核心命题。历年来,全球企业核心诉求需求没有根本改变,本质仍在于提高效率(SaveTime)。这也是多年来,亚马逊云科技这家业务规模已达1320亿美元的全球云巨头一直聚焦的工作。Agentic AI时代,AI Agent不是手段也不是目的,而成为生产力本身,不过前提还在于,需要让Agent安全合理地落地并实现高效运转。亚马逊云科技 CEO Matt Garman 在 Keynote 上就谈到:“Put Agent into Work。”
事实上,过去数年AI正在从Copilot向Autopilot加速转化过程中,不少企业已经为“聊天机器人”支付了昂贵的学费,然而实际操作下来,却发现辅助式、被动化的问答模式,很难真正让公司实现业绩实质性增长。因此,Matt Garman强调的“Put Agent into Work”,或许也指向了AI核心定位的变化,即从一种“咨询顾问”转变为“数字工人”,需要以一种工作更加主动、细节更加精准、安全更加可控的行为模式,为企业切实创造价值。
如果细看2025年re:Invent大会上关键人物的发言倾向,不难发现,从亚马逊云科技首席执行官Matt Garman到亚马逊云科技Agentic AI副总裁Swami Sivasubramanian,再到亚马逊云科技高级副总裁Peter DeSantis,均用了大量篇幅讲述AI Agent究竟如何有序、有效、有用地落地。“未来数十亿Agent将渗透各行各业,助力企业实现10倍效率跃迁。”Matt Garman在开篇演讲中激昂谈到。值得注意的是,近二十年来亚马逊云科技一直通过推动云计算和生成式AI普及在各行各业“搭台唱戏”,成为全球企业群中效能放大器的典范,“利他战略”也让企业实现了二次成长,仅仅在过去一年,亚马逊云科技新增营收就达220亿美元。
一、利他思维如何更好地“搭台唱戏”
没有一个真正的战略家是对战术细节不熟悉的,一个真正的战略家也不会将战略眼界聚焦短期胜败上。亚马逊科技2025年re:Invent大会首日,公司CEO Matt Garman两个多小时主题演讲聚焦与发散并进,实际上也是以上定论的集中反映。

一方面,Matt Garman全场两个多小时的Keynote就发布新品接近40个,集中展现了亚马逊云全新一代自研芯片、前沿基础模型及企业级模型定制框架等一系列重磅产品,在算力层、模型层和应用层持续突破,令人有一种应接不暇的感觉。另一方面,Matt Garman的绝大多数时间,实际聚焦在了AI基础设施和全新Agent产品的讲解上。
对此,Matt Garman直截了当地指出:“AI Agent正在把我们带到AI发展的关键拐点。未来每家公司,每一个可以想象的领域中都会运行数十亿个Agent!”什么让亚马逊云科技有了这样的判断?这与近些行业在AI浪潮中所处的一个尴尬境遇密不可分:仅从目前来看,AI浪潮助力下的企业仍无法实现投入产出比的均衡,巨额投入什么时候才能转化为企业实实在在的业绩反映,也成为困扰众多企业CEO的难题。
为了破局,为了让AI从Assistant加速质变成能主动干活、充分释放生产力的Agent,并且让Agent更可信、更好用、更可控、成本更低,亚马逊云开出了自己完整的解决方案,即算力基础设施、推理平台、数据、还有实现Agent 的一系列工具链。贯穿亚马逊云科技以上解决方案的核心思路则在于,向下自研芯片,以性价比夯实算力底座,中间扩充模型,提供给客户更多、更厚的选择,向上则树立规则,严格把控Agent实际操作风险,从而真正达成一整套可用、可信、可控的技术闭环。比如说,当下Agent对Token消耗量,已经达到了较为简单AI对话的十倍以上。为此,如何更直接地降低Token成本,为企业提供性价比算力基础设施配套,就成为亚马逊云科技的一大发力点。
在备受期待的算力基础设施构建上,亚马逊云科技一方面作为运行NVIDIA GPU的核心场所之一,积累了大规模的GPU运行经验,由此,本次大会公司例举P6e GB200 超级服务器就相比上一代 P5e,计算性能提升超过20 倍。此外,亚马逊云科技始终没有减缓自身底层芯片布局。本次大会上,Matt Garman宣布正式推出了最新Trainium3,并且发布Amazon Trainium3 UltraServers,这也成为亚马逊云科技首款搭载3纳米工艺AI芯片的服务器。
相较Amazon Trainium2,不仅计算能力提升4.4倍、内存带宽提升3.9倍,每兆瓦算力可处理的AI token数量达成了5倍增长,为大规模 AI 训练与推理带来显著的效率与能效优势。并且,新一代服务器在运行OpenAI的GPT-OSS-120B模型时,每兆瓦输出token数是Amazon Trainium2的5倍以上,可实现更极致的能耗比。大会上,Matt Garman还首次披露了Amazon Trainium4芯片,承诺将实现较Amazon Trainium3 UltraServers六倍的FP4计算性能、四倍内存带宽和两倍高内存容量,继续坚守亚马逊云科技在AI芯片领域的长期投入的战略定力。

值得注意的是,基础算力的底座夯实上亚马逊云科技常年持续投入,如今已完成超100万个Amazon Trainium2芯片规模化部署,为Amazon Bedrock中大部分推理工作提供了稳定可靠的算力支持,并且已为公司带来了几十亿美元可观收入。某种程度上说,也正式由于亚马逊云科技对自研芯片持续的投入,也让公司在当下越发复杂的竞争环境中拥有了更多主动权。尤其是在算力即权力的当下,一旦企业的核心利润被上游硬件厂商大幅拿走,那么云厂商在博弈中占据主动。
从这点上说,亚马逊云科技自研芯片构建发力点不仅仅是技术壁垒,更是一种构建自身UE的必然:尤其是当Agent时代来临,Token消耗量呈现出指数级增长时,要想实现商业更长久健康的盈利,基础算力上的“自研”与“降本”必不可少。除了算力,第三方模型引用上Amazon Bedrock也持续丰富着客户模型选择权,在“利他战略”下持续开源、继续“搭台唱戏”。大会现场,亚马逊云科技展现出一种更为开放姿态,Matt Garman则向世人宣布,公司收录了更多开源、通用、专用等多种类型的模型。其中,Amazon Bedrock就收录了包括谷歌的 Gemma、NVIDIA的Nemotron,Kimi和Minimax 厂商的最新模型,真正为亚马逊云科技的客户提供了模型运用上更广阔的空间。
与此同时,亚马逊云科技也在让自身大模型继续进化,大会现场同步了Amazon Nova迭代到了Amazon Nova 2的最新进展。该大模型包含Amazon Nova 2 Lite、Amazon Nova 2 Pro、Amazon Nova 2 Sonic、Amazon 2 Omni四个版本可供客户在不同场景中调用,延续了强大智能能力同时,也持续将成本效率与低延迟表现大幅提升。并且,Amazon Nova 2实际测试中各个版本性能表现也都可圈可点。例如,Amazon Nova 2 Lite 性能就可比肩 GPT-5 Mini、Claude Haiku 4.5等业界先锋模型。此外,Amazon Nova 2 Pro 在指令遵循、Agentic工具使用等基准上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5,进步显著。
而在数据层面, Amazon AI Factories的推出,则更能反映公司的“利他战略”:对于某些特殊客户来说,数据处境与安全始终摆在第一性,为此,Amazon AI Factories一经推出,就可将全套的 AI 算力集群、网络架构、存储设施,直接打包运到客户的本地数据中心里,实现了安全与算力的平衡统一。事实上,Amazon AI Factories的推出,也在某种程度上揭示了一种云计算叙事逻辑的改变:过去多年,企业大趋势是“上云”,可到AI时代后,由于数据主权、隐私和安全问题左右,如何让“云下来”,则成为一种维护数据资产的必然选择。
二、怎么让Agent可信、可靠、可用?
除了基础算力与模型扩展,亚马逊云科技2025 re:Invent大会上,还创造性提出了如何帮助客户“调教”出一个可控、可用、可信的Agent。某种程度上说,以上技术路线上展现的切实性,也是亚马逊云科技核心竞争力的一种外化。例如,当大多数平台还在比拼Agent框架灵活性、推理速度时,亚马逊云科技则更为敏锐又贴切地意识到,或许企业需要的不是一个能聊天的机器人,而是一个能干活的员工。

为此,亚马逊云科技围绕如何让Agent安全合理地高效落地,去解决企业种种核心痛点,大会上就推出了Agentic AI平台Amazon Bedrock AgentCore。在该平台“约束”下,Agent 的日常使用、行为秩序得到了更好的秩序,由此公司则可大规模地安全构建、部署和运行高性能的Agent。为了确保Agent运行过程中的安全性与合规性,亚马逊云科技则开放了AgentCore Policy、AgentCore Evaluations 功能。
此举的启迪意义,或许不止于帮助客户规避失序风险,更在于亚马逊云科技尝试着定义出Agent时代下一种全新的治理范式。这已经不是一种简单的程序约束,而是给Agent制定出了一套行事准则,甚至说“法律法规”。
由此一来,用户在Agent运行过程中,就可以从人类行事的逻辑去规劝、约束AI,只有这样,企业的更多核心业务或许才会让Agent落地产生可能。这也触及到了Agent大规模落地的真正痛点。某种程度上说,大模型有一定概率性,可回到企业业务流程中,尤其涉及到财务层面,需要的必须是100%的确定性。事实上,企业群体头疼的往往不是AI不够聪明,而是AI“一本正经地胡说八道”或“违规”越权操作。
从这点上说,Amazon Bedrock AgentCore的核心价值或许就在于,给相对不可控的Agent加上确定性“枷锁”后,很多风险将会被隔绝。事实上,Agent兴起的潮流下,围绕“风险”衍生出大量核心的讨论:比如在企业核心业务的使用场景下,一个不可控的Agent会展现出如何巨大的破坏力?这样的猜想在不少科幻电影中已经出现了大量发人深省的故事。正因如此,除了Amazon Bedrock AgentCore,如何更快、更安全地将Agent加入到日常工作中来,亚马逊云科技也提出自己一系列方案。比如,Amazon Quick 作为一款面向企业的智能 Agent 应用,不仅能够帮助用户进行深度分析、数据可视化和工作流自动化,还可以通过企业级的安全与隐私标准确保信息的可靠性与合规性。
除此之外,在备受关注的AI 编程领域,亚马逊云科技在大会现场,也提出了三大Agent——比如,Kiro autonomous agent,可以作为虚拟开发者,持续分担人类工作,并且能够独立完成各项任务,并在工作中持续学习拓展能力边界。再比如,Amazon Security Agent则可以承担虚拟安全工程师的角色,在应用设计、代码审查与渗透测试等环节充当起企业的安全顾问,极大降低安全风险。还有可以帮助开发者,尤其是负责值班的工程师,主动发现系统故障或潜在缺陷的Amazon DevOps Agent。从这点上说,鉴于亚马逊云科技在服务行业二十年来积累的大量经验,无疑不在证明,各行各业、不同规模的组织面临的需求痛点,都让这家企业能在第一时间准确捕捉,由此根据企业现实存在的痛点。
并且,此次大会基于底层算力、推理平台、数据再到Agent产品链路,亚马逊云科技在今年 re:Invent 上展现出的,或许是自身一步步地把早期具有“玩乐”属性、技术噱头的Agent ,由此正式推向商业实战中。
三、在Agent时代,找回丢失的创造力
过去两年,我们无不见证了大模型带来的颠覆,同时也看到了其呈现的局限性。比如,大模型或许能写诗作画,却很难替用户解决更多实际问题,比如买一张机票:从这点上说,Agent与传统大模型助手的核心区隔,或许就在于分自主行动力。在这一视角下,Agent需要担负起的责任,则更加精细化,是一个能够主动执行任务、在复杂环境中实现动态推理、并让工作流程自动化的“数字员工”,也是一种未来生产力的集中释放。
亚马逊云科技2025 re:Invent 大会上,亚马逊云科技Agentic AI高级副总裁Swami Sivasubramanian的Keynote上,就围绕Agent如何重塑商业世界的可能展开了核心推论。

比如,AI Agent 如何才能实现真正的大规模生产落地,从而将概念性变为真切的生产力提升?
Swami Sivasubramanian的Keynote上提到了一个生动案例:当我们最早写下第一行代码时是怎样的感觉?这样一种类似造物者、仿佛能做到任何事的创作自由,在Agent 时代又该如何找回?事实上,以往用户无拘无束、无所不能的创作欲表现,到了现在,却随着 AI 系统的日益复杂,变得更加难以实现:尤其是那些概念验证阶段看似表现良好的AI,一旦进入大规模应用,却往往因为逻辑脆弱、缺乏模块化,从而对用户想象力、生产力的激发产生了一种反作用。
为了解决以上痛点,亚马逊云科技则将发力点聚焦到了“简洁性”上。比如,一个Agent往往由基础模型、代码和工具三大组件构成,协同编排这些组件往往比较繁琐,为此,亚马逊云科技则发布并开源了Amazon Strands Agents SDK。这一框架也被引入了TypeScript 平台,今后,开发者则能够利用熟悉的工具栈构建完整出Agent 堆栈。更关键的是,Strands 还新增了对边缘设备的支持。这意味着,未来Agent将不再局限于云端服务器,而是可以运行在汽车、游戏机甚至机器人终端上。值得注意的是,短短数月,该SDK 下载量突破 500 万次,再次证明了开发者对“简洁性”的青睐。
另一个制约生产力解放的直接命题,也被Swami关注到了。比如,为了解决当下AI普遍存在的“健忘症”、即无法在长期交互中沉淀经验,Amazon Bedrock AgentCore Memory推出后,则接入了全新的情景式记忆功能,能够让Agent从过往的上下文、推理过程、操作结果中持续学习,并将这些信息应用于后续交互。
在帮助Agent解决了“聪明”的能力后,亚马逊云科技也对其效率提升,集中下手。Swami 更是直言:“效率关乎成本、规模与敏捷性。”

事实上,尽管通用的基础模型虽然“智商高”,但在处理特定任务时,往往伴随着高昂的成本和延迟。由此,企业特定使用场景中,“小而美”的高质量定制模型已渐成主流。这也是AI开发模式一种必然的“祛魅”过程。以往,行业迷信“参数至上”,不过,Swami的观点则强调专用性一定程度、一定场景下,无疑将会优于通用性。类似一家企业不需要一个样样稀松的通才,相反,去打造成百上千个精通业务细节的专才,或许才能真正释放生产力。基于此,亚马逊云科技也打出了一套组合拳。比如,RFT可让定制模型的准确率相比基础模型提升 66%。再加上Amazon Nova Forge开创了“开放式训练”的先河,允许企业在训练各阶段注入专有数据,让模型不仅懂通用知识,更懂企业的“行话”。
以上这一切,也让定制化实现效率大幅提升成为一种未来的趋势。并且,在让Agent变得更聪明、更具效率的同时,如何确保成百上千个Agent 被部署在生产链条的风险把控,也成为了一大重点。
对此,Swami则进一步将失序把控的解决方案细化给出。除了先前介绍的Amazon Bedrock AgentCore,为了进一步提升可靠性,亚马逊云科技还推出Amazon Nova Act。这是一套用于构建可靠 UI 工作流程的全新服务,由定制版的 Amazon Nova 2 Lite 模型驱动。它结合了自动推理(Automated Reasoning)的数学逻辑验证,在早期测试中实现了高达 90%的可靠性。
甚至,在现场演示的“反电诈”场景中,Agent 不仅能检查信用卡交易、合理提出怀疑,甚至能收集证据并协助报警。这种基于逻辑验证的严谨性,让“人机信任”不再是一句空话。
四、一条实实在在的道路大会最后一天,亚马逊云科技发布了自身迄今为止性能最强、能效最高的Amazon Graviton5处理器。与上一代相比,基于Graviton5的全新EC2 M9g实例性能提升高达25%,实现了单封装 192 核心的突破,并将 L3 缓存提升了 5 倍。一个直观的使用案例是,Apple在迁移核心服务后,实现了成本降低 30%、性能提升 40%的不错效益。值得注意的是,目前亚马逊云科技新增CPU容量中连续第三年有超半数由Graviton驱动,EC2头部1000家客户中已有98%受益于其显著的性价比优势,包括Adobe、Airbnb、Atlassian、Epic Games、Formula 1等。
不仅如此,在亚马逊云科技re:Invent 2025 最终日,公司从Amazon Graviton5 和Amazon Trainium3 UltraServers的极致能效展示,到Amazon S3 Vectors和Amazon Lambda Managed Instances重新定义了数据和无服务器的边界,并最终通过Project Mantle的系统级创新,再次完整地收束了过去数天公司想要强调的AI时代核心理念。
事实上,亚马逊云科技2025 re:Invent 大会临近尾声时,公司则用大量基础设施产品的密集发布,重申了一个公司发展的核心命题:即AI不会颠覆基础设施,反而会让基础设施的安全性、成本和敏捷性等变得更加显著。从这点上说,再次回顾亚马逊云科技2025年re:Invent大会,真正留下的或许不是一串令人眼花缭乱的产品清单,而是一张清晰、实用、贴切的企业发展蓝图。
从Nitro到Graviton再到Trainium的完整自研芯片堆栈,以及Apple、Anthropic等重量级客户背书,亚马逊云科技的企业竞争力壁垒中,一直有特殊且务实的底座:即当其他云厂商仍在试图证明自身“能做 AI”时,亚马逊云科技则已经将视野聚焦到了用“安全性、可用性、成本可控”等,能直达商业核心的解决办法,再次证明了自己在AI规模化、可持续发展、盈利实现等方面,于行业内扮演了一个重要且不可或缺的角色。

值得注意的是,大会最后一天,亚马逊CTO Dr. Werner Vogels也完成了他在re:Invent的最后一场主题演讲,并谈到:AI不会取代开发者,但停止进化的开发者则会被时代淘汰。 从这点上说,亚马逊云科技在AI 的聚光灯下,或许选择了一条最不性感、最不显眼的道路。从过去到未来,亚马逊云科技始终在做的事情,核心仍在于为AI时代去“修筑铁路、铺设电网”,这样看似“重资产、硬科技”的路径,表面显得笨重,内在则是在规模效应作用上去打造自身难以撼动的竞争壁垒。



银杏科技官方账号




