OpenAI甩出"王炸":一个APP干翻整个办公室,ASIC开始逆袭GPU?

电子发烧友网报道(文/李弯弯)北京时间7月18日凌晨,OpenAI通过一场精彩绝伦的技术直播盛宴,向全球用户正式揭开了具有划时代意义的AI智能体——ChatGPT Agent的神秘面纱。这款智能体巧妙融合了Operator的网页交互精髓、“深入研究”(Deep Research)的信息整合优势以及ChatGPT的深度对话能力,构建起了一个全面且强大的智能体系统,为人工智能领域注入了新的活力。

ChatGPT Agent:功能卓越的AI智能体

ChatGPT Agent的核心优势在于其强大的多任务处理能力。它如同一个智能中枢,将Operator智能体的网页交互能力、“深入研究”功能的互联网信息搜集能力以及ChatGPT的对话能力有机整合,形成了一个统一且高效的智能体系统。这意味着它不再局限于简单的问答交互,而是能够凭借互联网搜索或API获取数据,深入开展财务研究、精心制作幻灯片、轻松预定活动或规划行程等复杂任务,真正实现了从单一功能向多元智能的跨越。

在内部基准测试中,ChatGPT Agent展现出了令人惊叹的实力,具备处理入门级投资银行分析师任务的能力。例如,它能够为财富500强公司构建符合准则的财务报表模型,或者为私有化交易构建精准的杠杆收购模型。这些任务在过去往往需要专业人员耗费大量的时间和精力才能完成,而ChatGPT Agent却能在短时间内高效达成,极大地提升了工作效率,为金融等领域的工作模式带来了新的变革。

OpenAI在演示中呈现了多个生动案例,充分彰显了ChatGPT Agent的实用性和强大功能。在一个案例中,根据结婚请柬上的日期、地点和着装要求,ChatGPT Agent能够迅速搜索出合适的男装和鞋子,并贴心地推荐礼物。在另一个案例中,面对美国职业棒球大联盟赛程,ChatGPT Agent能够精心规划一条在2025赛季常规赛期间走遍全美30座大联盟棒球队的观赛路线,同时推荐合适的酒店住宿,最后以电子表格的形式呈现,并生成一张直观的可视化路线图,为用户提供了全方位的旅行规划服务。

这些案例不仅生动展示了ChatGPT Agent在日常生活中的广泛应用,更体现了其在专业领域的强大能力。用户只需通过自然语言向ChatGPT Agent发出提示,就能轻松获得所需的结果,无需手动进行复杂的操作和搜索,真正实现了人机交互的便捷与高效。

ChatGPT Agent卓越的功能离不开其先进的技术架构。它通过虚拟计算机处理任务,能够流畅地在推理与执行之间切换。在面对复杂任务时,它不仅能够进行缜密的逻辑推理,还能够实际执行任务,从而独立完成复杂的多步骤任务,展现出强大的自主解决问题的能力。

此外,ChatGPT Agent还配备了一系列强大的网络工具,包括可视化浏览器、文本浏览器和直接API访问权限。这些工具如同它的得力助手,使其能够更高效地获取和处理信息,进一步提升任务处理能力。同时,ChatGPT Agent的多工具集成能力也是其一大亮点,它将Operator的网站交互能力、Deep Research的信息整合能力以及ChatGPT的深度对话能力完美融合,形成了一个强大智能体系统。

AI Agent带来算力和芯片需求变革

AI Agent是人工智能领域的核心概念,是指能够感知环境、自主决策并执行动作的实体。其本质特征包括自主性、环境感知、决策能力和执行能力。与传统AI工具不同,AI Agent具备闭环任务处理能力,可独立完成从感知到执行的完整链条。例如,报销Agent能够自动识别发票、精准匹配规则、生成单据并提交审批,而不仅仅是提供数据辅助决策,真正实现了工作的自动化和智能化。

面对AI Agent的巨大潜力,微软、谷歌、百度、阿里等科技巨头纷纷布局。它们通过研发自己的AI Agent产品,试图在这一充满机遇的领域占据领先地位。这些公司的积极布局不仅推动了AI Agent技术的快速发展,也加剧了市场竞争的激烈程度,促使整个行业不断创新和进步。

随着AI Agent的广泛应用,其带来的算力需求也呈现出爆发式增长。随着AI Agent的广泛应用,其带来的算力需求呈现出爆发式增长。预计到2025年,全球AI Agent日活用户将达到3.25亿,到2028年这一数字将增至8亿。用户日均使用次数和单次请求次数的增加,以及任务拆解复杂度的提升,都直接推高了算力消耗。

AI Agent需要处理的上下文长度不断增加,多步骤规划与工具调用变得更加复杂,验证与合规性开销也相应增加。这些因素都导致了算力需求的激增。同时,文本、图像、音频、视频等多模态数据的同步处理需求,使得token数与算力消耗大幅增加。例如,一张512×512像素的图片对应约334个tokens,而Kimi Vision模型单张图片按1024 tokens计费,多模态数据的处理对算力提出了前所未有的更高要求。

大语言模型(LLM)性能的提升依赖于更大参数量,长上下文处理也需要加载更长的上下文历史,这些都进一步推高了内存与计算负载。

AI Agent的发展对芯片需求产生了深远影响。据巴克莱预测,到2026年,推理计算需求将占通用人工智能(GenAI)总计算需求的70%以上,是训练需求的4.5倍。这一趋势源于AI Agent的多层推理特性,每个步骤均需消耗大量算力。

不同应用场景对芯片性能提出了差异化需求。例如,云端推理需要高吞吐量、低延迟的GPU支持大规模并发请求,如同高速公路需要宽敞的车道和快速的通行能力;边缘端部署则要求芯片具备低功耗、实时响应能力,如同在偏远地区需要节能且灵敏的设备;终端设备需平衡性能与能效,支持本地化AI推理,如同智能手机需要在有限的电量下实现多种智能功能。

大型科技公司正通过定制化ASIC芯片降低对英伟达GPU的依赖。巴克莱预测,英伟达在推理市场的份额将从2024年的80%降至2028年的50%,这一变化反映了ASIC芯片在特定场景中的成本与性能优势。

国内AI算力获取成本高、部分GPU芯片受限,这促使国产芯片企业聚焦细分场景。例如,在端侧AI芯片领域,国内企业在语音识别、图像处理等垂直领域具备差异化优势。

写在最后

OpenAI发布的ChatGPT Agent无疑标志着AI智能体时代的正式开启。其强大的多任务处理能力、广泛的应用场景以及卓越的技术架构,为用户带来了前所未有的便捷与效率。同时,AI Agent的广泛应用也引发了算力需求的爆发式增长和芯片需求的深刻变革。

未来,随着技术的不断进步和应用场景的持续拓展,AI Agent将在更多领域发挥重要作用。它可能会深入医疗、教育、交通等各个行业,为人们的生活带来更多的便利和创新。同时,算力需求和芯片需求的变革也将持续推动AI产业的快速发展。在这一过程中,如何高效利用算力资源、提升芯片性能、满足差异化需求将成为关键。只有不断攻克这些难题,才能让人工智能真正造福人类,开启一个更加智能、美好的未来。

500

声明:本文由电子发烧友原创

站务

全部专栏