IT岗位天塌了!Claude 4震撼发布:AI编程大模型再进化
电子发烧友网报道(文 / 吴子鹏)5 月 23 日凌晨,著名大模型平台 Anthropic 召开首届开发者大会,重磅发布最新大模型 ——Claude 4。Claude 4 包含两个版本,即 Claude Opus 4 和 Claude Sonnet 4。这两个模型旨在更好地遵循指令,在编写代码、解答复杂问题等任务中,能够更自主地运行。其中,Opus 4 堪称全球顶级编程模型,尤其擅长处理复杂且长时间的推理任务,在 Agent 领域表现卓越。
据日本 Rakuten 测试数据显示,基于 Opus 4 打造的编程智能体,可独立稳定连续工作 7 小时,一举超越此前 OpenAI 创造的记录。Sonnet 4 作为 Sonnet 3.7 的迭代版本,在编程领域同样实力强劲,在 SWE-bench 测试中得分达到 72.7%,超过了 OpenAI 最新发布的 Codex-1、o3 等前沿模型。
尽管 Anthropic 声称,AI 模型 Claude 4 是用于实现日常工作自动化的工具,并非旨在取代工作岗位。然而,这些模型展现出的强大能力,确实可能给 IT 人员群体带来结构性影响,从事重复性编程任务的 IT 人员或将逐步面临淘汰。
编程大模型能力持续进阶
SphericalInsights 的预测数据显示,到 2032 年,全球 AI 编码工具市场规模将突破 295 亿美元。当前,全球 AI 编程大模型的技术水平不断提升。国际上,OpenAI GPT-4o-latest、Anthropic 此前发布的 Claude 3.5 Sonnet、Google Gemini Flash 2.0 和 Meta Llama 3.3 等大模型颇具实力;国内方面,字节跳动的 MarsCode 和 Trae、科大讯飞的 iFlyCode 等大模型也不容小觑。
在 Claude 4 发布前,OpenAI GPT-4o-latest 是全球影响力较大的编程大模型。在 SWE-bench 测试中,它取得了 72.5% 的得分,擅长复杂算法设计与数学建模,支持 Python、C++ 等多种语言的代码生成,能够处理数百万行级的代码库。根据 2025 年 1 月发布的 SuperCLUE 大模型排行榜,OpenAI 的 o1 模型以总分 80.4 领跑,在高难度任务(Hard 评分 76.7)和理科能力(87.3 分)方面表现出色,但在代码补全的个性化适配性上存在一定不足。此外,OpenAI 的 o3 模型是在 o1 和 o1-ioi 基础上的进一步升级,它摆脱了对人工设计测试时策略的依赖,通过强化学习自主开发并执行复杂的推理策略,在 CodeForces 和 IOI 2024 中的表现,充分证明了其在解决复杂编程任务上的卓越能力。
国内较具代表性的是字节跳动的 MarsCode 和 Trae。MarsCode 于 2024 年 6 月发布,是基于豆包大模型打造的智能开发工具,涵盖编程助手和 Cloud IDE 两种主要形态,具备项目问答、代码补全、单测生成、Bug Fix 等功能。据悉,MarsCode 支持超过 100 种编程语言,可与 VSCode 和 JetBrains 代码编辑器兼容。2025 年 1 月,字节跳动在 MarsCode 基础上新增 AI 编程功能,并推出海外版 Trae。Trae 是一个独立的 AI 原生开发平台,提供从需求到代码的全链路智能开发环境。
此前,Claude 3.5 Sonnet 在行业内就颇具名气。该模型发布时分享的 HumanEval 测试显示,Claude 3.5 Sonnet 以 92.0% 的得分超越包括 GPT-4o 在内的众多竞争对手。而 Claude 4 的问世,进一步巩固了 Anthropic 在 AI 编程领域的技术领先地位。Anthropic 首席科学官 Jared Kaplan 表示,公司自去年年底起,决定不再继续投入资源开发聊天机器人,转而专注提升 Claude 执行复杂任务的能力,如开展研究、进行编程,甚至编写整个代码库。
Anthropic 将 Claude Opus 4 誉为 “公司迄今最强大的模型,也是全球最佳编程模型”。Opus 4 和 Sonnet 4 均采用混合模式设计,既能实现几乎即时回应,也可进行深入的推理思考,即扩张思维。除了在 SWE-bench Verified 测试中的优异评分,以及 Rakuten 测试中连续稳定运行 7 小时的出色表现,Opus 4 还在记忆与工具使用方面带来革新:当获取本地文件访问权限时,它可创建并维护内存文件以存储关键信息;“即时响应” 和 “扩展思考” 双模式,使其在处理复杂任务时,能够暂停推理调用工具,并行处理多个工具请求,模拟人类边思考边验证的认知过程。此外,Opus 4 深度嵌入开发者工具链,可通过 GitHub Actions 执行后台任务,并与 VS Code、JetBrains IDE 实现原生集成。
与目前行业顶尖的 AI 编程模型工具相比,Claude Opus 4 优势显著。例如,在 SWE-bench 和 Terminal-bench 测试中,Opus 4 的得分领先顶尖对手超 17%,在处理数百万行级代码库时,其上下文窗口和连续编程能力更是远超竞品;与谷歌公司目前最强的 Gemini 2.5 Pro 相比,尽管后者在多模态理解方面占优,但在复杂代码重构场景中,仍不及 Opus 4。
由此可见,Claude Opus 4 的发布,标志着 AI 编程助手从辅助工具向核心开发者的重大转变。其 7 小时连续编程能力、动态记忆管理和混合推理模式,不仅重新定义了软件开发的效率边界,更促使开发者从单纯的代码生产者,向 AI 协作架构师转型。
让 AI 成为助力而非威胁
据裁员追踪机构 Layoffs.fyi 的数据,截至 2024 年 12 月 2 日,全球科技公司在这一年至少裁员 14.9 万人。这一数字明显高于 2022 年和 2023 年同期,凸显出科技行业在 AI 浪潮下所面临的巨大变革压力。尽管各大推出 AI 大模型的公司一再强调,AI 并非要取代人类员工,但 AI 带来的降本增效,确实是许多公司裁员的因素之一。
Claude Opus 4 等 AI 大模型无疑将加速 IT 行业的变革进程,推动软件开发和软件定制走向民主化。Anthropic 首席执行官 Dario Amodei 大胆预测,到 2026 年,首家由一名人类员工与 AI 合作运营、估值达十亿美元的企业将诞生。
综合 Claude Opus 4 等 AI 大模型所具备的能力来看,一个明确的趋势是:基础的 CRUD 开发需求大幅减少。这一趋势已有数据佐证,美国劳工统计局数据显示,2025 - 2030 年,“初级软件工程师” 岗位需求将下降 15%;同时,美国 2 月 IT 失业率上升近 0.5 个百分点,达到 3.3%,创下 2024 年 8 月以来的新高。
那么,IT 人员该如何顺应这股 AI 浪潮,避免被 AI 技术取代呢?行业内已形成普遍共识,IT 人员可通过以下路径实现职业进阶:首先,从 “代码生产者” 转型为 “AI 引导者”。如今,传统的写代码能力已不再是核心竞争力,掌握 AI 模型微调、提示工程的 IT 岗位薪资水平正逐步上涨,调查数据显示,国内相关岗位薪资已上浮 28%。
对于初入职场的 IT 人员,还可选择成为 AI 大模型开发者。该岗位基本要求掌握 Python、PyTorch/TensorFlow 框架,熟悉 NLP、CV 等技术,具备模型微调与二次训练能力,了解 LangChain、LoRA 等大模型开发工具。此外,IT 人员也可朝着 AI 大模型应用方向发展,大模型与具体场景的融合已成趋势,如电商虚拟试衣、物流智能问答系统等相关岗位,薪资上浮幅度在 10% - 20%。
除了上述基础型发展方向,IT 人员还可向全栈工程师、AI 架构师等复合型高阶岗位进阶。目前,这类岗位需求增长 58%,薪资溢价达 50%。
写在最后
Claude Opus 4 的发布,标志着 IT 行业正从人力密集型向 AI 增强型转型。尽管这一变革会带来冲击,但也蕴含着巨大机遇:AI 取代的是重复性劳动,而人类的价值将向创造性、战略性工作转移。IT 人员需以 “技术深度 + AI 协作 + 行业洞察” 构建核心竞争力,通过技能升级、职业转型和终身学习,实现从 “代码生产者” 到 “AI 时代架构师” 的跨越。
声明:本文由电子发烧友原创