IT岗位天塌了！Claude 4震撼发布：AI编程大模型再进化

歪睿老哥
芯片研发工程师

聚焦芯片行业的那些事，唯武侠与芯片不可辜负05-26 07:51

电子发烧友网报道（文 / 吴子鹏）5 月 23 日凌晨，著名大模型平台 Anthropic 召开首届开发者大会，重磅发布最新大模型 ——Claude 4。Claude 4 包含两个版本，即 Claude Opus 4 和 Claude Sonnet 4。这两个模型旨在更好地遵循指令，在编写代码、解答复杂问题等任务中，能够更自主地运行。其中，Opus 4 堪称全球顶级编程模型，尤其擅长处理复杂且长时间的推理任务，在 Agent 领域表现卓越。

据日本 Rakuten 测试数据显示，基于 Opus 4 打造的编程智能体，可独立稳定连续工作 7 小时，一举超越此前 OpenAI 创造的记录。Sonnet 4 作为 Sonnet 3.7 的迭代版本，在编程领域同样实力强劲，在 SWE-bench 测试中得分达到 72.7%，超过了 OpenAI 最新发布的 Codex-1、o3 等前沿模型。

尽管 Anthropic 声称，AI 模型 Claude 4 是用于实现日常工作自动化的工具，并非旨在取代工作岗位。然而，这些模型展现出的强大能力，确实可能给 IT 人员群体带来结构性影响，从事重复性编程任务的 IT 人员或将逐步面临淘汰。

编程大模型能力持续进阶

SphericalInsights 的预测数据显示，到 2032 年，全球 AI 编码工具市场规模将突破 295 亿美元。当前，全球 AI 编程大模型的技术水平不断提升。国际上，OpenAI GPT-4o-latest、Anthropic 此前发布的 Claude 3.5 Sonnet、Google Gemini Flash 2.0 和 Meta Llama 3.3 等大模型颇具实力；国内方面，字节跳动的 MarsCode 和 Trae、科大讯飞的 iFlyCode 等大模型也不容小觑。

在 Claude 4 发布前，OpenAI GPT-4o-latest 是全球影响力较大的编程大模型。在 SWE-bench 测试中，它取得了 72.5% 的得分，擅长复杂算法设计与数学建模，支持 Python、C++ 等多种语言的代码生成，能够处理数百万行级的代码库。根据 2025 年 1 月发布的 SuperCLUE 大模型排行榜，OpenAI 的 o1 模型以总分 80.4 领跑，在高难度任务（Hard 评分 76.7）和理科能力（87.3 分）方面表现出色，但在代码补全的个性化适配性上存在一定不足。此外，OpenAI 的 o3 模型是在 o1 和 o1-ioi 基础上的进一步升级，它摆脱了对人工设计测试时策略的依赖，通过强化学习自主开发并执行复杂的推理策略，在 CodeForces 和 IOI 2024 中的表现，充分证明了其在解决复杂编程任务上的卓越能力。

国内较具代表性的是字节跳动的 MarsCode 和 Trae。MarsCode 于 2024 年 6 月发布，是基于豆包大模型打造的智能开发工具，涵盖编程助手和 Cloud IDE 两种主要形态，具备项目问答、代码补全、单测生成、Bug Fix 等功能。据悉，MarsCode 支持超过 100 种编程语言，可与 VSCode 和 JetBrains 代码编辑器兼容。2025 年 1 月，字节跳动在 MarsCode 基础上新增 AI 编程功能，并推出海外版 Trae。Trae 是一个独立的 AI 原生开发平台，提供从需求到代码的全链路智能开发环境。

此前，Claude 3.5 Sonnet 在行业内就颇具名气。该模型发布时分享的 HumanEval 测试显示，Claude 3.5 Sonnet 以 92.0% 的得分超越包括 GPT-4o 在内的众多竞争对手。而 Claude 4 的问世，进一步巩固了 Anthropic 在 AI 编程领域的技术领先地位。Anthropic 首席科学官 Jared Kaplan 表示，公司自去年年底起，决定不再继续投入资源开发聊天机器人，转而专注提升 Claude 执行复杂任务的能力，如开展研究、进行编程，甚至编写整个代码库。

Anthropic 将 Claude Opus 4 誉为 “公司迄今最强大的模型，也是全球最佳编程模型”。Opus 4 和 Sonnet 4 均采用混合模式设计，既能实现几乎即时回应，也可进行深入的推理思考，即扩张思维。除了在 SWE-bench Verified 测试中的优异评分，以及 Rakuten 测试中连续稳定运行 7 小时的出色表现，Opus 4 还在记忆与工具使用方面带来革新：当获取本地文件访问权限时，它可创建并维护内存文件以存储关键信息；“即时响应” 和 “扩展思考” 双模式，使其在处理复杂任务时，能够暂停推理调用工具，并行处理多个工具请求，模拟人类边思考边验证的认知过程。此外，Opus 4 深度嵌入开发者工具链，可通过 GitHub Actions 执行后台任务，并与 VS Code、JetBrains IDE 实现原生集成。

与目前行业顶尖的 AI 编程模型工具相比，Claude Opus 4 优势显著。例如，在 SWE-bench 和 Terminal-bench 测试中，Opus 4 的得分领先顶尖对手超 17%，在处理数百万行级代码库时，其上下文窗口和连续编程能力更是远超竞品；与谷歌公司目前最强的 Gemini 2.5 Pro 相比，尽管后者在多模态理解方面占优，但在复杂代码重构场景中，仍不及 Opus 4。

由此可见，Claude Opus 4 的发布，标志着 AI 编程助手从辅助工具向核心开发者的重大转变。其 7 小时连续编程能力、动态记忆管理和混合推理模式，不仅重新定义了软件开发的效率边界，更促使开发者从单纯的代码生产者，向 AI 协作架构师转型。

让 AI 成为助力而非威胁

据裁员追踪机构 Layoffs.fyi 的数据，截至 2024 年 12 月 2 日，全球科技公司在这一年至少裁员 14.9 万人。这一数字明显高于 2022 年和 2023 年同期，凸显出科技行业在 AI 浪潮下所面临的巨大变革压力。尽管各大推出 AI 大模型的公司一再强调，AI 并非要取代人类员工，但 AI 带来的降本增效，确实是许多公司裁员的因素之一。

Claude Opus 4 等 AI 大模型无疑将加速 IT 行业的变革进程，推动软件开发和软件定制走向民主化。Anthropic 首席执行官 Dario Amodei 大胆预测，到 2026 年，首家由一名人类员工与 AI 合作运营、估值达十亿美元的企业将诞生。

综合 Claude Opus 4 等 AI 大模型所具备的能力来看，一个明确的趋势是：基础的 CRUD 开发需求大幅减少。这一趋势已有数据佐证，美国劳工统计局数据显示，2025 - 2030 年，“初级软件工程师” 岗位需求将下降 15%；同时，美国 2 月 IT 失业率上升近 0.5 个百分点，达到 3.3%，创下 2024 年 8 月以来的新高。

那么，IT 人员该如何顺应这股 AI 浪潮，避免被 AI 技术取代呢？行业内已形成普遍共识，IT 人员可通过以下路径实现职业进阶：首先，从 “代码生产者” 转型为 “AI 引导者”。如今，传统的写代码能力已不再是核心竞争力，掌握 AI 模型微调、提示工程的 IT 岗位薪资水平正逐步上涨，调查数据显示，国内相关岗位薪资已上浮 28%。

对于初入职场的 IT 人员，还可选择成为 AI 大模型开发者。该岗位基本要求掌握 Python、PyTorch/TensorFlow 框架，熟悉 NLP、CV 等技术，具备模型微调与二次训练能力，了解 LangChain、LoRA 等大模型开发工具。此外，IT 人员也可朝着 AI 大模型应用方向发展，大模型与具体场景的融合已成趋势，如电商虚拟试衣、物流智能问答系统等相关岗位，薪资上浮幅度在 10% - 20%。

除了上述基础型发展方向，IT 人员还可向全栈工程师、AI 架构师等复合型高阶岗位进阶。目前，这类岗位需求增长 58%，薪资溢价达 50%。

写在最后

Claude Opus 4 的发布，标志着 IT 行业正从人力密集型向 AI 增强型转型。尽管这一变革会带来冲击，但也蕴含着巨大机遇：AI 取代的是重复性劳动，而人类的价值将向创造性、战略性工作转移。IT 人员需以 “技术深度 + AI 协作 + 行业洞察” 构建核心竞争力，通过技能升级、职业转型和终身学习，实现从 “代码生产者” 到 “AI 时代架构师” 的跨越。

500

声明：本文由电子发烧友原创

科技举报

歪睿老哥

聚焦芯片行业的那些事，唯武侠与芯片不可辜负 |

211篇文章 | 219人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

IT岗位天塌了！Claude 4震撼发布：AI编程大模型再进化

歪睿老哥
芯片研发工程师

歪睿老哥

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

风闻“投资者保护”：守护你的财富，共筑理性投资路

最近更新的专栏

风闻最热

全部专栏

热门搜索

搜索历史

IT岗位天塌了！Claude 4震撼发布：AI编程大模型再进化

歪睿老哥 芯片研发工程师

热点

站务

最近更新的专栏

风闻最热

全部专栏

歪睿老哥
芯片研发工程师