阿里大模型突然震惊全世界

电商派

4小时前

阿里千问3登顶全球最强开源模型

阿里大模型又甩出一张王炸。

4月29日凌晨，阿里新一代通义千问模型Qwen3（简称千问3）开源，一发布就直接登顶全球最强开源模型。随即相关话题引发全网关注。

图源：微博

这款让全世界震撼的模型，有何特别之处？据了解，Qwen3是国内首个“混合推理模型”，它将“快思考”和“慢思考”集成进同一个模型，能快速低算力处理简单问题，也能通过多步骤深度推理解决复杂问题，有效降低算力消耗。

目前，Qwen3系列模型一共开源了8款“混合推理模型”，包括两款MoE（混合专家）模型Qwen3-235B-A22B和Qwen3-30B-A3B，以及六个Dense（稠密）模型32B、14B、8B、4B、1.7B和0.6B。

图源：阿里云

那么，Qwen3又强在哪里？首要原因是算力成本大幅降低，直接碾压全球各个顶尖大模型。

比如旗舰模型Qwen3-235B-A22B参数量仅为DeepSeek-R1的1/3，总参数量235B，激活仅需22B。

据市场多方消息，仅需4张H20即可部署Qwen3满血版，而且Qwen3旗舰模型的部署成本是满血版R1的25%～35%，部署成本大降75%～65%，显存占用仅为性能相近模型的三分之一。

其次，Qwen3大模型的性能也比同类大模型更强，在多个基准测试中表现出色，甚至超过了DeepSeek-R1和OpenAI o1等顶级模型。

在Qwen3系列模型中，旗舰版本Qwen3-235B-A22B是性能最强的。据阿里云披露的Qwen3基准测试结果，这款开源模型在代码、数学、通用能力等基准测试中，与一众顶级模型相比极具竞争优势，与DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro等模型不相上下，甚至有赶超的趋势。

Qwen3基准测试结果图源：阿里云

具体来看，比如，在奥数水平的AIME25测评中，千问3取得了81.5分，刷新开源纪录；在考察代码能力的LiveCodeBench评测中，千问3得分超过70分，表现优于Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3以95.6分超越了OpenAI-o1及DeepSeek-R1。

另外，在评估模型Agent能力的BFCL评测中，Qwen3取得了70.8分的成绩，刷新了该评测的记录，并超越了Gemini2.5-Pro、OpenAI-o1等顶尖模型。

值得一提的是，Qwen3模型还支持全球119种语言和方言，意味着Qwen 3试图开辟更多的国际市场。

不得不说，Qwen3模型的各项表现极为亮眼。当然，如果拿阿里自身来比较，Qwen3模型取得的成绩就理所当然和不足为奇。

因为阿里大模型都很能拿得出手，去年6月底，通义千问第二代开源模型Qwen2-72B亮相即登顶。

当时全球著名开源平台Hugging Face（笑脸）的联合创始人兼首席执行官在社交平台透露，通义千问第二代开源模型Qwen2-72B拿下全球开源第一，力压Meta、Mistralai等海外科技巨头。

图源：微博

紧接着今年3月3日，阿里的另一款大模型“万相2.1(Wan2.1)”也取得了优异成绩。

当时开源社区Hugging Face最新榜单显示，阿里大模型“万相2.1(Wan2.1)”登顶模型热榜和模型空间榜，成为近期全球开源社区最受欢迎的大模型。

图源：通义万相Wan公众号

如今，阿里大模型登顶全球最强开源模型，对阿里来说，又是一次重大的技术突破和战略布局。

阿里巴巴要全面AI化

阿里大模型能取得如此突破，与阿里在资源上的大力投入密不可分。

在战略层面，阿里巴巴对AI业务的重视提高到了前所未有的高度。在上个月的财报电话会议上，阿里巴巴集团CEO吴泳铭明确指出，阿里巴巴将持续聚焦国内外电商业务、AI+云计算的科技业务、互联网平台产品这三大业务类型。

而对于大模型，吴泳铭强调，未来三年，阿里将围绕AI这个战略核心，在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入。

显而易见，阿里巴巴正加速从传统电商公司向AI技术驱动的科技公司转型，这是随着AI战略深入推进的必然结果，也是两年前吴泳铭提出的“用户为先、AI驱动”战略的延续。

要知道过去两年，阿里深受电商低价竞争和市场格局变化的困扰，亟需借助AI的力量来打开新的局面。

去年4月正值阿里变革一周年，马云在内部会议上激情澎湃地表示：“AI时代刚刚到来，一切才刚开始，我们正当其时！”

同年12月，在蚂蚁集团20周年庆典上，马云再次现身并分享了他对未来20年AI时代的深刻见解，他强调了AI技术将如何重塑各行各业，并鼓励蚂蚁集团抓住这一历史机遇。

今年4月，马云发表最新演讲，再次大谈AI。

显然，马云对AI战略的重视程度非同一般，将其视为阿里巴巴未来发展的核心驱动力。

为支撑这一战略，阿里巴巴在资源投入上展现出惊人魄力。

去年，阿里接连出售银泰百货、大润发、高鑫零售等非核心资产，同时阿里还频繁减持快狗打车、B站、陌陌、网易云音乐等长期亏损的非核心业务。

这些动作背后与其聚焦电商、云计算等核心主业的战略目标息息相关。

除了减轻非核心业务的负担，阿里还加大与云计算有关的AI投入。

比如加大AI人才招聘力度。在3月25日的汇丰全球投资峰会上，阿里巴巴主席蔡崇信表示，经历了几轮裁员之后，阿里的员工数量已经触底了。接下来，阿里将重新开启招聘。

紧接着4月，阿里国际随即传出，首次启动一项面向全球的头部AI科技人才培养计划“Bravo 102”，打破传统的校招体系，面试通过后可反选项目和团队。另据阿里国际招聘官网，2026届校招中80%为AI岗位，包括AI算法、研发、AI产品经理等。

图源：阿里国际招聘

今年2月，阿里还挖来全球顶尖AI科学家、前Salesforce副总裁许主洪（Steven Hoi），为AI业务助力。

在资金投入方面，阿里也毫不含糊。吴泳铭直接放话，未来三年，阿里将投入超过3800亿元用于建设云和AI硬件基础设施，总额超过过去十年总和。

这一连串的动作，正在把阿里AI业务推向高潮。

互联网大厂掀起新一轮AI大战

AI热潮已经持续了两年，今年年初DeepSeek的横空出世再次引爆了整个AI圈，新一轮的竞赛已然拉开帷幕。无论国内还是国外，各大模型公司都在加速布局，竞相角逐。

当我们聚焦于阿里、抖音、腾讯、百度等国内互联网大厂，他们都以各自的方式铺开业务。

阿里利用开源大模型打开市场，自2023年8月开始，阿里云便开始大规模开源其大模型系列，成为我国首家大规模开源的大厂，并屡获佳绩。

同时，阿里AI业务有了新变化，从过去的侧重面向B端，转而向C端用户倾斜。上个月夸克上线全新功能“AI超级框”，以及通义APP的持续升级改版，都是针对C端用户侧的调整。

AI大模型技术正在快速成熟，应用场景从B端向个人用户扩展，C端用户对AI产品的需求日益多样化，由此，C端市场已成为阿里争夺的新战场。

抖音方面，则选择采取了“广撒网”式的战略打法，先构建起庞大的AI产品矩阵，并采用 “赛马机制”，鼓励内部团队围绕同类产品进行差异化开发。

通过多版本并行测试、数据实时反馈，筛选出最具潜力的产品方向，并快速迭代升级。

自2023 年起，抖音在国内市场加速AI产品的落地节奏。据不完全统计，短短两年间，其在移动端推出近10款AI应用，形成了覆盖聊天、社交、办公、教育、图像、视频、音乐全场景的产品生态。

目前来看，各大互联网公司都力图构建自身的AI护城河，抢占先机，重塑行业竞争格局。

作者 |木易

科技社会举报

电商派

727篇文章 | 28人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

阿里大模型突然震惊全世界

电商派

电商派

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

书香跨界，探索多元——世界读书日特别活动推荐书单公布啦~

最近更新的专栏

风闻最热

全部专栏