阿里放大招:自研AI芯片100%国产,不用台积电代工
电子发烧友网报道(文 / 吴子鹏)8 月 31 日晚间,有消息称阿里云通义千问大模型面临算力缺口,阿里紧急追加寒武纪思元 370 芯片订单至 15 万片。然而,该消息随后不久便被阿里云相关人士辟谣。9 月 1 日凌晨,该人士表示:“阿里云确实通过‘一云多芯’模式支持国产供应链,但传言中阿里采购寒武纪 15 万片 GPU 的消息不实。”
实际上,就在 “阿里紧急追加寒武纪思元 370 芯片订单” 这一消息传出的同时,甚至更早之前,已有行业人士爆料:阿里巴巴正在自研一款 AI 芯片,以填补英伟达 H20 采购受限后留下的算力空白。同时,爆料人士透露,这款 AI 芯片将采用全国产供应链,不再选用台积电的代工方案,业界将其定义为阿里巴巴的 “B 计划”。
豪掷 3800 亿构建国产算力底座
据《华尔街日报》、36 氪等媒体报道,在 “B 计划” 中,阿里制定了一项宏大规划 —— 未来三年,将持续投入超 3800 亿元用于云计算与 AI 硬件基础设施建设,进一步夯实国内算力底座。
在产品设计层面,阿里自研 AI 芯片采用全新自主研发路径,针对通义千问大模型及 AI 推理任务进行架构优化,能效比与计算效率实现显著提升。需要明确的是,这款芯片并非训练芯片,而是专注于人工智能推理任务。通常而言,AI 训练的核心是让模型从海量数据中学习规律、迭代优化参数,最终生成可用模型;AI 推理则是让训练完成的固定参数模型 “学以致用”,通过处理新数据输出结果。两者目标的差异,直接决定了芯片在计算能力、精度、存储性能、能效、延迟等维度的需求截然不同。
在应用拓展方面,阿里自研 AI 芯片将全面兼容英伟达 CUDA 生态。根据半导体分析公司 TechInsights 的最新报告,2023 年英伟达在数据中心 GPU 市场的出货量高达 376 万块,市场份额占比达 98%。尽管近两年受禁令等因素影响,这一比例有所下滑,但英伟达 GPU 在国内市场的占比仍超 50%,核心原因便是 CUDA 的生态壁垒。CUDA 并非单纯的软件框架,而是与英伟达 GPU 架构(如 SM 流多处理器、Tensor Core)深度绑定的共生体系。这种紧密关联使得其他厂商即便复制硬件架构,也难以复刻 CUDA 的算子级优化能力。因此,兼容 CUDA 堪称国产 AI 芯片实现突破的关键前提之一。对阿里自研 AI 芯片而言,通过兼容 CUDA 生态,开发者无需大规模修改代码即可完成技术迁移,大幅降低了迁移成本。这一策略既解决了国产化替代的 “最后一公里” 难题,又保留了与国际主流生态的衔接能力,显著提升了技术落地的可行性。
在产品供应环节,阿里自研 AI 芯片采用全国产供应链,由国内代工厂完成生产,彻底摆脱了对台积电的依赖。此前,国产 AI 芯片多依赖台积电代工,而台积电作为全球先进制程的主导者,其产能与供应受美国政策影响较大。转向国内代产后,阿里 AI 芯片实现了从设计到生产的 “端到端” 国产化,供应链中断风险显著降低。
据悉,目前该芯片正在阿里内部进行紧密的测试。阿里之所以能实现这一突破,离不开其在 芯片自研领域的多年深耕。阿里旗下的平头哥半导体有限公司(简称 “平头哥”)拥有定制芯片研发传统,先后推出含光 800、倚天 710、平头哥 RISC-V 芯片等产品。其中,含光 800 是 2019 年发布的 AI 推理芯片,采用 “自研架构 + 算法协同设计” 模式,在 ResNet-50 测试中性能卓越,峰值处理能力达每秒 78563 张图片,较当时业界最优水平快 4 倍;倚天 710 是 2021 年发布的基于 ARM 架构的自研云芯片,采用 5nm 工艺,集成 600 亿晶体管,拥有 128 个 Armv9 内核,主频最高 3.2GHz,性能对标业界标杆产品,目前已大规模应用于阿里云服务。
H20 留下一个大蛋糕
如前文所述,英伟达 AI 芯片采购受限后,中国 AI 算力市场出现巨大空白。2024 年,英伟达 GPU 在中国 AI 芯片市场的份额约为 66%;尽管 2025 年该份额降至 54%,但受限后国内仍面临显著的算力缺口。在监管部门释放相关信号后,国内各大企业纷纷调整采购计划,腾讯、百度、字节跳动等互联网巨头暂停或取消 H20 订单,转而寻求国产替代方案。
从今年世界人工智能大会(WAIC)的展示来看,国内瞄准英伟达 H20 替代市场的芯片产品不在少数,华为、寒武纪、摩尔线程、沐曦集成电路等企业均有相关产品布局。以寒武纪为例,前文提及的寒武纪思元 370 芯片,其应用载体为寒武纪 AIDC MLU370 S4/S8 加速卡。该加速卡采用台积电(TSMC)7nm 制程,搭载寒武纪新一代人工智能芯片架构 MLUarch03,支持 PCIe Gen4,板卡功耗仅 75W;相较于同尺寸 GPU,其解码能力提升 3 倍,编码能力提升 1.5 倍。此外,MLU370-S4/S8 加速卡能效出色、体积小巧,可在服务器中实现高密度部署。同时,业界关于寒武纪思元 590 芯片的传闻颇多。但是针对这一传闻,寒武纪在最新的公司公告里予以明确否认。公告称“公司未有新产品发布计划”,网络上的相关信息均为“误导市场的不实信息”,呼吁投资者理性决策。
沐曦集成电路于 2025 年 7 月发布的曦云 C600 系列芯片,同样被视为英伟达 H20 的潜在替代产品。该芯片基于沐曦自主知识产权的核心 GPU IP 架构,集成大容量存储与多精度混合算力,支持 MetaXLink 超节点扩展技术,并内置 ECC/RAS 多重安全防护模块,可为金融、政务等关键领域提供高可靠算力支撑,满足下一代生成式 AI 的训练与推理需求。尽管官方未披露该芯片的具体算力与能效参数,但曦云 C600 采用 HBM3e 显存,数据存储容量从上一代 C500 的 64GB 提升至 144GB,结合发布会信息可知,该芯片性能可对标国际旗舰 GPU 产品。
可能也有人会想起此前热议的英伟达的B30,该款产品基于Blackwell架构,定价区间在6500至8000美元,相比H20的1万至1.2万美元价格区间有显著优势。因此,尽管B30的性能约为H20的75%,但市场需求依然强劲。不过,该芯片目前获批的前景并不明朗,无论在美方还是中方皆是如此。
若阿里自研 AI 芯片最终如爆料所述正式发布并全面部署,全球及国内 AI 芯片格局或将发生变化。从全球视角看,阿里 AI 芯片的崛起将推动全球 AI 算力供应链向多元化方向发展,削弱美国在高端芯片领域的垄断地位;聚焦国内市场,阿里 AI 芯片的成熟可能带动更多互联网巨头入局 AI 芯片赛道,形成 “头部企业自研 + 中小厂商合作” 的产业格局。更重要的是,该芯片的国产制造模式及其技术突破,被视为国产芯片自主化进程中的重要节点事件,将为国产 AI 芯片的发展注入动力,加速国产化替代进程。
结语
从阿里云辟谣 “采购寒武纪 15 万片芯片” 传闻,到其 “B 计划” 清晰落地 —— 自研聚焦 AI 推理任务、采用全国产供应链的芯片,未来三年豪掷 3800 亿筑牢国产算力底座,这一系列动作既是阿里应对英伟达 H20 采购受限、填补算力缺口的务实举措,更折射出国内科技企业在 AI 算力自主化赛道上的战略觉醒。
阿里自研芯片的设计极具针对性:针对通义千问大模型优化架构以提升能效比,兼容 CUDA 生态以降低开发者迁移成本,依托国内代工厂实现 “端到端” 国产化 —— 每一步都精准破解了国产芯片 “落地难、断供风险高” 的核心痛点。而平头哥此前在含光 800、倚天 710 芯片上积累的技术沉淀,更为这一布局奠定了扎实的落地基础。
声明:本文由电子发烧友原创