阿里放大招：自研AI芯片100%国产，不用台积电代工

歪睿老哥
芯片研发工程师

聚焦芯片行业的那些事，唯武侠与芯片不可辜负4小时前

电子发烧友网报道（文 / 吴子鹏）8 月 31 日晚间，有消息称阿里云通义千问大模型面临算力缺口，阿里紧急追加寒武纪思元 370 芯片订单至 15 万片。然而，该消息随后不久便被阿里云相关人士辟谣。9 月 1 日凌晨，该人士表示：“阿里云确实通过‘一云多芯’模式支持国产供应链，但传言中阿里采购寒武纪 15 万片 GPU 的消息不实。”

实际上，就在 “阿里紧急追加寒武纪思元 370 芯片订单” 这一消息传出的同时，甚至更早之前，已有行业人士爆料：阿里巴巴正在自研一款 AI 芯片，以填补英伟达 H20 采购受限后留下的算力空白。同时，爆料人士透露，这款 AI 芯片将采用全国产供应链，不再选用台积电的代工方案，业界将其定义为阿里巴巴的 “B 计划”。

豪掷 3800 亿构建国产算力底座

据《华尔街日报》、36 氪等媒体报道，在 “B 计划” 中，阿里制定了一项宏大规划 —— 未来三年，将持续投入超 3800 亿元用于云计算与 AI 硬件基础设施建设，进一步夯实国内算力底座。

在产品设计层面，阿里自研 AI 芯片采用全新自主研发路径，针对通义千问大模型及 AI 推理任务进行架构优化，能效比与计算效率实现显著提升。需要明确的是，这款芯片并非训练芯片，而是专注于人工智能推理任务。通常而言，AI 训练的核心是让模型从海量数据中学习规律、迭代优化参数，最终生成可用模型；AI 推理则是让训练完成的固定参数模型 “学以致用”，通过处理新数据输出结果。两者目标的差异，直接决定了芯片在计算能力、精度、存储性能、能效、延迟等维度的需求截然不同。

在应用拓展方面，阿里自研 AI 芯片将全面兼容英伟达 CUDA 生态。根据半导体分析公司 TechInsights 的最新报告，2023 年英伟达在数据中心 GPU 市场的出货量高达 376 万块，市场份额占比达 98%。尽管近两年受禁令等因素影响，这一比例有所下滑，但英伟达 GPU 在国内市场的占比仍超 50%，核心原因便是 CUDA 的生态壁垒。CUDA 并非单纯的软件框架，而是与英伟达 GPU 架构（如 SM 流多处理器、Tensor Core）深度绑定的共生体系。这种紧密关联使得其他厂商即便复制硬件架构，也难以复刻 CUDA 的算子级优化能力。因此，兼容 CUDA 堪称国产 AI 芯片实现突破的关键前提之一。对阿里自研 AI 芯片而言，通过兼容 CUDA 生态，开发者无需大规模修改代码即可完成技术迁移，大幅降低了迁移成本。这一策略既解决了国产化替代的 “最后一公里” 难题，又保留了与国际主流生态的衔接能力，显著提升了技术落地的可行性。

在产品供应环节，阿里自研 AI 芯片采用全国产供应链，由国内代工厂完成生产，彻底摆脱了对台积电的依赖。此前，国产 AI 芯片多依赖台积电代工，而台积电作为全球先进制程的主导者，其产能与供应受美国政策影响较大。转向国内代产后，阿里 AI 芯片实现了从设计到生产的 “端到端” 国产化，供应链中断风险显著降低。

据悉，目前该芯片正在阿里内部进行紧密的测试。阿里之所以能实现这一突破，离不开其在芯片自研领域的多年深耕。阿里旗下的平头哥半导体有限公司（简称 “平头哥”）拥有定制芯片研发传统，先后推出含光 800、倚天 710、平头哥 RISC-V 芯片等产品。其中，含光 800 是 2019 年发布的 AI 推理芯片，采用 “自研架构 + 算法协同设计” 模式，在 ResNet-50 测试中性能卓越，峰值处理能力达每秒 78563 张图片，较当时业界最优水平快 4 倍；倚天 710 是 2021 年发布的基于 ARM 架构的自研云芯片，采用 5nm 工艺，集成 600 亿晶体管，拥有 128 个 Armv9 内核，主频最高 3.2GHz，性能对标业界标杆产品，目前已大规模应用于阿里云服务。

H20 留下一个大蛋糕

如前文所述，英伟达 AI 芯片采购受限后，中国 AI 算力市场出现巨大空白。2024 年，英伟达 GPU 在中国 AI 芯片市场的份额约为 66%；尽管 2025 年该份额降至 54%，但受限后国内仍面临显著的算力缺口。在监管部门释放相关信号后，国内各大企业纷纷调整采购计划，腾讯、百度、字节跳动等互联网巨头暂停或取消 H20 订单，转而寻求国产替代方案。

从今年世界人工智能大会（WAIC）的展示来看，国内瞄准英伟达 H20 替代市场的芯片产品不在少数，华为、寒武纪、摩尔线程、沐曦集成电路等企业均有相关产品布局。以寒武纪为例，前文提及的寒武纪思元 370 芯片，其应用载体为寒武纪 AIDC MLU370 S4/S8 加速卡。该加速卡采用台积电（TSMC）7nm 制程，搭载寒武纪新一代人工智能芯片架构 MLUarch03，支持 PCIe Gen4，板卡功耗仅 75W；相较于同尺寸 GPU，其解码能力提升 3 倍，编码能力提升 1.5 倍。此外，MLU370-S4/S8 加速卡能效出色、体积小巧，可在服务器中实现高密度部署。同时，业界关于寒武纪思元 590 芯片的传闻颇多。但是针对这一传闻，寒武纪在最新的公司公告里予以明确否认。公告称“公司未有新产品发布计划”，网络上的相关信息均为“误导市场的不实信息”，呼吁投资者理性决策。

沐曦集成电路于 2025 年 7 月发布的曦云 C600 系列芯片，同样被视为英伟达 H20 的潜在替代产品。该芯片基于沐曦自主知识产权的核心 GPU IP 架构，集成大容量存储与多精度混合算力，支持 MetaXLink 超节点扩展技术，并内置 ECC/RAS 多重安全防护模块，可为金融、政务等关键领域提供高可靠算力支撑，满足下一代生成式 AI 的训练与推理需求。尽管官方未披露该芯片的具体算力与能效参数，但曦云 C600 采用 HBM3e 显存，数据存储容量从上一代 C500 的 64GB 提升至 144GB，结合发布会信息可知，该芯片性能可对标国际旗舰 GPU 产品。

可能也有人会想起此前热议的英伟达的B30，该款产品基于Blackwell架构，定价区间在6500至8000美元，相比H20的1万至1.2万美元价格区间有显著优势。因此，尽管B30的性能约为H20的75%，但市场需求依然强劲。不过，该芯片目前获批的前景并不明朗，无论在美方还是中方皆是如此。

若阿里自研 AI 芯片最终如爆料所述正式发布并全面部署，全球及国内 AI 芯片格局或将发生变化。从全球视角看，阿里 AI 芯片的崛起将推动全球 AI 算力供应链向多元化方向发展，削弱美国在高端芯片领域的垄断地位；聚焦国内市场，阿里 AI 芯片的成熟可能带动更多互联网巨头入局 AI 芯片赛道，形成 “头部企业自研 + 中小厂商合作” 的产业格局。更重要的是，该芯片的国产制造模式及其技术突破，被视为国产芯片自主化进程中的重要节点事件，将为国产 AI 芯片的发展注入动力，加速国产化替代进程。

结语

从阿里云辟谣 “采购寒武纪 15 万片芯片” 传闻，到其 “B 计划” 清晰落地 —— 自研聚焦 AI 推理任务、采用全国产供应链的芯片，未来三年豪掷 3800 亿筑牢国产算力底座，这一系列动作既是阿里应对英伟达 H20 采购受限、填补算力缺口的务实举措，更折射出国内科技企业在 AI 算力自主化赛道上的战略觉醒。

阿里自研芯片的设计极具针对性：针对通义千问大模型优化架构以提升能效比，兼容 CUDA 生态以降低开发者迁移成本，依托国内代工厂实现 “端到端” 国产化 —— 每一步都精准破解了国产芯片 “落地难、断供风险高” 的核心痛点。而平头哥此前在含光 800、倚天 710 芯片上积累的技术沉淀，更为这一布局奠定了扎实的落地基础。

500

声明：本文由电子发烧友原创

科技举报

歪睿老哥

聚焦芯片行业的那些事，唯武侠与芯片不可辜负 |

229篇文章 | 228人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

阿里放大招：自研AI芯片100%国产，不用台积电代工

歪睿老哥
芯片研发工程师

歪睿老哥

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

风闻“投资者保护”：守护你的财富，共筑理性投资路

最近更新的专栏

风闻最热

全部专栏

热门搜索

搜索历史

阿里放大招：自研AI芯片100%国产，不用台积电代工

歪睿老哥 芯片研发工程师

热点

站务

最近更新的专栏

风闻最热

全部专栏

歪睿老哥
芯片研发工程师