国产GPU再下一城,群起突围英伟达+AMD

电子发烧友网报道(文/黄晶晶)去年底以来国产GPU厂商陆续开启上市辅导,最近摩尔线程、沐曦IPO获受理。另消息称,壁仞科技已完成新一轮约15亿元融资,并计划最快今年8月向港交所申请IPO,筹备赴港上市。

根据Jon Peddie Research的数据,独立GPU市场英伟达一家独大,近年来持续维持超80%的市场份额,而AMD公司则占据剩余近20%的市场份额。自人工智能市场爆发式增长以来,英伟达凭借优越的产品性能和完善的CUDA 生态筑造了护城河,领先优势不断扩大。根据TechInsights 数据,在GPU市场,2023年全球应用于智算中心的GPU总出货量达到385万颗,相比2022年的267万颗增长了44.2%。其中,英伟达面向智算中心市场的GPU出货量达到376万颗,市场份额超过90%。

随着国内GPU厂商经历前期研发、产品市场验证、走向资本市场等动作,国内GPU产品和应用生态越来越强,势必在GPU市场争取到一定的份额。

营收规模

近年来,摩尔线程把握市场发展机遇,专注于技术研发和产品创新,持续推出具有行业竞争力的全功能GPU产品。2024年公司营业收入超4亿元,近三年营业收入复合增长率超过200%,持续经营能力不断提升。

报告期各期,公司归属于母公司所有者的净利润分别为-183,955.22 万元、-167,331.03 万元及-149,193.77 万元,扣除非经常性损益后归属于母公司所有者 的净利润分别为-141,200.30 万元、-169,066.22 万元和-150,690.72 万元。2022年至2024年,公司营业收入由0.46亿元增长至4.38亿元,复合增长率为208.44%。报告期内公司研发费用金额较高,报告期内分别为111,649.37 万元、133,442.57 万元、135,868.90 万元。合计研发投入金额380,960.84万元;发行人最近3年累计研发投入占最近三年累计营业收入比例为626.03% 

500

沐曦报告期各期,公司营业收入分别为42.64万元、5,302.12万元、74,307.16万 元和 32,041.53 万元,归属于母公司所有者的净利润分别为-77,696.52 万元、-87,115.82 万元、-140,887.94 万元和-23,251.22 万元,尚未实现盈利。

500

500

报告期内,沐曦主要收入来源为核心产品训推一体芯片曦云C500系列的销售。2023 年度、2024 年度和2025 年1-3月,发行人训推一体芯片曦云C500 系列收入分别为1,546.81万元、72,173.52万元和31,359.27万元,占同期主营业务收入的比例分别为30.09%、97.28%和97.87%,最近一年一期占比较大。发行人正在研发基于国产供应链的新一代训推一体芯片曦云 C600 系列和 C700 系列,以及智算推理GPU曦思N系列、图形渲染GPU曦彩G系列的新产品。

相比于国际巨头英伟达、AMD的营业收入、净利润、毛利率、研发投入等,国内厂商都还相去甚远。其中2024年海光信息毛利率达63.72%相对较高。不过可以看到国内企业研发投入率高位数,其中沐曦的研发投入率达121.24%。

500

500

来源:沐曦招股书

摩尔线程表示,与国际龙头公司英伟达、AMD等企业相比,公司在技术积累、产品性能等方面仍需持续提升。英伟达在GPU领域拥有深厚的技术底蕴和丰富的行业经验,其产品在性能、兼容性以及超大规模GPU集群建设等方面具有较为明显的技术优势和成本优势。公司产品在部分性能指标上已经接近或达到国际先进水平,实现了对部分“卡脖子”领域核心产品的突破。

例如,公司MTT S80显卡的单精度浮点算力性能接近英伟达RTX 3060;基于公司MTT S5000 产品构建的千卡 GPU智算集群效率超过同等规模国外同代系GPU集群计算效率。公司在国内GPU领域具有一定的技术优势,基于自主研发的MUSA架构,公司率先实现了在单芯片架构上同时支持AI计算加速、图形渲染、物理仿真以 及超高清视频处理所需计算能力的突破,推动了我国GPU产业的自主可控进程。 

500

500

来源:摩尔线程招股书

产品技术

全球龙头企业在技术、市场和生态方面具有显著优势。在架构、计算能力、存储能力、集群能力和软件生态方面,国内外均存在差异。英伟达和AMD均采用通用型架构,并进行数次迭代,如英伟达常见的GPU架构包含Ampere架构、Hopper架构、Blackwell架构。AMD常见的有 RDNA 架构、CDNA架构等。英伟达及AMD先进的计算架构决定了其领先的GPU计算性能。而国内企业根据自身技术特色沿用了不同的技术路径,包括通用型架构(GPU)和专用型架构(如ASIC),不同公司的架构设计各有差异。

在计算能力方面,英伟达和AMD支持多种混合精度(FP64、FP32、FP16、BF16、FP8、FP4、INT8)等。算力指标上,英伟达主要产品的FP16/BF16在300-2000TFLOPS左右,AMD主要产品的FP16/BF16在300-1,300 TFLOPS左右。

国内企业支持部分混合精度,大多不支持FP64且对矩阵计算的支持程度较低。采用专用型架构的企业通常以支持 FP16、BF16、INT8 为主。算力指标上,国内多数头部企业主流在售产品的FP16/BF16在100-300 TFLOPS 左右。

在存储能力上,缓存方面,英伟达和AMD 均使用了复杂的多级高速缓存架构,以提升数据访问效率,减少延迟。显存方面,英伟达和AMD采用高带宽显存HBM2e、HBM3及HBM3e,显存带宽在2-7TB/s 左右。

国内部分企业以采用相对简单的缓存架构为主。国内企业结合自身产品特点,分别选择HBM2e、HBM2、GDDR等显存类型,显存带宽在0.5-2TB/s 左右。

500

500

来源:沐曦招股书

软件生态方面,英伟达自研 CUDA,拥有成熟完善且全球领先的生态,已建立显著生态优势:AMD自研ROCm 并兼容CUDA,软件生态较为丰富。国内企业通常采取自建软件生态或应用开发、功能调试和性能调优等核心环节,多数国内企业无显著生态优势,适配和迁移成本较高。

沐曦是国内少数几家系统掌握了先进制程 GPU芯片及其基础系统软件研发、设计和量产技术的企业之一,深度积累了GPU IP(包括指令集、 微架构等)、GPU SoC、高速互连、GPU软件等核心技术,打造了自主开放、高度兼容国际主流GPU 生态(CUDA)的软件生态体系,能够为客户构建软硬件一体的全面生态解决方案,在底层技术上摆脱对国外算力资产的依赖,为推进新质生产力发展提供动力引擎。

沐曦自主构建的MXMACA软件栈不仅拥有统一、完整且高效的全栈式工具链,涵盖应用开发、功能调试和性能调优等核心环节,同时高度兼容GPU行业国际主流CUDA生态,能够拥抱全球开发者丰富的开源成果,具有较高的易用性和迁移效率,在通用性和灵活性上具备独特的竞争力。

摩尔线程构建的AI+图形融合的GPU统一驱动架构,实现跨操作系统与异构硬件的无缝兼容。凭借自主研发的MUSA Unified Driver核心模块,驱动层同时支持Windows、麒麟、统信、OpenEuler、龙蜥等操作系统及Intel/AMD/鲲鹏/海光/飞腾等CPU平台,在统一代码库中整合AI张量计算与图形渲染管线,使DirectX、 Vulkan 图形API与MUSA AI计算框架共享底层硬件资源调度。

编译器技术通过多层次中间表示,实现生态兼容与性能优化双重突破。基于 LLVM 的前端支持PyTorch Eager 模式脚本、CUDA内核代码与标准SPIR-V着 色器语言混合编译,后端生成自主指令集的二进制码。 

为营造低门槛开发环境,公司推出MUSA统一编程模型,语法上兼容CUDA C++核心语义和 Triton 语言,内置架构抽象层能自动适配主流 GPU生态,在保持90%以上硬件利用率的前提下,将跨平台代码移植工作量削减90%。软件开发生态通过模块化SDK体系覆盖核心技术需求,MUSA SDK提供超 3,000 个从设备级内存管理到分布式训练通信的API接口,封装muDNN、muBlast、 muFFT、MCCL等主流加速库的优化实现,并集成自动化性能分析工具链。 

为深度融入现有AI生态,公司构建了AI Framework Bridge双向接口体系,支持PyTorch、DeepSpeed、MegaTron-LM、vLLM、SGLang 等通用AI 框架,助力开发者平滑迁移。 公司专注于自主知识产权的MUSA架构研发,通过开放API和SDK工具集, 助力开发者和合作伙伴快速集成GPU解决方案。 

公司生态团队建立了“摩尔学院”,为开发者提供系统化的学习路径,覆盖企业开发者、科研机构及在校学生,提升开发者对公司产品的认知度和使用能力。 此外,公司搭建了开放生态合作平台,向开发者和合作伙伴开放申请通道,提供定制化的技术支持、资源共享及联合开发机会,强化生态系统的持续优化和价值创造理念。

通过构建完善的生态系统,公司实现了从产品研发到市场的全链条闭环,增 强了市场竞争力。未来,公司将秉持“技术驱动、生态赋能、全场景兼容”理念, 发挥GPU技术潜力,推动产业数字化转型与智能化升级。

增长可期

根据沙利文数据,随着AI和大数据应用的不断深入,中国算力规模呈现出快速增长态势,整体规模从2020年的136.20 EFLOPs增长至2024年的617.00 EFLOPs,期间年复合增长率为45.9%,预计到2029年中国算力总规模将达到3,442.89 EFLOPs,年复合增长率达40.0%。GPU作为实现算力的基础硬件之一,在数据中心建设和部署过程中具有广泛的配套需求。 

根据弗若斯特沙利文预测,全球GPU市场规模预计在2029年将达到36,119.74亿元,其中,中国GPU市场规模在2029年将达到13,635.78亿元,在全球市场中的市场占比预计将从2024年的30.8%提升至2029年的37.8%。

500

过去五年,中国GPU产业呈现快速增长态势,市场规模从2020年的384.77亿元快速增长到2024 年的1,638.17 亿元。未来,随着AI的应用不断开发,对于GPU等算力基础设施的需求预计将会出现爆发增长。

500

声明:本文由电子发烧友原创

站务

全部专栏