国产GPU,要把算力搬到太空!

500

作者

鲁镇西

500

抢回英伟达扔掉的500亿美元,摩尔线程们还能做什么?

500

2025年11月,长达7年的“国产芯片替代”,终于迎来大众肉眼可见的成果。

首先是黄仁勋宣布正式退出中国市场,高端芯片市场份额从95%降至0%‌,预计将失去500亿美元营收,其次中国GPU企业摩尔线程,于11月24日摩尔线程(sh688795)正式申购,这意味着主要从事GPU及相关产品的研发、设计和销售,号称国内唯一实现全功能GPU量产的企业,初步获得市场认可。

500

图源:摩尔线程官网

只是碍于科创板门槛儿,申购者需要开户满2年;申请日前20个交易日中,日均持仓不低于50万元;风险承受能力等级需为C4(积极型)及以上,并签署《科创板股票交易风险揭示书》。

按摩尔线程发行价114.28元每股计算,中一签需要本金57140元,由于近期新股大鹏工业首日暴涨12倍,最高涨幅超1500%,市场对摩尔线程上市当日的涨幅预期极高,纷纷预测中一签摩尔线程最少盈利十万元。

且不论这种预测是否准确,从摩尔线程IPO进程来看,公司从申请受理到过会仅用88天,刷新了科创板审核速度纪录。实际上,二级市场反哺企业融资提速,恰好表明国产GPU研发加速落地。

01

摩尔线程的硬实力

此次上市的摩尔线程,成立时间不过5年,自2020年设立至今,公司以自主研发的全功能GPU为核心,致力于为AI、数字孪生、科学计算等高性能计算领域提供计算加速平台。

短短5年中,摩尔线程已成功推出四代GPU架构,并形成了覆盖AI智算、高性能计算、图形渲染、计算虚拟化、智能媒体和面向个人娱乐与生产力工具等应用领域的多元计算加速产品矩阵,产品线涵盖政务与企业级智能计算、数据中心及消费级终端市场,能够满足政府、企业和个人消费者等在不同市场中的差异化需求。

 

新一代架构相关产品处于研发阶段,同步推进高性能GPU芯片和智算集群前沿技术预研,以自主创新为核心,持续推动计算产业向通用化与智能化方向发展。

500

图源:摩尔线程招股书

值得一提的是,退出中国高端GPU市场的英伟达,赖以生存的就是“CUDA”,英伟达凭借CUDA构建了极高的软件生态壁垒。为冲破这个壁垒,摩尔线程自主研发MUSA架构。

500

MUSA架构是公司自主研发的融合GPU硬件和软件的全功能GPU计算加速统一系统架构。该架构涵盖统一的芯片架构、指令集、编程模型、软件运行库及驱动程序框架等关键要素,旨在为各类并行计算场景提供高性能计算能力。

开发人员可借助C/C++、Triton等编程语言,在该架构下编写并行计算程序,且同一代码能够在公司不同GPU产品及系统上运行,具有良好的灵活性与可扩展性。

最重要的是,MUSA架构具备与由英伟达主导的国际主流GPU生态的兼容性,使得开发者能够以较低成本充分利用目前国际主流生态下的代码资源。基于MUSA架构开发的应用程序不仅具有广泛的可移植性,还能够同时在云端及边缘的众多计算平台上运行,其应用领域广泛,涵盖AI、图形处理、科学计算等多个重要方向。

全功能GPU是指具备功能完备性与精度完整性的GPU。其中,功能完备性体现为在单一GPU芯片中集成了AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码等多种能力,满足多样化的计算需求;精度完整性体现为单一芯片支持FP64Vector、FP32Vector、TF32Tensor、FP16/BF16Tensor、FP8Tensor、INT8Tensor等不同计算精度,以满足GPU加速不同场景的计算需求。

全功能GPU在工作效率、生态完整多样性以及兼容性等方面更具有优势,能够更好地适应未来新兴及前沿计算加速应用场景的需求。

基于MUSA统一架构技术,摩尔线程在基础软件层面同时提供了AI计算、图形渲染和科学计算所需的基础软件技术。

在AI计算领域,支持PyTorch、PaddlePaddle等国内外主流AI应用开发框架,以及Megatron、FlagScale等大模型分布式训练框架;在图形渲染领域,支持DirectX、OpenGL、OpenGLES和Vulkan等主流图形应用开发技术,为视频游戏、数字孪生、虚拟现实、工业设计和地理信息系统等行业应用提供坚实基础;在科学计算领域,支持MUSA通用计算编程,可广泛应用于计算物理、信号处理、生物医药等科学计算领域。

在招股书中,摩尔线程特别强调,MUSA架构本身并不作为单独产品对外销售,而是作为公司全功能GPU产品的核心技术支撑。

02

机会留给了有准备的MUSA,国产算力迎来加速时刻

今天的MUSA架构,间接证明摩尔线程设立初期就锚定英伟达替代。

俗话说机会留给有准备的人,如今的英伟达,因为种种原因彻底退出中国高端GPU市场,而摩尔线程MUSA架构恰好可以兼容英伟达CUDA架构,在英伟达高端GPU退出中国市场的今天,摩尔线程MUSA架构似乎可以无缝衔接英伟达市场,国产算力行业有望借此实现加速落地。

基于MSUA架构,摩尔线程已经推出四代GPU架构芯片,分别为“苏堤”“春晓”“曲院”“平湖”,第四代芯片“平湖”增加了FP8精度支持,大幅提升AI算力,公司基于该芯片支撑面向DeepSeek类前沿大模型预训练的万卡集群智算中心解决方案。

500

500

基于MUSA架构,摩尔线程推出智能SoC芯片“长江”,这是集成了“全功能GPU+CPU+NPU+VPU”等异构算力单元的片上系统芯片。

摩尔线程AI算力本是基于“长江”SoC打造的产品,结合AI大模型与传统PC功能,为用户提供智能化的计算终端。该产品在满足传统PC功能的基础上,支持AI应用的运行与开发,用户可进行AI学习和实践操作。同时,AI算力本支持端云联动,用户可通过云端进行模型训练,将训练完成的模型下发至本地进行推理,实现个性化算力定制,满足快速、高效、隐私保护的推理需求。

500

除兼容英伟达CUDA架构的摩尔线程MUSA架构外,国产算力还有一个绕不开的玩家就是华为,2025年6月20日,华为在开发者大会发布CloudMatrix384AI超节点,将384颗昇腾NPU和192鲲鹏CPU通过全新高速网络MatrixLink对等互连形成了一个整体AI“服务器”。算力已从单台的6.4pFLOPS提升至超节点300pFLOPS,算力提升50倍。单卡的推理吞吐量从每秒600tokens提升至每秒2300tokens,提升近4倍。

500

实际测试中在默认配置下,总体预填吞吐量的测试CloudMatrix-Infer每个NPU每秒处理5655tokens。鉴于每个昇腾910CNPU的计算能力为1504TFLOPS(INT8),对应的计算效率为3.76tokens/sperTFLOPS。这比SGLang在英伟达H100上的默认配置(3.18tokens/sperTFLOPS)效率要高得多,尽管后者的原始吞吐量略高。

另一个老玩家龙芯中科也推出了新一代CPU及GPGPU,2025年龙芯产品发布会上,龙芯中科发布最新一代3C6000系列处理器。

龙芯3C6000系列处理器具备高性能,高可靠,高安全,高能效的特点。本次产品主要打造了5种服务器主板方案(3C6000/S单路、双路;3C6000/D双路;3C6000/Q双路;3C6000/D四路)主要针对不同应用群体,服务器性能全面对标Intel第三代至强服务器系列,基本达到2023年市场主流产品水平,实测中64核心双路和32核心四路产品整机性能比较Intel的8380有小幅优势。

500

在工控领域本次发布会发布了龙芯2K3000:采用8核SoC芯片,龙芯自主指令系统(龙架构),基于自主研制的LA364E处理器核,SPECCPU2006Base单线程定/浮点峰值性能均超过10分/GHz,与龙芯3A5000处理器使用的LA464核性能相当;集成第二代自研GPGPU核心LG200,图形性能成倍提升,支持通用计算和AI加速;集成丰富的I/O接口,可广泛应用于各种场景。

公司针对未来GPU芯片发展方向,发布首款GPU芯片9A1000:其定位是入门级的显卡并且支持AI加速,AI算力预计在40TOPS,相较于公司上一代2K3000性能提升5倍以上,产品目前已经在研发尾声,即将进入流片。下一代9A2000单精度浮点算力可达到5TFlops,INT8AI算力达到160TOPS,内存带宽256BG/s,并且支持双片互联拓展。

结语

在国产GPU市场,像摩尔线程、华为、龙芯中科这几家公司只是冰山一角,海光信息、寒武纪、景嘉微、沐曦集成等多家公司均聚焦GPU产品,为国产算力替代提供无限可能。

2025年11月消息,北京拟在700-800公里晨昏轨道建设运营超过千兆瓦(GW)功率的集中式大型数据中心系统,以实现将大规模AI算力搬上太空。

根据“智绘星空胜算在天——太空数据中心建设工作推进会”发布的规划方案,数据中心系统由空间算力、中继传输和地面管控分系统组成。数据中心建设分为三个阶段,2025年至2027年,突破能源与散热等关键技术,迭代研制试验星,建设一期算力星座;2028年至2030年,突破在轨组装建造等关键技术,降低建设与运营成本,建设二期算力星座;2031年至2035年,卫星大规模批量生产并组网发射,在轨对接建成大规模太空数据中心。

在此之前,浙江之江实验室于2025年5月14日,发射12颗卫星,搭载80亿参数模型,实现整轨互联,计划扩展至千星规模,为全球首个太空计算星座。

通常,卫星需先将数据传回地面,再由地面数据处理中心对其进行解析,这种“天感地算”的模式受限于地面站资源、带宽等因素,仅有不到十分之一的有效卫星数据能传回地面,且存在数据时效差等问题,之江实验室构建的“三体计算星座”恰好着力攻克该问题。

中国之所以可以大力发展太空算力,一个重要前提就是实现国产算力替代后,算力建设外溢,如果成功,这将是解决传统数据中心“用电 / 冷却 /土地 /碳排放 /扩容难”等问题的一条全新路径。尤其对AI、大模型训练/推理这类对算力密集、能耗大的任务——太空算力或将成为“绿色高密度计算平台”。

长期来看,如果太空算力可以落地,未来“天基算力星座+地面云+太空云+混合部署”可能成为主流算力基础设施格局。不仅仅是云+地面数据中心,而是云+地+空多维融合。

其次可以减少对地面能源/电力/土地/冷却资源的依赖,使得AI/超级计算/大模型训练更绿色/更可持续。这对碳中和/节能/资源利用/可持续发展有重要意义。

第三可以推动“太空+商业航天+AI+通信+新能源+基础设施”跨界产业链大发展。既是科技,也是基础设施、战略资产。可能促进新的产业形态、新商业模式与新服务类型诞生。

第四可以实现战略自主、数据主权、安全角度的基础设施重构。太空中的算力与数据处理可能更受控,更利于“主权云/主权算力/国家安全+数据安全”——对于一些敏感场景(政府、国防、卫星侦察、遥感监控、重大科研等)尤为重要。

着重构建太空算力,是中国在“算力基础设施+国家战略+商业航天”交汇处的一次重大布局。它的重要性不亚于几十年前地面互联网基础设施的建设,而这一切的基础,是国内GPU企业可以稳定产出优质GPU产品。

摩尔线程等新玩家成功上市,有望借助资本的力量进一步提升企业实力,后续还有沐曦股份(sh688802)等陆续登陆科创板,为国产 GPU 行业带来大量资金、媒体与人才回流、供应链验证与政府支持信号;中长期则可能推动产品化规模扩张、生态建设与国产替代提速。

© THE END

本文由贝克街探案官原创出品,点击阅读更多往期好文

未经许可,请勿转载。

站务

最近更新的专栏

全部专栏