瑞幸背后的芯片,藏不住了
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
瑞幸咖啡背后的芯片,藏不住了。

当你走进瑞幸咖啡店,点一杯生椰拿铁的所有过程,例如下单、出杯、核销、取餐……这一切的背后其实都有一双“眼睛”在盯着。
在看什么?
它要实时识别订单、判断制作节奏、校验物料状态、监控设备运行,还要把数据同步回总部,用于品控、调度和运营决策。

这就是藏在瑞幸咖啡背后无数的边缘侧AI,它们有一个共性,那便是算力必须就近部署,响应必须足够快,稳定性必须足够强,成本还要可控。
芯片,成了其中关键中的关键。
就在今天,瑞幸背后芯片的庐山真面目终于浮出了水面——
来自一家刚刚完成上市不久的国产通用GPU公司,天数智芯。
前脚刚刚敲完钟,时隔仅半个月时间,天数智芯便又一口气发布了四款边端算力产品,彤央系列。
而且不只是发布的动作,像瑞幸已经在用的边端算力,正是彤央。
那么这个系列的产品到底实力几何,我们继续往下看。
一口气发布四款新品
先来看名字。
彤央之名,源自商周青铜器铭文,但在天数智芯的内部,彤央有着别样的寓意:
“彤”指向高能效计算能力,“央”则意味着在边端场景中承担核心算力枢纽的角色。
换言之,这是一个为真实业务现场而生的算力系列。

彤央系列的首发阵容,共包括四款产品:TY1000、TY1100,以及定位算力终端的TY1100_NX和TY1200。
先看彤央TY1000。
这是一个标准699Pin接口的模组,尺寸只有口袋大小,但在这个方寸之间,天数塞进了近200T的稠密算力。
在实际测试中,无论是典型的CV任务,还是NLP推理,甚至是对参数规模达到32B的DeepSeek-R1模型进行推理,以及具身智能VLA模型及世界模型等场景,TY1000在多项指标上都展现出不弱于主流国际方案的表现。

在天数智芯披露的测试数据中,TY1000在多类负载下的综合效率,超过了英伟达AGX Orin所对应的典型配置。
虽然这并不意味着全面替代,但至少证明了一件事:在边端通用推理这个维度,国产通用GPU已经具备了正面对比的能力。
其次是彤央TY1100。
这款产品在架构上进行了进一步升级,采用了12核ARM v9架构CPU,并在系统级算力供给上更加充沛。
它面向的是对通用计算和AI推理都有较高要求的复杂场景,比如多传感器融合、边缘数据预处理、实时决策等。
如果说TY1000更偏向算力核心,那么TY1100则更像是一块完整的边缘计算底座。
接下来,是针对对显存容量和性价比更加敏感用户的TY1100_NX。
更大的显存配置,使其在多模型并行、长序列推理等场景中具备更高的稳定性,同时维持了即插即用的部署方式,降低了系统集成门槛。
最后,便是彤央TY1200,则被天数智芯定义为算力终端。
它的算力规格提升到了300 TOPS,更重要的是,它是面向终端形态的整体方案。这类产品的目标用户,并不只是算法工程师,还包括希望直接把AI能力装进设备的行业客户。
从产品组合上看,彤央系列并没有走单点极致路线,而是刻意拉开了算力、形态和价格区间,覆盖从算力模组到终端的不同部署需求。

但天数智芯并没有把重点只放在芯片的参数上。
在生态层面,彤央系列在接口和形态上实现了与主流产品的Pin-to-Pin兼容,大幅降低了客户从既有方案迁移的成本。
这一点,对于已经有成熟系统的工业和商业客户来说,几乎是“是否愿意尝试”的分水岭。
更重要的是,这些产品并不是为了发布而发布。
在机器人领域,彤央与格蓝若机器人合作进入企业实际应用场景;在工业侧,比依电器等制造企业正在用其进行设备智能化升级;在商业零售场景中,瑞幸咖啡只是其中一个典型案例;而在交通领域,彤央系列也已经参与到多个车路云一体化试点中。

当四个完全不同的行业场景,开始使用同一套通用GPU算力底座时,一个更大的问题随之浮现:
天数智芯真正想做的,究竟是什么?
天数智芯的“野心”也暴露了
如果只看彤央系列,很容易理解为一家国产芯片公司想要率先补全云边端的业务版图。
但从其同样于1月26日公开披露的架构路线图来看,事情显然没有这么简单,在其业务大本营的云端场景,天数有更野心勃勃的目标。
天数智芯并不满足于国产替代这个阶段性目标。在多次公开场合中,它都明确提到,自己的长期目标是对标乃至超越英伟达这样的行业标杆。
为此,天数智芯给出了一张明确到年份的架构路线图。

2025年天数智芯推出的天数天枢架构,超越英伟达Hopper。据了解,这已经不是规划,而是现实:该架构支持从高精度科学计算到AI精度计算,AI芯片在执行注意力机制相关计算时,算力的实际有效利用效率达到90%及以上。
而测试数据显示,天数天枢架构效率较当前行业平均水平提升60%,在DeepSeek V3场景平均比Hopper架构高约20%性能。
到2026年,天数天璇架构,新增ixFP4精度支持,对标Blackwell;天数天玑架构,实现全场景AI与加速计算覆盖,超越Blackwell。
而在2027年,天数智芯规划中的天权架构,则直接指向对Rubin架构的全面超越,重点融入更多精度支持与创新设计。
支撑这条路线图的背后,还有一整套底层技术能力。
包括TPC Broadcast、Instruction Co-Exec、Dynamic Warp Scheduling在内的多项技术,构成了天数智芯在指令级并行、资源调度和算力利用率上的核心优势。

这些能力,决定了它是否真的具备在通用GPU赛道长期演进的可能性。
那么,天数智芯是否真的有这样的实力?
一个直观的判断方式,是看通用性。
截至目前,天数智芯的通用GPU已经稳定运行400余种主流模型,并且强调Day 0适配能力;以DeepSeek为例,其在天数智芯平台上的适配和推理,已经成为客户实际部署的一部分。

第二个维度,是商业化落地。
根据其公开披露的数据,天数智芯累计交付的芯片数量已经超过5.2万片,服务客户超过300家。
在实际应用中,互联网AI客服的算力成本被压缩了一半,而单机性能翻倍;金融行业的研报生成效率提升了约70%;在高要求的集群场景中,其千卡规模集群已经实现了超过1000天的稳定运行。

这些数据足够耀眼,也足够具体。
尤其值得注意的是,天数智芯在招股书中,对客户数量、量产发货规模、卡级毛利等核心指标进行了相对完整的披露。这种摊开来讲的方式,在当前的国产芯片行业中并不多见。
也正是在这一点上,天数智芯与不少大厂自研芯片或专用NPU路线拉开了差距。
它选择了一条更难、也更慢的路——坚持通用GPU路线,从架构、指令集、编译器到软件栈进行全栈自研。这意味着没有盲区,也意味着每一步都必须自己趟过去。
最后,回到瑞幸的那杯咖啡。
当国产算力开始真正进入千行百业,进入门店、工厂、道路和设备,芯片不再只是发布会上的参数,已然是业务链条中不可或缺的一环。
从这个角度看,此次发布的意义,或许并不只在于发布了四代架构图,和四款边端新品,而在于国产通用GPU,一边抬头,试图超越行业标杆,并以更大的野心,尝试面向无人区提出自己的路径;一边低头,以一种更贴近现实的方式,不断深入产业现场。
而这,可能才是天数智芯真正想证明的事情。



量子位官方账号



