台积电:“一定要记住COUPE”

500

2021年,台积电在Hot Chips上发布了最新的3D封装技术路线图,里面涉及了一个硅光封装COUPE。

这一年行业最热的话题是3nm、2nm,硅光封装只是小小一点。但台积电看到的是另一个问题:当AI训练集群的GPU从几十块跳到万卡级别,数据在芯片之间跑来跑去的代价,开始变得让人难以忽视。

五年后,故事翻转了。台积电宣布硅光整合平台COUPE于2026年进入量产。英伟达、博通的订单已经砸下去了,三星在追赶。今年,台积电副共同营运长张晓强在技术论坛上说了句话:一定要记住COUPE。

01

一个被忽视的瓶颈

过去几十年,数据中心内部GPU和交换机的通信靠的是可插拔光模块,可以理解为一个可以拔插的盒子,把电信号变成光信号发出去,对方再把光信号变回电信号。这套架构的好处是:简单、好用、出问题换掉就好。

但是AI的疯狂,再次刷新了需求。当单次训练任务的GPU数量从几十跳到数万,当传输速率从400G涨到800G、1.6T,信号在电→光→电之间来回折腾的代价开始失控。传统DSP可插拔方案处理1.6T信号,功耗在30瓦量级。在先进制程竞赛中,这个功耗数字听起来不算什么,但放在数万GPU同时跑的大模型训练里,光是光模块的能耗就能吃掉的整台服务器的电力配额。更关键的是,FEC纠错需要额外的处理时间,在大模型分布式训练的场景下,这些零碎加起来,足以让相当一部分GPU在等数据。

铜能救场吗?短距离可以,但是一旦跨机架、跨节点,信号衰减和延迟就扛不住了。业界需要新的方案。

500

可插拔光学器件、OBO、NPO 和 CPO

500

可插拔和CPO 的功耗

业内选择了光互连,用光代替电来传数据,功耗更低、延迟更短、带宽密度更高。但问题在于,怎么把光学器件和电学芯片高效地集成在一起?传统做法是分立设计、光模块单独封装,但这种方式在AI场景下显得太松散,信号路径太长,损耗太大。

CPO,共封装光学,就是来解决这个问题的:把光学引擎直接塞进芯片封装里,让光信号在最靠近处理器的地方产生。

想法不复杂。实现起来,是另一回事。

02

COUPE是什么?

硅光子不是什么新鲜事。2000年代初就有人在研究了。优势明确:跟CMOS工艺兼容,成本可控,可大规模集成。但难题同样明确:光学器件和电学芯片怎么高密度地捏在一起?光学耦合怎么搞?封装精度怎么保证?测试怎么搞?这些问题不解决,硅光子就无法大规模量产。

台积电给出的思路是:既然硅光子自己搞不定,那就让它跟台积电最强的封装能力绑在一起。CoWoS、SoIC,这两把刀在AI圈已经是响当当的了。

500

2023年,台积电在IEEE ECTC上推出COUPE 2.0,核心升级是引入混合键合(Hybrid Bonding)技术。芯片之间不再靠微凸块(bump)连接,而是在室温下让氧化物分子直接“吸”在一起,再升温退火让铜键合。这个工艺大幅缩短了电子芯片和光子芯片的间距,把信号传输的损耗压到最低。

进入2024年,COUPE进入密集验证阶段。IEDM大会上,台积电公布了更多细节:单模硅波导损耗0.67dB/cm,氮化硅波导低至0.21dB/cm,Ge探测器响应率接近1A/W,200Gbps微环调制器的误码率不到一亿分之一。也就是说,COUPE不但能干活,而且干的好。

不过,能把复杂的事情变得简单,才有资格收溢价。真正让COUPE从技术变成生意的是台积电的改变。

500

这里要插一段行业背景:在硅光子这件事上,GlobalFoundries其实是更早的玩家,2017年就开始给客户代工硅光芯片,积累了大量经验。按理说,它应该占据先机。但GlobalFoundries的模式是典型的foundry思维:我只管造芯片,后面的封装集成你自己搞定。这套逻辑对有完整光电设计能力的头部客户没问题,但具备这种能力的公司,全球数不出十家。

台积电的打法不同,它不只造芯片,还包圆了整个封装流程。从硅光子晶圆制造,到电子芯片和光子芯片的键合,再到光学封装,全部在台积电的产线里完成。客户只需要把需求提了,剩下的一站式搞定。

这个差异最终决定了客户的流向。2025年,英伟达和博通开始把部分产品从GlobalFoundries迁移到台积电COUPE平台。更关键的是,当英伟达决定用6nm先进逻辑节点做电子控制芯片时,只有台积电能同时搞定先进制程和混合键合封装,其他家要么工艺领先但封装跟不上,要么封装可以但先进节点没有。

绕了一圈,CoWoS成了入场券,而台积电独发。

03

COUPE量产,产业链变局

COUPE量产的影响,远不止台积电自己。目前,供应链价值正在从传统光模块厂商向半导体与先进封装环节转移。

激光器将从配套零件变成核心资产。传统可插拔光模块用的是EML激光器,调制器是集成在里面的。但CPO需要外部连续波激光器,一个持续发光、功率高达数百毫瓦的激光光源,通过分束器同时给多个光子通道供光。技术门槛完全不在一个量级。同时,这类激光器的核心材料是磷化铟(InP),全球供应偏偏偏紧。需求在涨(光通信市场扩张、CPO新增需求、出口限制),产能却跟不上。

结果是,激光器厂商从幕后走到了聚光灯下。Coherent认为,InP(磷化铟)的供需失衡至少将持续整个2026和2027年。Coherent正全力推进6英寸InP晶圆的量产爬坡。Lumentum预计到2026财年底,EML产能将较2025年增长超50%,因此公司已推进约40%的磷化铟(InP)扩产计划。2026年3月,英伟达直接砸了40亿美元(各20亿)投资Lumentum和Coherent,锁定多年采购承诺。

测试设备厂商也是赢家。CPO的制造复杂度远超传统光模块。从光子晶圆测试、芯片键合、光引擎装配到整机测试,每个环节都需要微米级精度的专用设备。联讯仪器、Chroma、ficonTEC在CPO量产链路上不可或缺。Yole预测,CPO市场将从2024年的4600万美元飙升至2030年的81亿美元,这意味着,测试设备的订单高峰还在后面。

FAU厂商也将受益。光纤阵列单元(FAU)是把芯片产生的光信号耦合进光纤的关键组件。在CPO架构下,FAU需要更高的耦合精度和更复杂的封装集成。在CPO场景下,单个FAU的价值量将显著提升。天孚通信等国内FAU厂商凭借精密加工能力,正成为CPO产业链中不可或缺的一环。

传统光模块厂商会受到一定的冲击。中际旭创和新易盛是这场变局中最典型的案例。这两家全球光模块龙头,2025年业绩都在高速增长(中际旭创净利润同比增长109%,新易盛同比增长235%)。可插拔时代,光模块厂商是方案的集成商,掌握着光电转换的核心环节。但到了CPO时代,光引擎和XPU/交换机芯片被共封装在一起,方案集成商的位置被半导体厂商(英伟达、博通)和OSAT接手,传统光模块厂商能做的只剩下光引擎制造和外部光源组件。

不过,中际旭创早已官宣光引擎实现自研自产,新易盛也在2026年3月表态手握光引擎技术。它们的策略是:既然你不需要“外挂”的模块,那我就把核心的“光引擎”做好了卖给你。从“卖模块”到“卖光引擎”,这是头部厂商的主动转型。

04

竞赛才刚起步

2026年,Scale-out CPO(机架间互联)交换机开始量产出货,这是当前的主战场。但真正的挑战是2027年-2028年时,Scale-up CPO(机架内GPU互联)方案。Scale-up CPO意味着光互连要进到机架内部,直接和GPU封装在一起。这个场景对技术的要求更高,对供应链的控制也更严。

台积电并非这一赛道的唯一玩家。

每当台积电宣布什么大动作时,另一位韩国友商也会迅速跟进。对,说的是三星。今年3月,三星电子正式宣布进军光通信市场。三星电子路线图显示,将于2027年实现基于TC(热压)键合的光引擎,2028年实现混合键合过渡,2029年开始提供“交钥匙”CPO服务,即一站式、全流程的CPO代工总包。

目前,Tower Semiconductor的硅光子收入还在持续增长。从2024年约1.06亿美元增长到2025年约2.28亿美元,并计划将产能扩大5倍以上。今年已经与最大硅光子客户签署总额13亿美元的2027年供货合同,并已收到2.9亿美元预付款用于产能预留。公司还披露,客户已就2028年承诺更大规模的晶圆订单,相关追加预付款将于2027年1月前到位。

同时业内也有很多后起之秀,Ayar Labs、Lightmatter、Celestial AI,这波企业走的更激进,直接把光子塞进XPU封装里,瞄准2028年以后的下一代市场。Marvell宣布用32.5亿美元收购Celestial AI,就是希望早早占位。

05

结语

台积电正在打造完整的“三层蛋糕”AI平台架构,包括SoIC、CoWoS与COUPE光互连技术。

台积电表示,全球首款采用COUPE技术的200Gbps 微环调制器(Micro Ring Modulator)已于今年开始生产,并已实现低于一亿分之一的比特误码率。

到2030年前,台积电将通过400Gbps光调制器、多波长与多光纤阵列技术,把带宽密度提升8倍至4TBps。相较传统铜线,COUPE可让系统能效提升4 倍、延迟降低10倍;若进一步与封装平台深度整合,能效甚至可提升至10倍,延迟降低20倍,成为未来AI数据中心的重要基础技术。

COUPE的需求将越发旺盛。

站务

全部专栏