下一个半导体周期,这些领域是关键

500

集成芯片间的竞争正在愈演愈烈。

在国际上,根据Semiengineering文章,英特尔代工、台积电和三星代工都在争相提供全3D IC的所有基础组件。在未来几年内,这些组件共同作用,将以最小的功耗实现性能数量级的提升。

市场数据上,9月Future Market Insights发布报告称,3D IC和2.5D IC封装市场预计将以9.0%的年复合增长率增长,从2025年到2035年,市场预计在2025年将达到583亿美元,并预计到2035年将达到1380亿美元。复合绝对增长分析显示,在十年期间,由于对高性能计算、人工智能加速器以及下一代内存堆叠不断增长的需求推动,市场规模将扩大近797亿美元。

值得一提的是,根据报告,中国以12.2%的增速领先全球市场,其次是印度(11.3%)、德国(10.4%)、法国(9.5%)、英国(8.6%)和美国(7.7%)。

事实上中国不仅有市场优势,也在技术、生态等方面积极布局集成芯片。下一个周期的半导体,集成有可能取代制造的位置,成为这条产业链上最关键的一环。

这是一场不能输的竞赛。

01

集成芯片,绕过摩尔定律

随着半导体制造工艺接近物理极限,摩尔定律带来的性能提升与成本效益正显著放缓。在此背景下,芯片集成技术,特别是以芯粒(Chiplet)为核心的异构集成,正成为推动行业发展的关键方向。

芯片集成的新方向核心在于其模块化和异构化的能力。通过先进封装技术,可以将采用不同工艺节点、来自不同制造商、甚至不同材质的芯粒组合在单一封装内。例如,对性能要求高的计算核心可采用最先进的工艺制造,而对成本敏感的I/O或模拟模块则可使用成熟的工艺节点。这种方式不仅优化了各功能模块的成本与性能,还通过复用已有的芯粒设计,显著缩短了产品的开发周期和上市时间。

集成芯片的主要优势体现在性能、功耗和成本三个维度。在性能层面,通过3D堆叠等技术将内存与逻辑计算单元垂直整合,极大地缩短了数据传输路径,有效缓解了传统计算架构中的“内存墙”瓶颈,提高了数据处理效率和带宽。这直接转化为更低的功耗,因为数据在芯片内部的移动是能耗的主要来源之一。

在成本方面,制造多个小尺寸芯粒的综合良率远高于制造单个大尺寸芯片,这降低了因单一缺陷导致整个芯片报废的风险,从而控制了制造成本。

为支撑这一技术方向,2.5D及3D封装等先进封装工艺扮演了重要的角色。这些技术通过硅中介层(Interposer)或硅通孔(TSV)等方式,实现了芯粒之间高密度的互连。当前,互连密度已成为与晶体管密度同等重要的性能指标。这种高密度集成使得封装内的组件可以实现比传统PCB板高出数个数量级的带宽,同时功耗更低,为高性能计算和人工智能等数据密集型应用提供了必要的物理基础。

同时,3D集成芯片又不仅是工艺节点的竞赛。它还涉及EDA工具和方法、数字孪生、多物理场仿真的重大变革,先进设备的支持,并在从设计到制造流程的多个阶段注入人工智能。从某种意义来说,这些反而是集成芯片中更为关键的领域。

02

EDA平台,3D集成的设计灵魂

3D封装首先需要更先进EDA工具的支持。

三维堆叠架构对EDA工具提出了新的技术要求。设计复杂度大幅增加,从单一工艺的二维布局,转变为涉及多个芯片、多种物理场的系统级工程。热管理、机械应力、跨芯片时序收敛和电源完整性等以往的次级设计考量,转变为影响系统可行性的主要因素。为平面芯片设计的传统EDA工具,其架构难以处理上述系统级复杂性。

因此,EDA软件的角色从单芯片设计工具,转变为支持系统级集成的平台。对此,国际三大EDA厂商——新思科技、楷登电子和西门子EDA均已进行深度布局,推出了一系列针对性的解决方案。

新思科技的核心产品是3DIC Compiler平台,该平台基于统一的数据模型,将架构探索、实现、分析和签核等阶段整合在单一环境中。通过其Synopsys.ai技术,特别是3DSO.ai,平台能够提供自主化的AI优化,并整合了Ansys在电源、热和信号完整性方面的物理分析能力,旨在提供一个从架构到签核的完整解决方案。

楷登电子则推出了Integrity 3D-IC平台,其突出优势在于系统级的多物理场分析和跨平台协同设计能力。该平台与公司的Innovus(数字实现)、Virtuoso(模拟设计)以及Allegro(封装/PCB)等工具深度集成,并利用Celsius和Sigrity求解器,为芯片-封装-电路板的全链路协同分析提供了热与电性能签核支持。

西门子EDA的布局重点体现在其Xpedition Package Designer和Innovator3D IC解决方案套件,并以其行业标准的Calibre系列工具在验证签核环节建立优势。特别是Calibre 3DStress等工具,专注于解决3D架构中因热机械应力引发的翘曲变形等问题。

国产厂商中,华大九天于7月发布了先进封装设计平台Empyrean Storm。

据介绍,该平台支持跨工艺封装版图数据导入与设计编辑,深度适配当下主流的硅基(Silicon Interposer)以及有机转接板(Organic RDL)工艺,可实现HBM和UCIe等通讯协议多芯片的大规模自动布线;同时能够完成Dummy填充等保障量产的DFM版图后处理,更是内置无缝集成的跨工艺物理验证Argus,通过DRC / LVS等检查确保版图的正确性。凭借上述功能,Storm能够驾驭多芯片间大规模、高密度的互联布线和复杂的Layout需求。

芯和半导体的Metis 2.5D/3D先进封装SI/PI仿真平台能够进行系统级信号完整性(SI)和电源完整性(PI)仿真分析。此外,其PIDC(电源完整性直流)仿真流程可以迅速评估整版Chiplets及3DIC的电压降和电流密度热点。

同时,该公司的Hermes电磁仿真平台提供了全面的3D结构编辑和3D组件加密模型的功能,支持从芯片、封装、电路板、线缆、连接器到天线等任意3D结构的全系电磁仿真。

03

混合键合,关键设备

在设备领域,尤其重要的混合键合相关设备。

混合键合是一种用于芯片间连接的先进封装技术,包括晶圆对晶圆键合和芯片对晶圆键合两种形式。其核心在于通过金属焊盘与周围氧化物的直接接触实现连接,无需任何填充材料如焊料。该技术通过直接实现芯片间金属与介电层的键合,为高性能计算、人工智能和存储芯片等应用提供了高密度、低功耗的互连方案。

荷兰的BESI公司是当前混合键合设备领域的市场领导者,占据主导地位。该公司不仅累计订单量已超过百套,并已于2024年交付了首批具备百纳米精度的设备,同时计划在2025年底前实现50纳米精度的技术突破。另一家全球设备巨头ASMPT也取得了显著进展,在2024年第三季度向逻辑芯片客户交付了首台混合键合设备,并已获得用于下一代HBM的应用订单,预计于2025年交付。

韩国设备商在该领域的布局尤为积极。作为热压键合(TCB)市场的领先者,韩美半导体已宣布投入千亿韩元用于混合键合技术的研发与生产,计划在2027年底前推出相关设备。与此同时,LG电子选择绕过TCB技术,直接切入混合键合赛道,目标在2028年前完成概念验证,并已开始招募核心技术专家。此外,韩华半导体技术正与SK海力士合作研发,计划于2026年初推出其第二代产品。

根据华安证券研究报告,我国混合键合设备市场逐步崛起,拓荆科技、迈为股份等厂商陆续布局混合键合设备,关键技术逐步突破,有望在未来几年内提升市场份额。

拓荆科技通过控股子公司拓荆键科布局三维集成键合设备业务,已形成混合键合、熔融键合及配套量检测设备的完整产品矩阵,多款设备通过客户端验证并实现出货,应用于先进存储、逻辑芯片及图像传感器领域。该公司晶圆对晶圆键合产品Dione 300是国内首台国产混合键合设备,推出的W2W/D2W混合键合前表面预处理及键合产品均获得重复订单。

近日,迈为股份表示,其已布局半导体键合加工设备,涵盖混合键合、热压键合、临时键合和激光解键合等关键设备,旨在服务先进封装、化合物半导体和新型显示(终端为AR眼镜、车载应用)等领域。公司多台套键合设备已发往客户验证。7月15日,迈为股份宣布,公司自主研发的全自动晶圆级混合键合设备成功交付国内新客户。

04

存算一体,未来趋势?

存算一体技术旨在解决传统计算架构中的“冯·诺依曼瓶颈”问题。在该架构下,数据在独立的存储与计算单元间频繁搬运,导致了显著的延迟和功耗,在人工智能(AI)等数据密集型应用中尤为突出。为实现存算一体, 3D-IC技术提供了关键的物理基础。通过3D封装工艺,可以将高带宽内存(HBM)等存储芯片与逻辑计算芯片进行垂直堆叠,极大地缩短了数据传输路径并提升带宽,从而有效降低数据搬运的能耗与延迟,为存算一体架构的实现铺平了道路。

国际半导体厂商正在积极布局存算一体技术,并已在不同应用场景中推出商业化产品。在端侧消费电子领域,联发科已将存算一体架构集成到其天玑9500旗舰手机芯片中。该公司采用数字域与模拟域并行的技术路径,前者基于SRAM,适用于对实时性要求高的移动端任务;后者则面向能效比要求极高的边缘场景。

在云端AI推理领域,美国初创公司d-Matrix则展示了其应用。该公司发布的Corsair加速器采用了数字存算一体(DIMC)技术,通过Chiplet架构将大容量SRAM和LPDDR5X存储单元与计算功能紧密集成。其设计目标是直接在内存近端执行矩阵运算,以应对大型AI模型推理时数据搬运能耗占比过高的问题。

国产企业方面,后摩智能于今年发布了基于存算一体技术的端侧AI芯片“漫界M50”。该芯片可提供单芯片最高160TOPS的算力,并支持最大48GB内存与153.6GB/s的带宽配置。在实际性能方面,漫界M50目前已可实现7B/8B参数量的大模型达到25+ Tokens/s的推理生成速度,并已完成对DeepSeek 70B大模型的适配。该芯片理论上还可支持千亿参数规模的模型运行。

知存计算作为国内最早布局存算一体的企业之一,其量产的WTM2101芯片是全球首款基于NOR Flash的存算一体语音芯片,专注端侧低功耗语音交互场景。目前有WTM2系列,适用高能效场景;WTM-8 系列,新一代计算视觉芯片适用低功耗高算力场景,支持linux,支持AI超分、插帧、HDR、检测与识别。

站务

全部专栏