芯动科技重磅首发高速 UALink 全套 IP

近日,芯动科技正式宣布,国产首发高速 UALink(Ultra Accelerator Link)全套IP,支持先进的单通道高性能 112G/224G物理层,聚焦新一代AI Scale-Up(算力超级节点规模化提升)核心技术,实现 AI 基础设施领域重大突破 —— 打破 AI 设备间 “互联壁垒”,深度整合 Token 工厂核心能力,大幅提升 Token 生产效率。

以技术前置,夯实 Token 工厂产能底座

在 AI 时代,我们日常接触的 AI 对话、AI 生成内容等,背后都需要海量 “Token(词元)” 支撑,Token 是 AI 能识别的 “最小信息单元”,Token 工厂就是规模化生产这些 “AI 核心原料” 的智能基地。

随着大模型参数持续攀升,AI不断向会学习、会思考、会自主行动、架构更模块化的方向发展,单颗芯片算力存在上限,行业亟需依靠高速互联技术串联多台算力设备,实现算力聚合升级,同时主流的TP(Tensor parallelism)和EP(Expert parallelism)等算法对芯片间互联带宽和延时有着极高的要求。UALink是面向 AI 千卡算力集群、专为 AI Scale-Up 而生的开放型高速互联协议,由 AMD、谷歌、微软、阿里等 70 余家国内外厂商(芯动科技也是其中之一)联合制定。区别于传统通用以太网,UALink 舍弃冗余 TCP/IP 网络架构,采用四层极简硬件协议栈,原生支持内存读写语义,加速器之间可直接跨芯片读写显存,无须内存拷贝。

500

协议采用固定 FLIT 帧结构、硬件级链路重传,具备超低延迟、高确定性、高带宽利用率三大特性,小数据包传输效率超 93%。同时 UALink 复用现有以太网物理层、线缆与光模块,兼顾开放生态与低成本,既不像 InfiniBand(无限带宽) 封闭昂贵,也规避传统以太网延迟高、开销大、抖动明显的短板,是当前 Token 工厂、大模型训练集群的最优互联方案之一。

芯动科技此次发布的UALink IP套件,已通过客户系统验证,适配各类XPU算力芯片,广泛应用于AI超级节点,兼容800G/1.6T光模块及OIO、CPO光电融合架构。近年来,芯动科技坚持差异化研发,在量产送样的112G版本中预埋224G核心技术,支持40dB损耗信道,典型光模块应用场景下的Raw BER可达2e-10(纠错前误码率),在工艺电压和温度拉偏测试中表现优异稳定,发送和接收端测试均能通过协议一致性规范要求。同时该IP搭载纠错算法与低功耗架构,实现两代技术平滑迭代,规避传输延迟带来的产能损耗。

500

据悉,芯动科技224G UALink已完成流片,各项仿真验证参数均达标,计划年内开启全球授权。该技术将进一步强化光电互联能力,打通Token生产、传输全链路高速通道,解决行业普遍存在的“算力零散、传输受限”难题。同时UALink具备开放生态优势,兼容通用以太网硬件,相比封闭私有协议,大幅降低部署成本,适配多品牌算力设备混部。

抢占全球先机,定义下一代 AI 基础设施

依托近二十年技术沉淀,芯动科技致力于打造“存储 + 算力 + 互联”AI 三件套方案:高端内存接口保障数据高速存取,112G/224G UALink 打通传输瓶颈,自研风华系列 GPU提供强劲算力支撑。三件套关键核心技术协同发力,有力推动存算一体与光电融合深度落地,打破设备互联壁垒,实现 Token 存储、生产、传输全链路无缝衔接。除此之外,UALink 内置硬件加密模块,支持机密计算,可满足金融、政务等敏感数据训练的安全需求。

500

凭借成熟的量产交付能力,芯动科技已服务全球300余家企业,自研IP芯片累计出货量突破100亿颗,以实力跻身全球Token工厂核心合作供应商行列。未来,芯动科技将持续深耕高速互联赛道,持续优化UALink技术,赋能AI算力集群规模化升级,推动国产高端IP走向国际市场,助力客户抢占AI基础设施行业制高点。

站务

全部专栏