壁仞科技最快年内赴港IPO,或未来几周内递表,AI芯片有望替代英伟达
据《彭博》报道,中国芯片初创企业上海壁仞智能科技考虑最早今年在香港进行首次公开募股(IPO),抓住本土客户使用其人工智能AI芯片替代NVIDIA(NVDA)产品的热潮。
消息人士称,壁仞科技计划最快未来几周提交IPO申请。该公司还在与投资者进行磋商,包括广州有政府背景的基金,拟再进行一轮融资,可能筹集约20亿元人民币。
消息人士指,上市事宜还在考虑之中,公司尚未决定IPO规模,并指未来融资的细节,包括规模和时间表,可能仍会发生变化。
壁仞科技没有回复寻求评论的请求。
综合 | 香港经济日报 阿尔法工场 中国基金报
编辑 | Arti
本文仅为信息交流之用,不构成任何交易建议
作为一家通用智能芯片设计研发商的壁仞科技,成立于2019年,团队由国内外芯片和云计算领域的专家和研发人员组成。
壁仞科技创始人张文是哈佛大学法学博士学位,曾在联合国和华尔街工作多年,先后担任高级律师和华尔街泛美亚市场资深投资人等要职,曾在多宗大型并购案中担任重要的角色,一共参与总额达176亿美元的私募基金收购。
联席CEO李新荣,曾任AMD全球副总裁、中国研发中心总经理,负责AMD大中华区的研发建设和管理工作。
CTO洪洲,曾在NVIDIA、S3、华为等工作操刀GPU工程项目,拥有超过30年的GPU领域经验。
依据之前在英伟达、AMD、高通、商汤科技等知名企业的研发经验和技术积累,壁仞科技研发了自主原创的芯片架构——壁立仞。
壁立仞架构基于SIMT(单指令多线程)模型,针对AI场景进行了专用的优化和定制。
其最大的特点,就是可以将多个小芯片拼成一个大芯片,每个小芯片只做一部分功能,然后通过高速互连组合成一个大芯片。这样可以提高芯片的良率和可靠性,同时降低成本和功耗,实现更强大的算力和扩展性。
这就是壁仞科技Chiplet的设计理念。
据了解,壁仞科技已从包括IDG资本、平安保险和招商资本在内的投资者那里筹集了约47亿元人民币。去年消息称,该公司曾寻求以170亿元人民币(24亿美元)的估值再次筹集资金。壁仞科技还在2022年8月推出了第一款通用图形处理单元。
7月7日,在2023世界人工智能大会(WAIC)启明创投论坛“生成式AI与大模型:变革与创新”上,作为通用计算体系的开发原创性公司,壁仞科技合伙人梁刚博士分享了他对大模型和算力的理解。
加入壁仞科技前,梁刚博士是业内资深大咖。他是范德堡大学电子工程学博士、西安交大无线电技术学士,在英特尔、Marvell,AMD等有过近20年工作经验,主要是从事软件方面的研发和管理。
在这20多年中,梁刚博士管理过上千人的工程团队,成功推出了数十款芯片的研发和量产。在过去8年,梁刚博士是麦肯锡资深顾问,从事半导体和软件方面的咨询。
面对目前的算力需求,多数公司使用英伟达芯片,壁仞科技作为国内自研的GPU公司,过去一年已推出BR10x芯片,并且在大模型推理和训练中逐渐起到作用。
启明创投合伙人叶冠泰与壁仞科技合伙人梁刚博士展开对话,双方探讨了高性能通用GPU如何支撑中国大模型训练与推理,呈现了中国芯训练与推理的卓越实力。
梁刚认为,壁仞科技BR100芯片的BF16算力达到512 TFLOPS,在业界是领先的,并支持TF32、BF16、INT8等多种数据精度,其中INT8的算力可达到1024TOPS。
此外,带宽方面壁仞科技自主研发的BLINK能够支持单机8卡互联,另外通过IB网卡实现多机多卡高速互联。壁仞科技SUPA的软件生态已经建成,已经支持数个大模型和训练与推理框架,并适配了多个大模型算法。
梁刚说,半导体行业没有捷径可言,因此壁仞科技会持续专注于产品研发和与用户的合作,踏踏实实做事,最后用产品说话。倾听客户需求是重中之重,在硬件方面,壁仞科技将关注在算力、显存、带宽、集群互联和安全上的需求;在软件上,壁仞科技会与合作伙伴和客户形成“应用-优化-反馈-迭代”的循环,不断提高自己。
叶冠泰认为,大模型时代,训练千亿参数、万亿参数的模型必不可少的就是算力,大模型参数规模的高速增长对GPU的能力不断提出更高的要求。大算力的GPU要支撑各种各样的模型,需要具备稳定性、扩展性、延迟控制、性价比等,展现出典型的“木桶理论”,而且大算力芯片的推广,需要整个上下游的生态支持。
在算力愈发重要的AIGC时代,任何能提高模型训练、机器学习的硬件技术,都成了各大AI企业垂涎欲滴的产物。
壁仞科技的产品BR100不仅创下了全球算力纪录,并且宣称其峰值算力达到了英伟达A100的3倍,甚至还能对标没发售的H100。
虽然目前在国产GPU突围的道路上,部分厂商已经走出了自己的路,但鉴于硬件、生态等各方面的差距,这样的道路,必定是一条充满荆棘的长路。