算力租赁市场爆发,H20遭疯抢!小心掉坑

电子发烧友网报道(文/黄山明)从2022年起,美国开始持续收紧对华芯片的出口政策,而H20便是英伟达专为中国市场量身定制的AI芯片。今年以来,市场中的英伟达H20需求突然开始上涨。与此同时,市场中的算力服务器租赁需求也在爆发式的增长,更出现了“一机难求”的盛况。

AI服务器告急,H20芯片需求大涨

近期,许多上市公司纷纷发布公告,计划布局算力租赁市场。随着国产大模型的升级,算力租赁市场开始迎来高速增长,据某些算力中心人士预测,其今年的营收将比2024年增长三倍以上。

与此同时,不少公司正在加紧采购算力服务器,尤其是高性能的算力服务器更是需求旺盛。例如莲花控股孙公司莲花紫星智算科技向中建投租赁200台高性能服务器,为期三年。

有算力租赁分析师表示,从产业调研的情况来看,仅目前浮现的潜在大厂采购方可能接近300亿市场规模,预计中国2025年算力租赁市场规模有望超千亿。整体来看,2024年我国AI服务器整体市场规模190亿美元,2025年预期将达到255亿美元。

不仅是国内,海外市场中,算力租赁同样火热。前不久英伟达被爆出将收购Lepton AI,这是一家专门做搭载英伟达AI芯片服务器的公司,而此举被视为英伟达进军云计算和企业软件市场的一部分。巧合的是,就在这则消息被曝出不久后,近期市场中又传来谷歌公司正在洽谈租赁英伟达的AI服务器。

算力租赁市场的火爆,也带动了市场中AI芯片的旺盛需求。以英伟达的H20为例,尽管该芯片作为英伟达专为中国量身定制的产品,并且其性能仅为H100的十分之一,但好在可以直接在中国售卖。

有接近新华三的产业链人士透露,目前141GB H20基本被销售一空,而96GB版本也接近售罄,同时不知道未来何时能否再有供应,这需要取决于美国方面是否会放出相关禁令。

据财联社报道,H20的短缺情况从今年2月份便已有端倪,其中算力资源信息共享平台称H20咨询量为年前3倍,8卡H20机器价格较年前涨价10万,单价已经达到了110万左右。市场中算力需求主要集中在英伟达的H20,同时具有一定性价比的4090也受到了市场的青睐。

而采购方主要来自于互联网大厂,例如阿里巴巴、腾讯、字节跳动等,共向英伟达订购了价值高达160亿美元的H20服务器芯片。其中阿里在2月中旬确认了与苹果AI进行合作,苹果官网显示,中文版Apple Intelligence将于4月上线,其采用的服务器支持便来自阿里。

而腾讯方面也有相关人士透露,腾讯云已推出适配H20的四款面向不同场景的DeepSeek专属资源部署方案,并表示H20为性价比最优的选择。

AI算力市场,一时之间,好似又进入到了繁花似锦的阶段,尤其是目前H20的需求大增。其背后的原因在于DeepSeek的出现,以算法创新重构AI算力逻辑,让AI计算从训练为主转换到推理为主。虽然H20性能上有所下降,但做推理还是绰绰有余,显存足够,适合跑大规模的参数模型,价格也更低。

租赁市场仍在,但不一定是H20

在过去,大模型的私有化部署成本昂贵,仅采购商业闭源模型这一项,就需要数百万乃至上千万。如果企业规模大,使用人数多,还需要采购多套模型,成本呈指数级上升。但随着开源的DeepSeek出现后,企业可以直接免费下载,模型成本直接归零,直接点燃了市场中做AI应用的热潮。

同时,Deepseek主要的一个优势就是计算成本大大降低,其语义识别能力和推理能力非常强大。有企业透露其匹配率提升了20%左右,成本降低超过50%。

当然,对于许多想要参与的中小型企业而言,自己建立数据中心可能需要数十亿的投入,还不如直接采用租赁的方式,这也是为何近期算力租赁市场愈发火爆的原因。

但H20却不一定能一直伴随国内算力租赁市场的春风,自2022年起,美国先后将英伟达的A100、H100、A800、H800 等高性能 AI 芯片列入对华出口禁令,这才让弱化版的H20被推出。而随着前段时间,美国商务部再次将多个中国企业纳入所谓的“实体清单”,并进一步收紧H20的出口许可,未来甚至面临全面禁售。

与此同时,中国发改委正在推行数据中心的能源效率新规,要求新建或扩建的数据中心采用PUE(能源利用效率)低于1.5和符合“能效/算力比”的芯片。H20的能效表现显著低于华为昇腾、壁仞科技等国产芯片,例如壁仞科技的产品能效可以达到H20的2倍以上。

加上目前国内AI企业已经开始认可华为昇腾、寒武纪、壁仞等本土芯片产品,同时优化算法以降低算力消耗。此前,DeepSeek曾因算力不足暂停了API服务,也在倒逼行业加速构建自主算力生态。

据DeepSeek研究人员的测试结果,推理任务中,昇腾910C性能可以达到H100的60%。同时推理时代对于云计算、AI Infra架构也有着全新的需求。

此外,目前已经明确2030年前持续提升能效,H20的高能耗特性使其在算力采购中被边缘化,面临被技术性淘汰的风险。

尽管目前有消息显示,英伟达正在积极应对可能的禁令,同时计划修改H20芯片以符合中国能效标准,但这样一来性能可能会进一步下降,进一步推动企业采购国产AI芯片。虽然英伟达也可能通过租赁境外云算力,来间接服务中国客户,但这样成本较高。

因此,大摩预计,2025年中国本土AI芯片的市场份额将从2024年的15%提升至25%。而这种影响是深刻的,以腾讯为例,尽管仍然在采购H20,但腾讯也在加强芯片、模型、应用层的本土化协同,例如在其微信中集成DeepSeek模型时,还同步推进与本土芯片厂商的适配,减少对英伟达的长期依赖。

一方面是悬而未决的禁令风险导致供应链的不稳定,另一方面是中国能效政策下的驱动。显然,DeepSeek的出现固然推动了算力需求的增加,但H20未来的日子未必好过。

总结

在DeepSeek出现后,小微企业开始乘着AI应用的东风,算力租赁订单也呈爆发式增长。甚至一些企业还将大模型嵌入服务器中,降低企业的调试成本。H20作为目前唯一可以买到的英伟达AI芯片,也被市场拉抬炒作。但随着中美双方博弈持续,如今H20的爆火,更多像是一场绚丽的烟花表演。

500

声明:本文由电子发烧友原创

站务

全部专栏