“英伟达很急：别再卡了，中国自研芯片已突围”

guan_16745385081945

那个新闻说的8倍差距？给个链接呗！

04-18 23:54 来自湖北省
举报
分享

新浪微博微信 QQ空间

回复踩0 赞172 收藏

回复4条

康泰

AI芯片的差距在使用端没有那么夸张的，可以通过堆砌缩小差距，只不过成本高了

04-19 10:34 来自辽宁省
举报
分享

新浪微博微信 QQ空间

回复踩0 赞0 收藏
呼呼猫

新闻：H20作为美国出口管制下的“特供版”，性能缩水引发市场争议。尽管其计算性能仅为H100的20%-50%
也就是h100是h20性能的2到5倍，视乎不同任务的差异。
不过ai加速不需要高性能的单处理器，
ai的计算任务非常简单，只需要非常低端的处理器构成”超算“，
h100和h20都是多个处理器的堆叠，
资料：“流式多处理器（SM）架构：H100 包含 132 个 SM，
每个 SM 内含128 个 FP32 CUDA 核心
（也就是h100一张卡有 132*128=16896 个处理器）“
这就是为什么美国把阉割版h20也做限制，
因为只要堆叠几个h20，性能就超过h100了。
那为什么大家优先采购h100呢，
区别就是电力消耗不同，
h100耗电设计是h20的1.75倍，
但性能达到2到5倍，
性能/能耗比更佳。
当前制约ai算力的最大问题是电力，
其他竞争对手包括华为，
完全可以堆出比h100更快的ai加速卡，
但能耗太高行不通。
------
还有一个制约因素是出错率，
训练过程中这些卡会出错导致中断，
所以不是堆得越多越好。
例如deepseek由于卡少，
所以训练效率肯定比那些卡多的公司高。
当美国软件公司还在污蔑和质疑deepseek的高效率时，
英伟达果断宣布deepseek是最好的推理大模型，
那些软件公司就只能闭嘴了。
因为只有英伟达公司清楚哪个模型能发挥英伟达的更大效率，
美国大部分大模型都是在白白浪费电力。

04-19 02:31 来自广东省
举报
分享

新浪微博微信 QQ空间

回复踩0 赞0 收藏
克言

从公布的参数来看，H20主要被阉割的是算力，H20的FP16、INT8等主要算力参数仅为A100的不足1/2，更是仅为H100的约1/7；但是H20有着惊人的带宽（HBM容量96GB），而且H20通过NVlink架构，通过多卡使用、多卡堆叠模式，推理性能甚至可以超越非阉割版的H100，仅略逊于H200，其显存带宽在Decode阶段H20每生成1个Token所需时间，通过测试低于A100、H100，这也使得H20在整个推理过程具有较高的推理速度。

04-19 01:40 来自广东省
举报
分享

新浪微博微信 QQ空间

回复踩1 赞0 收藏
Verchiel

嘴链罢了，看看“川普总统”四个字就知道咋回事，从哪来的了。

04-19 00:14 来自陕西省
查看回复 1 举报
分享

新浪微博微信 QQ空间

回复踩0 赞24 收藏

返回文章

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

岁月匆匆，又是一年。这一年，我们看到过巴以战场上无家可归的孩子，见证过巴黎奥运会赛场上的拼搏，也迎来了新中国的第75个生日……这一年，我们讨论经济、讨论房价股市，在现实的磨......
- 评论 71
- 赞 13
风闻社区小助手_小风

书香跨界，探索多元——世界读书日特别活动推荐书单公布啦~

在喧嚣世界中，读书是一次悄然的返航，是心灵栖居的灯火。风闻社区与万千读者共赴文字之约，于百余本热荐中，凝练出12部年度之选，构成2025年度图书推荐。春深四月，世界读书日，......
- 评论 20
- 赞 13

热门搜索

搜索历史

“英伟达很急：别再卡了，中国自研芯片已突围”

回复4条

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

书香跨界，探索多元——世界读书日特别活动推荐书单公布啦~

最近更新的专栏

风闻最热

全部专栏