热点
- 1 过于高估世界的平均水平 16.5万
- 2 初中教材删除康乾盛世 9.6万
- 3 苹果让中国强大起来? 8.3万
- 4 车停桥下躲冰雹致拥堵 4.7万
- 5 F-35差点被击落 17.5万
- 6 回成都开面馆能成吗 3.3万
- 7 如何带领印度走出战败? 2.3万
- 8 日本路边不种树才对? 3万
- 9 歼10的艰苦研发过程 4.7万
- 10 年轻人可能爱上茅台吗? 1.0万
站务
-
请你来预测,2025年这些期待是否会发生?
岁月匆匆,又是一年。这一年,我们看到过巴以战场上无家可归的孩子,见证过巴黎奥运会赛场上的拼搏,也迎来了新中国的第75个生日……这一年,我们讨论经济、讨论房价股市,在现实的磨...... -
书香跨界,探索多元——世界读书日特别活动推荐书单公布啦~
在喧嚣世界中,读书是一次悄然的返航,是心灵栖居的灯火。风闻社区与万千读者共赴文字之约,于百余本热荐中,凝练出12部年度之选,构成2025年度图书推荐。春深四月,世界读书日,......
最近更新的专栏
风闻最热
-
1有B站UP称2024版初中历史教材删除有... 评论 421 赞 17
-
2这几天的事,让我怀疑是不是长期专注于发展... 评论 328 赞 217
-
3《Apple in China》:是苹果... 评论 154 赞 24
-
4车辆停在桥下躲冰雹导致严重拥堵,这样做违... 评论 134 赞 6
-
5“丈夫40岁年初失业,现在想拉着我一起回... 评论 132 赞 4
-
6巴基斯坦“自我克制”是一个错误 评论 123 赞 24
-
7如何看待辽宁沈阳一店铺老板自称爱心免费领... 评论 114 赞 1
-
8如果我是莫迪,我准备如何带领印度人民走出... 评论 94 赞 4
“英伟达很急:别再卡了,中国自研芯片已突围”
回复4条
也就是h100是h20性能的2到5倍,视乎不同任务的差异。
不过ai加速不需要高性能的单处理器,
ai的计算任务非常简单,只需要非常低端的处理器构成”超算“,
h100和h20都是多个处理器的堆叠,
资料:“流式多处理器(SM)架构:H100 包含 132 个 SM,
每个 SM 内含128 个 FP32 CUDA 核心
(也就是h100一张卡有 132*128=16896 个处理器)“
这就是为什么美国把阉割版h20也做限制,
因为只要堆叠几个h20,性能就超过h100了。
那为什么大家优先采购h100呢,
区别就是电力消耗不同,
h100耗电设计是h20的1.75倍,
但性能达到2到5倍,
性能/能耗比更佳。
当前制约ai算力的最大问题是电力,
其他竞争对手包括华为,
完全可以堆出比h100更快的ai加速卡,
但能耗太高行不通。
------
还有一个制约因素是出错率,
训练过程中这些卡会出错导致中断,
所以不是堆得越多越好。
例如deepseek由于卡少,
所以训练效率肯定比那些卡多的公司高。
当美国软件公司还在污蔑和质疑deepseek的高效率时,
英伟达果断宣布deepseek是最好的推理大模型,
那些软件公司就只能闭嘴了。
因为只有英伟达公司清楚哪个模型能发挥英伟达的更大效率,
美国大部分大模型都是在白白浪费电力。