他俩首会面，“谈了DeepSeek和AI芯片出口”

guan_17078339712000

ds据说绕过了cuda架构，昇腾也可以用

02-01 15:53 来自福建省
举报
分享

新浪微博微信 QQ空间

回复踩1 赞179 收藏

回复7条

路人2022

关于昇腾和Ds的组合，Ds给出的结论 ---短期：昇腾芯片与DeepSpeed的“完美结合”尚难实现，需依赖华为自研工具链（如MindSpore + 昇腾）或社区部分适配方案，可能牺牲性能和开发便利性。 • 长期：若华为持续优化昇腾的CUDA兼容性（如通过HIP类工具）并加强开源社区合作，昇腾有望成为英伟达的替代选项，但需时间积累生态。建议方案： • 新项目：若需完全脱离英伟达生态，可基于MindSpore + 昇腾自研分布式训练方案。 • 已有项目：若依赖DeepSpeed/CUDA，可尝试通过兼容层（如TransPL等第三方工具）移植，但需验证性能和稳定性。 • 混合架构：在非关键环节使用昇腾，核心训练仍用英伟达（如合规允许），逐步过渡。最终选择需权衡技术需求、成本、合规风险及长期生态策略。

02-02 09:10 来自辽宁省
查看回复 1 举报
分享

新浪微博微信 QQ空间

回复踩0 赞1 收藏
leve

DS用的老黄更底层的PTX，而且还用了FP8训练，等于深度绑定老黄硬件了。如果用的CUDA还能移植到rocm那些。
牢厂910适配是为了大规模部署推理用的，不是拿他训练。

02-01 20:02 来自北京市
举报
分享

新浪微博微信 QQ空间

回复踩9 赞1 收藏
最后三分钟

公开的信息提到两件事。1是绕开cuda用更底层的PTX指令解决了特供显卡互联带宽不足的问题；2是采访研发工程师提到改进算法，实现某功能比原装库最少快25%的性能。
这两件事说明，一方面DS技术很厉害，能他人所不能；另一方面说明他们对NV卡的理解很深，沉没成本也很高。

02-01 18:45 来自湖南省
查看回复 2 举报
分享

新浪微博微信 QQ空间

回复踩2 赞7 收藏
镜子里的陌生人人来人往谁还在？潮起潮落我自观

然而PTX依然是NVdia的

02-01 18:33 来自广东省
查看回复 1 举报
分享

新浪微博微信 QQ空间

回复踩1 赞1 收藏
苦逼小青年

本来AI框架也没有和特定的后端绑定啊

02-01 17:03 来自甘肃省
举报
分享

新浪微博微信 QQ空间

回复踩0 赞1 收藏
天刚破晓

用昇腾就不叫绕过CUDA，那叫弃用……绕过，就必须是硬件继续用N卡，但软件不用CUDA，这才叫绕过。
补充一下：
1）用昇腾的方案，肯定有，但进展不明；这种事半道上也不可能有消息。有消息就是干成了，就跟这次DS从天而降一样。
2）绕过的说法，纯属误传，没影的事，也不值得做。浪费时间和精力。最多，就是用了嵌入式汇编，算是小小的魔改；不存在绕过一说。

02-01 16:25 来自河北省
查看回复 4 举报
分享

新浪微博微信 QQ空间

回复踩19 赞11 收藏
guan_17031322351558

英特尔amd都可以了。

02-01 16:11 来自河北省
查看回复 2 举报
分享

新浪微博微信 QQ空间

回复踩0 赞20 收藏

返回文章

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

岁月匆匆，又是一年。这一年，我们看到过巴以战场上无家可归的孩子，见证过巴黎奥运会赛场上的拼搏，也迎来了新中国的第75个生日……这一年，我们讨论经济、讨论房价股市，在现实的磨......
- 评论 71
- 赞 13
风闻社区小助手_小风

书香跨界，探索多元——世界读书日特别活动推荐书单公布啦~

在喧嚣世界中，读书是一次悄然的返航，是心灵栖居的灯火。风闻社区与万千读者共赴文字之约，于百余本热荐中，凝练出12部年度之选，构成2025年度图书推荐。春深四月，世界读书日，......
- 评论 20
- 赞 12

热门搜索

搜索历史

他俩首会面，“谈了DeepSeek和AI芯片出口”

回复7条

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

书香跨界，探索多元——世界读书日特别活动推荐书单公布啦~

最近更新的专栏

风闻最热

全部专栏