R1重大成是RL,是不用人工监督,不依赖大量标注数据的自我进化

【本文由“印加节度使”推荐,来自《DeepSeek有可能从ChatGPT“蒸馏”而来吗》评论区,标题为小编添加】

通过一个大模型的输出,来蒸馏一个效率更高的小模型是有可能的。但ChatGPT是闭源的, 你不可能知道模型的架构,在学生模型的架构设计,蒸馏策略,数据增强,教师模型中间层信息的缺失,教师模型的噪声和偏差等很多方面有大量的问题要解决, 是不是比自行组织数据有效率, 是个很大的问题。再说,R1重大成就是RL,是不用人工监督,不依赖大量标注数据的自我进化。 关键是开源和极便宜的API调用, 使任何人都能本地运行最尖端的大模型,自己微调和蒸馏出特殊用途的小模型, 打破了美国的AI护城河,戳破美国AI泡沫,动摇美国的根基。美国AI圈对此心知肚明,市场和政治需要往不同方向炒作, 以保住市场市值,保住startup都估值,政客需要完成自己的议题。

发表于上海市
01-31
科技

观察者APP,更好阅读体验

李在明:若听美国的,1997年金融危机将重现韩国

“针对中印的关键要求,冯德莱恩拒了”

阿塔对美强硬表态:寸土不让,准备好再战20年

电磁弹射!歼-35等三型舰载机在福建舰完成起降训练

“这给美印关系的棺材板钉上一颗大钉子”