R1重大成是RL,是不用人工监督,不依赖大量标注数据的自我进化
【本文由“印加节度使”推荐,来自《DeepSeek有可能从ChatGPT“蒸馏”而来吗》评论区,标题为小编添加】
通过一个大模型的输出,来蒸馏一个效率更高的小模型是有可能的。但ChatGPT是闭源的, 你不可能知道模型的架构,在学生模型的架构设计,蒸馏策略,数据增强,教师模型中间层信息的缺失,教师模型的噪声和偏差等很多方面有大量的问题要解决, 是不是比自行组织数据有效率, 是个很大的问题。再说,R1重大成就是RL,是不用人工监督,不依赖大量标注数据的自我进化。 关键是开源和极便宜的API调用, 使任何人都能本地运行最尖端的大模型,自己微调和蒸馏出特殊用途的小模型, 打破了美国的AI护城河,戳破美国AI泡沫,动摇美国的根基。美国AI圈对此心知肚明,市场和政治需要往不同方向炒作, 以保住市场市值,保住startup都估值,政客需要完成自己的议题。