R1重大成是RL，是不用人工监督，不依赖大量标注数据的自我进化

CMosFet

善感温柔

【本文由“印加节度使”推荐，来自《DeepSeek有可能从ChatGPT“蒸馏”而来吗》评论区，标题为小编添加】

通过一个大模型的输出，来蒸馏一个效率更高的小模型是有可能的。但ChatGPT是闭源的，你不可能知道模型的架构，在学生模型的架构设计，蒸馏策略，数据增强，教师模型中间层信息的缺失，教师模型的噪声和偏差等很多方面有大量的问题要解决，是不是比自行组织数据有效率，是个很大的问题。再说，R1重大成就是RL，是不用人工监督，不依赖大量标注数据的自我进化。关键是开源和极便宜的API调用，使任何人都能本地运行最尖端的大模型，自己微调和蒸馏出特殊用途的小模型，打破了美国的AI护城河，戳破美国AI泡沫，动摇美国的根基。美国AI圈对此心知肚明，市场和政治需要往不同方向炒作，以保住市场市值，保住startup都估值，政客需要完成自己的议题。