R1重大成是RL,是不用人工监督,不依赖大量标注数据的自我进化

【本文由“印加节度使”推荐,来自《DeepSeek有可能从ChatGPT“蒸馏”而来吗》评论区,标题为小编添加】

通过一个大模型的输出,来蒸馏一个效率更高的小模型是有可能的。但ChatGPT是闭源的, 你不可能知道模型的架构,在学生模型的架构设计,蒸馏策略,数据增强,教师模型中间层信息的缺失,教师模型的噪声和偏差等很多方面有大量的问题要解决, 是不是比自行组织数据有效率, 是个很大的问题。再说,R1重大成就是RL,是不用人工监督,不依赖大量标注数据的自我进化。 关键是开源和极便宜的API调用, 使任何人都能本地运行最尖端的大模型,自己微调和蒸馏出特殊用途的小模型, 打破了美国的AI护城河,戳破美国AI泡沫,动摇美国的根基。美国AI圈对此心知肚明,市场和政治需要往不同方向炒作, 以保住市场市值,保住startup都估值,政客需要完成自己的议题。

发表于上海市
01-31
科技

观察者APP,更好阅读体验

直播:算法向善——共话AI与人类命运共同体未来

“没客户!”获47亿补贴后,三星在美芯片厂推迟投产

美国解除对华C919发动机出口禁令

“听到东方惊雷了吗?那是14亿中国人在笑话美国”

“美国政府像青少年,拿信用卡挥霍,直到…”

直播:算法向善——共话AI与人类命运共同体未来

“没客户!”获47亿补贴后,三星在美芯片厂推迟投产