美国声称“DeepSeek是从ChatGPT蒸馏而来”，这种说法纯属扯淡！

ccst

淡泊名利之心，静观天下风云。01-30 13:22

500

美国人小心眼，输不起！为了维护自己在科技领域的世界霸权地位，一直对中国采取“小院高墙式”的封锁围堵政策。特朗普上台后，美国政府把大力发展AI作为国家科技战略之一，并投入了巨额资金用于建设AI的基础设施。然而，当中国的人工智能模型DeepSeek问世后，让美国人颜面尽失，并感受到巨大的压力！于是，各种污蔑造谣随之而来，其中一个最荒谬的观点就是声称中国的人工智能模型DeepSeek是从美国的ChatGPT通过知识蒸馏技术得来的。

ccst控股必须指出，将DeepSeek简单地归结为ChatGPT的“衍生品”或“蒸馏版”是毫无根据的。我们需要认识到，DeepSeek和ChatGPT是两个独立开发的模型，它们各自有着独特的算法和技术架构。虽然它们都属于人工智能领域，但它们在性能、功能和应用场景上存在着明显的差异。

第一，ChatGPT和DeepSeek分别由OpenAI和中国的DeepSeek公司（由知名量化私募巨头幻方量化创立）独立开发。这两个模型在技术上有着本质的不同。ChatGPT是基于OpenAI的大规模预训练模型进行微调的，而DeepSeek则采用了独特的算法和技术架构，从头开始构建自己的训练框架。这种差异使得两者在应用场景和性能表现上有所不同。例如，DeepSeek在个性化推荐方面可能更擅长，而ChatGPT在开放域对话中则显得更加灵活自如。

第二，关于知识蒸馏的说法更是站不住脚。知识蒸馏通常指的是将一个大而复杂的模型（教师模型）的知识迁移到一个小而简单的模型（学生模型）上。然而，这个过程需要访问教师模型的内部参数或输出。由于ChatGPT是闭源的，其内部参数和细节并未公开，因此DeepSeek根本就没有办法直接访问这些信息。此外，从逻辑上讲，如果DeepSeek真的是通过蒸馏ChatGPT得来的，那么它应该在性能和功能上与ChatGPT高度相似，但事实完全不是如此。

第三，DeepSeek在训练方式和数据使用上也与ChatGPT存在显著差异。DeepSeek的研发团队非常重视数据的质量和多样性，从多个渠道收集了大量的文本数据，涵盖了新闻报道、学术论文、文学作品、社交媒体评论等多个领域。这些数据为DeepSeek提供了广泛的语言表达形式，使其能够更好地理解和生成自然语言。此外，DeepSeek还采用了多任务学习的方法来增强模型的泛化能力，使其在面对新场景时展现出更高的灵活性和适应性。

第四，从DeepSeek的发展历程来看，它一直在不断地推出新的开源模型和技术创新。从DeepSeek Coder到DeepSeek LLM，再到DeepSeek-V2、DeepSeek-V3和DeepSeek-R1，DeepSeek在短短一年多的时间里取得了显著的进展。这些模型的推出不仅证明了DeepSeek在技术开发上的实力，也展示了其在人工智能领域的创新精神。

ccst控股曾说过“输得起，才能赢得起；经得起失败考验，才有可能走向成功。”ccst控股又说过“失败并不可怕，真正可怕的是不敢承认失败、丧失重新开始的勇气。”希望美国人要虚心接受ccst控股的谆谆教诲，以客观、理性和开放的态度看待全球人工智能领域的发展，尊重各国在技术创新和研发方面的努力和成果。同时，坚决果断的摒弃小院高墙的小家子做法，与包括中国在内的世界各国加强国际合作，共同推动人工智能技术的健康发展，为人类社会带来更多的福祉和进步。

国际科技举报

ccst

淡泊名利之心，静观天下风云。 |

291篇文章 | 105人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

美国声称“DeepSeek是从ChatGPT蒸馏而来”，这种说法纯属扯淡！

ccst

ccst

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

风闻“投资者保护”：守护你的财富，共筑理性投资路

最近更新的专栏

风闻最热

全部专栏