揭秘DeepSeek团队:聪明、理工科、年轻、经验少

2024年中国大模型圈最火的是哪家?杭州深度求索人工智能基础技术研究有限公司深度求索(以下简称DeepSeek)一定榜上有名,如果说作为去年年中大模型价格战的发起者,DeepSeek初入公众视野,到了岁末年初先后对外发布开源模型DeepSeek-V3和推理模型DeepSeek-R1后,彻底引爆了大模型圈的舆论场。

人们一边惊讶于其高性价比的训练成本(据说DeepSeek-V3仅花费了557.6万美元的训练成本),另一方面为其模型开源和公开技术报告的行为鼓掌称赞。DeepSeek-R1的发布,让不少科学家、开发者和用户们都兴奋不已,甚至被认为是OpenAI的O1等“推理”模型强有力的竞争对手。

此前,OpenAI前政策主管、Anthropic联合创始人Jack
Clark认为DeepSeek雇用了“一批高深莫测的奇才”,对此,DeepSeek创始人梁文锋在接受自媒体采访时也曾透露过,并没有什么高深莫测的奇才,都是来自Top高校的毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

从目前已有的媒体公开报道中可以看出,DeepSeek团队最大的特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。

有负责大模型领域挖掘高端科技人才的猎头告诉记者,DeepSeek的用人逻辑和大模型领域其他公司的用人逻辑并无太大差异,对人才的核心标签都是“年轻高潜”,即年龄在1998年出生左右,工作经验最好不要超过五年,“聪明、理工科、年轻、经验少。”(澎湃新闻)

500

站务

全部专栏