打败月之暗面的,不是广东老乡的DeepSeek
文源:源媒汇
作者:谢春生
编辑:苏淮
从巨额融资、技术光环、疯狂营销到陷入沉寂,昔日的明星AI初创企业,正陷入新的困境。
“我们是典型的技术理想主义团队,用时间换空间,用积累换突破。”就在两个月前,月之暗面团队还如此形容自己的创业理念。然而,当这家明星AI初创公司最近推出会员付费模式后,却因发布虚假链接、退款封号等问题遭声讨。
从估值超30亿美元的AI独角兽,到因付费问题引发部分用户不满,月之暗面的发展轨迹颇具戏剧性。
创始人杨植麟,这位广东汕头走出的“中国大模型90后第一人”,在2023年4月创立月之暗面时,或许未曾料到,公司会如此迅速地面临严峻的商业化考验。
而更富戏剧性的是,将杨植麟推向当前困境的竞争对手DeepSeek,创始人梁文锋是一位老乡,来自广东湛江。
两位广东天才的技术路线之争,正在改写中国AI大模型的竞争格局。
01
天才的较量
杨植麟的身上从不缺少光环。
这位少年天才高中就读于汕头百年名校金山中学,凭借优异的奥赛成绩获得清华大学保送资格。尽管已经保送,杨植麟在当年高考中还是拿下了667分的高分,远超清华大学在广东的录取分数线。
2015年,杨植麟以年级第一的成绩从清华大学毕业,随后远赴卡内基梅隆大学语言技术研究所学习和工作,2019年获得博士学位。
其间,杨植麟成了AI领域的风云人物,他与多位图灵奖得主合作发表过论文,在ICLR、NeurIPS、ICML、ACL、EMNLP等计算机顶会发表论文20余篇,研究成果累计被Google Scholar引用超过17000。
学术成就之外,杨植麟还在Meta的人工智能研究院和谷歌大脑研究院工作。
2023年,早已是业内技术大牛的杨植麟,选择创立北京月之暗面科技有限公司。公司成立不到2个月,便斩获红杉中国、今日资本、真格基金等知名机构的投资,拿下近20亿元融资。
这仅仅只是开始。天眼查显示,2023年6月至2024年8月,月之暗面共计完成4轮融资,估值超30亿美元。
截图来源于天眼查
在资本的热捧下,月之暗面迅速成为国内大模型领域最具话题性的公司之一,与MiniMax、智谱AI、零一万物、百川智能、阶跃星辰并称为“AI六小虎”。
正当月之暗面高歌猛进之时,2025年年初,DeepSeek横空出世,给杨植麟来了一记“当头棒喝”。
彼时,月之暗面旗下的AI产品kimi,通过大量烧钱费时一年时间,也只获得了不足千万量级的日活用户。而DeepSeek的开源模型,在未投一分钱广告、纯靠开发者口碑传播之下,不仅7天内狂揽1亿用户,几十天内在自然流量上也达到3500万DAU(日活跃用户)。
DeepSeek这种近乎“白嫖”的增长模式,也对月之暗面造成了巨大冲击。
与杨植麟一样,DeepSeek的创始人梁文锋同样来自广东,打小亦为学校尖子生。当年,梁文锋以家乡高考状元的身份考入浙江大学电子信息工程专业,随后继续攻读信息与通信工程硕士学位。
毕业后,梁文锋先后在网易、阿里巴巴等互联网企业积累实战经验;2015年创立杭州幻方科技有限公司,后更名为浙江九章资产管理有限公司,即幻方量化。
梁文锋将人工智能应用于投资领域,幻方量化在短时间内迅速崛起,成为中国量化私募领域“四大天王”之一,管理规模突破千亿元。
不安于现状的梁文锋,2021年开始从英伟达购买数千块GPU,为进军AI领域做准备。2023年5月,梁文锋推出DeepSeek,作为资助人工智能实验室High-Flyer的一个分支。
这也为之后DeepSeek与月之暗面的争斗埋下伏笔。
02
技术路线分歧
其实,月之暗面的产品开局同样惊艳。
2023年10月,月之暗面推出首款大模型产品智能助手Kimi Chat。在当时“百模大战”的激烈竞争中,Kimi以其支持20万字长文本处理的独特能力,一举脱颖而出。
长文本能力成为了Kimi的杀手锏。在杨植麟看来,长文本只是“登月第一步”。大模型的长文本处理能力如同计算机的内存,内存越大,模型能够处理的信息量和复杂任务的能力就越强。
半年内,月之暗面团队又将长文本能力从20万字扩展至200万字。这种技术上的坚持,为其赢得了大量用户的认可。
为进一步扩大市场占有率,月之暗面开启了疯狂营销模式。
AppGrowning平台数据显示,2024年3月开始,Kimi几乎每个月的广告投放均达上千万元;当年10月、11月广告投放金额更是分别达到2.2亿元和2亿元。
高调的烧钱方式,短时间内确实为Kimi带来了流量上的剧增。据杨植麟透露,2024年10月,kimi的月活超过3600万,彼时其用户数亦超过3600万。
换言之,从0到3600万,Kimi用了一年时间。
然而,这种依靠巨额资金驱动的增长模式,很快便显露出局限性。加上DeepSeek的冲击,月之暗面内部不得不重新思考策略。
2025年2月,月之暗面决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。月之暗面的市场声量也随之减弱。
但市场将月之暗面与DeepSeek的对比却并未因此而减少。2025年2月18日,DeepSeek与月之暗面几乎同时发布论文,前者由梁文锋亲自提交;后者,杨植麟的名字则罕见地出现在论文作者的关键位置。
更为巧合的是,二者的新论文想要解决的是同一个问题:挑战一直困扰大模型的Transformer架构的注意力机制,通过自研的架构使其能处理更长的上下文。
表面上的不同在于,DeepSeek提出的新架构名为NSA(原生稀疏注意力),而月之暗面提出的新架构命名为MoBA(混合块注意力机制)。
但实际的区别是,DeepSeek的改造更为果断和彻底,而月之暗面兼顾了老机制和新机制,动态平衡,即为混合。
在NSA论文中提到,现有稀疏注意力方法存在局限性:多数方法仅在推理阶段应用稀疏性,而保留预训练的全注意力(Full Attention)主干。这种做法可能引入架构偏差,限制模型充分挖掘稀疏注意力的优势。
DeepSeek认为牺牲部分性能但是兼顾二者的方式具有局限性,试图从根本上重新设计稀疏注意力机制,遂提出了NSA。
尽管月之暗面同样认为现有的方法都行不通,但它们的解法是保留Transformer框架的同时遵循稀疏结构的原则,使模型能够在全注意力机制和稀疏注意力之间过渡。
一家完全丢弃传统结构做绝对的创新,另一家则在保留传统结构的基础上做创新。
03
商业化焦虑
月之暗面面临的挑战,亦是整个AI大模型行业的通病。
据统计,当前主流AI应用活跃率均在20%以下,用户月均使用天数基本都在3-5天,3日留存率均不到40%,30日留存不到1%。产品平均留存周期从6个月缩短至17天。
同时,IDC 数据显示,2023年到2024年两年间,一共涌现出将近200款AI应用,如今已有67%停止版本更新。
零一万物创始人李开复直言不讳地指出:“我们现在已经加速到了‘灵魂拷问’阶段,每家大模型公司都需要回答一个问题:有没有能赚钱的商业模式?”
同样的困惑也困扰着月之暗面——在获得了阿里、腾讯等巨头的巨额投资后,公司始终未能找到稳定的盈利模式。
2025年5月,Kimi开始了商业化尝试,推出了打赏功能,用户可通过购买5.20元至399元不等的礼物,获取不同的高峰期优先使用时长。
对此,月之暗面方面表示,打赏功能是一个小探索,是Kimi了解用户的方式,并强调Kimi的商业化会逐步开始探索,但还不是目前的重点。
然而,市场的耐心是有限的。投资方可能也希望月之暗面拿出他们想要的“回头钱”。
面对商业化压力,月之暗面并未放弃技术追求。2025年7月,公司发布了万亿参数开源模型Kimi K2,一举登顶全球开源模型榜首。
Kimi K2在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)等基准性能测试中,均取得开源模型中的SOTA成绩(当前最佳表现)。发布6天,已在全球最大AI开源平台HuggingFace上收获10万+下载,1400+点赞。
对此,Hugging Face联合创始人托马斯评价称:“来自中国的Kimi团队在过去几个月推出的系列模型令人印象深刻,K2更是挑战了闭源模型的极限。”
技术上的光环却未能转化为商业上的成功。9月底,月之暗面打破国内AI大模型长期免费的传统,上线付费会员服务——Kimi Agent 模式“OK Computer”开始灰度测试,并同步上线不同付费等级的会员体系。用户的投诉也随之而至。
图片来源:kimi
在黑猫投诉上,有用户投诉称,买了kimi的99元/月的Moderato的服务,要求生成文件,发过来的全部都是虚假链接;要求申请退费,结果公司也没有客服。
此外,还有用户在小红书上表示:“我付费49元订阅Kimi‘登月计划’,但体验差强人意,客服强硬拒绝退费,称一旦开通不支持退费。强烈建议大家谨慎选择,避免类似问题。”
图片来源:黑猫投诉、小红书
针对发送虚假链接、拒绝退费以及退费封号等问题,源媒汇日前致函月之暗面,截至发稿未获回复。
从资本宠儿到身陷困顿,月之暗面的发展路径犹如其名字一般,充满了光明与晦暗的双重性。
在技术的长跑里,快钱或许能买到流量,但买不到信仰。月之暗面的故事,像极了AI版的《龟兔赛跑》——当“技术兔”沉迷商业化捷径时,“开源龟”却靠持久战逆袭。
面对未来,月之暗面需要回答的核心问题是:如何让技术理想与商业现实实现平衡。而会员付费暴露出的用户槽点,或仅仅只是问题的开始。
部分图片引用网络 如有侵权请告知删除