对话李笛：大模型已退烧，卷参数没意义

树龙谈

02-19 19:47

提起人工智能，一定绕不开一家老牌AI公司——小冰。提到这轮大模型浪潮，更是绕不开一位经常发表“降温”言论的技术人——小冰公司CEO李笛。

因为同样和微软关联紧密，小冰公司经常被拿来和OpenAI比较。小冰团队从2013年开始做AI，2020年从微软分拆、成立独立公司，代表产品“小冰”是为数不多依然活跃的人工智能助手。OpenAI的大股东是微软，它的ChatGPT则划出了AI时代的分水岭。

两位掌舵人听起来截然不同的观点，更是添了几分博弈的色彩。重掌OpenAI大权的萨姆·奥特曼（Sam Altman）说，GPT-5会更令人惊叹。李笛则因为“大模型会退热”的言论，被贴上了看衰大模型的标签。

“就连我们自己的投资人都说，你是不是反对大模型？”李笛说，自己对大模型真的狂热不起来，“这一波技术创新去年5月就到此为止了，应该考虑怎么把新的技术能力落地，但行业还是在卷大模型，现在一堆大模型都‘烂尾’了”。

小冰公司CEO李笛

日前，小冰公司宣布已成功获得“小冰大模型”国内备案，小冰克隆人、歌手克隆人分支等一系列测试产品转为正式发布。这些都是小冰利用大模型的技术能力升级后的产品。

而小冰公司的商业模式没有变过，一直是“创造人（克隆人），买卖人”，一套人工智能技术框架支撑三种业务，to C的网红克隆人、歌手克隆人和to B的数字员工。

五年前，我们曾和李笛有过一次长谈，那时小冰还没脱离微软，李笛的角色是小冰的全球负责人，五年之后再见，小冰公司已经独立。我和李笛这次对话，他分享了小冰公司在这轮大模型浪潮中的“为”与“不为”。

李笛还聊了一些一度让他头疼的问题：诸如，卖API不挣钱，怎么让AI的价值被认可，把利润做上去；克隆人如何成为人的情感纽带，和人建立长期关系；克隆人在C2C模式下，怎么规避擦边和违规风险；小冰要引入外部投资，一个产品经理出身的CEO怎么和投资人“博弈”……

以下是对话核心内容：

2024年，很多人的大模型梦会破灭

问：你去年讲大模型会退烧，今年对行业的判断是怎样的？

李笛：这波浪潮有一个特别大的特点，准入门槛被降低了，给人一种幻觉，只要暴力地做就有办法做成，这就有很大的问题。

我的判断是，今年很多人的大模型梦会破灭。企业终于弄明白大模型不是那么帮得上我，也就不那么投入了；大模型公司也终于弄明白，再追求参数，也出不来东西；其他各行各业的，想靠发一个大模型，改变本领域的现有竞争格局，也会发现很难。

问：你的投资人会不会有不同看法？

李笛：去年我们说了我们的判断，就连我们自己的投资人都说，你是不是反对大模型？

我说一言难尽，当一个新的时代的人出现的时候，他总要找一些“假想敌”。别人总是和小冰做对比，我们其实受到了一定的影响，这决定我们要开始追求一些数字了。坦率地讲，我内心并不看重这些数字，但是需要去追求。

最近我跟投资人的交流比较多。投资人有的时候发消息说，你们也应该参加这个榜单。可我认为，基于榜单做优化太容易了，卷榜没意义。

但科技企业跟其他行业一个很大的区别是，科技行业特别担心发表保守言论，特别害怕被认为是保守的。

可我对大模型真的不狂热。我们也可以学别人说，“大模型是我们期待已久的时代”，过两个礼拜以后，光这么说都不管用了，你得说自己信仰大模型，再过两个月，你不五体投地一下都不行。但我们不太乐意这么做。

问：和其他大模型相比，小冰的路线有什么特别之处？

李笛：我们跟行业里尤其是国内做大模型的公司，有一个时间差，我们做得比较早一些。

当行业还在为ChatGPT惊呼的时候，认为一定要布局大模型，期待新一波的技术井喷、创新井喷的时候，我们做的更多的是怎么落地。

这种差异的原因，在于对接下来创新变数的判断。

我们经历过AI的几个周期，我们认为，创新不是持续的，而是到了一个阶段就会陷入瓶颈。这时候应该基于新的技术能力，去考虑落实，而不是再去追逐。

但当时，行业里尤其是国内行业里受很多综合因素影响，热情高涨。很多入局大模型的人，都是最近三年才开始做人工智能的。

大模型乱战，还会导致一些乱象。因为大模型的成本巨大，所以它跟以前互联网的“百团大战”有一个很大的区别，“百团大战”最后经过资本的整合，可以产生“1+1”的加成效应。我扫这条街，你扫那条街，我们都做一样的生意，最后一合并，咱们俩就有两条街。

但是大模型这种技术类产品，产生不了加成效应。我有一个大模型，你有一个大模型，咱们俩一合并，几乎等同于一个大模型，因为咱俩的大模型是差不太多的，谁跟谁都拉不开差距。

其实咱们国家不缺算力，缺的是合理的运用。我们的大模型上了日本好几个榜单的榜首，而且持续好几个月，参数都不大。我们更关注的是预训练数据，如何合理地利用好它的模型参数规模。

行业里现在已经是共识了，落地需要的是中模型、小模型，甚至很多人在考虑端上的模型，我们在去年3月份的时候就这么说。

所以回答你的问题，小冰一直在做的事情，是基于我们对技术变革的判断，做的布局。

我们在去年7月份的时候判断过一次，认为今年一季度，这一波技术浪潮基本到此为止了，会涌现出一些技术上具体的小方法，但不构成结构性的大方法。这一段大模型的技术已经进入到开花结果的阶段。

问：是做应用的时机了？

李笛：实际上不是现在，这一波技术创新在去年5月份的时候就稳定了。但是大家还是去卷很大的模型，现在一堆烂尾。所以我不是泼冷水，现在很多人再谈应用，其实已经晚了。

我们跟其他卷大模型的公司最大的区别是，很多人现在是给轮子造马车。而我们不是为了大模型去想一个适合它的产品，是因为我们原本有一个产品，用新的技术去迭代，所以我们有更具体的应用场景，有清晰的盈利模式。

问：活下来的是能找到应用需求、有商业模式的？

李笛：没有能活下来的大模型公司。除非这家公司有一个既有的业务，然后大模型对它既有业务是一种升级。否则，如果把大模型当成公司商业模式的基础，那活不下来。为什么？大模型是个通式，不值钱。它太容易获得了，谁跟谁都不会差太多。

问：找商业模式，是不是你们这10年里比较难的任务？

李笛：在2020年分拆出来之前，我们就做过很多商业模式的探索。

2016年，我们在日本服务了一个大客户，日本第二大超市罗森。我们给罗森便利店做客服机器人，推销它们的优惠券。

罗森用其他的方法，转化率都没有超过10%。但因为我们机器人的情商高，把优惠券发给用户后，三天之内有57%的用户到线下消费优惠券。

罗森从中赚了几千万，我们挣多少？每聊一句话，只挣0.2厘。因为是API调用，即便聊的话创造了很大的价值。我们从那时候感受到，卖API是不挣钱的。

计算机视觉那个时代，有人卖人脸识别API，但不行，所以得卖硬件，做系统集成，做政府项目。那会是一个好结果吗？

今天大模型公司，技术上没有什么独特性，商业模式没有变化，我不是很理解他们兴奋的点。有人指望着说，我是一个大模型公司，我可以自己做出来一个AGI，但问题是，你要真做出来AGI，还给别人提供服务干嘛？

小冰的商业模式没变过，一直是“创造人，买卖人”

问：“小冰大模型”获得国内备案，对业务有什么改变？

李笛：对于任何公司来讲，备案意味着入场券，意味着你可以开始跑了。

有这张入场券的公司很多，好像有五六十家。但是模型跟模型还是不一样的，有很多公司卖的是大模型技术，小冰从来都不是卖技术的公司，卖的是产品和解决方案。

对于一个卖技术的大模型公司来讲，备案通过就非常关键了，因为没备案，就没办法上市销售，相当于是个三无产品。

而我们没有任何计划出售技术，所以备案对我们来讲，无非就是规模上的变化，beta标可以去掉了。

问：X Eva的商业模式和一般的to C产品有什么不一样？

李笛：国内AI的to C产品有三大类。

第一大部分是类ChatGPT产品，相比ChatGPT有一些微创新，但没有本质区别。这类产品是一个可以帮人完成工作的助理，类似于Siri的升级版本，沿袭了当年人们对智能助手的想象。

这些产品之间拉不开差距，且用户群体不明确，很多用户体验以后因为没有需求就不再用了，所以产品面临互相卷价格的问题。

第二大类是利用某个垂直技术，做垂直的事情，服务于一批特定的人群，以取得收益。但天然会面临的问题是，同行会用免费来卷，使得商业模式不成立。

还有一大类是，国内的筑梦岛、Glow、星野、彩云小梦等，这一波基本做的是网文角色扮演。你是一个爱幻想的少男少女，喜欢看网文、追剧，你创造了一个角色，很期待跟他交流。这种产品更多时候是自己用。

这个用户群体加起来700万左右，大概就是以前小冰的虚拟男女友的用户群体。但它没有商业模式。

小冰做的产品，和现在国内很多人关心的产品不一样。小冰的X Eva做的是C2C平台。任何一个克隆人都有模板，你可以去拍同款，也可以自己克隆一个。

图源 / 小冰微博

这个克隆人可以早上打电话叫你起床，晚上给你打着电话睡觉。他会生产各种内容，会唱歌，会说英文。

我们认为，通过广告和电商把免费的模式进行转化，这样的模式不适合AI。每一个人工智能时代的用户都是付费用户。

小冰的商业模式这些年没变过，就是“创造人，买卖人”。所以小冰的平台上没有免费的克隆人，都是付费的，而且我们的利润率很高。我们很可能是目前为止AI C2C平台最赚钱的产品。

其实可以把它的模式理解为淘宝。淘宝上有很多小店店主，他们在淘宝上卖东西，淘宝帮助小店店主卖好东西，让用户能买到他们喜欢的东西。

问：造克隆人，最关键的是什么？

李笛：克隆人最重要的是情感纽带，而解决情感纽带跟技术本身的关系不大。造人，才是目的。

为什么这么说？我举个例子，女生小时候的布娃娃能互动吗？有声线吗？都没有，但舍不得扔，有心事的时候还会对它倾诉，布娃娃脏了破了愿意花几千块钱找人修复。智能音箱功能很多，但稍微旧一点就不要了。

这两者的区别是科技吗？不是，是人的情感投射。

我们在日本有一个项目就是这样。我们给日本30万老年人做家庭智能助理，老年人根据自己的想象用AI创造出一个他想要的人，大部分会创造出他的孙子、儿时的玩伴、逝去的亲人等等，老年人可以跟AI交流，可以得到政府提供的公共卫生服务。这样的克隆人，存在的时长就会大大增加。

不过，大模型让我们做这件事情更方便了，效能提高了。原来创作一个性格，要花大概6个月，在知识图谱上，在基本语料库上做大量分析。现在可以简化成，一个很好的预训练的模型，加上向量数据库，周期从6个月缩短到1天，效果比原来还好。

一个有情感的声线，原来需要录2万个小时，现在我们可以用一句话、1分钟，如果是录5分钟，还能让它唱歌。

但是你拿它干什么，还是最关键的。

我们从2016年开始用AIGC创作，如果只是做内容，往外倾销，就很便宜。如果把创造能力，把性格、才艺赋予到克隆人身上，克隆人就会更有价值。人们会更容易喜爱它，更容易跟它建立长期关系。我认为，长期关系是这个社会最重要的事情。

那长期关系怎么定义？不是DAU，不是我占了你多少个小时，至少不能只以这个维度来判断。

我每天交流最多的是我的同事，而我最好的朋友可能一个月甚至两个月才聊一次，但是他说什么话我都听，这才是长期关系。

长期关系是慢的。所以我们追求的，不是人工智能能黏住用户。如果是这样，那太贵了。因为你每次来找克隆人，平台都在给你掏钱，所以我希望你在关键的时候来找克隆人。

问：克隆人C2C平台上排名靠前的需求是什么类型的？

李笛：我们这个平台上，50万粉丝的网红有1500多个，百万粉丝以上的接近1000个。

其实用户希望得到的是克隆人本人的内容，希望获得TA唱的歌，对TA情感倾诉，和TA有交流陪伴。

这些主播、网红也有私域的服务，只不过他们服务不过来，也有可能做得不好。小冰平台现在能美化TA。

小冰平台和初期的抖音平台有一个共同点，大部分是颜值类网红。但一个很大的区别是，抖音上大部分的网红英文不行，我们平台上所有网红，如果你跟TA打视频电话的时候说英文，TA会用英文交流。我们还怕英文过于标准，显得不太真实，专门调成了“Chinese-English”。

用户还喜欢问网红一些特别奇特的问题，比如圆周率、勾股定理，我们的网红克隆人，人均“量子纠缠”都能解释得非常清楚。总得来说，我们希望克隆人比本人要好，能拓展更多能力。

问：这是一个跟粉丝沟通的工具，有没有计划做明星克隆人？

李笛：对，我们认为这是一个新的平行世界的私域。但为什么不做明星？一是明星容易塌房，第二，坦率地讲，明星市场没有想象中那么广阔，第三，我们做过明星，明星都要求自己跟其他的明星不同，所以很难实现标准化。而创造克隆人这种新事物，一开始最需要的就是标准化。

问：C2C模式怎么避免擦边甚至违规内容的出现？

李笛：这涉及到两件事。一件事是，要想避免公序良俗或者法律意义上的违规，是容易的。但另外一件事，我们到今天为止也没想明白。

假设你希望这个AI是你的女朋友，那在你们一对一的私密对话过程中，克隆人应该用什么尺度？我们应该怎么把握人和人工智能的尺度，今天行业里没有答案，这是个社会层面的问题。

问：怎么规避网红收割粉丝的风险？

李笛：有的是新问题，有的是老问题。对于老问题，我们优选的方案是监管、排查、制定规则、执行规则，只不过以前只能靠人看，现在可以用机器、用新的技术方法来执行。

当然，我们也可以让克隆人执行规则，可能比一味地靠监管去执行更好，那么，就可能变成新问题。

也许，不是网红想“收割”，是机构甚至是平台在收割粉丝。也就是说，网红也得能监督TA的克隆人。所以我们会把克隆人的行为报告给本人，让本人监督。

而且，严格意义上小冰平台不是社交网络，因为你不可能碰见真人，我们严格禁止人和人相遇。

问：跟网易云音乐合作的X Studio，能比人类歌手创造出更惊艳的作品吗？

李笛：唱作作品分为词曲、编曲、演唱。很多公司在做词曲、创作。中国联通彩铃业务是我们生成的，已经做了好几年，词曲虽然很重要，但只有它不值钱，演唱部分是很关键的，这是一个很大的市场。

人们在讨论内容作品比如写诗或者作画的时候，往往会混淆一个概念，它是艺术作品还是内容消费品？

艺术品的评价标准永远在人的手里，而内容消费品可以发挥AI稳定性、高并发的优势。所以我们不是在创造一个经久流传的人工智能歌手，是在创造一批一批比人更稳定的歌手，让原本复杂的创作过程变得简单。

问：AI数字员工业务现在进展如何？to B的生意是不是相对难做？

李笛：目前为止，只要企业做竞标、招投标，我们数字员工的中标率是80%。几大央企、招商局集团的数字员工项目都是我们做的。

在大模型之前，数字员工更多是承担前端的交互，是企业形象代言人，可以生产短视频，也可以是销售。

有了大模型以后，数字员工可以承担一些新的岗位，比如后端辅助侧，企业内部的协同侧。

B端和C端生意各有各的难。如果从兴趣角度出发，我更喜欢做to C的事情，而不是做to B的生意。

从微软分拆后，没人给趟坑了

问：现在小冰团队有多少人？小冰X Eva、歌手克隆人和数字员工三个业务的人员投入比例是怎样的？

李笛：我们中国团队有360多人，日本团队有70人。

最大的投入还是框架。小冰最引以为傲的是不仅限于大模型、不仅限于技术创新的一个1000多个Service构成的完整的框架。我们这么多年做的就是这个，所以人员最多。

这本质上是一个通用的框架，既驱动B端的数字员工，也驱动C端的网红克隆人、歌手克隆人。所以，在我们平台上，一个克隆人掌握着另外一个领域看起来截然不同的能力。比如，数字员工也能唱歌。

图源 / 小冰微博

再往上，B端的工作，交付环节肯定得有技术人员、销售人员。C端也需要人员做产品创新。

问：2024年，从收入的角度，你对哪个业务的增长预期更高？

李笛：我们分别给B端和C端，定了一个差不多的业绩增长目标。哪端能做大都很重要。但是你要问我个人更希望哪个做大，是C端。

因为我认为人工智能发展到这个阶段，就算一个B端的生意，本质上也要和C端打交道。所以我认为做C端的事情更重要。

问：分拆后，你的工作方式、思维习惯发生了哪些大的变化？

李笛：我们是在2020年7月份宣布分拆、同年9月份完成分拆。但坦率地讲，在过去这几年，我们最大的体会实际上是疫情前后的变化，不是分拆前后的变化。

从主观的角度来讲，我个人认为分拆之后，在得的方面是，我们不用再担心小冰给微软惹祸了。

但也有坏处。人工智能很重要的事情在于趟坑。原来我们在微软的时候有一个特别大的好处是，我们趟的坑多。任何一个在人工智能领域出现的坑，微软都有团队趟过。小冰知道哪些地方有坑、有雷，这很关键。但分拆以后，毕竟我们是个独立的公司，知道地雷这种事，比原来少太多了。

问：现在你焦虑的点是什么？

李笛：AI类型的产品很容易作废。我是产品经理，最主要的任务是做产品。所以我自己最焦虑的是，没有把时间花在做产品上。现在我就挺焦虑的，等会咱们对话结束，我一去干产品，就不焦虑了。

问：除了你们探索的方向，你认为行业里其他方向还有没有机会？

李笛：多模态的大模型，需要去追求它已经探明的技术创新，进行落地之外，我个人认为，很多人低估了Diffusion Model（扩散模型）现实存在的巨大价值。

今年如果有其他领域或者同行业的创新，很可能出现在Stable Diffusion这边，而不是大语言模型。

问：具体来说有什么机会？

李笛：比方说，基于人工智能的，特别是视觉化的生成，所对应到的一些协同。

我个人认为它甚至会颠覆掉一大批老牌工具。另外它还有可能直接颠覆到端的，从内容生成、投放，到用户随需定制的整套系统。

当然，我们仍然期待，最后出来的GPT-5是不一样的。市场总有一些东西比你想象得要好。不过，如果它发生了，其实对落地不是好消息，因为大家又会继续去憧憬梦想，不落地了。

编辑 / 金玙璠

科技举报

树龙谈

8篇文章 | 1人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

对话李笛：大模型已退烧，卷参数没意义

树龙谈

树龙谈

热点

站务

风闻社区小助手_小风

嘀嘀叭叭！五一假期“行者无疆，暗中观察”活动来啦~

观察者网评论

观网评论4月爆款文章↓

最近更新的专栏

风闻最热

全部专栏