对话司马华鹏:真人直播做不好,数字人也没戏

提到AI数字人,一定绕不开一家公司——硅基智能。

2017年,连续创业者司马华鹏在南京成立硅基智能,主营业务是语音(电话)机器人。次年,硅基智能决定进入数字人领域,并在2019年推出首个AIGC数字人。

那时候的自然语言理解技术尚不成熟,数字人的效果一般,行业里的热度也不高。司马华鹏带公司团队把各行业很多大V联系了一遍,免费送很多人也不愿尝试。

转折发生在2022年。10月,商业大V刘润在年度演讲中重磅推荐硅基智能的数字人,表示自己的短视频口播内容已经“不是本人”;11月底,ChatGPT横空出世,快速点燃了人们对AI大模型的热情。到了2023年初,抖音放开本地生活中的数字人直播,硅基智能的数字人批量“上岗”。

现在,有几万个直播间在用硅基智能的数字人,有的单天销售额已经做到了百万元以上。江南春、刘润、中国移动董事长杨杰等50多万名大V,都由硅基智能克隆了其数字人分身。大部分时候,你很难分辨屏幕里的人究竟是真人还是AI。司马华鹏说,希望在2025年为全球造一个亿的硅基劳动力。

“硅基”已成AI行业热词,相比人类这种DNA编码的“碳基”生物,硅基人的可复制性更强,正在很多岗位上替代人类。

司马华鹏早在2007年就提出“硅基”概念,当时他在海外创业,看到《变形金刚》上映、汽车人激战荧幕,大为震撼;后来他做杀毒软件“拯救”电脑,他认为电脑人、机器人、汽车人都是人类的朋友。所以后来再创业时,他将公司取名“硅基智能”。

当然,作为新生事物,难免会有争议。数字人直播运营门槛不低、可能被应用到电信诈骗,以及其背后的伦理和法律风险,都是未来待解决的问题。

硅基智能已进入快车道,司马华鹏则化身数字人产业的布道者。他传递宏大愿景,拆解商业逻辑,输出价值观。

500

硅基智能创始人、CEO司马华鹏

近日,抱着学习的态度,我和司马华鹏在南京进行了一次长谈。以下是对话要点。

01

“我们做的是知识传递的操作系统”

问:你们决定做数字人大概是在2018年?

司马华鹏:对。我们一直认为,硅基生命的出现是必然的。2018年底我们决定做数字人的时候,构成硅基生命的语音识别、语义理解、TTS等技术,就像木桶的木板,有的短有的长,其中NLP(自然语言理解)的能力是最短的。我们一直在等待NLP技术的成熟,之前预判会在2024年完备,2025年大规模爆发,没想到2022年年底就被补上来了。

问:早期推广数字人时,市场接受度如何?

司马华鹏:2019年推数字人,免费都没人用,免费送了有几十万个出去。但是我说,星星之火可以燎原,总能碰到欣赏我们的人。

问:是因为产品还不够完善吗?或者后续继续付费的模式还是有门槛?

司马华鹏:这跟新能源汽车有点像。前些年你花30万买辆新能源汽车,可能很多人不认同,但现在你要花30万买辆油车,估计很多人会说你落后于时代了。但其实这些年没有发生太大变化,特斯拉早就存在了。之前用数字人,有人会觉得你在欺骗粉丝,现在变成了很酷的事,都在问技术是怎么实现的。所以它必然要经历这样一个过程。

问:特斯拉的第一批车主在中国都是比较有名的人,比如李想、俞永福,你们后来推数字人也找了很多像刘润这样的大V,这是内部的推广策略变了吗?

司马华鹏:其实我们一开始找的就是大V,包括很多KOL和知识网红,但是敢于在公开场合讲出来用了数字人的,刘润是最早的。因为当时在做短视频这件事上,大部分人是没赚到钱的,大V的时间最宝贵,他们愿意用数字人来节省时间,获得更多做其他事情的机会。

500

刘润2022年度演讲

问:当时大V使用是完全免费的?

司马华鹏:免费。雀巢最早在推广咖啡的时候,发现日本人没有喝咖啡的习惯,于是推出速溶咖啡,就像糖一样搅拌一下就能喝,后来日本人才接受咖啡。包括中国人这两年也才慢慢接受咖啡。从产品到商业,中间一定要有平滑过渡,尽量减少交易摩擦,最好的方法就是免费。

问:免费的代价也很高。

司马华鹏:是的,我们的免费路线走了大概两年多时间,消耗很大。但是我们能看到数字人的商业前景,这是必须要付出的时间和资本代价,关键是要基于更远的价值来看当下的困难。

问:你们的数字人主要用在哪些场景上?

司马华鹏:我最早提出来“六个操作系统”——传递数据、传递信息、传递价值、传递体验、传递知识、传递生命,我们做的就是知识传递的操作系统。过去从来没有一个可以把知识封装起来传递的操作系统,ChatGPT和数字人诞生后,这件事变成了现实。

现在有很多家族办公室做财富的传承,但我们可以把知识封装起来传递下去。比如分众传媒创始人江南春,他基本从早到晚都在见客户,他并不想克隆自己的形象,他想克隆自己的知识和思想,这样就能服务更多企业。

问:训练数字人的数据来源于哪些渠道?

司马华鹏:我们早期积累了大量的用户和客户,他们在协议里都同意把数据拿来继续训练。这就是先发者优势,竞品的数字人既做不到我们的效果,也拿不到那么多数据。

问:像刘润的数字人,确实很难区分是不是真人。

司马华鹏:刘润配合我们打磨这个数字人花了很多心思,他的声音克隆用了5个小时的录音素材,普通人一般就录个20分钟、半小时,我估计市场上80%的人都不愿意录30分钟以上的音频给我们来训练。数字人本身是一个服务性行业,是一个精耕细作的事情。

问:你们一开始给刘润做的数字人,大家都说成本比较高,现在是不是成本降低了很多?

司马华鹏:就跟新药研发一样,在成本没有摊薄的时候,研发投入是很高的。但是现在我们有大量用户,成本摊下来了,就跟特斯拉长期降价一样,成本一定是一个长期下降的逻辑。

问:未来你们是不是可能直接免费?

司马华鹏:是的,我把商业模式倒过来。

问:但是有没有想过,可能免费了之后,站在用户的角度,他们觉得还有很多顾虑或者障碍来阻止他们用这些产品。

司马华鹏:人里面一定有先知先觉者、后知后觉者、不知不觉者,就像到最后一定有人还是坚持用油车。现在的社会因为信息茧房导致很割裂,容易人云亦云。数字人直播好不好,只有用了才知道。

02

“真人直播都做不好,数字人直播不可能做好”

问:有一些商家用完数字人之后,反馈说效果不好。

司马华鹏:他原来用真人都做不好,用数字人直播怎么做好?他都不知道怎么运营直播,就想着买一个几千块钱的工具改变公司命运,不可能的。你给老鼠身上插上翅膀,它也是蝙蝠,你给老虎身上插翅膀,那就是大怪兽了。

所以我们不能唯武器论,而应该唯根本要素论,核心的要素你能够做到,才能真正把事情做好,那才是如虎添翼。原来短视频和直播就已经做的好的人,用数字人去扩展自己的业务,效果才会好。

问:所以如果普通人想用数字人的话,可能还得慎重考虑。

司马华鹏:大V肯定管用,因为他那张脸就值钱,所以克隆出来还是值钱的,但是如果你原来这张脸就不值钱,克隆出来之后你还是不值钱的,你并没有因为数字人而形成什么特殊优势。

问:有很多企业可能没想好就上了一些数字人直播,问题反馈比较多,比如互动不及时,情绪表达比不了真人,这是很难解决的问题吗?

司马华鹏:三方面来看这件事。一是黑暗森林法则,我们现在做得好的直播间,基本上对外不讲,因为讲了之后就有很多竞对恶意投诉,把直播间给搞掉,但是好的直播间非常赚钱;第二个是图灵测试法则,在直播间你根本分辨不了他是数字人还是真人,结果就是你看不到数字人直播间;第三点,你看到的所谓数字人直播都是效果不好的,因为你都看出来是数字人了,说明效果太差了,大家基于自己看到的效果不好的数字人来评价,但我觉得这是好事。

问:为什么是好事?

司马华鹏:2023年上半年,媒体把我们捧到天上去,说数字人直播是未来,AI电商是未来,所有竞争对手都冲进来了,垃圾产品太多,打价格战,导致我们的员工、代理商、合作伙伴有时候会动摇。但最近几个月,媒体又开始捧杀,好像什么都不行。但其实我看到很多直播间在进化,尤其是一些赚到钱的直播间在变好。我觉得现在这种唱衰特别好,让我们能够安心地去做好产品。

问:所以其实做得好的都在闷声发财,什么类型的直播间适合用数字人直播?

司马华鹏:本质上就是原来做的好的,再用数字人就非常好。

问:数字人带给他的价值是什么?

司马华鹏:扩张,因为生意最难的是复制,就像开火锅店,可能第一家店开得非常好,但是复制到第五家店,就不一定能保证同样的品质。这件事麦当劳、肯德基做到了,所以成了世界上最大的连锁品牌,但中国的很多连锁品牌在店开多了之后质量就失控了。在本质上,你一开始的那家店必须做得足够好,这样在复制的时候才不至于太差,所以刘润、江南春在复制的时候就很成功。

问:所以比如像董宇辉,他在休息的时段用数字人直播,就是一种好的模式。

司马华鹏:对,它有很多种,比如董宇辉还可以开历史课、政治课、旅游课,他有很强的品牌效应,还有很好的内容团队,二者加起来就是一个强者恒强的逻辑。但是如果你原来就不强,那怎么复制都不行。你第一家店都开不好,还想开大量连锁店?开得越多砸得越快。

问:现在有多少企业客户用你们的数字人做直播?

司马华鹏:大概有几万家。

问:你们现在的B端业务是不是主要应用在直播电商这些场景?

司马华鹏:我的ToC和ToB是这么划分的:C有点像killing time(消耗时间),B有点像saving time(节省时间)。我们到底是给客户创造娱乐价值还是生产价值,是ToC和ToB的差别。

问:哪个成长性更好,或者公司的资源投入更大?

司马华鹏:我觉得有可能两者合二为一。原来ToC和ToB的划分,本质上是因为能力不足。大模型出现之前,我们可能会写1万、2万个函数,大模型出来之后,全世界就统一为一个函数:y等于fx。这个f非常强大,你的所有x进来我都能给你做,它既可以是工具助手,也可以是陪伴助手。本质上它会从工具集合变成情感集合,类似于超级伴侣,会慢慢融合起来。

问:在中国做C端生意其实也有很多问题,比较难建立收入模式,想让C端用户付费比较难,大家习惯用免费的产品。这一块你们是怎么考虑的?

司马华鹏:这取决于你给客户带来的价值。在服务这件事上,大家不一定是追求免费和便宜的,就像修脚,如果是免费,你会怀疑刀是不是没消毒,不太敢用。今天的问题不在于大家付不起钱,而是你能不能提供很好的服务。免费所带来的效果差,其实并不能给客户带来真正的价值。

问:现在ToC的服务上,营收状况怎样?

司马华鹏:我们处于ToC和ToB的交换期,原有的传统ToB业务每年还有很大规模,ToC业务也涨得非常好,8000元一个的克隆我们也卖了接近上万个。现在我们成本降下来了,接下来可能会把价格降到非常便宜。

03

“数字人直播跟股市一样,只有20%的人能赚钱”

问:有很多商家说数字人割韭菜,代理商把数字人卖出去后,商家播了没多久就被封号。怎么解决数字人直播间被封号的问题?

司马华鹏:封号一般是违反了抖音的几个核心原则,首先就是不录播原则,数字人其实并没有改变什么,就是很多商家连写个新话术让数字人重新讲都不愿意,相同的话术重复播。

抖音就是一个平台,大家在上面干活,干完领工资,只是抖音发的是流量。录播就是摸鱼,想不干活还领工资,那平台一定会给你堵上。商家有个误区,把数字人理解成在抖音摸鱼的工具,他们认为就应该电脑自动在那跑,应该给他赚钱。这就像自动驾驶,大家渲染成L4、L5级了,好像车往那一放就能赚钱,但实际是半自动驾驶,市区还得自己开。这是有大问题的。

问:所以新能源车企后来也不敢宣传高级别自动驾驶了。但数字人行业有个很大问题,代理商往往会夸大其词,给一些根本实现不了的承诺,让商家觉得被割韭菜了。

司马华鹏:所以我觉得一个行业不要太火,这是对行业很大的保护。因为这两年中国的创业机会比较少,我们把数字人产业带起来之后,鱼龙混杂进来一群人。而一些信息传播经常是以讹传讹,比如我们有个客户筹备了一周时间,背后还有真人配合,用数字人直播做了68万GMV,传出去变成了AI一晚上赚68万,这就产生了很多误解和误差。

问:这个行业不管是商家还是代理商都需要理性一点。

司马华鹏:我觉得就像啤酒,适当有点泡沫不是坏事,但你别弄吹出来的肥皂泡,把AI吹到天上去。数字人直播跟股市一样,只有20%的人能赚钱。

问:抖音在5月发布了数字人行业倡议,对数字人进行了一些限制。这个倡议对行业的影响体现在哪些方面?近三个月数字人产品的销售有变化吗?

司马华鹏:这个事情的核心,是有一批人拿着数字人做电商,触及到了抖音的核心利益。一开始大家用数字人做本地生活直播是非常合适的场景,但是商家赚的少,于是得陇望蜀,去做更赚钱的电商卖货,改变了游戏规则,抖音必然会采取行动。直播电商的核心是信用,主播靠个人IP和信用活下去,而数字人本身是很难有信用的。你来挑战这个核心逻辑,就会造成很多问题。

问:所以其实在平台的推流上,可能数字人去做直播也会受到非常大的限制?

司马华鹏:没有,都差不多。字节是一个算法治理的公司,只是以前没有加入对数字人的规则。抖音的核心规则是,直播一只狗都能有很多流量,根本跟你是不是人没关系,跟是不是数字人也没关系。观众有没有产生情绪价值和互动价值才是关键。

问:在淘宝直播、快手,以及拼多多、京东这些平台上,数字人的空间大不大?业务量现在怎么样?

司马华鹏:不论哪个平台,本质上开直播的逻辑都是把服务前置成一种宣传,销售跟服务在一个体系里面实现了。拼多多也好,淘宝、京东、亚马逊、TikTok也好,全都需要数字人。

500

硅基数字人直播间85万成交额

问:过去半年里新成立了2万多家跟数字人相关的公司,腾讯、百度、京东、华为等巨头也在做自己的数字人产品。这会对硅基智能造成影响吗?在这种竞争中,你们采取什么策略让自己保持竞争力?

司马华鹏:我们在2017年就预判到今天所有的竞争了。硅基智能是第一个站出来为数字人布道的公司,人是定义万物的尺度,数字人是定义元宇宙的尺度,当一个人的数字分身赚的钱超过他肉体赚的钱,他才进入元宇宙。所以谁能够一年给客户赚100万,谁就是好的大模型。

问:所以你觉得竞争的本质还是有没有给客户创造价值。

司马华鹏:最好是全自动创造价值。我们找到非常多自动化赚钱场景,真的给你赚100万,这个是很牛的,所以我是遵循那个方式的,而且我是朝那个方向走的。

问:什么场景?

司马华鹏:我们还有非常多的产业都在自动化运行,我们也不准备让它露出水面。就像如果你有一个很能赚钱的AI,你到底是拿出去卖还是自己用?我们一定是自己用的逻辑,这是基本的常识。

04

“200多个大模型不是太多,而是太少”

问:公开信息显示你们最新一轮融资停留在2020年,近三年都没有融资,为什么?

司马华鹏:我们其实在人工智能最好的时间点,把子弹都准备好了,足够我们发展,因为我们公司就200多个人,然后在南京成本相对比较低。另外这几年我们一直在追求打平,2023年基本打平了。第三个原因是我在成立这家公司之初,就拿了20%的股份给以前投过我的一些老投资人,经过多轮融资之后,我们团队大概只有40%,如果没有特别好的估值,我们也不太愿意再去稀释,否则公司就没有控股股东了,上市的时候就比较麻烦。

问:有很多公司都能做数字人,数字人的技术门槛到底有多高?大家的差距体现在哪些地方?

司马华鹏:中国大模型,从百模大战到千模大战,其中只有少数具备原创能力,有很多是套壳。我觉得在市场发展的第一阶段很正常,就像三国末年,从诸侯逐鹿中原到三足鼎立,最后到华夏一统。数字人领域也有跟百团大战一样的逻辑。

问:现在全国号称有200多个大模型,你们也发布了自己的大模型,市场需要这么多大模型吗?

司马华鹏:我觉得200多个大模型不是太多,而是太少了,中国应该有1万家做大模型的公司。中国文化里有成王败寇的思想,总是去看成败得失,大家会觉得大模型不如让百度、华为这些巨头做好了,但这样的话,大模型的技术就永远不会在市场上流传开来。

两百多家大模型企业,至少保障了中国大模型的生态多样性,哪怕最后钱都烧掉了,它属于科技创新,也是有价值的。就像芯片产业,一个一个芯片公司倒掉,但培养了大量人才,然后又出来继续做芯片,一代一代积累到今天,最后才出现伟大的公司。

问:大家对这些公司可能有一些看法,觉得跟风的比较多,有一些大模型是套壳,还有一些上市公司就是想炒股,整体评价不是特别正面。

司马华鹏:我觉得做生意或做商业,就不要道德论。中国改革开放40年发展最好的时候,就是符合了亚当斯密的私心论。我们没必要拿道德标准去套每个人,指望每个人都发自圣人之心,做大模型就是为国为民。

每个人都有私心,有的想拉股票,有的想拿投资,有的想发展,这很正常。就像人性不可考验,我们为什么要考验一家企业的人性呢?我们要尊重科技、商业的多样性。

问:很多人担心数字人会被应用到黑灰产,比如电信诈骗,这方面有什么好的办法?

司马华鹏:首先我觉得我国的立法现在比欧美先进、先行,另外我们是严格遵守国家的要求的,数字人必须先声明,做数字人要拿身份证拍照,整体已经非常规范了。

问:硅基智能也有数字永生业务,你怎么看待这方面的伦理和法律风险?

司马华鹏:数字永生其实是人类的刚需,我们是坚定的数字永生派,因为我觉得其他永生的方式很难。我们肯定是遵守法律,作为行业的领头羊,我们也要带头做好。

问:你在描绘愿景的时候比较宏大。

司马华鹏:对,如果一个东西小,就容易钻牛角尖,但是如果拉长了看,好多困难都不是困难,好多痛苦就不是痛苦。目标大了,当下痛苦就少了。否则创业的痛苦就跟马斯克讲的那样:凝望着深渊,咀嚼着玻璃。我会习惯性地给公司提供正能量,给大家拉长了看,往宏大来看。

编辑 / 黎明

站务

全部专栏