老罗这场直播火了,但背后的百度AI技术更值得拆解

罗永浩又一次站在了直播行业的潮头,这次不是他亲自出镜,而是他的“数字人”。

一场持续超过6小时的 AI 数字人直播,不仅吸引超1300万人次围观,还创下了5500万元 GMV 的纪录。在这个“人人想上镜”的时代,罗永浩却用“AI”打了场漂亮的“缺席仗”。

这不仅是一次流量与销量的爆发,更是百度多年AI技术积累首次在直播间实现全链路落地的集中展示。

这直播效果,就连老罗本人也被吓了一跳。直播结束后,罗永浩发文称,“我和萧木的两个数字人在那儿眉来眼去,讲着跟我一样风格的段子,有点恍惚……但这就是现实。”

500

看到这里,乌鸦君也不得不承认:AI,不再只是后台工具,它正在成为直播的主角。

/ 01 / 罗永浩的数字人首秀,为何火爆出圈?

在百度技术的加持下,罗永浩的数字人直播首秀一战成名。

直播开播仅26分钟,GMV就超过其真人直播时段的1小时带货金额,部分3C、食品等核心品类的成交单量,甚至超过罗永浩真人首秀,直接创下数字人直播的新纪录。

比热闹更值得关注的,是这次直播背后隐藏的技术和行业突破:

一是这是业界首个双数字人互动直播间;二是基于文心4.5T升级,剧本模式让老罗数字人“懂创作”“有个性”;三是实现了业内首个多模态高度融合的数字人,让数字人轻松实现超长待机,开播超6小时;四是攻克多任务复杂场景,数字人带货效果媲美真人。

这背后也是百度研制的“剧本”驱动多模协同的数字人技术,实现了语言、声音、形象的协调一致。

500

接下来,乌鸦君来给大家仔细说道说道。

最值得一说的是,这场直播中首次引入了“双数字人带货”场景。

除了“罗永浩”,还同步上线了朱萧木的数字人,两人默契互动、配合推品,完全还原真实双人直播间的节奏感。

例如,在介绍某款产品时,老罗数字人拿起商品,朱萧木数字人会自然而然转头、接话讲解;当老罗讲解“跑偏”时,朱萧木也能及时“打断”并引导回主题——整体节奏丝滑自然,观感比许多真人直播间还强。

在“虫小将”除虫喷雾的讲解中,老罗笑称:

“你买了这个以后看到蟑螂就不怕了,甚至有点期待它出现,好让你试试这喷雾有多神。”

朱萧木立刻接话调侃:“罗老师,你这心理有点危险。”老罗随即顺势接回话题,再次介绍产品功效。

这种高密度、高拟真的对话流畅性,彻底改变了大众对“数字人带货只是预录稿件”的印象,真正做到了“像真人一样带货”。

不仅能和数字人配合默契,独特的剧本模式也让老罗数字人打破了数字人直播“自说自话”的瓶颈。

无论是讲解风格、语气语调,还是那种熟悉的“老罗式幽默”,都被几乎一比一还原。

最经典的片段之一,是有观众在直播间评论:“你是真人还是数字人?”老罗数字人直接回答道:

“这还用问吗?当然是真人啊。我这大脸盘子,这幽默的谈吐,这丰富的表情,数字人能模仿得来吗?不过虽然咱们直播间不是数字人,但产品可是实打实的好东西。”

这段回应不仅自然流畅,甚至有些“狡猾”,正是老罗一贯的风格,足见其数字人已经预设了大量个性化语料,具备极强的拟人化表现力。

据“交个朋友”团队透露,这场直播背后由 AI 驱动生成的产品讲解剧本总字数高达 9.7 万字,数字人动作组合超过8300个,涵盖语调、口音、微表情的细节打磨,并内置智能应答模块应对弹幕提问。

更为难得的是,作为业内首个多模态高度融合的数字人,罗永浩数字人不仅拥有丰富自然的动作表情和语调节奏,还能做出“拿水喝”、“坐在桌上展示坐垫”等高度贴近人类的行为动作,整个直播时长更是超过6个小时,实现了高拟真、高稳定性的长时交互。

在直播时长足够长的同时,效果也一点没落下。

整场直播累计吸引超过1300万人次观看,互动频次是真人直播间的3倍,交易总额突破5500万元。换句话说,这场直播不仅卖出了货,更引爆了关注和话题。

而这一切,离不开百度数字人在底层技术上的积累和突破。

/ 02 / 从“能说”到“能想”,百度AI让数字人“开窍”了

作为互联网最成功的“网红”之一,罗永浩一直以敏锐的商业判断著称。

这一次,他选择牵手百度AI技术,绝非偶然。其背后,正是看中了百度在 AI 电商领域深厚的技术积累。据罗永浩所属机构“交个朋友”透露,此次合作源于双方在“AI 驱动电商变革”上的高度共识。

在今日AI Day现场,百度宣布罗永浩将担任百度慧播星首席体验官,以超头部主播能力助力慧播星突破。

很多人可能并不清楚,百度其实是国内最早一批布局AI电商的大厂之一。

早在 2023 年 5 月 25 日,百度电商便正式成立,并将“智能电商”作为核心定位。自起步之初,百度就聚焦于 AI 在电商领域的深度应用。今年 4 月 25 日,百度创始人李彦宏首次提出“高说服力数字人”这一概念,并称其为“最令人激动的应用之一”。

这一前瞻性的战略布局,最终也转化为了百度在数字人技术上的行业领先。

传统数字人制作往往依赖绿幕拍摄,表演内容大多是预设话术、套路动作与僵硬表情。说话似朗诵、互动如背稿,整体体验往往“似人非人”,观感割裂。

而百度提供的解决方案则彻底不同:

它以大语言模型为核心驱动,通过 AI 生成剧本,再由剧本反向指导语音、视觉、动作的多模态协同,形成一套完整闭环的、具备音容笑貌和智能互动能力的数字人系统。

在台词设计上,百度不仅能生成多种风格,还能结合主播人设和场景进行内容规划,加入深度思考与延展知识,让数字人具备知识性、趣味性与个性化表达,真正“像一个会讲故事的人”。

语音处理方面,百度的数字人也突破了传统“朗读式合成”的限制。

不仅语音自然流畅,还能呈现语调起伏、情绪变化,使得听众能够感知主播语境与状态,实现更真实的情感沟通。

视觉与动作方面,更是显著领先于市面同类产品。

面对长达数小时的直播场景,百度通过视频生成大模型,基于剧本、语言、骨骼和面部特征等多个维度进行协同控制,实现高度一致性的长视频生成,从而保证数字人在整个直播过程中的稳定性与拟真度。

在这套体系的支撑下,百度旗下“慧播星”数字人已实现大规模商业落地。截至目前,已有超过 10 万家商户通过百度数字人直播,覆盖电商、教育、医疗、法律等多个行业。

例如,新会陈皮产地品牌“广芸堂”,过去在进行真人直播时,常常受制于主播差旅、排期等高成本问题。如今借助数字人,不仅解决了人力与场地的限制,还进一步放大了展示效果:

一方面,技术手段可直观呈现产地环境、展示原料生长状态;另一方面,灵活切镜可以精准放大陈皮的色泽、纹理、触感等细节,让“产地直采、品质可控”的抽象卖点具象化、可视化、可感知。

最终,不仅提升了消费说服力,还带动GMV实现160%的同比增长。

/ 03 / 总结

这一次的直播,不只是一次成功的技术展示,更是一场对传统直播范式的改写。

数字人不再是幕后助手,而正逐渐成为内容的生产者、品牌的表达者、转化的执行者。

而百度也正在用全栈自研的技术体系,打造一套真正具备“人格”“话术”“思维”的AI电商基础设施。从“让技术像人一样说话”,到“让内容像人一样被信任”,百度无疑走出了最难的一步。

这场直播之后,我们或许不会再用“真假”去评判数字人,而是会开始问:这个数字人,值不值得被关注?够不够专业?能不能带来转化?

答案,也许已经在直播间里得到了验证。

文/林白

500

站务

全部专栏