“橙篇”背后的百度文库,如何做好“AI 原生化”?

500

百度大模型的「先锋」,是怎么做产品的?

对话 | 张鹏

编辑 | 连冉、靖宇

累计 AI 用户数已经突破 1.4 亿,使用次数突破 15 亿——AI 重构之下,百度文库焕发了全新活力。在「AI 产品榜」的 5 月份榜单中,百度文库 AI 功能更是以单月 6536 万访问量位列国内总榜首位,甩开第二名将近 1500 万的身位。

成立十余年的百度文库,是如何在 AI 时代迸发出强大的吸引力的?

当 AI 作为一项创新的底层技术被整合进产品系统中,如何理解百度文库的演进轨迹,及其在产品使用和目标上的转变?作为行业最火的 AI 原生应用之一,它是如何实现进化的?

近日,在与极客公园创始人、总裁张鹏的对谈中,百度副总裁、文库事业部负责人王颖给出了解答。

去年 8 月至今,百度文库经过大模型的重构,已经实现了从内容理解、规划到生成的全流程智能化。目前,百度文库背后的团队仅有两百余人,而在交付上实现正反馈之外,他们甚至还做到了商业上的正循环

在 5 月底,百度文库推出了新产品「橙篇」,是行业首个集「专业知识检索和问答、超长图文理解和生成、深度编辑和整理、跨模态自由创作」的「查阅创编」一站式 AI 自由创作平台,未来,文库和橙篇也会建立自己的内容分发体系。

在这一波大模型的浪潮中,百度文库的转型既借助了技术的跃进,也是对用户需求深刻理解的体现。如今,百度文库已进入与过去截然不同的发展阶段,产品正在并将继续经历一系列变革,而这些变革或许将彻底改变人们对文库的常规认知和使用习惯。

「理想的 AI,应该端到端解决问题,让机器像人一样思考,让产品像人一样工作。」AI 重构后的百度文库,已经做到了这一点。去年的极客公园创新大会 2024 上,百度创始人、董事长兼首席执行官李彦宏曾强调过,AI 的真正价值在于原生应用的开发,而橙篇作为新近推出的 AI Native 产品,正在为用户创作展开更广阔的可能。

从将所有旗下应用全部用大模型进行重塑,到文库成为跑在最前面的那个队伍,可以看得到,百度做 AI 的决心并非纸上谈兵,而是正在不断突破创新应用场景,用 AI 深度重构产品,为用户持续提供属于这个大模型时代的智能增益。

在对谈中,百度副总裁、文库事业部负责人王颖输出了一些精彩观点:

「文库会是一站式 AI 内容获取和创作平台,创作从文库开始就好了。」

「目标对不齐,来自于标准对不齐。」

「一开始做产品,心里就有一张损益表。」

500

01

AI 重塑下的百度文库

张鹏:文库在引入智能技术初期的决策过程是怎么样的?是如何设定第一个目标并逐步发展的?

王颖: 我们首先考虑了两个关键点。第一,我们引入了大模型技术,评估它在哪些领域有显著的能力提升,以及还有什么缺陷,AI 技术自 20 世纪 50 年代以来一直在发展,但大模型的出现标志着创作的能力飞跃,这个技术飞跃是不是能解决目前用户的问题。

第二,我们深入挖掘了用户在文库的需求。传统上,人们认为文库只是一个文档检索平台,但通过深入分析,我们发现用户找内容不仅仅是为了阅读,而是为了写作。我们进一步探究了用户为何寻找内容,以及找到内容后他们要做什么。我们意识到,用户的核心目的不是为了找内容本身,而是为了支持他们的写作需求。

写作有两条路径,第一条路径,擅长写的用户上手打开编辑器就写了,还有一种不会写的用户,他们第一步需要找素材。

50% 的用户属于第二类,他们需要找素材并进行组合和编辑。即使是擅长写作的用户,在写作过程中也常常需要寻找专业素材和灵感。这些都是文库用户的需求,也显示出找和写的需求实际上是一个统一的需求,只是由于过去的技术水平限制,这个过程不得不被分割在不同的工具和平台上进行。

张鹏:所以在技术进步的推动下,文库有机会更深入地满足用户需求了。

王颖:我们一开始就知道用户有一个完整的需求,但原来的技术和产品限制只能解决其中的一部分,只能提高一部分效率。其实,人工智能的本质是让机器像人一样思考。

做人工智能产品,就要让产品像人一样工作,帮用户完成所有工作。我们最初的重构思路是:既然有了这种技术,我们要让产品像人一样工作,端到端地解决问题,而不是只解决一个环节的问题。

很多人认为文库是用来搜资料的,质疑我们为什么要用大模型。可以回想一下去年 3 月份,很多平台是这么做的:用户搜索不到内容时,他们用大模型生成一篇给用户。可是这种做法并没有解决用户的本质需求。就像我们买米是为了做饭吃饱,而不是为了单纯拥有米。

我们最开始的目标是让产品像人一样思考,端到端地解决问题,在实现这个目标的过程中,确实遇到过很多问题。

用户对文库的认知是一个资料库,用来存储和查找资料,这个认知非常强烈。

我们要做的第一件事是让用户过来查找资料,并让用户继续留在这里,让他们知道文库也能帮助写作。

所以,我们在理解到用户在查找资料后可能需要编辑和创作时,就提供相应的能力,当技术进一步成熟时,我们就直接搭建新功能支持写作,比如后续文库就推出了各种格式的写作功能,到现在文库又推出的全新 App——橙篇,用户不仅可以查找资料,还可以直接进行写作。

张鹏:在找到文档和内容后,用户还需要对它们进行进一步加工、转化和存储,使其未来可以结构化使用。所以第一步是将这个过程延长,而不是直接到写作阶段,这些工作是什么时候进行的?

王颖:用户进入文库后,我们不仅提供文档搜索能力,还提供写作相关的能力。当你找到一篇文档后,可以进行扩写、改写,甚至基于文档内容制作 PPT。

这些工作是在去年 5 月份之前进行的。当时我们还没有编辑器,因此只能先做这些基础工作。然后我们一边开发编辑器,一边进行 AI 渗透,让用户知道文库有 AI 功能,AI 对写作有帮助,这是一个并行的过程。编辑器做完以后,我们直接推出了完整写作功能,用户就可以直接进入写作阶段。

张鹏:文库有画本的功能,这个功能用户的反馈怎么样?

王颖:画本功能分享率很高,有 30%。这个功能成本有点高,不过推出一个半月我们已经把成本下降了一个量级,到今年年底成本应该都算不上负担了。

现在文库所有的 AI 功能没有优化到位就不推,现在是因为到位了,所以就开始推了,转化率也特别好。

张鹏:所以文库不光交付实现了正反馈,商业上也做到了正循环。

王颖:我们从一开始做项目,就是从一张损益表开始的。

02

「模型接入」的挑战

张鹏:那么后来真正把模型接入,是很简单的事吗?还是说需要和模型团队磨合很久?

王颖: 我们没有觉得很简单。大家对使用模型的理解不同。以前的模型是解决专用问题,现在的通用模型解决很多问题。

通用模型有它的限制,所以我们用 MoE 来解决问题。首先,通用模型能力有限,我也不能全都用大模型,那样成本太高,现在 AI 应用赔钱就是因为成本问题。

我们把大模型看作大脑,它负责理解和分工,复杂的问题用大模型解决,其他的功能用不同的模型来做。

事实上,文库做到今天,我们有对模型进行精调,但并没有用想象的那么多的精调数据,因为要求的不是数据数量,而是数据质量够不够好,够不够均衡。并且,文库有自己的算法工程来做 Prompt(提示词)优化,包括使用不同尺寸的模型来执行不同的任务,最终将它们整合起来,形成一个协调一致的系统。

文库从第一天开始,就让产品像人一样思考,像人一样工作。这种思考和分工是持续进行的,我们从来没有在大模型上纠结过。

到目前为止,我们和大模型团队一起真正合作开发的定制能力只有两个:

一个是字数控制,大模型的多样性决定了依从性问题的存在:模型团队一开始不能完全理解这个需求,因为在搜索场景中,字数长短内容无所谓,但对文库用户来说不一样,如果用户要求写 500 字,它却写了 1500 字,就给用户增加了删减的负担。现在,文心一言在字数依从性上可以做到上下浮动 5%。

另一个是理解和生成:我们提供很多文档解析能力,以及专业文档的标准和专家标准,然后模型去训练这些内容。这两件事是我们与模型团队真正共建的。

03

AI 重构,核心在于「价值」

张鹏:你要求产品团队首先对于模型有根本性的理解,且对自己如何运用模型,一上来就要清晰的认识。

王颖: 对,现在的组织结构中,产品和策略是要融合的。过去的工作流程里,是算法团队来负责策略算法,产品负责提需求,产品团队提供产品原型可以了。现在这种模式行不通了,每个人都要渗透到对方的领域。原来是阵地型打法,现在得全攻全守往前推进。

张鹏:是什么让你下定决心必须这样?

王颖:标准不一致就会导致目标不一致。另外,交付不等于用户满意。成熟的业务有明确的标准。但对于全新重构的项目而言,如果没有建立明确的标准,光是以物理上线为目标,而不是以用户的实际满意度为目标,是行不通的。

张鹏:上一个时代的产品经理需要懂人性,但今天光懂人性不够,还需要懂模型。

王颖: 对,因为我们建立的是人和机器沟通的桥梁。

张鹏:你是怎么管理产品需求、定义和实现效果的?

王颖: 我会把各方面都搞得清晰。从最开始的需求判断是不是应该这么做,产品怎么定义,哪些是突出的卖点,应该实现什么样的效果。也画产品图,包括交互设计和一些 UI 设计,会带着团队一起来做。不同的生成路径也会关注,比如做 PPT 的生成路径和做漫画的生成路径是不一样的。但是在同一个产品中又不能让用户在生成不同内容或不同品类时,都感觉像在使用一个不同的东西一样。这些流程需要重新设计。

张鹏:做完第一步,把第一个延长线画了,看到什么样的数据变化?

王颖:用户使用时长有变化了,翻倍了。

张鹏:上线多长时间看到的?

王颖:大概是一个月。不光使用时长翻倍了,留存也提升了。

张鹏:怎么从时长的翻倍,去解读用户的收获?

王颖:看结果。以前的用户基本上是找到就下载,时间很短。现在会发现用户有了更多的互动,会调用各种功能,自然时间就变长了。

还有一个关键指标是下载完成后本地使用。毕竟下载可用了,才会下载。

张鹏:下载下来意味着有效交付完成了。

王颖:对,要么下载,要么分享转发。还要关注留存和活跃留存率,也就是用了某项功能的用户,第二天再次使用的比例是否超过以往。只有用户觉得功能有用,才会再次回来使用。就像去饭馆吃饭一样,如果今天不好吃,明天还会再来的人肯定不多。

张鹏:做到这一步有没有很复杂的技术挑战?

王颖:有很多,举个例子,在初期的文档写作中,除了大家熟知的幻觉问题还有字数依从方面。其实很多时候扩写 1.5 倍就够了,但之前有一些大模型的扩写长度赶上重写一篇了,这就不太好。文库推动解决的就是这一点。

张鹏:怎么去定义字数依从性的合理指标?扩写要做好是怎么做到的?

王颖:我们做了大量调研去了解用户对扩写的期待是什么样的。用大模型重构产品的时候,很多人不知道标准怎么建立,但其实标准不是存在于行业,而是藏在用户心里。

用户对新事物总是有所期待,我们得去满足这些期待,高太多,用户可能不理解,低于期待值更不行。找到用户的期待值,比它高一格就是标准。

产品刚上线的时候,我们邀请测试、维护了四个用户群,每个群里有两百人,版本出来就给这些群里的用户使用,他们会给到一些反馈。

张鹏:所以扩写也是在这一波前期测试过程当中,用户提出问题,然后你们反过来进行调研,到底应该怎么扩写。

王颖:对,因为 Prompt 解决不了这个问题。有些大模型问题是 Prompt 无法解决的。大模型的特性就是多样性,而多样性会导致依从性差,这是必须要解决的问题。现在一般的扩写比例是 1.5~2。

张鹏:所以这是一个扩写的黄金比例。在做这个的同时你们还在搭编辑器,这个事情复杂吗?

王颖:很复杂。复杂之处在于几个方面。

首先,不同的文件类型需要不同的编辑器,比如 Word、PPT、Excel 需要的编辑器都不一样。这导致用户在处理文件时需要频繁地切换。

其次,进入编辑器之前,文件可能存在多种格式,增加了处理的复杂性。

最后,编辑器本身的工具非常繁多,使用指令复杂,每个编辑器可能有数百个指令,如果每个都要实现,工作量非常巨大。

此外,这是一个强工程项目,像 Word 或 Office 这样的产品本身也是编辑器,我们做编辑器不是要跟它们做一样的产品,我们要做的是融合编辑器,这个编辑器要兼容所有的文件格式,用户不需要关心格式问题,只需要告诉我们需要完成什么任务即可。

百度原来没有这方面对应的积累,我们是从头开始做的。

张鹏:上线之后用户的反应怎么样?

王颖:扩写和续写对编辑器的要求并不高。真正对编辑器要求高的是 PPT。PPT 功能推出之前,扩写仅限于文本,我们对编辑器的理解和难度的把握都相对有限。

PPT 功能的出现,使得操作空间扩展了。首先,PPT 本身的制作难度就比文本要大;其次,现在能够在同一个平台上进行格式转换,融合编辑器的优势也就体现出来了。如果只限于 Word,能做的就只是文字处理,但有了融合编辑器,不仅可以处理 PPT,还能实现 PPT 与 Word 之间的格式转换,甚至还能制作图表。

张鹏:PPT 能力上线之后,用户能明显感觉到文库编辑器的意义所在了。接下来用户数据变化怎么样?

王颖:非常明显。各种用户数据曲线陡峭上升。去年 9 月到 10 月,DAU 从 30 万爬升到 140 万。

张鹏:所以文库接下来会是什么样的产品定义?

王颖:一站式 AI 内容获取和创作平台,所有创作从文库这里开始就好了。

张鹏:分发怎么做,有一键转发功能吗?

王颖:有。用户不需要考虑素材的来源、格式或者具体细节,他们只需将内容提供给文库,输出支持包括存储、转发、分享等。

张鹏:这样听下来,文库像是个人写作的操作系统。

王颖:对,除此之外,还希望文库有自己的生态,可以分发内容。

张鹏:Robin 说文库是被 AI 重构最好的产品,你有没有听他定义过他认为的好是在于什么?

王颖:核心就是价值,为用户、行业带来什么价值,有没有价值重构,提供价值增量。

给用户提供了价值,用户就会用脚投票,同时价值会反哺大模型,利用人类行为反馈提升自身性能。

04

橙篇——「长文创作、批量赋能」

张鹏:文库最近推出了橙篇这个产品,对它的定位是什么?

王颖:我们希望橙篇能够成就人生新篇章。除了专业写作以外,橙篇未来还将注重休闲娱乐性质的写作,以及分享互动的功能。

500

张鹏:文库这样的平台本身也支持创作,橙篇的推出是出于什么考虑?

王颖:用户在创作过程中存在两种情况:一半的用户因为不知道如何着手开始,需要找资料参考,另一半则能够直接开始写作。尽管文库已经积累了 15 年的经验,拥有广大用户,但大多数人仍然将其视为一个资料搜索平台,而非创作起点。

在短期内,文库是一个内容获取和创作的一站式平台的认知还需要逐步建立,但我们需要一个平台来尽快满足用户直接创作的需要,这就是橙篇的定位。

我们希望通过橙篇从创作的最初阶段就为用户提供支持,同时通过专业知识内容的辅助来提升创作质量、拓宽创作服务范围。

张鹏:可以有一小股部队像创业公司做新锐产品一样,更有活力。

王颖:对,没有包袱,可以做很多尝试。

张鹏:用户有给到一些什么反馈,对后续做产品有指导作用的?

王颖:呼唤赶紧出一个 App,需要更多的体裁和品类,希望有更多表格处理能力。

张鹏:用户在橙篇写作的话,主要写些什么类型?

王颖:长文很多,大多在 5000 字以上。

张鹏:写作通用性还可以。

王颖:对,我们也强调专业性。我们一直有在长文和专业内容上发力,为什么要这样做?因为大学生用户是传播力最强的用户群体,所以我们首先要满足他们的需求,在长文理解和写作方面,进行了专门的调整。

此外,为了应对大模型不够专业的问题,从去年 7 月份开始,我们就开始建设专业内容,大量引入专业资源,全覆盖 Nature 这样的头部期刊以及大量专业数据和出版社资源,这些其他大模型尚未涉足。这些工作是在去年 5、6 月份开始的。毕竟大模型有幻觉,有专业性不够的问题,所以比较早就开始准备这些。

张鹏:所以你们是希望写作这件事情,更多人当成更日常的东西,怎么做到这一点呢?

王颖:对,本质就是两件事,要么因此获得尊重,要么因此挣到钱。那我们就做好两件事,一个是分享,一个是激励。

我们现在和很多 IP 合作,用户可以自由创作并分享作品。通过分享,让更多人看到成果,满足了分享展示的需求。画本功能就是出于这个原因开发的。

激励方面,用户创作小说后,我们会通过多个内容分发平台进行分发,产生的收入会与创作者分成,这样用户就有了动力。

画本也一样,只要用户的创作在平台产生的利润,都会分给用户。即使用户没有直接在平台创作或分享内容,只要他们有所贡献,也会有代币奖励,这些代币可以用于完成任务,比如制作 ppt。如果代币不足,用户可以通过继续创作或购买来获取更多代币。这是我们在做的一些尝试。

张鹏:以小说为例,现在是供给不足、需求不足还是连接不足?

王颖:现在是供给不足,而不是需求不足。首先,小说用户占了整个中国用户的 50%,这个比例远远超出想象。我们原本认为小说用户是十八九岁到三十几岁的年轻人,但实际上,小说用户的年龄范围非常广泛,从十几岁到六七十岁都有。

需求已经非常明显,但供给却跟不上。供给可以分成几个层次,头部作家一直被催更,显然是供给出现了问题。比如,烽火戏诸侯一章要写十万字,创作时间很长,一直被催更。爽文、脑洞文也同样如此。

优质供给不足,不是说书放在那儿没人看,而是能让大家持续看下去的好书不多。我们发现,老白文人均阅读本书是 1.3 本,而脑洞文是 3 本多,读者阅读速度很快,而供给足够的话,读者还会继续阅读下去。问题在于,好的供给还是不够,这是非常明显的问题。

张鹏:所以可以理解为橙篇的目标是通过这个操作系统,帮助更多有效的供给批量产生。

王颖:对,有效的供给可以分为几类,每种都有其标准。首先是情节感人、文字优美、文笔也不错的优质供给;其次是虽然有好的情节但很多人卡在表达环节,这个问题大模型可以解决。

小说后续可以衍生到漫画领域,漫画供给问题尤为突出。我们和创作者合作进行了实验,有家公司尝试对两到三部漫画实施日更策略,以此来测试是否能够吸引更多的关注。结果显示,尽管付费率保持不变,但阅读量确实有所增加。

张鹏:有效供给最后很有可能也变成多模态。

王颖:我们本身也具备多模态能力,现在没上橙篇是因为人力不够,还没来得及开发出来,之后会上线的。

05

文库和橙篇的未来

张鹏:百度文库和橙篇是怎么通过用户行为数据实现数据飞轮效应的?

王颖:比如说在文档平台上,我们会根据文档的下载次数来筛选出比较优质的文档,然后让大模型重点学习这些文档。

PPT 工具中也是类似,系统会自动提供已经整理过的图片,并生成提示,用户可以根据这些数据进行修改。

漫画的话,通常会同时生成两张图片供用户选择,成本比较高,但效果并不是太好,因为有时候用户对哪张都不太满意。

张鹏:这种情况可以做局部修改?

王颖:漫画功能支持局部修改。

张鹏:这样就解决了一致性的问题。

王颖:一个是一致性问题的解决,另一个是满意度的提高。例如用户只对图像的脸部满意,而对身体部分不满意,那么评分可能只有 60 分;而如果整体都满意了,评分可能会达到 80 分。

张鹏:这种方式在交付、交互和数据循环上都是有效的。

王颖:对,我们会在模型上进行局部控制。比如,我们将分享和转发按钮放在显眼位置,方便用户操作后进行分享和转发。这样的设计不仅能够提升用户体验,也能更有效地引导用户参与,为后续进一步优化提供参考。

张鹏:橙篇算是文库下面一个「特种部队」?

王颖:它跟文库是平行的两个产品,但是底座的基座能力、基座算法、编辑器都是一套,不同主要在于前端的交互方式,除此之外,就是不同的产品团队在与模型对接。

张鹏:橙篇与文库为用户提供了两种典型的创作方式:一种是原生创作加资料参考,另一种是资料参考加创作,最终的目标都是打造创作的操作系统,两者的价值在于解锁更多高质量的内容供给,从而激发需求,并通过内容分发建立连接,最终形成完整的闭环。

王颖:对,先从激发需求开始。

张鹏:过去发现,互联网领域里只要能够指数级提升创作者的数量,就有机会诞生新的分发平台。你们相信现在又有这样的机会了。

王颖:文库的目标是平衡消费者和创作者之间的关系。过去,消费者远远多于创作者,因为很多人觉得创作是一件很难的事。

文库的核心是让每个消费者都能成为创作者,通过进一步降低创作门槛,扩大创作者群体,促进更多内容的涌现,从而吸引更多人来消费。

张鹏:文库怎么定义 24 年的目标?这里面的优先级是什么样的?

王颖:最重要的是有多少用户使用,也就是 DAU 或者 MAU。这可能不是唯一的标准,但是是很客观的标准。用户愿意使用甚至持续使用某个产品,说明这个产品真的给他们带去了价值。对于文库这种依赖用户主动参与的线上业务,这是很重要的。

张鹏:未来文库里的交互会出现根本性的变化吗?

王颖:会。现在有一个改版在酝酿了,后面还会有一个版本。

张鹏:交互变化的思路原则是什么?

王颖:更倾向于自然交互。7 月底,橙篇 APP 出来之后,应该会跟完全大家想的不一样。

*头图来源:百度文库

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

全部专栏