一句话生成3分钟创意视频,百度搜索改版,从给链接到一站式解决
7月2日,百度搜索在北京宣布启动十年来最大规模改版,此次升级覆盖搜索框、搜索结果页到搜索生态全链路,核心目标从“提供链接”转向“直接解决用户需求”。其中,“一句话生成3分钟创意视频”的智能创作能力,以及全球首个中文音视频一体化生成模型的接入,成为此次改版的两大技术爆点。
搜索框升级为“智能框”:多模态输入与创作工具“一步到位”
此次改版的“第一印象”来自搜索框的革新——百度将其升级为“智能框”,不仅支持超千字的长文本输入,更全面强化了拍照、语音、视频等多模态输入能力。用户无需切换工具,即可在搜索框内直接调用AI写作、AI作图等创作功能。例如,用户输入一段旅行灵感描述,智能框可同步生成图文攻略、风景插画甚至短视频脚本,真正实现“需求输入即服务”。
搜索结果页革新:从“给链接”到“直接搞定需求”
搜索结果页的变化是此次改版的核心突破。过去,用户搜索后需点击多个链接才能找到答案;如今,百度通过升级"百看"功能,实现了图文、音视频混合的结构化内容直接输出。更关键的是,“百看”将逐步接入智能体(AI服务)与真人服务,用户搜索“装修攻略”时,不仅能看到图文案例,还能直接连线设计师咨询,或调用AI生成3D装修效果图。
而在内容创作领域,百度搜索推出的"智能创作"能力堪称“降维打击”:用户只需输入一句创意描述(如“夏日海边亲子vlog”),系统即可自动生成3分钟创意视频,支持分镜编辑、画面内容自定义,覆盖从灵感捕捉到全平台发布的全流程。目前该功能主要支持PC端,用户搜索“AI视频”、“百度智能创作”即可体验,彻底解决了普通用户“想拍不会剪”的痛点。
技术内核升级:全球首个中文音视频一体化生成模型加持
此次改版的技术底气,来自百度商业研发团队自研的视音频生成模型“MuseSteamer”及创作平台“绘想”。作为全球首个实现中文音视频一体化生成的模型,MuseSteamer突破了传统视频生成中"画面与音效、台词割裂"的瓶颈,可协同创作高质量画面、背景音与人声台词。其技术实力已获权威验证——在VBench I2V榜单中,MuseSteamer以89.38%的总分登顶全球第一,支持单张图片生成10秒1080P电影级画质视频,人物微表情与运镜效果达到专业影视水准。
此外,百度同步宣布文心4.5系列大模型正式开源。该系列包含10款模型,覆盖47B/3B混合专家(MoE)模型(最大总参数量424B)及0.3B稠密模型,在文本理解、多模态推理等任务中达到国际领先(SOTA)水平。截至2025年4月,飞桨文心已累计服务超2185万开发者、67万家企业,创建模型达110万,此次开源将进一步降低AI应用门槛。
生态协同:1.8万+优质内容方构建国内最大AI搜索生态
支撑此次改版的,还有百度搜索开放平台的生态布局。目前,平台已接入1.8万+优质MCP(多网内容提供者),涵盖媒体、创作者、服务机构等多元主体,形成了国内最大的AI搜索生态。通过“智能框+百看+AI助手”的组合,百度搜索正从“信息枢纽”升级为“服务中枢”,用户不仅能获取信息,更能直接完成创作、咨询、交易等深度需求。
搜索的“十年之变”,是从“连接信息”到“连接服务”的跨越
从2013年的移动化转型到2025年的AI全链路升级,百度搜索的十年之变,本质是对用户需求的深度响应——当信息爆炸时代,用户需要的不再是“更多链接”,而是“更精准的答案”与“更高效的服务”。此次改版中,“一句话生成视频”、“多模态输入输出”、“音视频一体化生成”等能力,不仅重新定义了搜索的边界,更将推动内容创作、信息获取甚至生活服务场景的全面变革。
正如百度搜索负责人在发布会上所言:“未来的搜索,是‘你需要什么,我就给你什么’。”而随着文心大模型的开源与MuseSteamer的落地,这场搜索革命或许才刚刚开始。
版权声明:《一波说》所发布文章及图片之版权属作者本人及/或相关权利人所有,未经作者及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。