春节返乡,记得带上这全国34个省的AI人脉……

500

快过年了,大家是否和我一样,跟家乡的关系弱了,归家途中“近乡情更怯”,担心大过年的把天给聊尬了。但踏上故土的那一刻,听到熟悉的乡音,听听亲友的倾诉,又有一种“知所从来”的踏实。

放下“XX老师”“Selina”“X总”等在外的身份,带着乡音的那一声呼唤,是我们的来时路,与春节格外适配。

用方言过一个热闹而熨帖的春节,百度文心智能体平台,带着你我的34个省AI人脉走来了。

500

我最近发现,百度app上线了由开发者打造的34个省级行政区的AI智能体,不仅能听懂各地方言,回答吃喝玩乐、旅游订票等个性化问题,还能一键「打电话」视频聊天畅聊,堪称是i人过节的“神助攻”。

我们第一时间连线一番,给大家带来这份AI智能体过年攻略,是时候给亲友们展现一下咱的AI人脉,给春节添加一些有趣的AI年味儿了。

500

我听过一个说法,小时候觉得年味儿浓,是大人们特意为我们营造了过节氛围。那些记忆中熟悉的仪式感,很难再引发强烈的共鸣。而长大后的我们,成了那个制造年味儿的人。

面对代际间的生疏,略显尴尬的提问,我们能不能主动带来新鲜的谈资,让年味儿变得有那么一点不同呢?

蛇年春节,我就打算用AI智能体来打开话匣子了。

返乡第一件事,肯定是关心这一年在外面过得怎么样。作为一名进京务工人员,我的家人们就格外关注北京。北京近来天气怎么样,搞了什么大型活动,亲戚家哪个孩子来北京求学工作了……仿佛了解这座城市,就参与到了我的日常生活。怎样让他们了解一个地道的北京城?我在百度app上,把皇阿玛请出来给大家做导游了。

听皇阿玛用京片子讲解北京的知名景点、风土人情,告诉俺娘俺在北京不是孬种。

孩子们在外有没有人陪伴,是父母最关心的问题,在难得相处的几天里,一唠叨关于工作、升职、婚育的问题,特别影响过年气氛。

今年我就不打算正面硬刚了,直接给安徽老乡“包拯”智能体拉出来,给他们讲讲理。没想到AI包公不仅合肥话讲得地道,还挺会做人,一下子就把注意力转移到安徽旅游了。

太好了,是AI智能体,我们有救了。

长期出门在外,难以承欢膝下,父母平时在家缺少陪伴,是我们外地游子最惭愧的事情。我妈去年最爱看的电视剧就是《繁花》,当我帮她拨通“许文强”智能体的电话,用沪语介绍繁花相关的各色上海风貌。

这样接地气又随时随地地陪伴,带着科技的温度,来到日常生活中,熨平了孤独的人心上的褶皱。

AI智能体的语音功能,不仅形象和口音极具地域特色,也能听懂各地方言,用家乡话跟AI对话也毫无问题。比如我用蹩脚的“港普”跟港姐AI智能体聊天,夸她“超靓”,对方也能听懂我在讲什么。

这个春节,各地方的人都能用自己的家乡话,在家“云游”34省,告别尬聊,包充实的。

值得一提的是,34省AI智能体,都是百度文心智能体平台的开发者,基于文心大模型打造的。你我不仅是AI用户,还可以零门槛化身AI开发者,在百度文心智能体平台一键get同款,定制自己家乡方言的智能体,或者自己感兴趣的垂类智能体。

蛇年春节,AI不再是大厂发布会上的炫技,不再是遥不可及的黑科技,而是化作千姿百态的乡音,在千家万户的团圆夜,找到了最温暖的栖身之所。

500

过去一年来,AI领域最大的变化,就是从一项大厂实验室诞生的高科技,变成了四五线城市乃至乡镇间都在热议的全民话题。

但百闻不如一用,如何让AI在全国范围内被广泛地应用和理解呢?阖家欢聚的春节,无疑是一个绝佳的契机。不过,在春节期间,大规模且稳定地向大众输出技术能力,对任何一个顶尖科技企业来说,都极具挑战。

以AI智能体的方言对话为例,其实方言语音功能,大多数网友都不陌生,早在机器学习时代,就已经有方言识别与合成的TTS产品了。但此前,方言语音合成的实现难度大。

比如九声六调的粤语,“诗”“史”“试”仅靠音调区分含义,AI需要捕捉比普通话复杂3倍的声纹特征。合肥话的“连读变调”,更是让工程师们抓狂。一些语料较少的方言,要深入当地走街串巷,收集语料,再为每种方言单独开发前端。

整个过程耗时很长,功能上线当然快不了,所以很多地方的小众方言,以前都是无法通过线上应用,被大众体验到的。

500

今年春节,34省AI智能体的方言语音功能,不仅能搞定较难的粤语、合肥话,而且在百度app说上线就上线。

这种方言功能在AI应用中的快速落地,依赖于百度语音技术的特殊支撑。主要是两大能力:

一是语音大数据挖掘技术。通过识别大模型,对不同省份的方言数据,进行切分、降噪、识别等自动化处理,可以高效产出海量方言数据;

二是语音合成大模型技术。基于大模型,将普通话和方言统一建模,利用迁移技术训练出支持多种语音合成的通用模型,让一个模型可以用任意音色说任意方言,大大减少了开发工作量,缩短了研发周期。

AI智能体,从一种高大上的技术概念,到乡土地头的趣味应用,不仅给这个春节带来了极大改变,也将成为AI语音应用广泛普及的开始。

500

AI大模型爆火之后,普罗大众最关心的就是:AI有什么用?如果要选一个最具重要性和紧迫性的应用场景,那应该是:听懂中国话。

中国的万里山川,存在着大量“十里不同音”的地域,让各地方的人们跨越方言的阻碍,顺畅地彼此交流、融入数字生活,是国产语音技术一直努力的方向,其中,百度就是一支源远流长的技术力量。

起步早。2010年,百度语音技术团队成立,专注于语音识别(ASR)、语音合成(TTS)等基础技术研发。深度学习技术在全球刚刚兴起的时候,百度就在2014年推出了基于深度学习的语音识别系统(Deep Speech),被《MIT科技评论》评为全球十大突破技术。

500

技术强。多年来,百度不断推出了流式多级截断注意力(SMLTA)、多模态交互、端到端语音合成、定制化音色等语音技术,研发实力领先业界。

覆盖广。经由DuerOS(小度助手),百度语音技术被广泛应用于车载场景、智能家居硬件、AI客服等,不断积累语料、迭代打磨产品。

回望百度语音技术的来时路,也就不难理解,为什么是百度,在蛇年春节首个上线34省的方言功能了。

春节只是一个缩影,实际上,百度的AI声浪已经席卷日常生活,成为你我身边的一个个科技彩蛋。

比如说,直播电商,是很多人的购物首选方式。但真人主播的成本高、人力稀缺,很多小品牌请不起;使用数字人直播带货,以前的音色很不自然,消费者体验不好。百度通过自动化的数据采集和增强技术、语音大模型的迁移技术、篇章段落合成技术等,不仅让语音更连贯,提升了数字人主播的自然度和拟人度,而且仅需几分钟,就能达到超越真人的TTS水平,降低了定制音库的制作成本。如今,百度语音技术每天支持众多直播间开播,业务侧CVR也得到大幅提升。

有声小说,是大众喜闻乐见的娱乐应用,但以前的有声书,缺乏对内容段落的理解能力,霸总狂拽炫酷地冷哼,反派邪魅狂狷的大笑,念起来都是一个味儿,缺乏沉浸感。如今,百度小说、头部第三方小说平台,接入了百度全自动化生产平台,可以基于大语言模型的文本理解技术,对角色、人物画像、对白情感,进行精准分析,再利用高表现力的声学建模技术,对十多种情感和副语言进行迁移控制,生成贴合语义、情感细腻的类真人声音,听起小说来,那叫一个身临其境。

车载语音,是智能座舱的体验重心。一位汽车销售告诉我,基于百度语音技术打造的智能座舱,是业内唯一多人同时说话、语音助手也能听清的互动体验,甚至没有之一。怎么做到的呢?原来,百度将视觉信息引入语音增强,对人脸唇动特征和语音信号统一建模,改变了过去单一模态的交互体验,更准确地理解用户交互意图,对目标说话人做语音分离,解决传统语音单模态技术难以区分和追踪目标声源的问题,从而大幅提升了复杂场景下的语音增强的效果,带来“人无我有”的车载语音交互体验。

凭借在智能语音领域的技术壁垒和创新能力,百度完成了国产AI技术落地的一次次演练。

这一个蛇年春节,AI乡音在游子们的归途中响起,智能的种子也飘散在了万里山川。

500

站务

全部专栏