在ChatGPT之后,下一个强震正悄然而至

【本文作者 刘莎】

【导语】

自ChatGPT横空出世以来,犹如覆盖全球的8级地震,不仅引发了各路专家展望ChatGPT对未来人类生活的影响力,相关职业人士也开始高度关注ChatGPT将会造成哪些就业压力。但是,科技发展只要能够为大多数人带来正面效益,就将成为历史车轮滚滚向前。于是,分析和预见重大技术和应用创新对人类生活(包括就职压力)的影响,就不只是相关科技公司的大事,也是亿万公民需要时时关注的人生大事。

本文预言,在ChatGPT之后,互联网领域的下一个强烈地震,将会发生在哪里,何时发生.........

1、互联网信息应用领域还有哪些尚待解决的重大问题

ChatGPT的许多功能确实给人以震撼,但只要其原始数据是来自互联网上的已有信息,无论采用哪种技术手段,其核心价值就是高效重组各类互联网信息,以提高互联网信息的应用效率。ChatGPT在互联网信息组织领域的巨大成功,再次印证了信息组织学的一条基本定律——海量信息的应用效率首先取决于信息组织效率。

互联网信息属于典型的低组织水平海量信息。而ChatGPT提供的高效率聊天服务也只是互联网信息的组织方式之一(其丰富的创造能力不在此讨论)。所以,要想预测互联网信息应用领域的下一个强烈地震将发生在哪里,可以先梳理一下在互联网信息组织和相关应用领域,还有哪些尚待解决的重大问题?

互联网信息的组织和应用有6个通用环节,信息发布-信息建站-信息检索-信用服务(如用户在购物平台上的交易诚信记录)-相关交易-数据挖掘(也许有人会认为数据挖掘不属于互联网信息应用的通用环节。但一旦数据挖掘的效率像ChatGPT一样高效和通用,它肯定会成为互联网信息应用服务的基本环节)。目前,在互联网信息应用的上述6个通用环节上,都存在着长期未能解决的重大问题。

环节1、用户发布信息麻烦:互联网信息的组织效率首先取决于信息发布效率。而到目前为止,除非你有一个属于自己的独立网站,用户要想在互联网上发布信息,都必须先找到并进入各种各样的垂直应用平台,掌握其信息发布规则,然后分别或重复发布信息。

环节2、用户建站成本高:到目前为止,如果用户想在互联网上独立建站,必须对网站内容进行自主分类以及自主建立信息应用流程(比如,网站信息交易流程)。这不仅使用户建站需要委托专业服务商提供付费建站服务,并且导致了独立网站信息存储不仅必须独占服务器空间,并且需要预留网站内容扩展空间。这进一步推高了互联网用户的建站成本。

环节3、信息搜索效率低:全文关键字搜索可查全不可查精,结构化信息搜索可查精不可查全(前者如百度,后者如淘宝)。无论相关专业工作者如何强调ChatGPT不是一种搜索技术。但事实就是,互联网信息搜索效率低下,正是ChatGPT引发强烈轰动效应的重要原因之一。

环节4、信息交互信用低:用户在互联网上发布或交互的大多数信息,均可以由发布用户或垂直平台管理者自由删改,导致互联网信息信用价值低。除非提供互联网信息通用备案服务,这一重大问题很难解决。

环节5、不能提供各类交易通用服务:用户如果要在网上进行交易,只能在各类垂直应用平台分别进行各类交易(如视频浏览交易、文字信息有偿交易、实物交易、服务交易等),这导致网上交易用户只能在各类垂直应用平台间辛勤奔波。也因此,与其说互联网经济是平台经济,不如说现有互联网经济是垂直平台经济。

环节6、数据挖掘难以推进:互联网信息的整体组织效率低下,直接导致了互联网信息数据挖掘服务效率低下,故无法打开互联网数据挖掘服务的巨大市场。

也许,人们对上述重大问题已经习以为常。觉得互联网信息组织和应用方法只能如此。但这就像人类已经习惯于迈开两条腿走路或者骑自行车,而从来没有体验过驾驶汽车。事实上是,如果能找到上述问题的一揽子解决方法,互联网信息应用将进入用户自驾汽车的崭新时代!

2、为什么上述重大问题长期未能解决

为什么在互联网信息应用的每个通用环节,都存在着长期难以解决的重大问题呢?其关键问题就在于,现有互联网信息的整体组织水平太低。

正是因为互联网信息的整体组织水平太低,导致了互联网上只有垂直应用平台而没有通用平台。为什么呢?因为垂直应用领域的信息组织方法基本是现成的。垂直平台经营成功与否,基本取决于商业模式和执行能力。因此,垂直应用平台成为了推动互联网经济此轮发展的基本动力。

那么,为什么互联网信息领域至今没有出现通用服务平台呢?并不是用户不需要,而是因为在全球范围内,无论大小公司还是散兵游勇,至今都没有找到简洁、高效、通用的互联网信息组织方法。

于是,能否找到简洁、高效、通用的互联网信息组织方法,就成了能否提供互联网信息应用通用服务的决定性环节。

垂直应用平台和通用平台都需要完成的首要任务

500

3、梦里寻他千百度

表面看来,要为浩瀚且复杂的各类互联网信息建立一个简洁、高效、通用的信息组织方法,似乎是一个不可能完成的任务。但是,当我们对网页信息全文关键字搜索结果进行系统分析后,却发现简洁、高效、通用的互联网信息组织方法其实早已真实存在。我们把它命名为,互联网信息组织结构双十定律。

互联网信息组织结构双十定律——

在全文关键字输入框内输入任意关键字(例如:国家发改委、苹果公司、智能手机、云计算、普京、世界杯、战狼…..),其相关信息的顶层高频分类均包括以下10类:新闻/消息、告示、知识、产品、服务、论坛、人际交往、点播/下载、微博/微信、大黄页。(有两类信息合并为一类的,是因为它们内容组织结构基本一致)

并且,每个分类下的顶层高频组织结构词也在10项左右。例如:招聘、应聘、征婚、交友信息的顶层高频组织结构词均包括:交往目的、年龄、性别、学历、职业、性格、爱好.....。因此,均属于“人际交往”类信息。

互联网信息组织结构双十定律示意图

500

4、通用平台的应用优势

显而易见,以互联网信息组织双十定律为基本原理,完全可以建立起一个简洁、高效、通用的互联网信息结构化摘要数据库。(并可通过对已有通用组织结构及用户自主添加分类及分类下的结构化标签的使用频率,自动调整通用分类及结构项标签)。而建立通用结构化摘要数据库正是高效率组织海量自然语言信息的最佳途径。于是,信息组织学的基本定律——海量信息的应用效率首先取决于信息组织效率将再次闪耀其夺目光芒。因为一旦建立起简洁、高效、通用的互联网信息结构化摘要数据库,前述互联网信息应用六大通用环节中的重大问题便可一揽子迎刃而解。

在信息发布环节,通用平台不仅可以实现各类互联网信息一站式发布服务。并且,所有发布信息都可以用通用结构化摘要来进行高效率组织。这不仅将使互联网信息的整体组织水平发生质的飞跃。并且,通用平台也可提供比现有自动摘要技术更高效率的文本信息自动摘服务。

在用户建站环节,由于用户在发布每条信息的结构化摘要时,已经完成了所发布信息的通用分类。于是,用户只需一键操作,即可完成自动建站。并且,由于网站信息中的摘要信息和详细信息可以分别存储,不同用户发布的详细信息也就可以根据其数据类型(如文本、视频、音频、图片......)进行统一压缩云存储。因此,只要不超出常规数据量,网站信息存储成本也几乎可以忽略不计。

除此之外,互联网用户在通用平台建站的最大好处,是站内信息可以享有通用平台的所有服务功能。直接了当地说,为某个用户在通用平台上建站,只不过是将该用户发布的所有信息,以及在发布信息时所选择的各项应用功能,在该用户网站中进行集成显示。

通用平台网站的信息组织效率

500

在信息检索环节,采用与发布摘要结构基本相同的结构化摘要信息检索方法,即可实现各类互联网信息一站式精准搜索,其信息检索效率将比网页信息全文关键字检索提高100倍以上。

通用平台的信息搜索主页面图示(PC版)

500

通用平台信息检索与全文关键字检索结果对比

500

在信用服务环节,通用平台可直接提供各类信息(包括交易凭证、未在互联网上公开发布的信息)一站式信用备案,从而根本解决互联网信息应用中的信用问题。(实际上,提供互联网信息通用备案服务的关键点并不在于技术,而在于是否能提供各类信息的通用备案服务,备案信息是否可以被公众高效检索,并直接进入相关应用。)

在交易服务环节,只要是实名注册用户,均可提供各类交易对象(包括信息、数据、产品和服务等)的一站式交易服务。

在数据挖掘服务环节,面向互联网信息通用结构化摘要进行数据挖掘,将根本改善互联网信息的数据挖掘质量,从而真正打开互联网信息数据挖掘服务市场的大门。

当然,互联网信息应用通用平台也肯定不是万能的。如果现有网站或垂直平台不想改变自己已经建立的信息组织方法,只需在通用平台上发布相关结构化摘要,再指定链接至现有垂直平台或独立网站的相关网页,即可根本改善现有网站和垂直平台的信息传播效率。

互联网信息应用通用平台基本功能示意图

500

5、通用平台是否会像ChatGPT一样风靡全球

互联网信息组织和应用通用服务也会涉及到自然语言处理技术。例如,摘要结构自动调整,自动摘要、数据挖掘。但就其技术板凳厚度而言,肯定不如ChatGPT。不过,其服务成本也会和ChatGPT不可同日而语。例如,通用平台提供的各项应用服务,即不需要存储互联网上已有的海量网页信息,也不需要在后台进行大规模人工标注,还不需要高强度大算力进行信息匹配、生成和整理。而这一特色并不是通用平台的缺点,而恰恰是其应用优势。

就应用价值而言,通用平台服务的最大优点在于,它不仅可以一揽子解决互联网信息组织和应用领域的各项重大问题。并且,无论把互联网信息通用结构化摘要数据存储在哪里(个人终端数据库、企业或机构数据库、本地数据库、中央数据库),都将毫无疑问地成为组织海量互联网信息不可或缺的核心应用。

通用平台的全球化应用

500

就普及速度而言,通用平台估计也没法和ChatGPT相比。十有八九,也无法提供具有创造性的生成式应用。但从互联网用户覆盖率和需求刚性而言,从根本改善互联网信息组织和应用效率的能力而言,其应用价值同样具有划时代意义。 

就信息来源而言,通用平台不会像ChatGPT一样,受到知识产权或信息隐私的约束。因为通用平台涉及到的所有内容,或者直接来自用户的自主发布、自主上传,或者是发布信息用户自主提供的外部链接网页。

如果实在要比较通用平台和ChatGPT在互联网信息组织领域的应用价值,或者可以假设在ChatGPT和通用平台之间,让互联网用户只能二选一。请仔细想一想,您将选择哪一个?

当然,所幸这只是一个假设。每一个互联网用户都可以同时拥有这两类服务。

6通用平台对互联网行业发展的影响力

首先,通用服务平台的普及应用将导致垂直应用平台从服务方法到商业模式的洗牌式重组。

仅以视频播放平台为例。

现有视频播放服务平台(如爱奇艺、腾讯、优酷)的商业服务模式,基本都是视频播放平台先从内容制作方买断电影、电视剧节目播放权,或者自制网剧;然后仅对本平台收费用户提供内容播放服务。这种商业模式的缺点在于,除非用户在多个视频播放平台都成为付费会员,总会有相当一部分内容不能及时看到。而内容制作方由于是一锤子把作品卖给一家视频播放服务平台,肯定要尽可能抬高购买价格。其结果是,视频播放平台为了获得内容播放权,其服务成本一直居高不下。这直接导致了即使是提供服务十余年的顶级视频播放平台,即使已拥有数亿用户,至今任然走在艰难赢利的路上。

而有了互联网信息应用通用平台,内容制作方可以通过通用平台对所有用户提供内容收视交易。各视频播放平台均可叫价提供内容播放服务。而用户则可以适时看到喜欢的内容,并自由选择播放平台。于是,互联网视频播放服务的商业模式将会趋向更为合理的电影院电影放映模式。这才是内容制作、视频播放、收视用户三方均可合理实现利益最大化的网上视频播放服务方法。而这种新的视频播放服务模式一旦上线,将使更多视频播放平台应运而生。因为这些平台只需提供播放设备和购买数据播放服务带宽,其运营成本将明显低于现有视频播放服务平台。

同理,通用平台一旦上线,写小说,唱歌,代写商业计划书的;卖产品、卖服务的.......,都只需在通用平台上用后台实名进行交易信息信用备案,即可直接和买家进行交易。不再需要相关垂直平台提供交易组织服务。

当然,通用平台提供的商业性服务也需要赚钱。但通用服务平台的运行成本和用户应用成本,都将非常明显地低于垂直服务平台。

其次,通用平台将会催生大量互联网谋生机会。

例如,需要高信用要求的社区内用户有偿互助服务(如小孩、老人临时托管,作业辅导,小区内用户互相提供拿手菜社区供应服务,就近家政服务等),将催生大量的临时就业机会。而这种就近互助服务,至少将省去相关垂直服务平台的交易组织成本,或者外卖服务员的送货成本。

再例如,由于通用平台运行成本很低,可以向至今任然未上网,但占小微企业总数70%以上的小微服务性企业,提供尽可能低成本的服务费打折,新品上架等信息的精准传播,以及直接进行线上交易。

也许有人会认为,通用服务平台的前台和后台服务都会相当复杂,有可能导致普通用户难以驾驭和操作。但实际上是,通用服务平台不仅开发成本低,应用成本低,且用户操作方法也空前简单。文化水平在小学以上的用户均可很快上手。

通用平台服务的商业模式

500

第三,通用平台将在各类公共信息服务领域大显身手。

例如,中国国各级政府机构在50万以上(包括行政村及居委会)。2015年有8万多政府网站,2020年反而下降至不到2万。主要原因就是政府无法有效监管各级各类公共信息服务平台,只好仅在区县一级采用各部门整合上网服务。 

现有政务微信公众号28万,政务微博公众号10万。但无论微博、微信公众号,其功能仅是传播信息和信息交互。其应用功能难以满足其相关需求。

而通用平台不仅可以实现50万政府机构一键式高效率建站,也可以对各级各类政府机构的公共服务信息进行实时高效监控。从而根本改善各类各级政府机构的公共服务效率。

7、通用平台将对谁造成压力

上文已经谈到了通用平台服务对现有垂直应用平台服务可能产生的冲击和影响。但这并不等于对所有垂直应用平台都会产生压力。例如,信息沟通类组织平台,如微信、微博、知乎,应该都不会受到实质性冲击。而是恰恰相反,这类垂直应用平台将可能通过加盟通用服务,成为长期获利者。例如,几乎无需增加成本,只需建立一个通用平台微信站、微博站、知乎站,这类垂直服务平台就可利用其庞大的用户规模在通用服务领域获利。而通用平台则省下了推广成本。

另外,理性的垂直应用平台也可以从通用服务平台获得好处。首先,可以将自己平台中结构摘要化数据集成上传至通用平台,利用通用平台进一步提高自有信息的传播效率。然后,也可成为通用平台服务的加盟方,为垂直平台增加一个可长期获利的渠道。再然后,由于各类垂直平台的名字都可以被视为是一个普通关键字,垂直平台(尤其是行业类综合服务平台)也可以购买通用平台软件,直接为自己的用户提供类似于通用平台的各项服务。不过,通用平台也有可能要求买家必须上传自有结构化摘要信息至通用平台,来作为出售软件的先决条件。

但是,即使采用了以上行动,相当一部分垂直应用平台的主营业务任然会承受通用平台的有力冲击。而这种冲击也必然会传递给在垂直平台企业中就职的员工。因此,除了各类垂直应用平台运营商需要认真思考未来之路,在各类垂直平台就职的白领们,也需要认真关注通用平台将对各类垂直应用平台的未来就业机会产生何种影响和压力。

8、通用服务平台的竞争优势

与ChatGPT相比,通用服务平台肯定不会一夜间冒出提供同类服务的竞争者。因为提供智能化聊天服务的技术环节太多,即使一家服务商拥有上百个专利,其价值也有可能只是用于和别的同类服务商进行专利交换。而通用平台设计的基本原理均来自相关领域的客观规律,其后端和前端设计,相关智能化服务方法也十分简洁,这将使其核心发明专利形成的知识产权壁垒很难被突破。

目前看来,由于互联网信息应用通用服务具有天然的垄断性,无论有多少家企业参与其中,其信息组织方式必然共享、通用。除非像中国目前的电信通讯行业一样,由政府强行拆散,才有可能形成提供同类服务企业之间的相互竞争。

通用平台的间接竞争对手主要是各类垂直应用平台服务商。但垂直应用服务商要想进入通用服务市场,恐怕只有通过服务加盟、知识产权付费或参股、并购等方法来实现。

9、通用平台何时能上线服务

通用平台提供的互联网信息组织和应用整体解决方案(包括自动摘要、数据挖掘等)已经在中美两国获得了系列发明专利。只需资金到位,一年内即可公开上线。

如果不出意外,随着通用平台的问世,以垂直平台为中心的互联网信息应用时代将有可能逐渐走向衰落,而以用户为中心的互联网信息通用服务则有可能迅速崛起,成为互联网信息组织和应用服务的未来主流。而人类的互联网应用方法,则将从骑自行车上网时代进入自驾汽车时代。(以垂直平台为中心的互联网信息应用相当于骑自行车上网,而以用户为中心的通用平台服务则相当于自驾汽车上网。)

特此声明,用通用平台和ChatGPT比较,只是为了方便说明通用平台在互联网信息组织和应用领域的重要价值。并无攀比之意。并借此机会,向一代又一代生生不息的人工智能技术探索者们致敬!

刘莎简历

毕业于云南大学哲学系科学哲学专业。曾任国家语委、北京大学、国内贸易部联合开发机器翻译项目总牵头人 、总经理。

曾负责央视信息服务系统业务需求分析 。曾在国内顶级刊物《计算机世界》开个人专栏。其《互联网信息服务产业发展关键性技术预见》一文在“全国技术预见学术研讨会”获一等奖。

互联网信息应用通用平台项目相关专利发明人。

全部专栏