吕鹏 | 大型社会模拟器:社会知识生产的大科学装置

吕 鹏|中南大学公共管理学院教授,教育部青年长江学者

本文原载《探索与争鸣》2024年第11期

具体内容以正刊为准

非经注明,文中图片均来自网络

500

吕鹏

探索世界的本质与本原,需要借助特定的方法和工具,以探索未知、拓宽视野、发现新知。在自然科学领域,粒子对撞机等大科学装置的出现,使科学家得以不断深入了解物质在原子以下更微观层面的构成,促进了物理学的繁荣和发展,包括理论物理学和实验物理学,成为科学研究范式革命的重要推动力量。在社会科学领域,学术界同样需要这样的大科学装置,以增进对社会本质、社会运行规律的理解,不断推动社会研究范式的更新和迭代。

解决社会运行与认识论问题

对于社会科学的发展而言,方法和工具的革新具有第一性、内生性、源头性的重要意义。顾名思义,大型社会模拟器是对社会整体(即社会有机体)进行系统性模拟的工具。这种思想在历史上经历了长期而朴素的萌芽阶段。例如,人们曾使用周易、八卦推演、图谶、推背图等,来解释和预测社会运行规律。这些工具和方法在过去初步回答了人类对社会层面的世界观问题,并据此指导人类的社会行动和生产生活。今天的大型社会模拟器则是通过计算机科学、智能科学、人文社科的融合发展,对社会开展系统性实验研究的大科学装置。如图1所示,大型社会模拟器即基于社会知识,通过模拟过程,实现社会治理、社会干预和社会优化的目标。

500

如何看待社会?这是社会研究者需要面对和回应的一个首要问题。学术界普遍认为,社会是一个具有复杂系统特征的有机体系,存在微观和宏观两个可观察、理解和诠释的层面。宏观层面的社会本体呈现一种结构性特征,如阶层结构、群体分布、社会规则等。这种宏观的社会结构具有知识的属性,为行为体开展社会生活提供信息与知识导向。微观层面的社会则呈现为各种类型的社会行动者,具有过程性,如个体、群体、组织、政府等社会行为体,以及这些行为体之间的互动过程。微观行为体(如个体)的社会活动,不仅需要知识的导引,而且在微观情境中产生、更新和实践知识。跳出社会研究者的认知框架,存在更大的社会观。自然—社会学术界达成了类似“最大公约数”的结论,即将社会有机体总结为一个物理—信息—社会系统(Cyber-Physical-SocialSystems,简称CPSS)。在数字社会和信息社会,这种社会系统观能够以数据为中心,融合打通信息空间、物理空间、人类社会空间。这种观念能够适应新文科建设、计算社会科学、跨学科时代社会研究范式变革的内在需求。关于社会运行,尚未出现有效的能够直接呈现的装置和工具,目前主要通过数据分析、调查报告、局部调研、学术研究、资料分析等间接呈现。进入工业社会以来,人们一直在探索大系统方面的模拟工作。例如,IBM公司提出了DigitalEarth(1998年),谷歌公司研发了GoogleEarth(2005年),2024年英伟达又提出了Earth-2,用来模拟全球气象并进行可视化工作。这些工作具有很强的自然科学属性,但仍未能深入到社会系统运行的内部。2019年,“欧洲时光机”计划提出,旨在联合大学、档案馆、企业、学者、市民等,保存欧洲大陆的历史档案并进行大数据感知和记忆数字化工作,目前仍停留在社会的数字化静态性阶段。笔者团队推进的大型社会模拟器项目,尝试解决“欧洲时光机”的相对静态性问题,通过对社会系统的运行进行动态智能推演,超越单纯的数字城市建设中的“映射”逻辑,揭示社会演化、社会进化过程中的动力学机制与规律,助力提升国家治理现代化水平。

大型社会模拟器的知识生产机制

(一)系统性刻画社会知识的情境与场域

社会有机体视角是社会模拟的主要思路。采用复杂系统视角和有机体视角,能够较好地反映社会要素与功能子系统之间的关系。大型社会模拟器,旨在打造一个有记忆、能呼吸、会思考、自适应的社会级通用智能体,以充分调动社会知识的基础性作用。社会的宏观性存在与微观性存在是社会运行的两个面向,都蕴含着特定的社会性知识。宏观性知识具有相对的静态性,而微观性知识则具有动态性、实践性。在实际研究过程中,人们未能将这些宏观与微观信息有效纳入研究范围,导致对社会知识的反映与刻画呈现出碎片化特征。

最常见的情况是,研究者将个体抽象为调查问卷中的信息与数据。这种做法无法提取和还原具体的社会场景和社会场域信息,只能将其操作化为若干个宏观的结构性变量。这种结构性、碎片化的宏观知识,导致了研究的割裂性、管窥性、静态性,只看到“露出海平面的冰山一角”,而忽略了“冰山下面更主要的部分”。这种研究方式忽略了个体行动的具体生活情境,导致对个体行为的研究趋于简单化、脸谱化、数据化。或者说,相关的发现与结论是针对脸谱化的“平均人”群体,而非具体的、行动着的社会化个体与群体。使用大型社会模拟器,则可以构建具体化的个体(社会行为体),包括个体的特征、属性、信息等,并为个体行为和社会互动构建全息的社会场域与社会环境。通过构建建筑物、街道、楼房、场所等具体的行动场域,实现精确化设置,从而还原个体行为的社会生活场域、社会互动场域、社会学习场域以及整个社会场域。这样的方式既可以模拟可见的社会结果,又可以模拟导致这种结果的深层次因果机制,并拓展研究能力。

500

(二)强化知识的探索与发现

知识的本质,是一种确定性的因果关系。这种因果关系的发现需要经过一个探索和确认的研究过程。为此,不仅需要获得实证数据的验证,而且这种验证过程本身也应具有可重复性,以进一步提升研究的科学性。在人类自然科学的发展史上,大科学装置(如天文望远镜、粒子对撞机、高能加速器等)长期以来一直是人类探索世界物质边界的重要工具,使得人们对宇宙的边界、物质本原的认知不断深化,促进了自然科学的大繁荣、大发展。然而,在社会科学领域却长期缺乏用于模拟个体行动、分析社会运行、开展社会实验、验证社会知识、寻找治理策略的大科学装置。作为社会科学领域的首个大科学装置,大型社会模拟器能够大幅度提升知识发现的效率,显著增强社会科学研究与知识发现的效能。

这其中存在两个可能的方向:一是开展面向社会的系统性观察。通过整合政府数据、平台数据、基层数据,大型社会模拟器开展基础性环境搭建,能够揭示社会运行的“黑匣子”过程。集中的社会运行刻画和社会系统展示渲染,既能够发现显性变量之间的结构性关系,又能够揭示显性变量与隐性变量之间的结构性、可能性关联。二是通过“数据—模拟”双向联动,提升知识发现的质量、水平与能力。数据挖掘所得的知识具有静态性,能够反映静态变量之间的关系。这种静态性的知识具有局部性、权宜性,容易因数据来源的不同而发生较大变化。基于实证数据开展社会模拟工作,能够提升数据的使用效率和使用价值。在正常情况下,人们对社会开展常态观察几乎是不可能完成的任务,需要投入巨大的精力来组织研究。但有了大型社会模拟器这一社会的系统性镜像和实验工具,则不难实现此目标:一方面,通过系统性模拟去发现、识别、验证因果机制;另一方面,通过常态化模拟来刻画社会的运行状态,不断验证、提升知识发现的能力和实践应用的价值。

(三)开展社会知识的验证与更新

作为虚拟世界、虚拟社会的一种可视化承载,大型社会模拟器构建了平行于宇宙(社会)的“镜像世界”,赋予研究者极大的自主性。通过大型社会模拟器,可以对真实社会(或其替身)进行实验验证、知识发现、系统更新、知识交换,实现知识的叠加效应,甚至聚变效应。

其一,在实验验证方面,针对已有的研究结论,在不违反基本假设、基本条件的前提下,将相关数据导入社会模拟器,基于原有理论假设和过程发展机制,搭建模拟场景,通过对模拟结果的观察、提取和比较(基于真实数据),验证结论的可靠性、稳健性。其二,在知识发现与更新方面,基于模拟器,全球范围内的众多研究团队可以与其他模拟平台展开数据撞库、参数交流、参数互动、参数比对、结论交流等。借助大型社会模拟器,通过持续不断的实验验证(针对既有研究)和实验探索(针对新的研究),可以逐渐形成关于特定社会与国家的地方知识系统(localknowledge)。从国际化视野来看,还可以实现跨国别、跨地区、跨社会的研究协作和知识交流。大型社会模拟器可以与既有的研究主体如众多研究团队、国内外学术同行等,开展研究对接、结论交流、知识聚变、迭代创新,实现知识的“聚变”,进而基于对众多地方性知识的系统性考察、总结、评估,提取出全局性的“元知识”。

(四)实现知识的扩展、迁移与比选

随着社会进入智能时代,基于智能体的研究范式与方法,将在研究中发挥越来越重要的作用。个体的决策过程、心理机制本身不再单纯依赖事实信息,而是在实际生活中大量纳入反事实信息,包括条件、场景、结果等。目前,研究者正基于AI智能体,模拟人类个体的心理、行为以及群体涌现。反事实推断是个体决策的基本模拟目标。当前的社会科学研究,不仅面临着可重复性危机问题,还面临着反事实推断能力不足的问题。社会研究的主流范式仍基于实证证据(案例、文本、数据等)开展。这种思路在促进知识发现的同时,也逐渐暴露出重大缺陷,即忽略了个体在真实行动过程中的索引性、能动性、反思性,将个体简化、僵化为静态的数据串,即数据库中或数据处理过程中的一行或一列。从事实知识到反事实知识,社会模拟方法能够实现知识的扩展与迁移。对个体行动者而言,如果基于事实知识,通过模拟不断推断反事实知识,就构建了多重结果的可能性,形成多重的行动策略集合与空间,即知识空间。基于该知识空间,个体行动者、社会管理者、经济主体决策者等均可进行比选,智能选择最有利于个体、群体、企业、社会的行动策略,最大化相应层面的价值函数。

真实社会的善治与优化

由于宏观条件、组织成本等客观因素的限制,社会治理实验很难在更大范围内开展。大型社会模拟器,则秉承社会改良与善治目标,实现了在更大场域、更广范围内的社会实验。严格来说,基于大型社会模拟器的社会实验属于一种计算实验。通过与政府部门的交互,能够实现基于真实社会场景的问题治理与效能提升,服务社会治理与城市发展。大型社会模拟器主要从两个层面提升社会治理效能。

一是通过数据交互、数据融合来激活数据生态。在数据逻辑方面,社会模拟通过借助真实数据、产生虚拟数据以及虚实数据校准等方式,激活数据生态,并重点生产合成数据,实现数据融合。在各地治理过程中,大型社会模拟器可以通过盘活数据应用场景模拟,促进大数据资源的整合与集成,解决数据孤岛问题。通过模拟的动态性和全过程验证,提升存量数据与流量数据的使用价值。

二是开展虚拟—现实工作交互。根据对应的模拟场景,与交通局、社会事务局、发改局、经信局、网信办等部门开展工作联动。大型社会模拟器综合势能函数、价值函数,定义海量智能体,开展交互训练模拟、长期规划和多任务泛化开放博弈验证,实现对真实世界各种复杂场景的系统模拟。基于此,管理者可以了解个体、群体、企业、社区、城市、省域等层面的社会运行规律,参考趋势预测并制定有效的社会治理与干预策略,服务科学管理与智能决策。例如,人群与人口是社会的主要行动者,对于经济社会发展具有决定性影响。大型社会模拟器可以将城市全部人口的年龄、性别、居住小区、职业类别等分布性信息,通过反向赋值,获得虚拟的模拟人口集合的“共同体”。

500

按照“等价共同体”理论,在用于研究、认知的社会(共同体)和真实社会共同体之间,建立和确保一种等价关系,这是社会科学研究的必要前提。在若干维度、标准、方面实现等价的共同体,也被称为“等价共同体”。这里“等价”至少包括相等和等效两个层面的含义。通过反向赋值得到的虚拟模拟人口集合还不能直接被认为是该城市人口的等价共同体,而应称为虚拟共同体。尽管虚拟共同体与真实人群数量一致,但与真实个体并非一一对应。基于样本代表性、分布特征相同、行为机制可比、干预反馈等效和多次实践稳健的等价性标准,虚拟共同体初步满足了样本代表性和分布特征相同的标准,但仍需通过模拟训练获得该城市居民的“等价共同体”,作为城市治理的核心社会行为体集合。

要使“共同体”成为“等价共同体”,还需要将共同体的行为与城市居民的真实行为轨迹进行比对,这种比对需要一个过程,以实现行为机制的可比性。各类生活场景的轨迹数据,如工作通勤、周末消费、国内外出游、区域热度、交通态势等,都是能够发挥模拟校准价值的城市居民行为数据。大型社会模拟器不断模拟全体居民的行为模式及其总体结果,同时拟合真实社会的居民群体在上述生活场景的各类数据。如果能够通过多个场景(维度)的真实数据验证,最终达到干预反馈等效、多次实践稳健的标准,则表明达到了“等价共同体”标准,能够在大型社会模拟器中发挥模拟真实社会运行、发现问题并增强真实社会治理的能力。

基于“等价共同体”,我们可以模拟未来五年、十年的人口变化趋势,并依据个体的属性特征、行为倾向等提出干预方案,进而上升为城市社会政策。比如,基于人口的变化,智能调整社会公共资源的配置,提升财政资金的使用效率。基于每个社区的老人、成年人(就业者)、儿童家庭的比例,科学动态地配置适老设施、健身器材、儿童设施、社区食堂等民生设施,以及设定矛盾调解中心、反诈宣传活动等维护社会稳定的制度性安排。当然,大型社会模拟器也存在信息茧房、数据“回音壁”、“等价共同体”难以确定等困境。未来,大型社会模拟器应该在个体算法、场景算法、验证方法方面发展与突破,实现对真实社会的精准映射,以及对运行趋势、解决方案、公共政策的模拟。

综上,大型社会模拟器不仅是人类社会知识生产的大科学装置,还能助力新的智能社会治理模式的探索与生成,深度参与国家治理现代化进程。

最近更新的专栏

全部专栏