姜利标 | 数据内爆时代认知范式变革下的知识生产

姜利标|西安交通大学社会学系副教授

本文原载《探索与争鸣》2024年第11期

具体内容以正刊为准

非经注明,文中图片均来自网络

500

姜利标

在这样一个需要知识且极可能产生知识突破的时代,审视具体情境、重塑认知理念以及厘清现实约束,无疑为我们有针对性地创造自主知识提供了可能性空间。围绕知识生产范式变革的议题,以下四个方面的问题尤为值得关注:第一,社会情境是否已发生了实质性变化?是否可以将当下的社会情境理解为一个全新的性质状态?第二,是否存在一个被学界广泛认可的“范式”概念?如果存在,那么社会科学尤其是社会学的知识传统又将经历怎样的范式变革?第三,在这样的时代背景下,知识生产的过程正面临哪些问题与挑战?第四,作为一门面向社会现实的科学,社会学知识生产的自主性策略何在?

数据环绕和内爆的时代

认清自我所置身的时代,是个体终其一生都无法回避的现实议题。伊恩·斯图尔特认为,人类社会已跨越信仰时代、科学时代、概率时代、量子时代和混沌时代……进而以不确定性为核心驱动人类知识的发展。姑且不论斯图尔特对人类社会性质发展阶段的判断是否准确,他所提及的一个不可忽视的事实是,个体已处在一个数据不断环绕和内爆的时代。

简单来说,这是一个建立在互联网、物联网等现代网络渠道广泛收集数据资源的基础之上,并进行数据存储、价值提炼、智能处理和结果展示的信息时代。此时的数据资源不仅体量大、类型多样,还伴有速度快、时效高甚至价值密度低的特性。从社会学角度来看,这时的大数据时代具有完全崭新的三个特性:首先,数据生产痕迹化。个体做任何事情都会留下相应的数据痕迹,虽然我们感知不到它,但并不代表它不真实存在。数据痕迹并不像互联网早期所宣称的那样,个体行为具有模糊化、匿名化和多元化的特性;相反,个体行为指向更加具体、精准和明确。其次,数据运作并行化。如果说传统的数据运作机制有时间先后次序之分的话,那么当下数据挖掘、生产、存储、分析等都可以同时发生。最后,数据真身鲜活化。数据已非单纯的客观数据或“死数据”,而是拥有生活化甚至社会化倾向的“活数据”,是能够被科学精准分析的有价值的数据。

这样一个数据不断环绕和内爆的时代的社会症候包括三个方面:其一,万物数据化。个体日常所接触的东西、内心的想法以及外在事物的变化等,都可以借助物联网等技术进行数据化表达。人和物在成熟的科学技术支持之下,已被智能化地识别、定位、跟踪甚至监管。其二,数据具有开发价值。至于这个大时代的数据价值怎么衡量,不同的领域、不同的职业所看到的侧重点可能会有所不同。其三,数据化时代也是一个动态发展的智能化世界。未来世界将面临是否还受人控制,科学技术是否会像人一样拥有理念意识等问题。

知识生产的范式变革

智能人类与人工智能的结合,使得知识生产正面临着“范式的革新抑或范式的转移”。用“范式”概念来指涉当下的知识生产情境确实契合,但到底什么是共同体尤其是社会学界所理解的“范式”?

围绕范式概念而延伸出来的歧义,很大程度上与托马斯·库恩1962年首次使用且没有作出明确限定有关。他在《科学革命的结构》里,只是将“范式”视为一个无须过多解释且共同体都能够领会的分析性概念。玛格利特·马斯特曼统计后发现,库恩用了21种不同的表达方式来使用该概念。将“范式”概念首次引入社会学的是乔治·瑞泽尔。他在1975年将“范式”理解为“一种关于科学研究主旨的基本意向。它为我们确定了研究什么问题、怎样提出问题、遵循什么样的原则等。范式是共同体内部共识的东西,我们可以用它来区分不同的共同体或者次共同体。它包括定义、案例、理论、方法以及运用的工具等”。自此,“范式”概念也就变成了超越具体、包含理论、容纳流派的一个抽象认知工具。吉姆·格雷在范式认知的基础之上进一步指出,人类知识正处在“计算科学和数据密集科学的知识生产路径上”。当站在该角度来理解社会情境时会发现,社会学学科的知识生产已不再限定在实证主义、人文主义以及批判主义的范式认知基础之上,相反它会随着社会情境的即时性变化延伸出新的认知方式。

社会学的知识生产脉络由此可以区分为两种认知性范式,即保守主义范式和激进主义范式。所谓保守主义范式,是指研究者在知识生产过程中对大数据持谨慎态度,没有将大数据时代的来临视为学科知识生产所必然要考虑的核心变量;相反,持激进主义范式立场的研究者,则积极看待大数据时代所发生的情境变化,并试图在知识生产过程中扬弃、革新既有的知识传统。当然,在学科知识不断涌现的事实面前,保守主义范式和激进主义范式也只是一个相对化的认知区分。这点在整个社会学的知识发展传统中体现得淋漓尽致。譬如,20世纪中叶网络社会的崛起,就曾引发过学界内部类似认知立场的争议,随着知识的累积化发展,这些争议最终都消融在个体的日常生活之中。从某种程度上可以说,社会学就是围绕社会性质的状态变化,进而逐渐确立起属于自我的学科知识体系。大致来看,社会学学科知识的发展可以理解为建立在“三种社会形态和两种范式认知”基础之上所形成的结果。

古典社会学时期,学科知识的生产方式主要受哲学思维的直接影响,它根植于研究者的逻辑思辨能力,进而围绕工业社会性质状态形成体系化认知。虽然社会学家也注重比较、历史、分类等方法的运用,但这些方法本身并不属于学科自身的知识生产策略,因此它所催生出来的知识自然容易遭到受众的冷落。伴随学院派将数理统计分析和实地田野观察的理念带入学科,社会学才算真正巩固了以代表性样本来建构知识合法性的根基,但该阶段学科知识的生产素材只注意到了社会事实的实体层面。换句话说,在网络社会出现之前,社会事实的虚拟特性始终没有被纳入知识生产的认知范畴之内。

500

当微电子、电脑、光电等技术催生出社会情境的新形态时,人类便进入了以技术信息组织起来的网络社会。由于网络社会兼具虚拟和现实的双重特性,建立在实体社会基础之上的传统社会学的知识生产策略必然面临巨大的认知冲击。此时的社会学研究思维,已不再局限于传统的小样本数据,而是转向自然生成的大样本数据范式认知。随着生成式人工智能渗透进个体的现实生活并成为社会发展的主导性力量,社会情境中的现实和虚拟特性开始变得模糊起来。人类社会也从网络社会进一步升级为“数据会自我生成、技术日益智能化”的数智社会形态。

这种基于保守主义和激进主义的范式认知理念,能够帮助我们厘清学科知识生产的现实逻辑,但也会伴随社会性质状态的变化而发生认知立场的形式摇摆。譬如,相较于网络社会、数智社会,工业社会在知识生产过程中的哲学思辨策略和小样本策略,就属于一种保守主义的知识生产方式;而网络社会里的“主题模型、词嵌套模型、语义网分析”等分析策略,相较于数智社会里的“洞察分析、行动者建模、卷积神经网络”等生成式人工智能策略而言,则可以看作是一种相对保守的知识生产方式。可见,将“范式”概念引入知识史的分析和知识生产的脉络逻辑中,能够让我们快速明晰知识生产过程中的认知取向。

范式变革背后的双重现实

数据环绕和内爆的时代,给社会学知识生产带来了不容忽视的机遇和危机并存的事实,需要辩证审视。

第一,这个时代的来临为社会学学科提供了跨时空、多元化的素材。虽然社会学脱胎于哲学,但它与哲学最大的区别就在于:社会学的知识生产方式,非常注重对日常生活之中的经验素材进行加工和运用。没有鲜活丰富、客观具体的素材,就没有社会学知识创新的灵感和知识立论的依据。素材是社会学知识推陈出新的基础性条件。伴随大数据时代的来临,社会学知识生产所依赖的素材已不再受限于特定的时空情境,相反可以跨越时空尺度、实虚特性的限制,可选择性空间很大,且具有随时可获得的特性。

第二,这个时代的来临加速了社会学学科分析模型的智能化发展进程。如果说传统社会学知识的科学性主要在于,将数理化的分析模型纳入分析过程进而赢得共同体认可的话,那么当下社会学知识还须创造性地推进更加精细化的模型开发和运用,并以此来维系其社会科学的合法性地位。其实,不论是大数据策略下的可视化分析、数据挖掘算法、词嵌套模型抑或语义网分析,还是生成式人工智能策略下的洞察分析、行动者建模以及卷积神经网络等,都意味着学科分析模型正在快速崛起,且不断朝着实用、完美的智能化方向迭代发展。

第三,这个时代的来临可以让社会学的研究结论变得更加精准、客观和科学。传统社会学的分析结论,不仅与具体素材的信度和效度有关,还受研究者自身主观思维能力的约束。这时的知识是否具有科学性和实用性,往往受知识形成之外的影响颇多。相反,大数据时代所研发出来的知识生产工具,很大程度上能规避传统社会学知识生产过程中的外部劣势,进而最大限度地激活学科知识生产过程中的主体思维优势。简单来说,它能在研究素材和创新思维相互启发的基础之上,让最终呈现出来的结论更具有说服力。

然而,这场令人振奋的发展实则也潜藏着内在性危机。譬如,研究者能否获得自己想要的素材数据?毕竟大数据的生成、聚集、储存和挖掘等都需要依赖特定的平台或技术,而不是单凭个体的研究能力就能轻易做到的。大数据之所以“大”,还在于其是一种多维度、非结构性、异质性的数据类型。即使研究者能够获取并分析它,也容易触及具体个体的隐私权。既然涉及隐私的数据也能够被搜集到,是不是意味着这种数据背后始终存在着某种无形的控制力量?这时候所关注到的议题,是否还有学术价值可言?我们还必须正视的一个客观事实就是,社会学的知识生产活动不再是研究者的专长。生成式人工智能已发展成为学科知识生产过程中的主体性力量。研究者不再处于认识和研究的中心,相反转变成为知识生产环节的衔接角色。在此背景下,一个极端结果是,社会学具备了在自我繁衍基础之上生产知识的能力,不再依赖研究者的创造性贡献来形成知识。当知识具有自我延续的生命力时,也就意味着研究者“步入了主体意识的黄昏”。他们被迫接纳和学习不再由人类所创造的知识,进而只有过度依赖智能化的技术,才能寻找到自我从事研究的意义。

社会学知识生产的自主性策略

基于上述分析,捕捉社会性质状态的变化以及如何回应知识生产范式的变革,成为社会学发展必须要正视的现实议题。我们可以从知识生产的事实对象、知识生产的核心焦点以及知识生产的认知本质三个维度寻找可能的自主性策略。

第一,社会学之所以被视为一门科学,很大程度上源于该学科能及时捕捉到社会性质的微妙变化,并在明确自我研究的事实对象时给予合理性解释。因此,学科自主知识生产策略的起点,必须回落到对社会性质状态的理解之中。如果说社会学根源于现代性所孕育的工业社会性质状态,那么随后的学科知识发展可以说都是在紧密围绕工业社会事实所衍生出来的变化,进而形成的增补性对话。后工业社会、消费社会、风险社会、网络社会、倦怠社会等,这时都转化为了社会学知识增长的情境背景。如何更好地根植于当下的数智社会事实状态来生产知识,是共同体构建自主知识体系的重要切入点。

第二,如果说“个人和社会”抑或“行动和结构”是社会学新生知识的增长点,那么大数据时代下的学科知识骨架也无法脱离对这四个概念的具体化延伸理解。譬如,从“个体和社会”的角度来看,意识是否是个体的专属特性?生成式人工智能是否也具有人类的意识?数智社会的基础和本质是什么?具体社会情境又有什么样的变化?从“行动与结构”的角度来看,“指涉人类也可能指涉类人类”的个体,他们将会作出什么样的行为选择?个体更看重行动的动机、目的,还是行动所带来的后果?作为总体性理解的结构,具体在日常生活之中是如何体现出来的?实际上,社会学之所以能延续下去并取得突破性的知识成就,某种程度上与学术共同体不断推动对“个体”“社会”“行动”“结构”四个核心概念的拓展理解有关,进而形成了以“个体和社会”抑或“行动和结构”为核心议题的差异分歧性共识。随后,借助延续、对话和修正的方式,不断地推进学科知识的累积性发展。

500

第三,虽然当下已进入大数据时代且社会学的认知范式已发生变革,但当共同体谈论知识生产时,还需琢磨知识生产背后的本质性问题,即只有弄清楚了什么是知识、知识是如何诞生的,研究者才能更好地推动创新性知识的生产。其实,个体对什么是知识的认知,并不是一种与生俱来的思维能力,而是源于自我生存的本能以及生命历程的发展性觉悟。也就是说,个体起初并不知道自己已经掌握了某种知识,只是在凭借自我所熟知的生活经验与周边的世界打交道。这时候的知识,带有更多生活经验直接传承的间接特性。当个体发现之前一直运用自如的知识突然不能适应生活类似情境时,也就意味着他们开始反思和试图修正先前的间接性知识,进而促使知识的适用边界和应用范畴变得更加明确。如果个体就类似情境为什么会有不同的认知结果进行再思考,实则已触及对知识的起源进行考究式探寻。此时,知识已不再简单停留在具体的实用功能层面上,而是涉及具体情境差异背后的现实起源问题。可能个体仍疑惑类似情境为什么会有截然不同的表达脉络,进而对知识的生产历程进行追问,这也就牵扯到知识与规范的隐性交织问题。也就是说,所谓的知识其实就是特定权力表达规范化之后的产物。当个体明白知识生产背后的规则且遵循相应的表达书写规范时,才可能自如地针对具体现象生产出新的知识。因此,认知范式变革时代下的知识生产反思,还需要对知识到底是如何形成的这一根本问题进行本质化思考。

概而言之,社会学是一门关注社会现实的学科,其知识生产方式离不开对社会情境的假定。关注社会情境的本质变化,是社会学学科知识生产得以更新的必要条件。当然,社会学知识的专业化抑或学科知识的独特性,不仅在于需要延续既有学科知识的根基,还在于需要及时根据社会情境进行适当性调整。只有不断地追问学科知识的供给市场在哪,研究者才能时刻保持知识生产的冲动状态。即使在社会情境面目全非、智能技术高度发达的状态之下,他们也不会陷入唯技术、唯方法的工具主义窠臼之中。毕竟,技术或方法只是人类认识世界的工具,而不是独立于人之外的意识化生命。退一步讲,即使人工智能真的取代了人类的某些工作,那些被视为知识的知识,仍离不开属于人类知识生产的螺旋塔逻辑。

全部专栏