王涛 | 蓬勃兴起的数字史学,将为历史书写带来何种可能?

王涛 | 南京大学历史学院教授

史学研究的范式转向

一直以来,一批史学工作者痴迷于将技术、数据引入史学研究领域,断断续续地推动着计量史学发展。有人质疑计量方法使用单纯的数理模型解释历史现象,会导致复杂的历史简单化,而计量史学家回应,在史料的爬梳中总结规律性质的结论,本来就是历史研究的应有之义。这一自我辩护似不无道理。借着数字人文兴起的东风,计量史学(也被称为量化史学)延续着学术生命,并在近几年有与数字人文合流的趋势。

在历史学研究领域量化方法的高调回归中,美国学者乔·古尔迪激情饱满的“历史学宣言”最为引人瞩目。古尔迪主张历史研究要关注长时段的维度,善于运用基于大数据的统计方法,并把与此相应的研究路径比喻为徘徊的“幽灵”,寓意似乎是这种思路从未离开历史学界。从某种意义上说,长时段的思考维度也好,量化的研究方法也罢,实际上一直在延续“二战”结束以来历史学研究的社会科学化趋势。时下的“数字史学”,也可算作历史学社会科学化的一个注脚。

有学者注意到,数字史学在解决一些问题的同时,也制造了更多新问题,比如可能会把研究做成“抛弃人性”的工作,或者是没有“思想穿透力”的空洞架构。但是,数字史学在方法论层面得到了技术加持,在学术生产、展示以及交流的层面提供了多样性以及透明计算,从本质上带来了史学研究的范式转向。实际上,每一代人都在完成属于自己的可能性,数字史学当前的成绩,只能符合当下的技术前提。

数字史学何以成功

从史学史的维度反思,新兴的研究领域能否取得有价值的学术成果,是否具有成为学术流派的可能性,必须具备一个重要前提:尊重史学家研究工作的自主性,有助于展开具有个性的研究议题。以环境史和社会医疗史为例,其之所以能在学术界得到认可、推广,就在于这些研究方法能够有效维护研究项目的灵活性。它们不会拘泥于研究时段、研究区域,研究者有充分的自主权挑选研究对象、时段、国别,只要其研究主题致力于探讨人类活动与自然环境的关系,或者疾病瘟疫对人类历史的影响,就都能被纳入环境史或者社会医疗史的范畴。对于史学界的新生代而言,他们采纳这样的视角,就获得了更换角度书写历史的能力,能够发掘出更多选题和研究可能性。这些方兴未艾的史学研究领域,在很大程度上兑现了用户生产内容(user generated content,UGC)的愿望。历史学家(用户)创造出立足自身需求的研究成果(内容),丰富了整个史学研究社区的生态多样性。相较而言,数字史学想要获得类似的发展前景,关键同样在于它能否实现UGC的设想,能否为史学家提供充分的研究自由。

表面上看,数字史学具备这样的潜能。数字史学能够不问东西,在中世纪史的研究中,在印度史的研究中,在艺术史的研究中,都可以深度运用。正是由于这种灵活性,数字史学不断激发人们的好奇心,近年来受到了很多关注;或许是基于同样的理由,与数字史学紧密相关的数字人文也获得了快速发展。

但细思似乎又没这么乐观,数字史学欣欣向荣的表象与环境史的生意兴隆,存在着本质上的差异。环境史研究能够基于人类历史与环境变迁的互动关系,重构全新版本的人类历史叙述。而数字史学虽然号称能提供新的知识,挖掘大数据中隐含的信息,找出隐匿的关联,但它与作为研究领域的环境史不同,无法提供一个解释历史发展轨迹的全新视角。这也是很多学者质疑数字史学研究价值的理由,因为截至目前,数字史学似乎还未推出令人耳目一新的重大研究成果。可以说,数字史学领域还缺少一部《寂静的春天》。

探索数字史学之道

环境史等新兴史学领域的成功,根源在于它们能为历史发展提供新的“解释框架”,因而具有学术生命力。大约十年前,有学者提出了“形象史学”的概念,并对这个研究领域的发展充满期待。但是,形象史学一直有条不紊地发展着,而没有激发出环境史那样的热烈讨论。究其原因,形象史学主张将图形、图像资料作为历史研究的对象,其优越性只在于拓展了史料的范畴,但自身的理论体系建构还不充分。从上述例子来看,数字史学的从业者需要思考:数字史学对历史发展的解释理论何在?

当然,环境史或医疗社会史虽拓展了史学研究的路径,但在方法论的层面,仍然是沿袭传统史学方法,倚重传统的文献梳理与研究者个人解读。从方法论的意义上看,在数字技术的加持下,数字史学能够把各种成熟、有效的算法和工具纳入史学研究的领地,在考据、史料整理、空间分析等问题上提供先进生产力的援助。从“术”的层面看,数字史学无疑具有光明的前途。这恰是数字史学最擅长也最具变革性的部分。但是,数字史学显然不能止步于此。数字史学的从业者需要尝试建构其关于历史的解释框架,这才是所谓“数字史学之道”,也是数字史学持久不衰的重要前提。“解释框架”之所以重要,就在于它能够带来库恩所谓的范式转换,让历史学家解释史料的能力获得增益。

对此,笔者提出一种假说,期待为数字史学的深化发展起到抛砖引玉的作用。数字史学作为解释框架的一种可能性在于:发现和分析事物之间的链接,由此来解释历史过程的演进。我们可借用“蝴蝶效应”来说明,“蝴蝶效应”其实就是对事物间复杂因果关系的一种极其模糊的概括。历史事件之间的复杂程度与此类似,不过,随着技术进步,在大数据的支持下,这种复杂性或许能够被巧妙地计算出来。用链接的思路来研究历史问题,其实有一个很好的施展领域:全球史。正如德国全球史专家康拉德提出的,全球史最常见的研究是对“关系、互动和交互的追问”。但是,美洲原始部落的日常习惯,如何演变为西方世界的高雅生活方式,这中间缺失了哪些环节,传统的历史研究难以回答。或许可以借助数字史学的技术补全中间的环节,并用更直观的方式来书写全球史的地形图。

目前,实践派已经开始用数字史学的理念和方法来解决历史研究的各种问题,甚至乐观地估计“数字史学已经成为跨国史研究不言自明的助手”。如瑞士伯尔尼大学与德国吉森大学联合开发了关于神圣罗马帝国时期精英群体的数据库,收录了公元1250年至1550年间学习法学、医学、神学等专业的学生信息,目前其总数已达64000人。基于这一数据库,研究者使用量化统计、社会网络分析、可视化等技术手段,能够清晰地描绘出中世纪知识分子的文化影响力以及流动情况,从而全面了解现代知识社会的中世纪起源。

在数字技术不断发展的环境中,美国历史学家协会前主席麦克尼尔看到了历史学家的“技艺”需要更新,甚至鼓吹要打破“文献拜物教”(text fetish)。麦克尼尔指出,技术的进步为历史研究提供了更加多元化的史料和研究方法,其背后的逻辑正呼应了新文科所推崇的不同学科间的跨界合作。比如在研究玛雅文明的活动范围、人口规模等问题时,历史学家完全可以借助之前主要用于地球测绘的激光雷达扫描(light detection and ranging,即LiDAR),来获取更多关于玛雅人定居点的精确信息,丰富对于玛雅文明的认知。

数字史学的限度

另一方面,需要强调的是,基于数字史学的解释框架有其限度,不能被滥用。有的从业者想当然地认为,数字史学最引以为傲的优势在于,基于大数据和巧妙的算法,可以对很多问题形成更合理的因果判断,将历史现象的解读带入科学化的正途。但这可能只是一厢情愿。问题不仅在于历史研究需要直面复杂的人性,对思想、情绪的量化相当困难,而且对科学主义的迷信本身就是一种不切实际的幻想。更吊诡的是,相比传统的研究方法,数字方法或许要消耗更多的时间和精力。参与过数字史学项目的研究者都有这样的体会,虽然很多算法高效便捷,但是清洗数据、元数据标注等工作,是丝毫不能懈怠的“手工活”。数字方法一方面极大提升了分析史料的洞察力,但另一方面对史料的完整性提出了更高要求,否则在漏洞百出的数据面前算法反而会放大潜在的错误分析。可见,科学远非“全能型选手”。以目前人类的技术和智慧水平,科学主义对客观世界的描述尚且存在盲点,更遑论主观世界了。如果以科学性为数字史学的唯一追求,就会把整个领域带入歧途。

当然,这并不意味着数字史学毫无价值。最重要的是,对数字史学的认知,需要回归到合理的位置,正如我们看到全球史或环境史的方法和理论日渐成为历史学界炙手可热的议题,但并没有天真地认为这些研究范式可以解决历史研究的所有问题。同样,数字史学也不能解决所有的问题,虽然它看上去似乎无所不能。

另一方面,我们需要用一种“整体性”(holistic)的思维来评判数字史学的价值。数字史学呈现的不是单纯的技艺或解释框架。无疑,数字史学在方法论层面能够对传统史学家珍视的“技艺”在效率上进行改善;同时,它基于量化、数据库思维供给了一种世界观,也需要参与对历史学或者宽泛意义上的人文学科的批判性反思。很多人热衷提及的“数字转向”,表面上是方法论的转向,其实从深层次看,是强调对历史研究怀抱更加开放、共享、合作的精神。不论我们是否承认,现在的历史研究方式已经比司马迁、顾颉刚的时代有了更多可能性。我们需要有更多探索性的研究,打开历史研究的新天地,而不是单纯计较一种方法有效与否。这其实正与新文科提倡的跨界融合的学科发展理念高度统一。

数字史学的起伏发展历程,与人工智能的发展轨迹类似。人工智能研究领域曾经充满希望,乐观者已经在考虑人工智能大量取代人类劳动引发的失业潮问题;但也遭遇过寒冬,悲观的观点认为连弱人工智能能否实现都要打上巨大的问号。有趣的是,正是在这种大起大落的迷思中,AI技术实现了螺旋式的增长。有理由相信,如果认为数字史学不单纯是一个研究领域或史学理论,而是代表着史学研究与数字技术融合的趋势,那么就不用在意一两个城池的攻守,而可以满怀希望地看到无限的发展可能性。我们不要自我限制想象力,以为数字史学只是单纯的“数字+史学”,仅仅是史学研究对数字技术单方面的倚重。在新文科理念越来越受到重视的前提下,更多学者投入数字史学的研究与思考,将为这个领域带来有效的进展。

全部专栏