梁晨:大模型时代,能够有所“发明”的史学或将实现

梁晨|南京大学历史学院副院长、教授

本文原载《探索与争鸣》2024年第11期

具体内容以正刊为准

非经注明,文中图片均来自网络

500

梁晨

跨学科对话一直被视为现代学术发展的重要途径,历史学也不例外。尽管历史学研究对象与诸多学科存在交叉,史学家们也普遍认同跨学科对学科发展的重要性,但历史学的跨学科对话依然困难重重。社会学与历史学的研究对象非常接近,被视为最亲近的“近缘学科”。遗憾的是,从布罗代尔到彼得·伯克都不无惋惜地指出,这两个学科之间的交流其实是“聋子间的对话”。何以如此?笔者试图从理论与技术使用的旨趣差异来解释这一现象。而跨学科理论与方法的介入,是史学研究常新与长青的关键所在,这让我们对数字智能时代历史学的研究范式转型与进一步发展充满期待。

理论与方法:现代史学研究范式的特征

如果说社会科学侧重于研究人类行为,那么历史学则强调理解人类文明。与社会科学试图通过理论建构和规范术语来阐释社会现象与规律不同,历史学研究的主要目的在于“求真”,即尽可能真实地还原历史。杜赞奇认为,对“求真”或复原过往的重视,使得历史学可能是众多现代学科中唯一不反思自身假设且反理论的学科。历史不能假设,历史研究也不能从假设开始。反理论当然不是指史学研究不需要理论思维或与理论对话,而是指与“社会科学研究的主要任务是建构某种具有普遍意义的理论解说”不同,史学研究往往需要基于丰富的史料,开展坚实的实证研究。实证研究不仅能揭示历史真实,还能检验各种社会科学的理论与假设,在修正或推翻各种理论的同时,推动理论演进和学术进步。因此,当社会学的学术规范强调观测、分析各类人群,并建构普遍性规律和理论解释时,历史学家更擅长深入探究具体人物与个案性事件,重新呈现复杂与多维的真实,这也使得史学研究的问题更加具体和分散,在一定程度上阻碍了与其他学科的理论性对话。

500

如果说历史学与其他学科的理论性对话存在研究范式上的阻碍,那么技术上的交流如何?反技术或远离技术,是作为人文学科的历史学又一重要的学术标签。这或许是16世纪科学革命之后逐渐形成的文理分科和学科文化疏离所导致的刻板印象。历史学不仅在研究方法上远离技术,在价值理念上也多有抵牾。但历史研究是否真的不需要科学技术?答案显然是否定的。更关键的问题或许是,科技发展如何能与历史研究相结合,进而实现双向赋能。要讨论这一问题,首先要回顾现代历史学学术规范形成的简要过程。自19世纪30年代,兰克和柏林大学同事倡导客观史学以来,通过史料来探究历史真实的学术范式就逐步明确。尽管具体的研究范式多有不同,但多数历史学家都遵循如下的史学研究范式——广泛甚至没有遗漏地收集史料、认真细致地考订史料、深入且个体化地解读史料,进而建构丰富多元的历史书写。有学者就指出,历史学虽然是一个规范性很强的学科,但接受过同样规范训练的学者,阅读同样的一批史料,往往有各不相同的解读和书写,这与社会科学研究明显不同。

历史学作为现代学科的根基就是强调史料先行,而不是价值观或各类理论先行,这确保了历史学具有基本的客观性和学科边界。但史料先行也束缚着历史学家的手脚。历史学家无法像社会学家那样通过访谈与调查等形式,设计与创造出研究所需的材料,而只能不断地挖掘既往保存下来的史料,“有一份材料才能说一份话”。这既是历史研究的规范性要求,也是历史学者的史德与操守所在。没有史料基础,就无法构成史学研究。所以,虽然多数学科都重视“前顾后瞻”,力图打通过去与未来,但历史学往往必须先“后顾”再“前瞻”,必须有符合科学精神、经得起考证的史实基础,才能与理论和价值观进行对话。

推动与挑战:技术发展与史学研究的碰撞

既然史料对于历史研究如此重要,而数字技术的发展能够为研究者提供从史料获取到史料整理、史料解读等不同程度的帮助,技术方法当然能够推动史学研究,史学研究也应该积极拥抱技术变革。实际上,早在20世纪初,梁启超开始呼吁中国史学界建设“新史学”的时候,就特别提出要运用统计技术等科学方法来“聪明”地分析历史文献。他不仅亲身实践,开展历史上佛教人物的量化研究,还推动丁文江等科学家一起开启中国最早的定量化人才地理学研究。梁启超借助清华学校这一平台,通过设立历史统计学的研究课题来培训清华国学院的学生。其中一位学生卫聚贤,后来更是编著了《历史统计学》教材,并在民国的大学校园中开设相应课程。

500

技术的进步与国际化趋势的加强,使得如今无论哪个历史时段的研究资料都大为扩展。尤其是电子化存储,不仅使得史料的永久保存得以实现,更使得远程阅读、开放利用等使用方式愈发普及。与二三十年前历史学者常常苦于资料不足不同,今天的历史学家面对的问题已然是史料过多和史料爆炸。但这种史料爆炸绝非是简单的“幸福的烦恼”,如果不认真对待,很可能成为历史学的新危机。历史研究的目的在于求真,学术规范要求研究者广泛占有和尽可能穷尽地理解史料。当史料已经能够集中呈现在历史学家面前的时候,如果无法阅读完材料,理论上就无法保证理解不会以偏概全。由此,不仅是历史学建立在史料基础上的求真规范无法满足,历史学的学科价值也面临被消解的危机。20世纪八九十年代,法国历史学家勒华拉杜里曾经指出,将来的历史学家都必须是程序员,如果不会写代码就无法研究历史。这个看法在当时被许多人看作天方夜谭,现在再回过头来思考,可能不得不佩服勒华拉杜里的超前远见。

历史研究需要引入技术方法,这不仅不是无关宏旨之事,相反是必要甚至紧迫的。当年鉴学派第三代学者们提出上述看似耸人听闻的说法之时,欧美史学界并非全然无所触动,而是采取了一些具体甚至重要的应对之举。基于当时的技术条件,一批大规模、跨国界的量化历史数据库被构建起来,特别是大规模人口数据库,在为量化史学研究搭建起基础平台的同时,既推动了量化历史研究的推陈出新,也带动了经济学、医学、社会学等诸多学科的发展,历史视角的重要性和历史学科的基础性作用由此得以彰显。

1990年中国台湾史学界创刊《新史学》,号召史学研究进一步推陈出新,特别指出要重视计算机的运用与普及,结合技术发展来推动历史学科的进步。相较而言,大陆史学界对技术进步的关注则多少显得不足。2002年,北京香山召开的“中国需要什么样的新史学”会议,昭示了大陆新史学运动的兴起。20多年以后,大陆的新史学运动已产生了重要学术影响。然而,相比于西方和中国台湾地区,大陆的新史学运动对技术的重要性仍缺少关注,更强调跨学科理论的使用和进一步发扬学者自身的想象力。

作为人文学科的历史学,固然需要个性的学术想象力和穿透力,但笔者以为,作为基础学科和强调求真的历史学,更直接和更首要的任务还是要基于史料复原过往。其中,大规模量化历史数据库建设的核心工作,便是帮助历史学家从海量的历史文献中挖掘出彼此关联的史料或数据,以形成数据链,进而在研究范式上更好地平衡定性与定量,做到以定量方法来回应定性问题。比如,民国大学生学籍卡一般都含有学生本人和家长信息,民国初期的部分家长信息被发现能够和晚清缙绅录资料中的记载相匹配,从而形成一个近代中国多代际教育成功者的信息链。无论是学籍卡,还是缙绅录,都是典型的结构性史料,其电子化处理难度较小,链接效果相对较好,同时便于开展量化分析,拓展了历史研究的史料利用数段和研究方法。

链接与发现:数字技术与史学范式的变革

以往大规模量化数据库的构建多依赖结构化较好的史料,如今借助数字技术,历史学者能够进一步打破结构化史料的限制,在更广泛的史料库中建构具有针对性的研究数据集。比如,笔者在民国清华留美生群体研究中发现,清华大学官方在民国时期出版过详细的《同学录》,全面记载了该校留美生的姓名、籍贯、求学经历等重要信息,但唯独对他们的职业记载不够详细。只有六成学生有学成后的职业记录,每个人最多也只有一个职业,而且几乎都集中在调查开展的20世纪30年代初期,这样的数据状况显然不足以支撑对清华留美生职业获得与职业发展的系统研究。

同时,各种机构公报、社会新闻以及个人传记乃至讣告等,也分布着大量该群体成员的职业信息。职业生涯是个人“长时段”的“大历史”,研究者能否尽可能多地获取不同时间节点的信息,形成连贯的数据链,对研究的效果影响甚大。但是面对有一定规模的群体,完全依靠人工来获取较全面的数据链,存在很大难度。过往,历史学者收集、整理和分析史料的工具有限,依靠的往往只有人工,这限制了清华留美生群体系统、连贯的职业信息获取与研究。在数字技术不断渗透进各研究领域的今天,历史学家的工具箱也更为丰富,研究的边界也得以拓展。

笔者曾以清华公布的官方名单为基础,利用python语言编写爬虫程序,能够24小时不间断地在各数据平台按照给定姓名查找信息,先后自动检索获取到11529条潜在信息。接下来通过人工比对,确认其中9112条信息确为研究所需,占比79.04%。这种机器+人工的路径高速且有效地实现了研究目标——1356位(约占96%)留美生由此具备了至少1项职业信息,相比《同学录》中仅有六成学生的职业记录,这是很大的提高。对61位没有采集到职业信息的留美生进行具体分析后可以发现,他们多数是无职业可采集。比如,其中有30位因各种原因,或亡于留美期间,或亡于归国后不久;有3位在留学期间已出现精神问题。不能确认是否有工作且未采集到信息的,只有26人,占全部1417位留美生的约1.8%。此外,511位留美生被追踪到10个以上职业信息,占全部留美生的36%;追踪到3个以上职业信息的留美生有1172位,占全部留美生的83%。依靠技术手段收集和分析群体多节点关键性信息,突破了单一结构性史料的记载局限。可见,大数据技术可以帮助历史学家从海量史料中挖掘更多数据,形成数据链,发现历史真实,这是一个重要的改变。

技术方法的介入,不仅丰富了历史学者掌握与分析史料的工具,而且能更好地展现史学研究“发现未知”的功能,丰富史学研究的范式。随着科学革命的发生和文理学科分野的加剧,逐步形成了自然科学重在发现未知物质,谓之一种“求是性”的学术;而人文社会科学强调理解已知现象,谓之一种“解释型”的学术。马尔萨斯的人口学理论就是解释型学术的代表。文理科的学术范式差异也由此被建构和凸显。但数字技术的不断介入,无论是文本挖掘、社会网络分析还是既有的量化研究,都强调通过对史料的重新组合和定量分析,发现个体阅读所不易甚至无法发现的历史。在努力实现历史研究以“求真”为最高追求的同时,数字技术逐步丰富了历史学的研究范式,即由以解释为主,走向发现与解释兼顾的历史研究。这种发现往往能够做到更长的时段和更广泛的群体观察,从而在研究对象、研究手段和理论探索层面更好地对话社会科学。有研究者将数字技术比喻成显微镜,帮助学者观察到更多微观史实,其实数字技术或数据库平台还可以看成微观数据的加速器或对撞机。被组织起来的史料,在数字技术作用下加速运动并在各种数据的交叉和对撞过程中呈现出可被观察到的特征、趋势和规律,进而带来历史学研究范式的变革。

不足与可为:数字史学的未来可能

今天,人工智能技术已经全面渗透进各个学科,历史学在持续遭受冲击的同时,也展示了现有技术应用的不足。尤其是大语言模型的兴起,不仅极大丰富了历史学家的工具库,更可能引领研究手段和研究方式的迭代更新。有学者甚至认为,人工智能正在创造历史。例如,在当前诸多流行文化中,对历史图景和历史故事的构建充分利用了机器学习技术,人工智能也开始渗透进历史课堂。大语言模型甚至能够根据简单的自然语言指令,自主生成引人注目的、非抄袭的文本,从而为学生提供一个以最小努力生成一定质量书面作业的机会。大语言模型在语言翻译、总结海量文献等任务上的出色能力,都对历史研究作品的生成产生了深远影响。

500

而无论是笔者个人的初步尝试,还是其他历史学家更为深入的实践都表明,当前大语言模型在回应历史研究的核心关切上并不理想。以史料分析为基础的历史学,研究工作的核心是史料的链接分析或文本信息的层层追踪。而在这方面,大语言模型的表现甚至可以说是失败的,因为人工智能不仅在自主链接不同材料方面存在局限,甚至会毫无根据地编造虚假材料,作出难以理解又真假难辨的分析。

尽管如此,人工智能技术仍在高速发展之中,其与史学研究努力结合的尝试让我们对技术重塑史学的未来充满期待。近年来,一些史学研究团队通过各种形式的合作,以某类大规模史料(如方志、官文书等)为基础,对机器专门进行训练,锻炼它们从这类史料中收集、分类和分析特定信息的能力,进而作出具体问题的因果判断甚至价值理解。这一工作被称为“人工智能作为历史学家”(TheAI-as-Historian)。人工智能在链接海量材料方面具备人脑无法比拟的效率,这或许能让历史学者对未来实现更多基于史料且可溯源的历史发现和历史学研究范式的变革充满期待。

检索工具也曾被视为数字技术影响人文社会科学研究的重要里程碑。就史学研究而言,检索工具可以帮助研究者按时间、事件等逻辑,依据关键词对海量文献进行信息检索。但一般来说,文献数据库的史料编排有固定的逻辑,如按时间或部门分类,而真实的研究对象或史学问题,涉及的方面是多元的,时间线和内容更是复杂的,单线条的检索工具在便利研究者工作的同时,也可能在无形中进一步“遮蔽”史料,使研究者不自觉地践行史料使用的“选精”与“集萃”。如果人工智能的训练能够突破线性检索和结构化史料的限制,在一定程度上开展自主的逻辑化史料收集和分析,那么,它无疑将成为极具价值的历史学研究助手,甚至是具备相当功底的历史学家。

今天以大语言模型为代表的人工智能技术,已经突破了过往统计软件和地理信息系统等工具完全被动接受指令与数据的局限,逐步呈现出可对话性和初步的自主研读能力。人机合作的研究模式在不断巩固的同时,也面临着更新换代的挑战。人工智能的不断嵌入和人机合作的增加,将不可避免地影响史学研究范式。在算力算法的加持下,历史学的发现功能将被重新唤醒,更多隐藏于各类史料中、需要通过比照和计算才能被发现的史实将逐步呈现。多元史实的增加,必将推动史学理论的演变和跨学科对话的加强。近代中国现代史学创立者们所期待的、以社会科学为基础且能够有所“发明”的史学,或许更有希望实现。

全部专栏