生成式人工智能构成对法律人的真正挑战吗——以疑难案件处理为中心
朱赫夫|浙江工业大学数字法治研究院研究员
舒国滢|中国政法大学钱端升A层次讲座教授
本文原载《探索与争鸣》2026年第1期
具体内容以正刊为准
非经注明,文中图片均来自网络
2022年底,OpenAI公司发布ChatGPT,宣告了生成式人工智能时代的到来。2024年,OpenAI在GPT系统的基础上开发了SORA,其可根据文本生成视频,具有惊人的精细程度,被称为“世界模拟器”。OpenAI的创举回击了之前的看空言论,再度确定了生成式人工智能(下文简称GAI)在科技前沿领域的地位。当下,各国都将更多的资源倾注到GAI的开发中,此间,各行业不同程度地受到了GAI的挑战,法律人亦难以幸免。本文将结合GAI的技术细节廓清学界误解,从而阐释生成式人工智能何以构成对法律人的真正挑战,法律人又应当如何因应。

何谓真正挑战:疑难案件处理
“GAI对法律人的挑战”之所以成为近年来法学界之热点,不仅因其新颖性,也因AI的使动性和嵌入性引发的法律人的生存性“远虑”。对此问题的探讨,学界有三种立场:一种是保守主义的,认为所谓“挑战”危言耸听;一种是激进主义的,认为挑战是颠覆甚至是“想象法学”式的恐慌;最后一种是现实主义的,认为应基于人工智能和法律人的现状,对问题进行现实分析。本文采取现实主义的研究倾向,根据概念进行推演,先行廓清以下问题:第一,何谓对法律人的挑战;第二,GAI对法律人的现有影响如何;第三,是否存在“真正挑战”的形式标准,以GAI达成特定目标为准。

(一)何谓挑战法律人
法律人(jurists)亦可称法学家,是自罗马法复兴以来,形成的知识—职业共同体。关于法律人的定义纷繁复杂,可包含三方面的内容:理念方面,法律人是拥有法治理想的人群;职业方面,法律人是从事法律相关工作的职业人,包括法官、检察官、律师等;教育方面,法律人是接受法律专业教育,拥有特定知识和方法的人。
GAI对法律人的挑战,在本文视角下特指对从事法律职业的法律人之挑战。GAI显然难以在理念方面造成挑战,因为法治理想具有应然性,不会因实然之变而迁异;GAI虽也会对教育带来一些挑战,但更合适的限定词是“法律教育”而不是“法律人”;GAI对于法律人的职业影响,是最典型的挑战。首先,法律职业在特定语境下与法律人等同,若将职业的主体资格限定在人类,那么法律人就可以指代法律职业人;其次,法律人的职业属性是作为群体的本质特征,理念是职业目标之引导,教育是为从事职业而服务的,没有职业就难以形成共同体;最后,GAI对法律职业的影响涉及法律人最核心的利益,会引起全体法律人的注意。因此,本文将生成式人工智能对法律人的挑战限定在对法律职业影响的论域内。
接下来须定义何谓挑战,GAI对职业的挑战可分为多方面,包括执业范围、能力、知识等,其中最为法律人所关切的,莫过于对法律职业需求的侵蚀。法律人长期以来存在默示的、习惯性的职业承诺,如获得学位、通过考试、实习,就可以获得就业岗位。即使职业环境竞争加剧,但岗位始终是在法律人之间流转,仍属正常的市场经济竞争范畴。但是如果职业需求被GAI挤占,并不会导致其他法律人获利,从而将使职业基本盘萎缩,引发职业承诺的破裂,进而使教育、理念方面受到影响,最终动摇共同体存续的根基。GAI侵占法律职业需求,是对法律人整体功利的减损,因而可以算作是挑战。
(二)生成式人工智能对法律人的影响
对于GAI对法律职业需求的侵占这一问题,还需要进一步限定论域。此问题是复杂、多因扰动系统,其中政治、经济、文化等因素都会对推演产生影响,本文无意也无力对多因进行研究,而是将注意力放在技术方面。本文的一个重要的基本假设是:法律职业需求是因法律人的技术能力供给的,若GAI能够模拟法律人的这种技术能力,那么就具备了侵占法律职业需求的必要条件,从而形成挑战。
GAI对法律职业需求的侵占,符合一般的科技替代人工的规律。这一侵占先从外围的、较低端的职业需求开始,后随技术进步而逐渐上升至核心的、高端的工作。若言GAI已经完全替代了法律人,这显然不是事实,否则也不用讨论这一论题,但GAI已经展现出对法律职业需求进行侵占的能力,有三件事具有代表性:ChatGPT-3.5参加美国律师考试,取得了中流成绩,ChatGPT-4.0则以优异成绩则进入了排位前10%;美国一律师通过ChatGPT生成诉状文本并使用虚假判例,直至最后阶段才被发现;哥伦比亚一法官在审判中使用ChatGPT生成裁判文本。对此,高盛认为,未来44%的法律人将被AI所替代;Tech.co也认为,法律人是这场AI浪潮的受害者。在AIOE榜单中,法律人位于受冲击职业之首。
在传统法律人的工作中,包含大量重复性、同质化的文书工作,如法条检索、案例搜集、合同审查、案件管理等,这些工作很容易为GAI所替代。另外,GAI已经不仅限于感性材料搜集阶段,其甚至已经具备一定的知性处理能力,如论证检索和认知计算,这将极大改变法律人的工作方式和运作方式。GAI可以提供便捷和廉价的法律渠道,对于法律经营者而言,这也是更廉价、高效的选项。可以预见,在法律职业的较低层级的需求上,如文书代写、法律咨询等工作,GAI提供的法律服务能实现充足的职业供给。如此,以此为生的法律人必然会受到冲击,动摇部分法律人的地位,足以称得上是挑战。
(三)法律人面临的真正挑战:疑难案件处理
讨论至此,至少能够确定边缘的法律人正在受到GAI的挑战。但也有观点认为,GAI带来的挑战在各行业是普遍存在的,并不能算作对法律人的“真正挑战”。为进一步分析GAI对法律人的影响,则需进一步分析法律人以为的“真正挑战”是什么。
AI与法律人不算是新鲜的话题,在国内谈论勃兴之前,海外学者就已展开多轮论争,最著名的莫过于艾希礼和桑斯坦之争。艾希礼(Ashley)尝试对法律论证进行建模,建立HYPO系统,该系统内置法律推理机制,可根据知识标签对案件进行匹配。HYPO系统彼时在法律界引起了轩然大波,并引发了人工智能对于法律人挑战之讨论。桑斯坦(Sustein)旗帜鲜明地驳斥了这种观点,他认为AI仰赖人类标注标签,只能处理简单案件,但是在疑难案件中涉及实践理性,不是AI可以触及的。这场论争为后世的讨论确立了范式,人工智能对于法律人的挑战的关键在于:AI是否可以媲美法律人的特殊职业能力?在GAI横空出世后,这场讨论蔓延至国内,不少学者也持有和桑斯坦类似的观点。如於兴中等人判断,ChatGPT不会对法律人产生根本性影响,法律人的判断性质并不容易突破。王禄生认为,现阶段生成式人工智能还不会立即产生冲击,因为其技术的底层逻辑还无法回应法律知识丰富性、严谨性与创造性的需求。雷磊指出,ChatGPT不具有人类的自我意识和自由意志,反思能力与道德能力对于法律职业活动而言必不可少。在GAI“灰犀牛”到来之际,这些观点是相对受欢迎的,给法律人吃了一颗“定心丸”。
应该看到,这些观点或多或少地弱化了GAI对法律人的挑战,人为拔高了“挑战”之标准,即一般职业需求被侵占不算挑战,只有涉及法律人核心的职业能力才是“真正挑战”。那么,学者们认为法律人之核心能力展现在何种案件之中?对这一问题的回答,可以将法律人之职业需求根据难度进行分类,分为简单案件(easy cases)和疑难案件(hard cases)。所谓法律人的特殊能力,即实践理性、自由意志、反思能力,在90%以上的简单案件中都无涉,直接套用法条即可。只有在疑难案件中,才需要动用这些“屠龙之技”。换言之,学者们认为,只有在疑难案件处理中法律人的地位被动摇,才构成真正挑战。
诚然,在疑难案件中最能展现法律人之能力,优秀法律人相较于边缘法律人的优势最大,是职业的核心生产力与附加值。如果GAI可以处理疑难案件,大部分法律人会失去生存空间。法律人在就业市场的竞争力减弱,将被迫转业或转型,进而法律教育也将难以维系,人才将会出现断档。同样的现象曾发生在新闻业,自媒体时代“全民记者”现象导致纸质媒体不断消亡,使就业市场艰难,出现新闻学领域“职场—教育”的下行螺旋。在GAI时代,如果其形成真正挑战,尽管还会有一些孑遗法律人,如立法者、高级法官、法学教授等,但是法律职业共同体将不复存在。这样,我们就明确了GAI对于法律人真正挑战的形式标准——GAI能否接手疑难案件处理。
疑难案件的典型处理模式:等置模式
明确GAI对法律人真正挑战的形式标准并未完全解决问题,还需要探索是否存在更加实质之标准以检验GAI的挑战,即法律人在疑难案件处理中,是否存在特殊的职业方法,如果GAI能够模拟这种方法,就足以认定形成真正挑战。
(一)疑难案件处理模式的模糊性
在AI与法律人这一论题的梳理之中,我们发现有一种论证思路是一以贯之的——“法律的生命不在于逻辑,而在于经验”。对此,耶林曾批判:“那种完全不顾其裁判所带来之结果,并且将责任完全推给立法者,而仅对法典的条文机械式适用的法官……他只是司法机器中一个无感情、死板的齿轮。”马克斯·韦伯将这种论证思路提炼为“法律自动售货机”(Rechtautomaten):“现代的法律人由于仅限于解释法规与契约,法律犹如一部投币自动售货机,人们只需往里投进事实(加费用)即可得出判决(加理由)。”这套论证的逻辑是这样展开的,首先,将简单案件和疑难案件进行区隔。简单案件可以通过规范三段论予以解决,即法律规范—案件事实—法律后果。但疑难案件则不可以通过这种方式予以解决,甚至不能以逻辑的方式解决。其次,人工智能所进行的推理是必然性的逻辑推理,在设定程序之后,就会得出确定的后果,这与疑难案件处理中所要求的个案衡量、实践理性相违背。最后,只要是逻辑所设定的程序,即使是GAI也无法处理疑难案件。
但这套论证模式存在问题:简单案件的“法律自动售货机”模式毋庸置疑,疑难案件也确实不可能通过这种模式予以处理。但是逻辑不是只有三段论,疑难案件是否可以用逻辑方式予以表达,需要进行探讨。如果说在AI发展的早期阶段,符号主义的观点认为AI是必然性推理还有些道理。但在当代连接主义和行为主义指导下的GAI,已然脱离了机械推理的窠臼,已经能够实现可废止推理。对于疑难案件处理方法,本身也存在较大争议。疑难案件本就是相对简单案件而言的,难以用常规方法进行处理,很多时候确实有赖于法律人的实践智慧,也无怪乎法律人将此视为禁脔。但涉及疑难案件的处理往往非常模糊,比较典型的说法有实践智慧、经验、自由意志、利益衡量、类比映射甚至是灵光一闪等,颇有“道可道非常道”“不足为外人道”的神秘意味。法学界也为此争论不休,有的学者认为,法律人对于疑难案件的处理并不存在什么特殊方法,更多的还是为了职业利益进行“包装”。真正的问题是,论证者不能一边认为他者无法解决疑难案件,一边又不阐明该如何解决,这并不是有诚意的讨论态度。因此,必须清楚阐述法律人在疑难案件中的特殊能力,然后才可谈论GAI能否真正挑战法律人这个问题。
(二)等置模式如何处理疑难案件
本文欲寻找一种重要的法律思维模式,其是法律人在疑难案件中的核心作业方式,也是拒斥GAI的理由。学界很多论述思路往往不得要领,不仅对GAI的前沿不了解,也是对法律人特殊能力的“返魅”。法律人的特殊能力应明述,讲述不清的应当沉默,认为法律能力不可名状并不明智。在这方面,以英美为代表的普通法系往往语焉不详,而德国则更为清晰,这可能与两者对法学的不同认知有关。英美法学为Jurisprudence,自Iuris Prudence而来,具有法律(审慎)智慧之意;德国法学为Rechtswissenschaft,源自Iuris Scientia,直译为法律科学。智慧者因不同人之慧根不同而有别,而科学则必须清晰、可言说、可检验。
德国学界认为,处理疑难案件的方法是“等置模式”(Gleichsetzung, equating of the law)。等置模式的基本假设是,法律事实的判断建立在事实与规范比照的基础上,法律人并不是先进行事实描述后适用法律,而是将法律适用环节整合入事实认定环节。等置模式运用了“诠释学循环”,案件判断是“目光在规范和事实间往返流盼”。恩吉施认为:“具体的事实行为被归在由法律概念表明的共同类别中……新的案件与已经确立了类别归属的案件进行等置(Gleichsetzung)的基础之上。”考夫曼认为:“只有在用经验来丰富规范,用规范性来丰富案件之后,其方式为它们相互‘适应’,并应对这种适应通过论证加以说明,归类方为可能。”那么,等置模式适用的场域为何?对于简单案件,只需简述案情适用法律即可;只有在疑难案件中,等置模式的作用才能充分体现。疑难案件的案件事实比较复杂、法律关系并不清晰,单向从事实至规范是比较困难的;而采取“逆向”方案是相对容易的,即法律人先根据事实与规范的比对确立适用的规范,然后再建立起两者之间的联系。
接下来,需要进一步剖析“等置模式”,建立模型进行分析。法学方法论上有一对著名范畴——法律发现(discovery of law)与法律证立(justification of law)。法律发现是生成法律结论的心理过程,法律证立是对法律结论进行验证的过程。法律发现过程会受到诸多因素的影响,包括实践智慧、法律经验甚至是法官的早餐;法律证立过程必须表达清晰、合理,经得起法律与同行的检验。学者们常将等置模式归为法律发现,如考夫曼认为,法律人在发现法律过程中不是简单的“三段论”,而是主体加入其中发挥积极的构建作用;郑永流也认为,等置模式对应的是法律发现。等置模式固然在法律发现中有重要作用,但并不意味着其在法律证立中无关紧要。等置模式的核心就在于将事实与规范等置而观,在规范还未确定之时,法律人是采取“假定—验证”的方法,根据经验与案件事实推断规范适用的可能性。进入法律证立阶段,规范与事实之间存在一些落差,再通过“逆推”的方法从事实进行诠释,构建通往规范的论证,使事实落入规范可适用的范围之内。换言之,等置模式是集合了法律发现与法律证立的模式,适合处理疑难案件。
等置模式单用事实与规范来分析还存在不足,事实是实然问题,规范是应然问题,法律适用必然穿透两者的界限,这就需要两个过渡概念——构成要件与事件性质。构成要件是从规范中规定或衍生而出的,事件性质则是对事实作出的进一步抽象定性。事件性质与案件事实之间的关系是法律性与自然性的关系,案件发生之后就成为自然世界的组成部分,但进入法律世界则需要对其定性。法律人将案件事实拆解为多个事件,然后对事件进行抽象评价,贴上相应“标签”,这就是事件性质;法律规范与构成要件是总和与内涵的关系,法律规范往往是立法者制定的,构成要件则更多是学术上总结的逻辑构成部分,构成要件主要与法律后果相连接。等置模式通过构成要件与事件性质实现过渡:一方面,构成要件是法教义学指向实践的线索,法律人通过构成要件识别事件性质;另一方面,事件性质是指向构成要件的“转换器”,法律人通过明确事件性质,可以与法教义学中的构成要件相匹配。如果能在构成要件与事件性质之间建立联系,那么也就打通了事实与规范的界限,案件就能得到解决。
通过以上分析,我们就廓清了等置模式的奥秘,法律人通过巡视事实与规范,从而进行法律发现,寻找该案应适用的规范。进入到法律证立阶段,则需要在案件事实与构成要件之间目光流转,法律人需要将案件事实拆解为事件性质,每项事件性质须落在构成要件之项下。最终,法律人输出法律结果,按照案件事实—事件性质—构成要件—法律规范的顺序完成法律证立。那么,下文需要讨论的问题是,GAI是否能模拟“等置模式”?
生成式人工智能构成挑战的技术基础
前文我们阐述了GAI挑战法律人的形式标准,即GAI可以接手疑难案件处理;GAI挑战法律人的实质标准,即其可以模拟法律人处理疑难案件的模式——等置模式。接下来就要论述GAI是如何“构成”对法律人的真正挑战的,即现有的GAI技术可否模拟等置模式。很多学者仍将GAI当作“法律自动售货机”看待,这是一个重大误判。GAI构成挑战的技术基础,在于自注意力机制和预训练大语言模型。
(一)自注意力机制
有学者会认为,自然语言必须被“理解”才能进行处理,理解要依据人类心灵的标准,GAI难以理解人类语言,因此在根本上无法挑战人类。GAI作为自然语言处理(Natraul Language Progress,NLP)的产物,在技术演化的过程中各学派对其提出不同方案。其中,最有代表性的是心灵哲学(philosophy of mind)的观点,塞尔提出了“中文房间”的假想实验,假设房间里有人对中文一窍不通,但会通过字典对中文进行翻译,这就使在房外人不知其人非为中国人。同理,AI看起来也能产生有意义的语句,但是其无法理解语义并不能产生意向性。这种观念影响甚广,在法学界也有相当多的学者秉持此观念,进而断言AI永远无法“理解”法律。
哲学家们往往将“理解”蒙上一层神秘的面纱,而维特根斯坦对这些观念进行了“祛魅”。他指出,语言的理解不在于其内在,而在于外在使用之语境,明白语言在语境中起到何等作用,才算理解了语义。现代NLP主要采纳“语言游戏”进路,通过上下文的语言网络确定语义。《你所需要的只是注意力》(Attention is All You Need)作为里程碑式论文是这一转变的关键,此文提出了自注意力机制,彻底改变了NLP的范式。“自注意力机制”源于“循环神经网络”(Recurrent Neural Network, RNN)中注意力机制的改良。所谓注意力机制,是将计算结果作为下一步计算的输入,嵌入到循环流程中。自注意力机制结合了“长短期记忆”(LSTM),是由语段自身产生注意力,而不是由输入的询问语段产生注意力,其将语段自身作为询问语段Q,将待处理文本中的语段标记为K,通过Q*K之内积表示询问语段与处理语段之间的相关性。

“长短期记忆”(LSTM)
由此,基于自注意力机制的transformer架构应运而生,其由解码器(decoder)和编码器(encoder)两部分组成:解码器是对自然文本进行处理,成为AI可以处理的中间信息;编码器则是对中间信息重新进行编码,转化为人类可以理解的自然文本。首先,系统先将语段转化,并嵌入位置信息。其次,进入自注意力机制。自注意力生成三个值:Q、K、V。Q作为自我生成的询问语段,与其他所有的语段(包括自身)的K进行内积(Q*K),再与词权重V相乘(Q*K*V),输出结果经过softmax进行处理,得到“单头注意力”。再次,是多头注意力。“多头注意力”与“单头注意力”相似,为拟合更为精确将语段作多层处理,每层都进行单独的自注意力运算,最后多层归一化得到“多头注意力”,得出了中间值。最后,是进行掩码预测。所谓掩码就是将词本身的KQV给遮盖住,通过全连接神经网络去推测所需要的参数。此处的询问值Q来自解码器前端的输出,K、V来自编码器的输出值,根据需求去求解相似度最高的值,归一化后进行神经网络全连接得到输出值,经过分类输出预测的结果。
通过自注意力机制,GAI得以理解语义之间的有机关联,可以用不同形式复述语句(外语、同义置换)。这反将“中文房间”一军,如果基于transformer架构也不算“理解”语言,那么人脑的神经网络也不能理解。首个基于transformer架构的是ELMo模型,其以双向长短期记忆网络(LSTM)为基本组件,以语言模型为训练目标,通过预训练得到通用的语义表示,将通用的语义表示迁移到下游任务中。受ELMo模型的启发,预训练大语言模型的发展开始突飞猛进,最具有代表性的有谷歌研发的BERT模型,OpenAI研发的ChatGPT模型。BERT是改造了编码器,ChatGPT则是使用了解码器。ChatGPT的要点在于,提示是作为询问值Q输入,与大语言模型的词向量求解,最终输出语句。
(二)预训练大语言模型
GAI是建立在预训练大语言模型(Pretrained Large Language Model)之上,此模型不是在网上检索,而是将数据库“内化”了。GAI可以理解提示的意向,并生成自然文本。我们以ChatGPT为代表,阐述预训练大语言模型是如何构造的。
预训练大语言模型的第一步是选定训练语料。GAI并不联网,而是基于预训练大语言模型生成具有逻辑的自然文本。在AI领域有句名言“垃圾进,垃圾出”,因此选定合适的训练语料比训练本身更重要。OpenAI选用的语料除了传统的书籍文献外,还选取了很多网络语料,包括维基百科、Reddit等网页文本。
第二步是进行语词数据化(tokenization)。选定的语料大多是自然文本,必须将之转化为AI可以处理的信息形式。ChatGPT数据化并没有采用拉丁字母的数据编码,因为此方案对算力要求过高,而是采取名为Token的信息单元,按需分解成信息单元,如词组、词汇、字母等。再将这些信息单元进行二进制标记,转化为GAI可以处理的Token序列。
第三步是最关键的,即机器学习进行自注意力计算。自注意力机制将每一个Token分解为多层,并在每一层自行生成K、Q、V,再将Token之间作多头注意力运算。根据计算结果,就形成了一系列的数据矩阵。语义关系上更近的Token之间的近似值会更高,在文段中权重值也会更高。自注意力需要通过全连接神经网络进行,中间层被隐藏,经过多次叠加运算自行生成语词网络。值得注意的是,ChatGPT并不是单调的巴贝奇计算机,而是数据推土机。GPT-1参数量达1.17亿,预训练数据量约5GB;GPT-2的参数量达15亿,数据量约40GB;GPT-3的参数量则达到了惊人的1750亿,数据量达45TB之巨。这一步消耗了最多的算力,在2023 年OpenAI使用了30000个GPU从事机器学习,硬件成本超过3亿美元。在量变导致质变的效应下,GAI的数据处理能力是可以接近甚至超越人类的。
第四步是形成词向量空间。词向量(word vector)是通过向量形式表达语词之间的关系,通过第三步的计算,可以把Token转化为向量形式,根据向量可以得知语词的远近关联。又因词向量之“向量”自带空间属性,因此人们常将机器学习后形成的模型称为“词向量空间”。当然,词向量空间并不意味着真的存在一个空间,它更多是以关系序列的形式而存在。假设Token是词向量空间中的点,这些点会形成类似于“星系”的结构,如“女王”附近会有“女皇”“国王”等词。GAI是将数据库“内化”了,形成内在的语词结构网络。
第五步则是掩码预测。预训练大语言模型是基于词向量空间,使用者输入语句被称为“提示”(prompt),AI通过自注意力运算得到提示的关键信息,然后再从词向量空间中找到相对应的语词组。在生成语句时,AI通过前文语词,预测下一个出现概率最高的语词进行输出,直至终止符的出现。在训练时先将询问语段Q进行掩码处理,这样GAI就需要通过其他序列的数值,预测下一个生成的语词。如在提示输入“法律人”时,GAI根据词向量空间预测“律师”“法官”等词组,在此处将谓词嵌入,就可以形成完整的语句。
第六步是微调。任何人工智能系统都需要进行微调,在早期时,OpenAI主要采取了人类反馈强化学习 (RLHF) 机制来进行微调。技术人员直接对ChatGPT的结果进行修正,AI根据人类的反馈进行修正学习。但这种方式的效率较低,后续改为近端策略优化来微调模型,即采取标注损失和排名奖励的方式:标注损失是技术人员对输出结果与预期结果的偏差值进行标注,排名奖励是技术人员对输出的结果进行排名。通过“逆向神经网络”,让AI将损失与奖励纳入计算中,从而输出技术人员所欲的结果,准确率和拟人性更高。通过这些工作,预训练大语言模型就完成了。
生成式人工智能如何模拟等置模式
前文明晰了GAI对于法律人的挑战关键在于疑难案件。在疑难案件中,法律人主要使用等置模式进行处理。GAI是最新的技术进展,其原理基于自注意力机制和预训练大语言模型。结合以上所有线索,我们需要判断,GAI是否可以模拟等置模式,从而对法律人构成挑战。
(一)模拟法律人的知识基础
应该说现阶段的ChatGPT及类似应用还不能构成对法律人的挑战,最核心的问题是ChatGPT及类似应用并不是针对法律训练的生成式人工智能,而是针对一般自然文本生成开发的模型。现阶段已经有了几款针对法律的生成式人工智能,如lawGPT、ChatLaw、LexiLaw、LAW-GPT,但是这些模型只是简单嫁接在ChatGPT或类似应用之上。能构成真正挑战的GAI,应该是同ChatGPT和BERT一样,基于专业的法律文本进行训练,并且由法律专家进行微调的GAI。如果有针对性地开发法律GAI,就能构成对法律人的挑战。接下来我们先从法律知识层面探讨,该模型的训练是否可能。
首先,法律知识主要是由概念网络组成。法学处理的主要就是概念问题,从最上层的法律理念概念开始,其下就是部门法,部门法下属则是法律规范所抽象的概念,再下就是围绕着规范概念所形成的各种构成要件。法学就是研究这种“概念谱系”的学问,由下至上形成“概念的金字塔”,所有近似的概念都被归入到同一模块之中。同理,GAI可以形成类似的概念网络,法律概念被赋予不同的Token,通过对法律知识的深度学习,也可以形成法律领域的词向量空间。法律词向量空间不仅可以完美复刻“法律概念谱系”,甚至还可能发现法学研究和实践未发现的词向量关系。
其次,法律知识的关键钥匙是法律要件。知晓法律规范和概念并不等于掌握了知识,因为法律的一个大问题就在于其具有“开放结构”。只有少数案件与规范完全重合,但是更多的案件则处于模糊地带,需要进行认定。法律要件就是从规范和概念内涵中引申而出的,用于识别概念的关键特征,通过对案件特征与法律要件进行比对,得以知晓此与彼概念之别,也是进行快速检索案件类型的识别符。对于GAI而言,法律要件更是有用的工具:一方面,法律要件可以作为词向量空间中的语词核心,串联起一系列相关概念;另一方面,法律要件还可以作为法律实践中的关键信息,围绕其进行法律文本的生成。
最后,法律人也有“预训练模型”。法律人在学校接受法学教育,从中学习到法律规范、概念与法律要件,在知识中已然形成了“概念网络”,语义相近、关联性较高概念都聚合在一起。上述根据教科书形成的法律知识模型还需要实践的修正,对于此项任务,法律人在实践中,强化正确的连接、修改错误的连接,最终经过“微调”形成了法律人的“预训练模型”。因此,法律人所谓的“实践智慧”,就是这种预训练模型发挥了作用,其能快速识别法律关系并进行法律发现。GAI与法律人的认知模式非常相似,其经过训练形成词向量空间,再根据提示在空间内寻找相应的向量关系,从而生成符合“概念网络”的文本。生成式人工智能是通过预训练+微调模式生成的,法律人的认知模型则是学习模型(复制)+实践微调。两者都是先形成知识模型,随后再经过提示生成答案。
(二)模拟等置模式的关键:概率推理
GAI挑战法律人的关键在于疑难案件,法律人处理疑难案件主要使用等置模式,GAI可以模拟等置模式的关键是概率推理。法律推理不是演绎推理,不具有必然性,其是一种盖然性的推理。法律推理是一种“可废止推理”或“易错推理”,即推理过程是可逆的、随时可修正的,“等置模式”是猜想—比对—修正—输出的过程。对于有经验的法律人而言,这一过程会极度简化,看起来就像“实践智慧”直接“发现”了结果。法律人诉诸经验、实践理性、价值等因素,归根结底都是概率推理。概率推理是把一个事物的特征综合起来,与另一个事物与事件的特征相比较,如相似性达到一定程度就推出相同的结论的推理模式。
等置模式也是一种概率推理。首先,等置模式的前提是法律知识。法律知识以通用知识模板的形式存在,建立了法律规范、概念和要件之间的知识网络,这种模式给法律人提供了诸多“标签”,用以在实践中识别案件的性质。其次,当法律人接收到案件时,会先将信息进行区分,将无意义和具有干扰性的信息排除,而将有用的信息加以搜集和整理。法律人将有用信息给予相应的权重,并将各种信息附以事件性质。再次,法律人将事件性质的内容予以叠加并综合,然后与法律知识中的法律要件进行比对。比对是多线进行的,法律要件和事件性质双向进行,最终确定适用的法律规范,完成法律发现。最后,法律人根据确定规范的方向,对案件事实的叙事进行微调,尽量使其与相应案件类型相似,进而在形式上推导出法律结论。
GAI推理也遵循概率主义的进路。早在20世纪时,乔姆斯基曾断言存在一种“先天语法”,是AI进行自然语言处理的前提。而当代科技发展反驳了该假设,无论是BERT还是ChatGPT都没有内置任何语法程序,纯粹是根据概率生成语句。这似乎也暗示了语言也许并没有哲学家说得那么神秘,不具有某些“内置”的特质。既然语言上不存在先验结构,那么也没有理由认为法律存在特殊性。生成式人工智能的算法中使用了“马尔可夫链”(Markov Chain)的原理,即一系列个体性的概率事件,进行叠加之后会收敛于某一个值,新的孤立事件并不会对收敛值造成干扰,因此可以基于先验事件对结果进行预测。GAI的工作原理是“造句预测”,前一个词作为下一个词的提示,可能包含多个选项词汇,需要综合方能计算。文段中所有词的预测值会叠加收敛于最大概率的选项,GAI就会选择这个词进行输出。GAI破解“等置模式”的关键就在于这种概率算法:法律人综合案件的所有因素,并通过“实践智慧”,也就是根据概率发现了法律结果,那么,GAI可以提取案件的所有关键因素,并运用“马尔可夫链”算法对法律结果进行计算。再从GAI的视角重现这一原理。首先,GAI对案件事实语句进行初步处理。根据Token在文段中的权重值,消除不相关信息,重组为噪点更少、重点更清晰的概括事实语句。其次,根据概括事实语句中重要权重部分进行同义置换,在词向量空间内与最接近的事件性质进行连接。再次,将事件性质在词向量空间中找到最接近的法律要件。AI对一连串的事件性质进行叠加运算,指向概率最大的法律要件,再将法律要件叠加收敛指向最大概率的法律规范。如果偏差值太大,则以最近的法律要件作为查询值,反向对文段进行检索,重新计算权重值。最后,确定法律规范之后,由GAI按案件事实—事件性质—法律要件—法律规范的顺序进行证立。
总体而言,GAI的推理是概率推理,通过自注意力机制和预训练大语言模型,实现了法律规范与案件事实的连接,模拟了法律人的等置模式。GAI可以处理疑难案件,因此在未来会对法律人构成真正挑战。
(三)GAI挑战法律人的可行性
应该指出的是,当下毕竟没有较为成熟的法律GAI,我们该如何衡量其在技术上是否可能,答案是:如果法律GAI训练难度低于ChatGPT,那么就可以认为其构成挑战是可能的。
法律人的知识模型是现成的。法律人的知识经过数千年的演进,形成了法教义学的庞大知识体系,这为法律GAI训练提供了框架。训练语料可以包括三种类型:法律规范、法学框架与实践材料。法律规范包括法律解释、政府规章、判例等;法学框架主要是对法教义学的知识进行学习,包括法律的构成要件、学理解释以及范例;实践材料包括法律文书、法院判决等。法学框架承担着承上启下搭建词向量空间的作用,向上承接法律规范,向下指向实践材料,语词之间与法律框架作为核心连接点。由于法律人的知识模型的关键作用,意味着法律GAI的训练不需要另起炉灶,大幅降低了训练难度与成本。
此外,大语言模型微调的工作量较小。法律领域天然存在一个其他自然文本处理不具有的优势,就是自带评价机制。在疑难案件中,有海量的法律数据可供使用,其中包含当事人各方的交锋,还包括法官对法律意见的评述。这就省去了花费人力进行微调的成本,只需要对法官意见掩码处理后,对疑难案件进行生成文本,再将两者对比,就能实现标注损失和排名奖励的微调。更进一步,法律GAI的微调还可以使用对抗式神经网络技术,这种技术由生成网络和对抗网络两部分组成,生成网络是根据现有模型对内容进行生成,而对抗网络则是对生成网络的内容进行打分、反驳和修正,两者进行内循环反馈从而提升模型的精度。法律GAI只需要将学习分为两个部分,一部分是正向学习,通过学习法律数据库中的成功案例以优化输出结果;另一部分则是对错误与失败的案例进行学习,学习相反意见形成对抗网络,进而自主对预训练模型进行评价。这两种网络相互对抗,再通过逆向学习方式,促使预训练模型再进行微调,直至产生理想的结果。
预训练大语言模型有“涌现”现象。GAI进行机器学习并非线性的,当训练量较小的时候,训练效果并不理想,但当训练量累加到一个阈值时,就会出现“涌现”(emergence)现象,即自然语言处理能力会突然获得巨大提升。法律GAI的法律知识基础,已经是在海量数据的“提炼”之上,训练可能在达到一定数量级后,就不再需要进一步投入,也意味着也许并不需要花费与ChatGPT一样的时间与成本。根据以上分析,法律GAI的训练难度比ChatGPT更低,如果在经济与政策上可行,科技公司训练出高精度的法律GAI只是时间问题。
法律人对于疑难案件的处理能力系在实践中反复进行微调,花费数十年方才形成,最终可以凭借直觉进行计算。在过去,法律人秉持职业导向、实践理念以及“法律工具主义”,将法律视为工具,自视为“法律工匠”,在工作的过程中可以通过实践来掌握这种能力。然而,法律人数十年之努力,对于GAI而言可能只需要数周,而且GAI在知识广度、深度上还会更优秀。法律人高深莫测的“实践智慧”是数据与时间的魔法,但在预训练大语言模型和概率推理面前毫无秘密可言。当然,要承认有的法律人的能力比AI强,但是,任何生产方式的革新都是冲着“廉价七成正确”去的,即使某些顶尖的法律人仍有“炫技”空间,但并不足以阻拦法律职业需求的崩溃。这也就解释了GAI为何能对法律人构成挑战——在GAI出现之前,法律人的作业模式已经制式化,而任何制式化的产业在现代大工业冲击面前都束手无策。
法律人的因应之策
本文意图不在于预言,而在廓清法学界对于GAI的错误认知:GAI已构成对法律人的真正挑战,在疑难案件处理的“等置模式”层面,技术阻碍已不存在。法律人面对这柄“达摩克利斯之剑”,采取讳疾忌医的态度是不理性的。那么,法律人应当如何正确因应该挑战?本文认为,我们应诉诸法律人的主体性,以下从三个方面进行论述。
(一)从法教义学教育转向重视法学方法论
法学方法论也被称作法律方法论,是指对法律学科发展的情况、思考方式,以及所利用的认识手段的反思。在传统的法学教育中,尤其是部门法中,侧重法教义学的传授。法教义学作为自中世纪以降的法学教育范式,在法律的科学化、专业化和精细化方面起到了不可替代的作用。在实践方面,法教义学更是表现为侧重对法律要件的分析,对法律规范进行提要化处理。等置模式就是法律要件分析之产物,法律人在同一框架模式的训练和学习,对于统一法律认定标准发挥了重要作用。然而法教义学也为GAI的介入大开方便之门,这种制式化的框架作业模式,非常利于GAI进行建模和机器学习。
因此,我们应当转变法学教育的范式,从侧重法教义学的教育转向重视法学方法论。重视法学方法论的教育,需要松化固定的法律要件框架,对于方法论的评判优先于法律适用的评价。法律人不是法律工匠,而是在法学方法论指导下的创造者。法律人在进行规范与事实连接的过程中,并不承认采取法律要件才是唯一正解,需要结合法律目的进行评价,使用各种方法对案件事实进行重新诠释。法学方法论更多是抽象性的方法指引,AI虽可以进行语料学习,但没有具体的语词指向,很难建立词向量空间因而难以深度学习。法律人使用方法论也不是毫无限制的,其中存在一些客观的评价标准。当法律人使用方法论不当时,即使符合法律要件,也不应认为这种连接是合理的。
(二)转向以法律证立为重心
在法律发现与法律证立之间,法律证立的优先级是更高的。法律证立即建构法律事实到法律结果之间的连接,通过论证将这种连接合理化。所谓转向以法律证立为重心,就是鼓励法律人创设新的法律证立方法,以不同的角度、思维与方法去建立事实与规范连接。其中的三个关键点,是论题思维、法律修辞与论证策略。
首先,是论题思维。论题是古典时代的一门技术,是借助一些关键节点的提示寻找论据的学问,目的是帮助言说者展开论述。“法律论题学”思维不同于演绎体系思维,是以问题为取向的思考技术。法律论题学是指明法律人如何在更广义的范畴上寻找前提的学问,以“片段性的省察”,而不仅仅依赖法教义学体系。论题思维可以与传统法律的“解题思维”相对,实质上是一种“问题思维”,根据与问题相关的诸多论题,扩展言说者的思路,寻找论辩前提的运作过程,有着特定的思维程序,论题思维更凸显价值,在法教义学框架内,GAI总能寻找到法律前提(规范)。但是如果采取论题思维,以更广度的视阈寻找前提,就突破了GAI的边界。
其次,是法律修辞,现代法律修辞思潮源于《新修辞学》,法律修辞的方法旨在获得人们的认同,关键是进行心灵上的沟通。法律修辞中的关键概念是“听众”,听众系言说者想通过其论证来影响的人之总称。如果我们将法律工作当作逻辑推理,那么法律人不可能是GAI的对手,但是如果将听众这一概念引入,法律人仍然具有竞争力。GAI就像是一个法律公务员,其工作主要是制式、精准的法律公文写作。法律修辞的使用意味着法律人需要更像演说家,应创制具有情绪言说以感染法律听众。在对人性的把握上,GAI仍难以媲美法律人。
最后,是论证策略。在当事人主义模式下,论证策略使用得较为频繁,而在职权主义模式下,论证策略通常会被抑制。在职权主义模式下,GAI可以缩小与法律人的差距,甚至论证得更为直接和清晰。若允许论证策略,则法律人不需要像答题一样按照程式输出固定答案,只需要围绕着一个主题,通过不同的方式以达到目的,如诉诸情感、类比论证等,这些论证策略是GAI难以掌握的。法律人作为一个职业共同体,为了职业的长期存续,也理应对论证策略采取包容的态度,而不能一概视为“奇技淫巧”。
(三)从概率推理走向法理分析
概率推理是一种盖然性而不是因果性推理,只需要概率最大即可确定结果,而无须考虑相似的原因为何。GAI基于自注意力机制和词向量空间也可以进行概率推理,从而对法律人构成挑战。我们可以联想,在阿伦特著名的“平庸之恶”(恶的平庸性)论题中,她阐述了官僚在执行恶的命令时,缺乏一种“思”,即把自己降级为法律的客体,并不去思考法律与自身的价值。无独有偶,在对ChatGPT的观察中,不少哲学家指出其身上也存在着“平庸之恶”的特质,即其展现出四平八稳但毫无特色的行文特点。从这个角度不难发现,GAI之所以能模拟“等置模式”,在于两者都是将概率计算包装为制式化的推理,其中并不存在一种“思”。要应对生成式人工智能的挑战,关键是确立起法律人的“思”,也就是要将重心放在法理分析之上。
法理是法律本身内含之理,法理分析需要注意三个方面。其一,法律证立需探讨法理。法律人不应停留于特征相似的概率推理之上,而应探求事物内涵之理与法理的同构性。GAI对于法理论证是无能为力的,这才是实践智慧真正需要展现的地方,根据案件的情况与法理的一致性,并不一定需要选择盖然性最高的因素。案件符合要件并不等于符合法理,需要回到法律本身的客观与主观目的才能把握。其二,法理分析应当注重对法律本身的评价。传统的观念是法律对案件进行评价,这本身蕴含着法律工具主义的取向。法律人在法理分析时,除了对案件本身进行评价,也可以对作用的法律进行评价,甚至越过法律而采取原则。法律不应当是一个封闭的体系,也不是计算机的系统算法,应根据案件的法理分析,对法律进行批判性思考。其三,法理分析要推进“思”的深度。法理分析要超越法律要件的分析,进入政治学与哲学领域,这是法律人掌握主动权的作业方式。法律人通过对法理进行思考,不仅是单纯为了解决案件,还要解决社会的系统性问题,凸显人类的尊严。历史不止一次证明——人类有尊严的思考才是无法被替代的。
结语
需要说明的是,本文所提及的几种因应方式也并非最终解答,我们对因应方案持开放态度。生成式人工智能构成对于法律人的真正挑战,在于其能够模拟法律人引以为傲的“等置模式”,从而攻克疑难案件,冲击法律人的核心职业需求。GAI对法律人的挑战,与其说是技术进步造成的,不如说是法律人自我设限造成的困局。重复与制式化的作业方式总是很容易被替代,唯有保持主体性与生命力才是法律人永远屹立的基石。认知方式是法律人走进法律之门的钥匙,窄化的认知方式是我们获取钥匙的捷径。但是永远不要忘记,人类永远不可能在限定的知识领域中比AI做得更好,不要因为贪图捷径却让我们最终失去了法律之门。也许在合理的因应策略之下,法律人能将挑战转化为机遇,让法律人成为真正意义上“自主的人”。



《探索与争鸣》杂志官方账号




