实验方法在经济学中的应用与思考
来源:中国社会科学网 作者:葛新权
原贴:http://econ.cssn.cn/jjx/jjx_jjxff/201905/t20190506_4874344.html
摘要:在重新认识微观经济,实现“通宏洞微”,重构宏观经济学中,源自自然科学的实验方法得到了广泛的应用,实验经济学、行为经济学、神经经济学等显现出巨大的生命力,并发挥出重要的积极作用。随着经济学追求以数理化为特征的自然科学化趋向,相比而言,反倒对经济发展历史、经济史与文化,以及现实经济状况或多或少有些忽略。这种现象已经引起了广泛的关注与思考。一些事实已经表明,那种只通过实验方法研究经济问题,因经济现象的复杂性,而产生了偏差,甚至严重的偏差。为此,在条件许可下,需引入试验方法,作为由实验到应用过程中不可或缺的环节,并对实验结果进行检验、修正与完善。当然,通过检验的实验结果的应用同样会产生偏差,但这种偏差可以显著减少,以期更好地、准确恰当地发挥实验方法应有的积极作用。
关键词:经济学方法论 实验经济学 实验方法 试验方法 模型验证
一、实验方法在经济学研究中方兴未艾
众所周知,经济问题的核心是一个利益问题,进而是一个价格问题。从理论上讲,选择博弈论是在研究经济问题中最佳的理论与工具。对于诸如自然科学和工程技术科学等硬科学来说,对机理或机制的识别与分析是重要的,或是生命生理中器官系统结构与功能及其关系,或是生产过程中产品部件系统结构与功能及其关系。这种科学的分析方法应用到经济(或社会或管理)领域,就是相应的经济系统中各个子系统(子系统之间的连接的节点)功能(责权利)及其关系,都可以概括为节点上利益主体,以及节点连接上相关的利益主体的关系。这就是在经济领域中应用博弈论分析经济现象或问题的机制或机理的出处,进而进行制度或政策设计。但鉴于实际情形的复杂性,并且限于常规的、有限的几种博弈理论模型,诸如纳什均衡、囚徒困境、智猪博弈、重复博弈、公地悲剧、零和博弈、拍卖博弈等,结果,应用者只能千方百计地把少数实际问题简化归结为这几种理论模型适用的情形后进行分析。
对于大多数经济问题,博弈论是一种指导思想,因尚无有效的可操作、落地的方法与工具,影响了博弈论的应用与发展。我们认为,这可能是博弈论特点决定的,难以甚至不可能成为可操作、落地的方法与工具。因此,不能缘木求鱼,而应开辟新的思路与途径。对此,仿真模拟应运而生,但多年实践后发现,它们对于博弈论应用与发展的作用还是很有限的。
随着计算机网络技术发展与对“理性人”行为的认知,实验经济学实验方法“横空出世”,即应用心理学实验室实验的理论、工具与方法研究经济学问题,对博弈论应用与发展起到积极的促进作用。实验经济学之父费农·斯密荣获2002年度诺贝尔经济学奖。当然,我们认为,并不是所有的经济学问题都适宜于实验室实验研究,只有那些基于个体异质性,以及有关风险偏好与心理承受差异的时适博弈问题,才适合选择实验经济学实验研究。从研究结果来看,与其他传统的方法相比,实验方法本身及其所获得的结果都更符合问题的实际,揭示了问题内在结构质的特征,充分体现出对个体差异的认识,而传统的方法本身及其所获得的结果忽略了差异,只是停留于对问题表面特征或总体的(平均)认识。当然,为了解决问题,有的时候实验方法还需要辅助于其他方法,有时候它还只是其他方法的补充。实验方法这种独特的作用,不难使我们想起标志着科学管理诞生的弗雷德里克·温斯洛·泰勒1881年著名的“金属切削试验”和1898年著名的“搬运生铁块试验”和“铁锹试验”。这些试验告诉我们,在遇到问题或矛盾时,选择基于事实求是的科学态度,进行试验,发现原因,揭示规律,进而解决问题。显然,这种试验比实验经济学实验、仿真模拟更贴近实际、更科学、更有效。
随着实验经济学应用普及,以及基于实验的行为经济学、神经经济学崛起,有关实验方法研究与应用大有超出经济学问题的趋势。对此,有必要全面、客观地做出冷静的思考,以使基于实验方法的行为经济学、神经经济学,包括实验经济学回归经济学问题,成为真正的经济学研究,也为了准确恰当地发挥实验方法应有的积极作用。
为此,以下先分析实验,以及在经济学中实验存在的问题,进而引入试验方法,以检验、修正、完善实验方法在经济学中的应用。
二、实验方法的自然科学属性
关于什么是科学,有多种观点,这里我们引用以下两种。第一,科学是一种通过控制实验来找到两个因子之间的确定性的互动关系,并将这种关系上升为理论。显然,这种观点强调的是科学的方法,并且突出实验的方法。我们认为,实验是科学研究方法中最重要、最基本的工具。如有的学者认为,科学基于实验,其最高境界就是控制实验、系统思想、实证分析,并且科学的基本方法就是“控制-对照-比较”的过程。第二,科学是一个领域的知识总和,进而科学方法是指一套包括记录、理论化、检验、应用的积累知识的方法。特别地,模型是理论化中最核心的逻辑推理工作,它是一个简化的现实世界,试图解释真实世界里研究者关注的现象。同样,这种观点强调的是科学的方法,并且突出理论化中模型的方法。我们认为,从广义上讲,模型本身也是一种实验方法,况且研制模型需要理论、数据库、模型库等,如仿真、模拟。推断统计中的方差分析,也是一种实验方法。
那么,什么是实验?有多种观点,我们引用以下观点。一般地,实验是科学研究的基本方法之一。根据科学研究的目的,尽可能排除外界的影响,突出主要因素并利用一些专门的仪器设备,而人为地变革、控制或模拟研究对象,使某一些事物(或过程)发生或再现,从而认识自然现象、自然性质、自然规律。可见,这种通过实际操作的方法对应于理论研究的方法,用于预先研究中对某种不确定的情况进行实物类或半实物类探索。
实验内在的核心价值体现为一种科学的实验方法,即实验方法是指经过特别安排,在人为控制下确定事物相互关系的研究方法,它是自然科学研究领域最早被普遍使用的研究方法之一,也是近代自然科学建立的基础,以致有的学者认为,研究就是实验、实验、再实验,反复寻找的过程。Malhotra认为,实验方法作为一种研究方法,其最大的特点在于可以推断因果关系,即通过实验方法,研究者可以了解哪些变量是原因(自变量),哪些变量是结果(因变量),从而确定原因与预测结果之间关系的性质。
对于描述性或相关性研究而言,因果关系通常很难实现。Cook
和
Campbell认为,因果推论成立需要建立在Mill提出的“因果必须相关、原因必须先于结果、必须排除导致因果关系的其他解释”三个标准基础上。他认为,实验方法不仅满足这三个标准,而且可以通过操纵
(Manipulate) ,对变量精准控制 (Control) ,实现“排除导致因果关系的其他解释”。
实验方法具有以下两个优点:一是,可以复制实验。根据统计规律,在相同条件下某实验的次数足够多后,偶然中蕴含必然才得以出现。因此,我们不能,也很难从一次实验的结果中推断出规律性的结论,因为一次实验所呈现的结果具有偶然性。重复实验的次数越多,且获得的结果趋势相同,才有价值。二是,可以在真实环境中开展实验。在统计推断系统中,输入的是垃圾,输出的还是垃圾。这说明通过实验获得的数据真实、具有可靠性很重要。实验可以在真实环境中进行,从而获得真实的行为数据,为归纳提升或推断奠定坚实的基础。而其他方法(例如问卷调查)中几乎是不可能的。
从科学实验的角度,模型不仅是理论化中最核心的逻辑推理工作,重要的是,模型还是实验者所运用的实验手段,其本身又是实验对象,即实验者对模型进行各种实验,以获得关于模型的各种认识,进而认识真实的客观世界。这就使模型在科学实验中占有特殊重要的地位。
三、实验方法在经济学研究中的局限
实验是自然科学,以及工程技术科学等硬科学的研究的基本方法。一些经济学方法是从自然科学来的,尤其实验方法在经济学研究中得到广泛应用,如心理、行为、风险、神经等实验方法的实验经济学、行为经济学、神经经济学研究遍地开花,如火如荼,呈现迅猛发展态势。面对环境巨变下的宏观经济重构,在重新认识微观经济,以及构建宏观经济的“通宏洞微”中发挥着积极的作用,有着良好的预期。如实验经济学通过实验方法揭示心理、风险态度、偏好等个体行为异质性,探讨经济问题内在的特征与规律;又如行为经济学和神经经济学应用心理学的洞见,并通过实验方法,加深理解人类对经济行为内在动力机制,其最重要的特征是从情感与理性之间关系角度入手理解经济行为,以及关于自我控制、动态决策、情绪和移情问题。特别地,神经经济学利用眼动仪、功能磁共振成像以及脑电仪等探究在某种刺激下人的无意识行为(反应),这些为经济学研究开辟了新的视角、方法和工具,揭示了微观经济学新进展。
在这种发展环境与趋势下,通过对实验方法研究经济学问题全过程的思考,我们发现,基于实验的实验经济学,尤其包括行为经济学、神经经济学,也存在一些值得商榷的问题。
(1)毫无疑问,每种方法都有特殊性。行为、心理、偏好等实验方法也不例外,并非所有问题都适宜用这种实验方法。如前,我们认为,只有涉及问题中的利益主体的行为(心理)实时博弈时利用实验方法才有价值,否则未必是最好的选择。
(2)不可否定,从事行为、神经、实验经济学研究者,因脑医学知识、行为科学知识、心理学知识不足以支撑实验结果的分析与认识,且不说实验结果与经济决策的关系,这就如同,不熟悉实际宏观经济的人,利用经济学理论与模型,根据公开发表的统计报告数据建立模型,对模型结果的分析停留在模型估计的参数上。可想而知,这种分析是很肤浅的,且无益于对问题的认识。从一般上讲,任何理论在实际中的应用本身是一个创新过程,对研究现象过去、现状与未来的认知是很重要的。不具备这一点,基于以问题为导向,纵有再好的研究理论与方法,也会功亏一篑。
(3)实验的科学性。有的学者认为,科学实验成为真正的科学方法,关键是把握实验原则。实验原则主要体现在以下诸方面:掌握理论、提出假设、精心设计、做好准备、保持状态、控制因素、仔细观察、反复实验、核对结论。对此,科学实验应具有鲜明的纯化条件(纯化观察对象的条件的作用)、强化条件(强化观察对象的条件的作用)、可重复性(观察对象可重复的性质)等特点;还具有观察、定义、假设、检验、发表(解决问题的研究结果)、建构(理论)等六个重要步骤;还具有准备阶段(确立实验目的、明确指导实验设计的理论、着手实验设计、实验准备)、实施阶段(取得某种实验效应和数据的客观的物质活动)、处理阶段(消除因主客观因素对实验结果产生的误差)等三个阶段。
概括地讲,科学实验包括实验者、实验对象、实验手段。实验者是实验活动的主体,即组织、设计和进行科学实验的人,包括确定实验目的、设计实验方案、制定实验步骤、操作实验过程、处理解释实验结果等。实验者是自然和社会的参与者,其背景知识、理论假设、方案设计、资源利用、实验条件控制、数据分析、科学解释,以及与其他实验者和实验对象沟通交流能力都很重要。
实验对象是实验研究的目标总体或实验单位的取样总体,也是实验者进行变革、控制、实现认识的对象。实验手段由实验的仪器、工具、设备等客观物质条件组成,为实验者和实验对象之间的中介环节,并决定着科学实验所能达到的认识水平。
这对于自然科学与工程技术科学等硬科学来说,都是可以做到的,但对于经济学问题中的实验,则难以做到。特别地,实验环境、实验方案,以及被试对象与实际的客观差异,对实验结果都会产生影响。对于硬科学来说,利用实验室,通过控制实验条件,模拟真实环境是可能的,但对于经济科学的实验研究来说,关注人类活动,通过控制实验条件难以模拟真实环境,甚至是不可能的。
硬科学的实验结果往往还要通过试验进行验证。一般来讲,硬科学研究自然规律与工程技术规律,与人类无关,而经济科学研究的任何问题都是人类活动。这正如在所有要素中,马克思政治经济学把人(活劳动)这个最重要的要素独立出来,而西方经济学起初把人与物同等看待为要素,但随着发展越来越关注人,如人力资本、创新、知识、人才、人的行为、偏好、心理等等。因此,在经济学研究领域,实验方法还是有较大的局限性。
(4)经济学系统的特点。如前,经济学不同于自然科学。一方面,有的学者认为,因经济学系统性弱、结构和功能关系可强可弱,以及非科学性因素,它只有机制,没有覆盖性法则(这些机制各不隶属、互不相关),具有非常大的艺术性。这决定了经济学概念只有在问题意识下才有意义,其发展理论基本上是多元范式下的范式交替,而不是范式转移。研究方法即使明晰,具有可积累性,但试图寻得一种精巧的方法,像自然科学那样,就能把握经济现象,以及我们的生活经验,也是不可能的。
另一方面,还有的学者认为,经济学都应用自然科学的方法及其实验中的模型,同样与自然科学不同,经济学模型难以使用实物模型,而使用图形或数学方程式(经济学特点决定,或是模型在经济学中应用的体现),不仅实现简化,而且实现抽象化,不求真实,但要求有用。正如Krugman所言,经济学家使用的模型特别像地图。
再一方面,在经济学领域,“理性人”及其行为的重要性,如实验经济学,尤其行为经济学和神经经济学等用实验方法研究人的行为及其异质性,具有重要的价值,成为破解“微观到宏观”困境、实现“通宏洞微”的必然选择。同时,正因此,这项工作也有挑战,不像自然科学那样精准!
再一方面,我们提出经济学近科学性。众所周知,“科学”具有客观性、理论性、系统(逻辑)性等最基本特征。在经济学研究中,虽然应用科学的方法,但其结果不像硬科学,虽具有可推导性,但不具有精确性、可验证性。因此,我们把经济学称为近科学,即不断逼近“真科学”,但永远达不到“真科学”的境界。同时,经济学不同于硬科学,其价值目标(函数)取向是相对、非线性和非增量的,而且环境具有不可控性。而硬科学的价值目标(函数)取向则是绝对、线性和增量的,环境具有可控性。相对来说,经济学更有思想,更有艺术性,更有心理、信心、经验,因为经济学研究人类社会生产生活及其与资源、生态、环境的关系,其所追求的综合、相对和动态平衡的思想是不能用精确性、可验证性衡量的。因此,用科学的方法研究经济学问题,所得到的结果不全具有精确性、可验证性。
(5)由实验结果直接到实际应用,这个过程中缺少一个重要环节,即对实验结果检验修正。管理科学的诞生启示人们,这个重要环节就是通过进行试验,检验并修正实验结果。如通过验证,可应用于实际;如没有通过检验,分析原因,修正实验方案重新进行实验,再进行试验检验,直至通过检验后应用于实际。在这方面,在制定与实施制度或政策中,我们通常采取的试点做法是可取的。否则,一旦实施,后果不堪设想。一般地,对于制定的制度或政策进行检验是必须的,一方面检验如此的制度或政策能否达到预期目的;另一方面检验实施中发现存在的负作用、这些负作用能否被接受或允许或减弱,以及相应的预案。只有这两方面的检验都通过了,且建立相应的预案后,如此的制度或政策才能全面付诸实施。这个检验过程就是试点(试验)。这如同一个近似公式本质的意义是其误差公式,否则这个近似公式没有任何意义,因为一旦使用,无法判断后果。
基于以上的问题与原因分析,根本原因是经济科学与自然科学与工程技术等硬科学的不同特点决定的。因此,在经济学领域,从客观和主观上讲,应用实验方法我们都需要斟酌与选择,以及必要的引入试验。当然,引入试验并不能彻底解决实验方法在经济学研究中的问题,但至少尽可能地朝着解决问题的方向迈进。
三、试验方法在经济学中的应用
所谓试验,是指采用测试的手段来获取或验证某一结果的行为,或者为了察看某事的结果或某物的性能而从事某种活动。
试验和实验有什么区别呢?在《现代汉语词典》中,实验是为了检验某种科学理论或假设而进行某种操作或从事某种活动;而试验是为了察看某事的结果或某物的性能而从事某种活动。或者说,实验是为了获取实验值或验证某个已经被接受的原理;而试验是为了探索的目的,并不知道结果会怎样,有时候并不能预料结果。
众所周知,一方面,实验中被检验的是某种科学理论或假设,通过实践操作来进行,而试验中用来检验的是已经存在的事物,是为了察看某事的结果或某物的性能,通过使用、试用来进行。
另一方面,实验是对抽象的知识理论所做的现实操作,用来证明其正确性或者推导出新的结论。它是相对于知识理论的实际操作。试验就事论事,对事物或社会对象的一种检测性的操作,用来检测哪里正常操作或临界操作的运行过程、运行状况等。
另一方面,实验重在实证,就是用实际的行动验证某种理论的真实性;而试验重在尝试,需要通过不断尝试积累数据来形成某种理论。前者是真理证实导向,后者是社会需求导向。
再一方面,如果能获取一个规律性的结论,或者得到的结果能升华为结论,那么是实验;如果得到的只是简单的预期结果之一的话,就是试验,例如核试验的结果就是成功与失败两个,掷骰子随机试验中的结果就是1,2,…,6中的其一。
特别地,在工业领域,或者科研领域,实验与试验往往有交叉。试验是依据已有的标准(国际、国家、企业标准)去验证产品或零部件或材料是否达标(比如型式试验),也就是已知试验品“应该”达到什么结果而进行的验证操作。这里的“试”跟非专业用语“试一试”不是一个含义,着重在是否达标,往往属于质量管理的范畴(质量管理涉及产品研发、生产、售后、反馈等整个过程)。实验是不完全依赖特定标准文件来判断是否成功(纯科研甚至往往没有标准),而主要是依据实验目的,设计实验的条件和方法,然后操作,来观测实验品能否达到期望(成功)的或未知的效果。
另外,实验可以划分为实验室实验和现场实验。一般情况下,若不特殊说明,实验都是指实验室实验。相对于实验室实验,现场实验会放弃一些对环境的控制,以换取真实感。因此,现场实验可以被认为介于实验室实验和自然结果之间。现场实验在很多时候也会面临一些难题。虽然现场实验可以辅助实验室实验从而提高研究结论的真实性和说服力,但它经常难以直接探究真实行为背后的心理机制。就诸如环境、干扰变项、控制、内部效应、外部效应、时间、样本量、实施容易程度、成本、参与者是否意识到参与研究等实验因素来说,实验室实验与现场实验有着显著反向差异,各有利弊,至于是选择实验室还是现场,不仅需要综合考虑这些因素,更重要的是考虑研究对象、内容与目的,以及实验的可能性、经济性与可达(实际)性。我们认为,在条件允许的情况下选择现场实验,若不允许则只能选择实验室实验。这种不允许,有客观上不允许,别无选择,以及主观上不允许,就是综合考虑实验因素的结果。鉴于现场实验终究是实验,而不同于试验,但它们之间的关系大体如同实验与试验。
我们认为,试验标志着管理科学的诞生,但很长时间,试验方法因主客观原因被遗忘。在当下实验方法备受青睐的时候,尤其费农·斯密获得诺贝尔经济学奖之后,加之本来诺贝尔经济学奖偏好经济学数理化,不可否认,直接应用只通过实验获得的结果分析与解决问题,存在着很大的风险。因此,有必要在应用实验结果之前,通过试验,对实验及结果进行检验,发现问题,修正完善后再应用。这样,可以在很大程度上克服经济学领域应用实验方法中存在的问题与局限性,回归经济学问题,以及解决问题的经济学思想,把握经济学多重综合相对动态平衡。这可以通过以下两种途径实现。
一是现场实验的方法。现场实验的重要性日益凸显,尤其在经济学领域,相对于传统的实证经济学,现场实验的优势在于:允许研究者在感兴趣的变量中创造外生变化,从而建立因果关系而不仅仅是相关性。
二是试验方法。我们认为,实验是指在实验室里模拟现场环境进行的实验,而试验是指在现场环境下进行的试验。当然,试验的成本比较大,且试验次数,以及对时间、季节、空间等还会有限制要求,而利用计算机网络仿真模拟与实验在这些方面具有优势。
更重要的是,通过试验,为我们提供了基于实事求是的解决问题的科学思想与方法,这一点是实验难以达到的。因此,研究者应充分利用试验方法来研究特定的事物,但是必须懂得实验方法的局限性,如实验不能替代理论研究;实验总是特殊的,而特殊的结果与普遍的理论之间总是有距离的;实验只能是在有限的范围内进行,许多问题是无法通过实验进行研究的。
总之,任何方法都有局限性,实验也不例外。现场实验,以及试验作为特殊的现场实验,在环境与成本允许的情况下,实验后再进行试验,可以在很大程度上解决问题,但问题不可能彻底解决,仍需要其他方法来解决,这是由经济学特点决定的。对目前大数据的认识,也需要客观、冷静地看待。我们认为,大数据分析与应用确实在服务社会方面带来了快速、便捷与高效,在研究深度上确实比过去较接近实际。但大数据分析与应用还有很长的路要走,如大数据方法中还是一些传统的技术方法及其扩展,鲜有突破性的技术。我们认为,大数据为新的技术方法研发提供了可能与有利条件。关注技术没有问题,但不能重蹈“重数理技术轻经济内容(相关经济的历史、思想、制度与政策、文化)”覆辙,而应重视技术研发的同时,更加重视大数据的内容。
因此,对于实验经济学,尤其行为经济学和神经经济学等,需要引入试验来补充和完善,对实验进行检验与修正,才更有价值。
值得一提的是,对于行为的研究,在思维、逻辑与决策科学中具有重要的意义。固然实验经济学、行为经济学和神经经济学对行为认识在经济学研究中有着特殊、积极的作用,甚至在遗传经济学,将人类分子遗传信息(基因数据)运用到经济学中,为经济学对个体“异质性”行为的探索提供了生物遗传学基础,但就经济学研究,相比行为来说,不能一味追求行为,更需要解决经济问题的思想,更需要对经济问题的历史、现状与未来,以及相关的历史、思想、制度、政策与文化的认识,更需要统计报表数据、实验和试验数据,以及实际的长期定点、跟踪的调研。因此,在行为引入经济学,需要一个合理的选择和科学化的边界。