专访:因果涌现能解释什么
对于一个复杂系统来说,“整体大于部分之和”是我们对其涌现现象的简单描述。涌现背后是否存在可度量的因果?本期我们访谈了北京师范大学张江教授,聚焦其“因果涌现”理论展开,谈一谈科学家怎样自上而下地定义涌现,如何从数据中自动找到简化复杂系统的粗粒化规则,以及它和AI、和意识研究又有怎样深刻的关联。
受访者 | 张江整理 | 集智俱乐部目录
如何理解涌现?
科学家通常怎么研究涌现?
因果涌现和传统方法有啥不同?
它到底想回答哪些难题?
因果涌现能帮助理解AI吗?
因果涌现强弱为何与时间反演对称相关?
它能不能为破解意识带来新思路?
未来因果涌现研究会走向哪里?
因果涌现的核心理解
Q1:如何理解涌现?
简单来说,涌现就是指整体大于部分之和。也就是说,当一个复杂系统形成一个整体的时候,它在宏观层面就会展现出一些特性,而这些特性很难简单地归因于每一个个体或每一个单元的特性。因此,这种特性就被称为涌现的属性。涌现而出的不仅仅是这种特性,而且有时候它会展现出一种规律。比如,像规模法则,当系统在变大的时候,它的新陈代谢与体重规模之间会有一个幂律关系。像这样一种可以用数学方程去描述的规律,也被称为涌现的。
图1:体重和新陈代谢之间的幂律关系, = 3/4,F:新陈代谢,纵轴(total metabolic rate),M:生物体重,横轴(body mass)
Q2:科学家通常怎么研究涌现?
通常,涌现研究是一种所谓的自下而上的、以微观为基础的研究。它的研究方式,基本就是试图找到一个复杂系统在个体层面遵循的相互作用规则、规律或方程,然后我们可以在计算机里面、或者是用一个数学方程,去整体描述整个系统的相互作用、大量个体的相互作用,从而复现出真实复杂系统中的这些涌现规律。因此,这是一种目前来看科学家们最主要使用的研究涌现的手段。
Q3:因果涌现和传统方法有什么不同?
因果涌现是一个研究涌现的不同视角。它并不试图从微观到宏观,去解释一个个涌现现象的发生。因为那样去解释的话,实际上基本上找不到通用性,你只能针对一种涌现现象找到一种解释模型,另一种现象的时候就会换一种模型。但是,这个因果涌现跟以往的涌现研究非常不同的点,就是在于它试图自上而下地去找到一种涌现的描述性定义,这是它非常不同的点。这样的话,它的一个好处就是在于,它可以针对不同的涌现现象,给出一个统一的量化的定义。当然,它的缺点也是很明显,就是它无法去刻画究竟是什么机制产生这种涌现现象。
Q4:它到底想回答哪些难题?
实际上,因果涌现面向的研究对象是各式各样的动力系统。这样一个系统,无论是复杂的还是简单的,只要能抽象成一个马尔科夫链,或者说一个马尔科夫的动力学过程,那么实际上都可以用因果涌现这个框架来对它加以刻画。
它要解决的科学问题,第一是判断涌现的发生,也就是说给你这样一个动力学系统以后,这个背后它是不是有涌现现象,这是第一点。第二点,它还能够找到涌现的宏观动力学,也就是说我对一个很大的系统,能否用一种更加简化的方式去描述它的运动规律。第三点,就是找到从微观到宏观的这个过渡,也就是我们常说的所谓的粗粒化的方法,也就是你如何把一个复杂的、大型的系统给它简化成一个小型系统,这种简化的规则是什么,它也能找到。
图2:粗粒化示例图,寻找到复杂系统的简单规则
比如说我们以鸟群作为一个典型的复杂系统的分析例子来说。那么如果采用一个因果涌现的视角,它就会先去找一些宏观变量,比如说我们找到的宏观变量就是每一群鸟的重心这个位置,假如说重心也是一个动点,那么它也会随着这个鸟群的飞行而产生一个运动的轨迹。那么因果涌现它就会自动能够识别出来这种轨迹,并且能够比较你这个重心飞行的轨迹和你这些个体的鸟飞行的轨迹,哪一个因果性更强,它就能够计算出来。另外一个就是说,如何从一群鸟的这个轨迹得到这个重心,这样的一个粗粒化的方式,它也能够找到。
AI与因果涌现
Q5:因果涌现能帮助理解AI吗?实际上,整个因果涌现的机器学习框架,它是和World Model相似。比如说这个在强化学习里面,我们建立一个agent模型,那么比较好的一种建模方法,就是要让这个agent内部产生一个小的世界模型,相当于一个内嵌的虚拟世界。那么agent要先去学习这个虚拟世界的动力学,再跟这个真实世界进行互动。那么这个时候,它的学习效率以及它的这种规划能力,就会变得更强,这就是强化学习的所谓的基于World Model的这种建模方式。
比较有趣的是,我们发现,实际上因果涌现这个框架和内嵌World Model的agent,其实是存在着一个非常相似的这种结构特性,如果把agent所在的环境看做是因果涌现中的微观动力学,那么World Model就对应了宏观动力学。因此,我们说因果涌现这个框架,不仅仅能够描述一个复杂系统,而且它还可以抽象一个认知或者是建模的主体,比如说一个人、或者说一个AI、一个智能体。那么实际上,也可以用因果涌现的框架去描述它。那么有了这样一套描述,好处就在于,它遵循了两条重要的原则,第一条,它是要把这个外界世界尽可能预测地准,这是一个。另外一个重要的原则,就是它不仅仅要追求准确,还要追求因果的最大化,也就是说,它的World Model是一个因果性非常强的这种世界模型,这个时候agent才会具有一个内在的审美观点。
因果涌现与时间反演对称的联系
Q6:因果涌现强弱为何与时间反演对称相关?这个发现也是让我们自己觉得很意外的。首先就是动力学可逆性,这是一个在物理学里面一个非常重要的概念,跟时间之箭、时间的运动方向、热力学第二定律,实际上是密切相关的。我们都知道,这个世界的时间是不能倒流的,但是实际上这个不能倒流,它也有一个前提条件,就是你在宏观去讨论这个问题,你看到是我们日常的这种宏观世界,那它的确,这个时间箭头是不能够倒着运转的。这个背后,实际上是联系着著名的热力学第二定律,因为熵是要一直不停地增加,因此时间不能倒流。但是如果你的观察视角,如果能够进到微观粒子这个层面,甚至于你不去对这个系统做测量,而是保持它的这种量子态,我们知道,实际上这个系统,它的时间是没有箭头的,它往前走和往后走,实际上是一样的。那这个不是我随便乱说的,这是物理学基本的规律,它就告诉我们,实际上,这个最基本的量子层面的物理学规律,实际上是一种时间反演对称的。
那么我们意外地就发现,动力学上的可逆性实际上是跟因果性是密切相关的。为什么会这样呢?实际上我们的研究就会发现,当你给定因变量和果变量的时候,就是你不去讨论其它因素的干扰,只考虑因变量和果变量,这一对变量,那么这个时候,二者之间,它会有一个因果效应的强度,也就是说你干预一下因变量以后,这个果变量有多大程度跟着一起做出精确的反应,那实际上这个就刻画出来因果变量之间的所谓的因果效应的强度。那么我们就会发现,这种因果效应的强度,就跟整个因、果这两个变量,如果把它看成是一个动力学的话,它的动力学的可逆性,就密切相关了。
当因果这个系统构成一个函数映射,或者构成一个马尔科夫的动力学的时候,那么你就会发现,它越是可逆的,也就意味着它的因果效应就会越强,否则的话,它越是不可逆的一个系统,它的因果效应,其实也就越弱。因此,我们就建立一种等价的关系,也就是一个因果变量的这种系统,它的因果效应强度,和它的动力学的可逆性程度,其实是密切相关的。这个是在我们的论文里面,有大量的从数值角度、从数学公式推导的这个角度,都给出了相应的这个推论和验证。因此,这二者建立等价性以后,我们就会发现,因果涌现整个这个框架,其实完全可以把它翻译成是一种动力学可逆性的涌现。那换句话说,一个系统发生了因果涌现的时候,实际上也就意味着它的动力学层面,发生了一个可逆性的这种涌现。原本是一个动力学上可能不那么可逆的系统,那么当你粗粒化以后,它可能变成是一个可逆的这种动力学,那么这个时候我们就说这个系统,发生了一个可逆性的涌现。
那么既然二者都是等价的,那你为什么又要换一种说法,非要用可逆性的角度去描述同样的这种因果涌现呢?其实这个背后,有一个更高层次的,我觉得是审美上的一种追求吧。那实际上动力学可逆性,它其实跟时间的反演对称性有关,那换句话说,也就是说这个可逆性,它其实是跟对称性有关,这也是物理学还有大自然充满了一种优美的一种特性。因此,当我们追求因果涌现的时候,其实我们也是在追求一种对称性的涌现,这是一个智能体所要追求的目标。那么这个目标就很符合整个物理学发展的一个精神,以及我们对大自然这种审美的一种追求。
对意识的探索
Q7:因果涌现能不能为破解意识带来新思路?
我们开发了一个机器学习的框架,这个机器学习框架能够自动地从数据之中来识别出因果涌现的发生,以及学习出来它的宏观动力学和它的粗粒化函数,或者说粗粒化的这种方法。那么我们最近的一些研究也已经表明了,就是我们用因果涌现这个机器学习的框架,去对这个复杂的,比如像大脑里面的这个数据,进行分析,那就会发现,它实际上是能够发现一系列不同层级的这种因果变量,而这些因果变量,很有可能就跟大脑之中的意识现象密切相关。
因此,因果涌现也会跟意识这个问题有一个非常深刻的联系。我们知道就是因果涌现这个理论框架的提出者,它的通讯作者实际上和意识中的整合信息论的提出者是同一个人,就是意大利的神经科学家Giulio Tononi(朱利奥·托诺尼)。所以你就能看出来,实际上因果涌现的研究是帮助我们破解意识之谜必不可少的一个理论工具,也是研究人工智能,让人工智能如何更加优美地去对数据进行建模,它也是一个必不可少的一个工具。
走向对称性的涌现
Q8:未来因果涌现研究会走向哪里?
首先,我们将在理论层面进一步突破。正如刚才所述,我们通过动力学可逆性的研究,已经尝试在因果涌现和可逆性(也就是时间反演对称性)二者之间架起一座桥梁。同时,这座桥梁让我们更深入地看出,可能它背后所追求的,更多的是这种所谓的对称性的涌现。因为本身关于大自然有一种说法,就是之所以会呈现出今天所看到的这种复杂性,实际上是一种对称性破缺的结果。
也就是说,在宇宙演化的初期,整个宇宙实际上是高度对称的,你可以理解成是个几何体或者是个物体,但是由于各种原因,比如噪声、观察者的存在等等因素,那么大自然或宇宙就会发生不断的一系列的这种对称性破缺。因此,慢慢地很多的这种对称性不再存在了,而破缺成了各种各样的复杂性。那反过来讲,对于一个智能体来说,它却是在历经一个反向的过程,也就是它面对的是这种嘈杂的、复杂的这种世界,试图在这个背后去抽象出它可能存在的那种对称性。这个是我们经过这个因果涌现框架的研究最后悟到的。可能说跟宇宙的演化也密切相关的规则。因此,在这样一个原理的制约下,我们猜测有可能存在一个普适的、更加广义的涌现的原理,而不仅仅是局限在因果涌现上面。我们暂且把它叫做,比如说“对称性的涌现”。
很有可能,一个系统,无论你是不是动力学,经过粗粒化以后,如果你的对称性能够比原来的系统更高,无论你这个对称性是,比如空间平移对称性、旋转对称性等等,都有可能,只要你体现出更好的、更多的对称性,我们都可以看成是一种涌现现象。因此这样的话,如果这个结论是成立的,那就是可以大大推进我们对涌现的认知。
本文根据访谈内容进行了书面化整理,内容删减仅涉及重复表述与非核心细节。
本文为科普中国创作培育计划作品
受访者:张江 北京师范大学系统科学学院教授
创作团队:集智俱乐部
审核专家:刘宇 北京师范大学珠海校区 副教授
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。



返朴官方账号




