技术发明评价需小同行和专家结合

2018年中共中央办公厅、国务院办公厅印发了《关于深化项目评审、人才评价、机构评估改革的意见》,对科技领域的项目评审、人才评价、机构评估工作部署了有针对性的改革举措。现在的问题是,如何全面、准确地落实这项措施。

项目评审、人才评价、机构评估虽然是三个层次的问题,其实核心问题是一样的,就是对成果的评价。至少从表面看,大家都承认过去主要看论文发表的刊物的影响因子、文章数、被引用数等的办法是不好的,但究竟应该如何评价却还没有共识。所以,对这个问题仍然值得深入分析和讨论。

500

不同的问题其评价标准和方法当然会有所不同。本文只涉及与自然科学有关的基础和技术研究成果的评价。

即使是基础研究,也还有两种不同的类型。以力学为例,它无疑是基础科学。其发展大体可分为两个阶段。第一个阶段从牛顿创建力学到19世纪末,这一阶段大体上是力学的自我完善,即从力学的基本原理出发,基本上只依靠逻辑推理的发展。当然也有一些针对实际问题的研究,包括工程技术。进入20世纪,力学进入大发展的时期。其特征是为了用力学解决实际问题,大大扩展了力学的研究范围,引进了很多新的,不能依靠逻辑推理而从基本原理导出的概念和物理参数,以及相应的新的理论和研究方法,形成了众多新的力学分支。例如,结合航空问题,出现了空气动力学这一分支,而结合航天的问题,又发展出高超声速空气动力学,稀薄气体动力学,等等。

到现在为止,经典物理的各个分支基本上都经历了这样两个阶段的发展。近代物理的发展也大体上如此。

因此,本文讨论的评价,就基础研究而言,指的主要是针对实际需求而做的基础研究。

我和张涵信、崔尔杰、童秉纲等院士针对如何评价科技成果的问题,写过好几篇文章。其中多次举了20世纪初德国数学家克莱因对近代流体力学之父普朗特(钱学森先生的老师的老师)的一篇论文的评价作为典型例子。由于这个例子实在有典型意义,为免得没有看过我们过去写的文章的读者去查看那些文章,这里再把这个典型事例复述一下。

1903年,在德国的海德堡召开的第三届国际数学大会上,年仅29岁,本身并非数学家的普朗特在会上宣读了一篇论文。论文的最主要内容是:描述粘性流体运动的一个偏微分方程,即Navier-Stokes方程,在应用于解决流体和物体的相互作用问题时(例如空气对机翼的作用),在很多情况下,在紧贴物体表面的一薄层内,可以略去方程中的一项。当时已经很有名的哥廷根大学的数学家克莱因一眼就看中了这篇文章,认为是整个大会最有价值的文章。他随即推荐普朗特去哥廷根大学,哥廷根大学很快为普朗特成立了研究所,该研究所很快成为国际上最著名的与力学(主要是流体力学)有关的研究中心,在推动航空技术发展上起了极为重要的作用。

这一对成果和人才的评价,具有非常典型的意义。身为纯数学家的克莱因,为什么对普朗特简化方程这种通常会被纯数学家看不上眼的做法情有独钟,而且还是在普朗特仅仅提出了简化建议,并没有提供任何具体的结果的情况下。

我们不可能知道克莱因做出判断的具体思考过程,但是也许可以做以下分析。

克莱因虽是纯数学家,但他对当时的流体力学的状况有一定的了解。这是因为当时的流体力学主要针对的是理想流体,即无粘性的流体。而事实上,在很多情况下,粘性在流场的大部分的确几乎不起作用。再做了流体运动无旋的假定后,其控制方程就是拉普拉斯方程,这是数学家们很熟悉和研究得很多的方程。克莱因本人还在哥廷根大学主持过有关流体力学的讨论班。

如果不做无粘的假设,则流体力学的控制方程Navier-Stokes方程。除极少数几个简单情况外,无法求解析解,而在没有先进的计算机时,也无法求数值解。而普朗特则从实验中发现,如果一个薄的物体在流体中运动,例如薄板在流体中被顺着薄板的方向拉动,则流体只在靠近薄板的地方有旋,而离薄板稍远处就几乎是无旋的。因此,他建议将流场分为两部分,大部分区域可用无粘方程,而在紧邻薄板的一薄层内,则用他建议的简化方程。这样在当时没有计算机的条件下,有可能求得全流场的近似解。

克莱因作为数学家,应该可以判断出普朗特对方程的简化是合理和可行的。

500

菲利克斯·克莱因

另一方面,克莱因在1897年访美时,参观了在芝加哥举办的世界博览会,深感美国和德国相比,地大物博,人口也多,而且很有创造性,发明了很多新东西。他认为德国要和美国竞争,必须要依靠自身当时在科学上胜过美国的条件,将科学作为技术发展的支撑,也就是说将理工结合起来。

而当时正是航空技术蓄势待发的时候。正是在1903年,美国的莱特兄弟试飞了世界第一架有动力的飞机。而飞机不像一般在陆地或水上的交通工具,不能事先没有可靠的设计就试飞,那样很容易机毁人亡。而普朗特成果的意义正是在于它提供了能够事先算出流场,从而为设计提供依据的可能性。

所以,我们可以说,克莱因做出判断包括两个方面。一是他判断普朗特的工作“有价值”,即使得将流体力学用于解决重要的实际问题,例如与航空有关的问题,成为可能。二是普朗特提出的做法在科学上是正确而且可行。这“有价值”和“内容正确”应该就是针对某项技术需求而做的基础研究的评价标准。

当年克莱因一个人对这两个方面都做出了正确的评价。但现在科学和技术的范围和内容都已远远大于克莱因时代,要一个人同时对上述两个方面都做出正确的评价一般已不可能。为此,一般需要经两级同行评审。

要判断成果的内容是否正确和其难度,一般需要找小同行,即属于同一个三级学科(例如一级学科力学下的二级学科流体力学下的三级学科空气动力学),甚至于还要是同一研究方向的(例如都是空气动力学下的稀薄气体力学研究方向)才行。而要对成果的价值做出评价就要求评审专家对更大范围的力学问题,甚至于对预期研究成果能起作用的领域,如航天技术、船舶技术等领域,都有一定的了解。仅有小同行是不足以对成果做出全面评价的,除非那个小同行同时满足上述条件。

事实上,找小同行不难,但要找能对成果的价值做出评价的同行则不太容易,因为他要有更宏观的判断能力,而这样的专家并不是每个三级学科都有的。姑且称这样的专家为顶级专家。

即使有了顶级专家,除非他恰好又是小同行,一般来说也还要和小同行相结合才能得出更可靠的结论。因为没有人可以精通每一个三级学科。在上世纪八十年代,曾有人发明了一种与航空发动机燃烧有关的技术。在评奖会上,多数专家认为可授予二等奖,但在场的一位顶级专家认为可授予一等奖。鉴于该顶级专家的声望,最终授予了一等奖。但迄今似乎该技术并未被采用。该顶级专家就航空发动机的燃烧问题来说,并不是小同行,因此在判断该技术是否有创新,是否的确可以用于航空发动机上,可能不如小同行准确。

至于对技术上的创新而言,一般来说,其有关的科学已不存在大的问题,问题在于将某一新的“有价值”的事或物做出来。因此,技术的成就主要表现在发明,而不是发现。例如,在建筑领域,钢筋混凝土构件是广泛地被应用的。具体什么时候,由谁发明的,我没有查到。但钢筋混凝土的发明,从科学上讲,只要有工科大学二年级的材料力学知识就够了。混凝土实际是人造石头,而石头一般仅能做成柱子、墩子等而不能做成梁。其原因是石材能抗压,但不能抗拉,而材料力学告诉我们,梁在载荷的作用下,其下部产生的是拉应力,因而仅用混凝土不能做梁。后来人们发明了在混凝土梁的下部加上钢筋,在梁承受載荷后,其下部产生的拉应力可由钢筋来承担,于是就有了钢筋混凝土梁。梁是众多建筑不可或缺的构件,其发明无疑是个非常有价值的。

到了上世纪50年代,美籍华人林同炎对钢筋混凝土梁又做出了重要的改进。梁中有了钢筋就可以由它承受拉应力,但钢筋的强度远高于混凝土(即使是抗压),而且在被拉断前会有明显的拉长。因此,在梁的載荷不断增大时,在钢筋远未被拉断前,梁下部的混凝土已经开裂了。也就是说,在梁中的钢筋还有很大的潜力。林同炎提出,如在用梁或制梁前,在钢筋上预先加拉应力而同时使其附近的混凝土产生压应力,则梁的容许載荷可显著增大。因为在没有載荷时,梁下部的混凝土有预加的压应力。在对梁加載荷时,只有載荷达到某一值时,梁下部的混凝土才开始有拉应力。该載荷值,就是钢筋预加拉应力的情况下,梁能多承受的載荷。这样就大大地提高了钢筋混凝土梁承受載荷的能力。这种构件就是预应力钢筋混凝土构件。这个发明,同样只需要材料力学的知识就够了。但是要发明这一技术,就一定要对传统的钢筋混凝土梁的使用有长期的观察,熟知其破坏的原因,这样才能有针对性地创新,就和普朗特的创新一样。由于钢筋混凝土梁的使用是如此广泛,这一发明的重要性不言而喻。林同炎后来成为美国第一位华裔工程院院士,再后来又成为为中国科学院外籍院士。

可见,对于技术上的创新,其评价标准就应该是其实用的价值。

500

但新技术刚发明时,还未经实践的考验,对其最终价值的判断并非易事。例如,对大飞机而言,减少空气产生的摩擦阻力是永恒的课题。因此,科技工作者就不断提出各种湍流减阻的理论和方案。几年前,英国皇家学会的Transaction of Philosophical Magazine 有一期是专门针对飞机减阻的理论和技术的。其刊登的十几篇文章中,除一篇外,全是高校和科研机构的专家所写。从纸面上看,他们的方案都是有效的。最后那篇文章的作者是在波音公司工作的,也是有一定名气的湍流方面的专家。他的文章中給大家泼了一盆冷水。他指出,各种方案看起来不错,但从技术和经济上看可能都不可行。的确,迄今为止,没有一家航空公司在它们的大飞机上实际采用任何一种以控制湍流为手段的减阻技术,今后也看不到有此可能性,尤其是看起来非常诱人的主动控制技术。其原因是,只要是主动控制,就要有非常复杂的传感器、作动器和计算机。而增添这些装置就大大增加了飞机出问题的可能,即降低了飞机的安全性,而飞机的安全性是第一位的。所以仅从论文或实验室数据看似乎很有创造性的成果,实际上并没有使用价值。

因此,技术发明不仅要看其科学性和新颖性,还要看其可行性。而对可行性的判断往往不是在大学或科研单位的专家的长项。所以,对技术发明的评价,不但要有小同行参与,也应该有潜在的使用部门的专家参与。

有些技术发明,不但要看其本身的科学性、可行性,有时还要从更宏观方面考虑。例如,利用太阳能制氢是一种提供清洁能源的可能途径。而利用太阳能直接发电的光伏技术也是一种途径。但两者都不能就事论事地孤立地考虑,而需要放在更大的范围考虑才行。利用太阳能制氢,就牵涉到氢的收集、储存和运输,以及最终如何利用氢的问题,每一步都有新的技术难题。而利用太阳能发电,则最大的问题是不能保证平稳发电,要大规模使用,有赖于和其他电源合理调配。目前看来,智能电网技术是可能的解决方案之一,但实际做起来同样难度不小。因此,这两种途径,究竟谁更有前途,不能仅限于电解水技术和光伏技术本身。但由于从技术发明到实际应用之间,还有事先难以完全预估的困难,因此评价哪种途径更有前途,即更有潜在价值,其难度是很大的,更需要在宏观上能把握技术发展前景的专家参与评估,而不能仅仅限于做学术研究的专家。

钱学森先生在提倡发展技术科学时就指出:“在开发一种新的工程技术时,首先要对其可能性、可行性和克服困难的主要途径作出判断”。因此,对于一种还没有实际被采用的技术发明,其评价指标中就应该有“其可能性、可行性和克服困难的主要途径”。这正是对技术发明评价的难点。

所以,对技术发明的评价,同样需要小同行和顶级专家相结合。不过这里的顶级专家,是指知识面广泛,能从技术实现的可能性、可行性、经济性等做出判断的专家。

有了对科技成果的可靠评价方法,则对项目、人才、机构的评价问题也就迎刃而解,即只要对其相应的具有标志性的成果进行评价就行了。

顺便说一句,同样的办法应该也可以用于对刊物进行评价,即对刊物自选的若干标志性论文进行评价,并考虑该种论文数在刊物总论文数的占比,但关键是看标志性论文的水平。

总结一句话,评价一般需要由两级专家做出。一级是小同行,另一级是顶级专家。

(作者系天津大学教授、中国科学院院士,本文发表于《科学与社会》2019年第三期)

全部专栏