“归去来兮”的颜宁,到底在做些什么?

大家好,我是谷智轩。本月初,在2022年深圳全球创新人才论坛上,著名结构生物学学者颜宁宣布,将会辞去美国普林斯顿大学教职,全职回国,协助创立深圳医学科学院(SMART),并出任创始院长。颜宁教授的经历颇具传奇色彩,不过本期《轩讲》不聊她的经历,而是聊聊她正在做的事情,包括科学研究上的,以及她即将在深圳开创的新事业。

500

我们先来看一下颜宁在普林斯顿大学分子生物学系的简介,上面写着,她的研究领域,是生物化学、生物物理学和结构生物学,具体的研究对象,是膜运输和脂类代谢的结构与化学基础。我给简单解释一下。细胞膜大家都知道吧,就是包在细胞外面的一层很薄很薄的膜,平均厚度不到10纳米。别小看这层薄膜,它由脂类、膜蛋白、多糖构成,不但成分复杂,而且结构也非常复杂,还一直处于流动状态。它的一项重要功能,就是只允许特定的物质进出细胞,还会帮忙把这些东西运进运出。这个过程,就叫“膜运输”。

那么,这个过程是怎么进行的呢?

我们都知道,油水不相容。油就是一种脂质。脂质分子不溶于水,有疏水性。细胞膜的脂质双分子层,会像墙壁一样围住细胞,把一些亲水性化合物,比如说糖、氨基酸、离子、药物,统统拦住。那它们要进进出出,怎么办呢?只能走“大门”呗。细胞膜上面,有各种各样的“门”。这些门一般由蛋白质构成,也就是膜蛋白。它们有各种各样的形状,开合的方式也不一样。有的呢,一直打开着,只要形状、大小、电荷对上了,就让过。有的平时关着,受了刺激才打开。比如说,有遇到物理刺激打开的“机械门控”;受到化学物质刺激打开的“配体门控”;还有“电压门控”,顾名思义,细胞膜电势变化,“门”才打开,是不是听上去就很高端?还有一种“门”,要更“负责”一点,有“门卫”守着。“快递”来了,“门卫”认证、接手,再亲自送到里面。前面说的“门”,叫作“通道蛋白”,“门卫”,叫作“载体蛋白”,它们合起来,都叫“转运蛋白”。

我们身体里面,每个细胞的“外墙”上,都有许许多多这样的“门”,几乎针对每类物质,都有量身定制的“门禁”系统,还经常是好几套“门禁”配合使用。你说这事复杂不复杂?但是不弄清楚又不行。因为很多疾病,都和这些“门”的功能失常有关。比如说,葡萄糖转运蛋白(GLUTs),如果出了问题,就会影响葡萄糖的正常吸收,导致大脑萎缩、发育迟缓、癫痫等一系列疾病。再比如说,电压门控钠离子通道和钙离子通道,和心率紊乱、癫痫等疾病有关。要治疗这类疾病,首先就要知道,“门禁系统”是哪里坏了,才能思考怎么去修补。后面这半程,就是设计药物、疗法的过程,修补的位置,叫做药物靶点。

颜宁团队主要研究的对象,就是这些“门”,上面提到的葡萄糖转运蛋白啊,电压门控离子通道啊,都在其列,而且是研究的重点。再具体一点,这些科学家的工作,是用各种生物物理和生化化学方法,去琢磨这些蛋白质“门禁系统”的构造,以及它们放行的对象是谁、具体是怎么运转的。这也是为什么说颜宁是结构生物学家。

结构生物学是一门用各种方法,研究生物大分子空间结构、动态过程和功能的交叉学科。转运蛋白就属于是一种生物大分子。不过,虽然叫“大分子”,它还是非常小,你们想,细胞膜才不到10纳米厚,它上面的蛋白质,能有多大?这个大小,别说眼睛看了,光学显微镜都不顶用,因为光的波长都要几百纳米,用麻绳探针孔,能找着么?电子显微镜倒是可以,但在观察蛋白质方面,它的短板也不少。

首先,大生物分子,它是活的,会动,会改变姿态,在溶液里也不老实待着,而是漂来漂去。咱们要仔细观察活的动物,就说一条鱼吧,是不是最好能想个法子,把鱼给固定住?观察有活性的蛋白质也是如此,要先把它们给固定住。比如说,把蛋白质结晶,也就是把蛋白质放到溶剂里面,让溶液过饱和,再通过降低溶解度,析出蛋白质晶体。但是,我说得简单,实际上,蛋白质大分子的结晶是非常困难的,因为它们的分子链太长,非常容易扭曲、缠到一起,还有很多修饰,就像雾里看花一样。而且结晶的过程,还会受到大量因素的影响,不好控制。所以很多人都说,蛋白质结晶既是一门科学,也是一门艺术。

500

​像颜宁解析的葡萄糖转运蛋白GLUT1,结晶就很困难。这种分子修饰很多,而且高度动态,结构很不稳定。自从1985年鉴定出它的基因序列之后,世界那么多顶尖实验室攻关了近三十年,都没能搞明白它的三维结构。直到颜宁和她的团队,先是通过改变了蛋白的一个氨基酸,去掉了GLUT1的糖基化修饰,又找到GLUT1的一种天然存在的致病突变体,把它多变的结构,锁定到不容易变化的状态,这才成功表达、纯化、结晶,最后通过X射线衍射成像,分析出它的三维晶体结构。这项发现,也是颜宁最有份量的研究成果之一。

除了需要结晶、结晶困难之外,电镜观测蛋白质分子的难点,还在于两个地方。一方面,蛋白质分子是比较脆弱的,如果照射过量电子,就会打断化学键,破坏蛋白质的结构。这也叫“电子辐照损伤”。

所以,观察蛋白质分子,要严格限制电子照射剂量。但是剂量不够,观察到的图像,就看不清楚。这也是一个悖论。另一方面,只有在真空环境中,电子才能稳定有序地排列,用于观察。但是蛋白质分子是泡在溶液中的,放到真空当中,溶液受到气压差,会流向电子显微镜,影响观测。所以,为了解决这些问题,科学家们发明了一种的新装备,叫做冷冻电镜(Cryo-SEM)。原理呢,就是通过瞬间把样品冷冻到零下170℃,将分子固定在一层薄薄的玻璃态冰晶里面。这样一来,不需要结晶,也能把蛋白质分子给“定住”。而且,也不存在溶液流向电镜的问题。至于电子剂量太小,看不清楚图像的问题,可以拍摄成千上万张照片,再通过计算机处理来强化图像,进行三维建模。

冷冻电镜技术,在2010年前后基本成熟,开始大规模应用。这对于结构生物学家来说,那真是瞌睡了送枕头。有了趁手的工具,他们的研究可以说是突飞猛进,成果井喷式增长。颜宁,以及她的恩师施一公,就是第一批将冷冻电镜技术引进国内的学者。清华大学投资数百万美元,引进设备,招募专家,早在2011年就搭建起了冷冻电镜的核心团队。而借助冷冻电镜,颜宁团队接二连三地做出了重大成果。比如2013年,发表了与疼痛通路有关的辣椒素受体TRPV1蛋白结构;2015年,发表了与肌肉兴奋收缩通路有关的电压门控钙离子通道复合物CAV1.1和RyR1的结构。之后,颜宁团队还进一步解开了葡萄糖转运蛋白GLUT1、GLUT3、GLUT4在不同功能状态的结构,并继续对电压门控钙离子和钠离子通道的各种复合物的结构、功能进行探讨。这些研究都对理解相关疾病的病理、找到潜在的药物靶点,做出了很大贡献。

诺贝尔物理学奖获得者理查德·费曼曾半开玩笑地说过一句话,“许多基础的生物问题是非常容易解决的,只要能看到它们就行”。颜宁自己也说过,“结构生物学是打开人类观测分子世界的眼睛”。阻拦我们解开很多疾病奥秘的最大拦路虎,就是我们看不见体内这个微观世界正在发生什么。所以,人类发明了各种各样的工具去“看”,颜宁过去使用的X射线晶体衍射法,现在使用的冷冻电镜,都是这样的工具。不过,在目前阶段,即使是再先进的工具,都有局限性。所以,在得到蛋白质的氨基酸序列后,科学家们往往要通过各种方法,先对蛋白质结构进行一定的预测。比如说,从数据库里,找到与研究对象同源的已知蛋白质作为模板,再通过理论计算方法进行优化,得到预测的蛋白质结构模型。之后,他们再通过一系列的实验设计,去观测蛋白质,然后比对观测信息和模型,不断修正模型,最后得出结果。

从结构预测到实验验证,可以说每一步都要消耗大量的人力物力,而且很多时候,甚至是大多数时候,实验结果会告诉你,你预测的结构不太靠谱,最好从头再来一遍。所以,结构预测得准不准,很大程度上就决定了这种字面意思的“猜-测”过程,要重复多少回。这就是人、dollar和时间的事。那科学家们当然希望,这预测能做得越准越好,最好一“猜”一个准,只要拿到氨基酸序列,就能通过某种炫酷的公式啊、模型啊,把结构算出来。这样,指不定连实验都省了,完美!

不过,天底下哪有这样的好事啊。虽然蛋白质的折叠确实受物理规律的支配,但是蛋白质分子太复杂,含有的氨基酸从几个到几万个不等——要知道,100个氨基酸组成的蛋白质,就有3的198次方种可能的稳定结构,这还不算它与周围的溶剂分子相互作用。人类掌握的规律又那么有限,要判断这些氨基酸链的折叠方式,谈何容易?我打个比方,你知道一座房子有几块砖,几根梁柱,也知道把房子建起来,要符合力学定律,还有很多限制条件,比如说房子的功能,周围的环境,等等。那么,你可以算出房子长什么样吗?如果是一座泡在水里的,有大大小小、成千上万不同材料粘在一起的,用途尚不明朗的建筑呢?我只能说,很难的啦。

几十年来,科学家们一直在总结规律,尽量把不太可能出现的结构排除掉,缩小他们预测的范围。现在他们的主要出发点,是一个叫“自由能”的概念。可以这么理解,自由能越高,蛋白质就越不稳定,容易发生改变。所以,它会以自由能最小化的方式折叠起来。从这条规律出发,算结构变得容易了一些,但也有限。诺贝尔化学奖获得者理查德·亨德森就说过:“你可以通过能量最小化来做结构,最多可达60或70个氨基酸……但是一旦你想尝试1000个氨基酸左右的蛋白质,答案就会迅速变得遥不可及。”

可能性太多,规律又太少,所以很长时间以来,预测蛋白质结构方面的进展,一直缓慢。科学家们还专门为了这个事情,办了一个比赛,叫CASP,名称翻译过来,就是“蛋白质结构预测关键评估”大赛。主办方出题,给出几十个已经实验测出结构,但结果还没公开的蛋白质。参赛者答题,根据氨基酸序列,用自己的模型来算结构。然后由独立评审,比较这些模型和主办方的实验结果,给模型打分,分出高下。这个比赛两年举办一次,到今年刚好15届。前13届,进展都有限,慢到几乎看不出来,大家给出的模型,差别也没多少。直到2018年,突然蹦出了一个冠军,成绩比亚军高出20%。这下无论是学界内外,都炸开锅了。

500

这个冠军,叫AlphaFold,和那个围棋下赢世界冠军的AlphaGo,来自同一家公司DeepMind。没错,它也是一个AI。

这还没完。两年之后,AlphaFold二代又参加了比赛,还是第一,分数比上次还高。而且,这个AlphaFold2不但参赛了,还在一年后开源了,数据集向公众免费开放。到今年7月,它数据库里预测的蛋白质结构,已经超过了两亿个。包括植物、细菌、真菌在内,已知的100万个物种、2.14亿个蛋白质结构,全都进了它的数据库。而从几十万到两亿,它只花了两年的时间。

对比一下,生物学家们花了几十年时间,实验解析的蛋白质,大约是18万种。

好家伙,计算科学家搞出来的AI,不但抢了围棋大师、艺术家的饭碗,现在又来抢结构生物学家的饭碗了。所以网上不少人阴阳怪气,说颜宁现在回国,是因为被抢了饭碗,在美国混不下去了。

真是如此吗?

不论是CASP大赛,还是AlphaFold,它们要做的事情,都是在提高预测蛋白质结构的准确度。我们前面说了,要了解蛋白质的结构、过程和功能,需要不断地去“猜”和“测”。除非能保证百分之一百猜对,少0.1都不行,否则,还是需要通过观测去验证。而百分之一百,不要说看不见的微观世界了,就算是看得见的宏观世界,有无数定理规律可循,还是无法做到“百分之一百”。对不对,还是要试试才知道。而AlphaFold的准确度中位数,只有92.4,在没有蓝本的自由建模类项目中,只有87。科学家们也通过不断地使用,发现了它的不少缺陷,和可以改进的地方。

比如说,运行AlphaFold神经网络所需要的参数和权重,需要大量的数据进行训练。这些数据来源于各大蛋白质数据库中,几十万个实验确定的蛋白质结构。有些复杂的结构,实验还没有解析出来,人工智能也就学习不到,也就预测不出来。而且,你白拿人家的研究成果来训练AI,总不好还拿它挣钱吧?必须免费啊!当然,这对DeepMind来说是个缺点,对别人估计不是。

再比如说,蛋白发挥功能是一个动态变化的过程。你光知道“门禁”长什么样没用,还要知道它是怎么工作的。算结构,相当于算一幅静态画面,算过程,相当于预测一部电影的走向,一帧都不能出错。这个难度,就要大多了,还是老老实实,把电影看一遍吧。

所以,至少在很长很长的时间,计算不能代替观测。结构生物学家,还是有很多事情要做的。被AlphaFold抢饭碗,主要是那些本身就是做结构预测模型的学者,以及帮助不断试错、重复实验的“实验室打工人”。预测结构更准确了,需要的实验次数就减少了,他们的工作量也就少了。不过,哪怕是这一批人,也未必会失业。现在搞科研,是需要研究的东西多,做研究的人少。减少大量的重复劳动之后,他们可以把精力和资源,投入其他领域,进行创造性工作。我个人觉得,至少在科研这个方面,AI提高效率,目前来看,是利远大于弊的。

至于颜宁教授会不会“失业”,在听了上面这些分析之后,你们觉得像她这样的顶级结构生物学家,普林斯顿大学终身讲席教授,会“失业”吗?相反,就像当年改变研究路径,从X射线晶体学转换到冷冻电镜一样,她一定会拥抱AI技术提供的助力,在科学研究上,更上一层楼。而且,此次颜宁回国,除了科研之外,另一个重要的目标,是“开宗立派”。

宣布挂帅SMART之后,颜宁在接受采访时,对这个选择做出了解释:她将人生分为吸纳、证明和输出三个阶段,第一个阶段是努力学习、充实自己,第二个阶段是努力工作以获得认可,而第三个阶段是把自己的所学、所感传递给更多人、扶持更多人。在深圳,她将努力实现第三个梦想。颜宁过去曾不断强调,一个好的科研环境,以及发达的科研相关产业,有多么重要。试剂、设备不但贵,还买不到,好不容易获得的成果,却无法转化,也得不到回报。这些情况,她都遇到过,也不希望更多的人遇到。而SMART运作灵活,有足够的资源,却没有条条框框,不定编制、级别,自主设岗,学术自治,市场化薪酬、社会化用人。这无疑是她为中国生物医药产业竖起一座灯塔的理想平台。

在论坛现场,颜宁说:“经过几代人的共同努力,在10年、20年之后,在世界生物医药的版图上,深圳将会占有重要的一席之地。在那个时候, 希望当大家说起生物医药的大湾区,首先想到的就是东半球的这里。”豪言壮语,振奋人心,但做什么,往往比说什么更重要。颜宁的科研成就,举世公认,她能否在中国这片土地上高举火把、薪火相传,我们拭目以待!

好了,以上就是本期《轩讲》的全部内容。这档节目现在会固定在我的个人号发布,每周两更,一般是在周三晚间和周六早上,还请各位点个关注。最后还是少不了大家喜闻乐见的吟唱环节:观察者网是一家独立而负责任的新闻网站,我们秉持全球视野、中国关怀的理念,为大家制作节目。想要支持我们的朋友,可以加入付费会员频道观察员,年费198,使用我的邀请码007可立减十元。现在充值或续费,可领取复旦大学中国研究院出品的《东方学刊》第十六期和范勇鹏老师著作的《从公司到国家:美国制度困局的历史解释》,限量三百套,大家赶紧行动吧!

全部专栏