母亲的染色体端粒长度只有父亲的37%?最新端粒测序技术问世,揭示父母本端粒差异

500

在过去很长一段时间里,端粒都被视为生命的沙漏,或者一个抽象的尺子:我们每老一岁,它就会磨损一点。

而今年4月份发表在《Science》的重磅研究就发现,哪怕是同一个个体,不同染色体上的端粒长度可能也存在显著差异。比如,染色体A的端粒可能会比染色体B的端粒长6000个bp(碱基对,DNA的基本单位)[1],要知道,通常端粒总长最多也才不过10000bp!

精细化的测序让人们知道,我们曾经对端粒长度的认知仅是冰山一角,那么在染色体端粒长度差异的背后,又包含了什么秘密呢?

最近,端粒研究领域的大神,美国沙克研究所的Jan Karlseder教授团队百尺竿头更进一步,利用他们最新开发的Telo-seq技术,深入研究发现,端粒长度背后竟还有这么多奥秘[2]。

500

500

通常来说,端粒被我们视作细胞寿命的倒数计时器,每次细胞分裂时,端粒就会变短一点,当端粒变得过短时,细胞会停止分裂,进入衰老或凋亡阶段。

500

尽管我们常说“细胞衰老不等于个体衰老”,比如年轻个体体内同样存在衰老细胞,但他们的细胞衰老通常并非是由端粒缩短引起的,而主要是氧化应激[3]和紫外线照射[4]等其他因素导致的。因此,端粒的长度依旧是我们评估细胞乃至整个身体生理年龄的参考

但是,准确测量端粒长度仍旧是一个不够成熟的课题。传统的短读长测序通常只能测出50-300碱基的序列,这对于一般的DNA序列来说还算够用,但面对端粒这种包含大量重复序列的选手,就有些抓瞎了,我们用两段文本来做比较,首先是一般DNA序列:

500

像这样重复文字不多的序列,短读长测序读出的片段很容易通过上下文信息判断出每一个片段的位置,也就比较容易准确地还原出原本的完整序列,而大量重复序列则是这样的:

500

你会发现很难通过上下文确定三个片段之间的顺序,因为这些短片段的内容在原文中出现了好几次,所以面对大量重复序列,短读长测序技术就很难拼凑出原本的完整序列,也就很难准确测量长度。

而为了解决这一难题,PacBio公司开发出了长读长测序技术,可以一次性产生1k到2w个碱基的读长[5],有了更多的上下文信息,片段的拼接就容易多了,准确率也高了不少。

500

可是,长读长测序固然强大,却并不是专门为端粒设计的,它是用来测全基因组的,对于人类细胞来说,端粒仅占全基因组的0.015%,直接用长读长测序技术测端粒长度,无异于大炮打蚊子,不仅浪费还效率低下。因此,本文研究者们又开发了针对端粒的测序方式。

500

Jan Karlseder教授团队开发的新方法——Telo-seq中,DNA序列的端粒部分和非端粒部分可以被有效地分离,甚至能识别出每一段端粒来自哪条染色体。在此基础上,再使用长读长测序技术,就能精确地检测出端粒序列了。

500

图注:蓝色代表端粒,灰色代表染色体,黄色代表端粒序列和一般染色体序列之间的过渡序列,而Telo-seq可以识别并切断这种过渡序列

接下来,让我们看看Telo-seq的效果如何。研究者测了B淋巴细胞系HG002的端粒长度,结果同样发现了不同染色体臂之间的端粒长度差异,比如17号染色体的q臂端粒长度在3088-3139bp之间,21号染色体p臂端粒长度在9603-9835bp之间,相差高达6700bp!

500

图注:横轴数字代表了人类体细胞的22条染色体,#1和#2代表了两次重复实验,而重复实验的结果高度一致,意味着Telo-seq的测序结果稳定性较强

通常来说细胞每分裂一次,端粒就会丢失25-200bp[6],那么接下来,我们来看看这种微小的变化是否也能被Telo-seq捕捉到。

研究者们在体外培养了表达人类乳头瘤病毒E6和E7致癌基因(IMR90 E6E7,可以让细胞突破海弗利克极限)的IMR90人肺成纤维细胞,并传代多次,然后,他们用Telo-seq检测了这些细胞在分裂66次、68次、71次、85次、96次和106次时的端粒长度。

500

图注:上半为染色体p臂,下半为染色体q臂,PDs为倍增次数,可以近似理解为细胞分裂次数

结果显示,平均端粒长度从66次分裂时的4294bp,到106次分裂时的2746bp,端粒长度平均每分裂一次就缩短39bp

如果说到此为止,Telo-seq也只是比肩“前人”的话,那么接下来它的“绝活”就要登场了!

我们每个人的染色体有一半来自母亲,一半来自父亲,此前没有人知道父本和母本染色体的端粒缩短速度是否一致,这次,Jan Karlseder教授给出了答案:

即使是同一条染色体,来自父亲的端粒和来自母亲的端粒也会在长度上大相径庭,比如HG002细胞系中,1号染色体p臂的母本端粒长度为4165bp,而父本则长达11139bp。

500

图注:蓝色为父本,红色为母本

最后,研究者还对20到94岁捐赠者的成纤维细胞进行了Telo-seq分析,不出意外,总体趋势显示端粒长度与年龄成反比关系,然而,若仔细区分每条染色体,会发现相比于染色体因素,年龄因素带来的端粒长度差异更小

500

图注:上图为不区分染色体的情况下,不同捐赠者细胞的端粒平均长度随年龄的变化趋势;下图不同颜色代表了不同的年龄,并展示了22条染色体的p臂和q臂的端粒长度

简单总结一下,我们不难得出一些有意思的新发现:

1. 端粒长度受到染色体臂的影响比年龄更甚,就像组织器官的差异对基因表达的影响比年龄差异更大一样,因此今后在对比端粒长度、端粒缩短速率时,或许该先控制好染色体臂这一变量,也许,同一号染色体臂之间的端粒长度对比,比整体端粒长度的对比更有意义

2. 端粒长度在不同染色体臂之间的差异,不仅仅与染色体本身的特性有关,可能也受到同一条染色体中,父本与母本的染色体端粒长度差异的影响。

500

如果用传统方法对端粒长度的测序是360p黑白照片的话,那么Telo-seq下的端粒测序结果,就可以说是1080p高清全彩大图了,不仅精度更高,而且还能区分染色体和父本母本,顿觉端粒长度背后的奥秘如此广阔深邃。

500

既然科学家们在这项新技术加持下,能够获取大量不同年龄人群的不同细胞类型、不同染色体臂的端粒长度数据,或许能以此为基础,构建出堪比甚至超越甲基化时钟的端粒时钟也说不定呢。

不过,目前Telo-seq想要被大规模应用还有一些障碍,比如参考基因组数据的匮乏等

参考基因组是“实际基因组”的相对概念,代表了某一类物种/组织/细胞系的典型的、健康的基因组结构,参考基因组的构建需要对大量的实际基因组进行汇总、整理、校对才能完成,而有了这样的基因组作为基准,科学家才好判断实验中的实际基因组是什么样子。

500

图注:参考基因组就像是一个标准化的蓝图,比如成纤维细胞的参考基因组,就为所有实际的成纤维细胞基因组提供了一个共同的参考,如此才能知道实际的成纤维细胞是否发生了某些变异

对于一般的基因而言,参考基因组已经比较完善了,但是针对端粒的参考基因组数据目前还比较有限,想要将Telo-seq用于检测更多样化的人类细胞端粒,势必要丰富相应的参考基因组(该研究使用HG002细胞系也是因为其具备一个公开的高质量参考基因组)。

而在这些“基础设施”完备之后,衰老检测体系或将迎来重大更新,在将来,我们或许可以通过这项技术,更直观地感知到我们身体组织细胞的更新速度、端粒耗损速度等,从而牢牢把握住自己的衰老进程。

500

端粒缩短与衰老的关系早在上世纪就已经被发现了[7],这种在抗衰界看似“家喻户晓”的概念,我们对其都仍有着如此巨大的认知空白,更别说其他的作为端粒“晚辈”的衰老机制了,只能说我们对衰老的理解,或许仍旧并将长期处于初级阶段。

———TIMEPIE———

我们不是必须随着时间流逝而变老”,这里是专注“长寿科技”科普的TIMEPIE,为您带来最前沿、最热门的抗衰资讯。全国☝️个“长寿极客联盟”集结号角吹响,定期线下沙龙、抗衰主题实践(冥想、轻断食)、环球抗衰之旅(健康长寿中心、衰老研究所)等待解锁!来绿泡泡+timepie06/扫描下方二维码联系健康顾问,和派派探讨更多抗衰内容~

500

参考文献

[1] Karimian K, Groot A, Huso V, Kahidi R, Tan K-T, Sholes S, Keener R, McDyer JF, Alder JK, Li H, Rechtsteiner A, Greider CW. Human telomere length is chromosome end-specific and conserved across  individuals. Science (New York, NY) 2024; 384:533–539.

全部专栏