常识性错误——人类和黑猩猩的基因相似程度99%

【作者:李雷 中国科学院遗传学博士(授权转载)】 

经常看到各种问题,比如,

人类和黑猩猩的基因相似程度有99%,为什么人和猩猩差异这么大呢?
500

然而,这句话论据就是错的。

————哪里来的99%?————

其实,99%这个数据并不是无中生有,这个内容是来自1975年的一篇science文章。

500

在这篇文章里,作者通过比较了人和黑猩猩的部分蛋白质结构,得出了人和黑猩猩基因相似度99%的结论。

500

(上图是比较的部分内容,红框为相似度)

于是,作者得出结论是:

That is, the sequences of human and chimpanzee polypeptides examined to date are, on the average, more than 99 percent identical

但是,这个内容是有适用范围的

只是部分比较

由于当时的技术限制,所以,作者只是比较了人和黑猩猩的43个蛋白质差异,发现相似度很高。

然而,这只是人体蛋白质的沧海一粟啊。

人体有多少蛋白质呢?

答案是25万-100万左右。

用43个相似度去推论100万个的相似度,比盲人摸象还夸张。

500

————真实的相似度 72% or 88-89%————

那么,人类和黑猩猩真实的相似度有多少呢?

2001年,人类基因组全部组装完成,这意味着,有史以来,我们第一次看清楚了人类基因组这30亿个碱基对的真实情况。

500

而既然有了基因组的信息,那么,直接比较就可以了。

不过,不要着急,因为,黑猩猩的基因组还没测呢!

2005年,黑猩猩基因组测序完成

于是,我们真正的比较人类和黑猩猩基因组有了材料。


那么,首先最简单的比较染色体,发现:

500

染色体数目不一样

上面的绿色是人类的染色体,下面的红色是猩猩的染色体。

最直观的是,黑猩猩比人类多了一对染色体,图中标识的是2A,2B。

染色体都差异这么大,你还说相似99%,这不是欺负人嘛。

以1号染色体为例:

500

图中,蓝色是差异,绿色是G+C含量,红色是重组率。

具体选几个转座子瞅瞅

500

左边是黑猩猩,右边是人类,这差异……

进一步,直接比较二者的基因组差异。

Best reciprocal nucleotide-level alignments of the chimpanzee and human genomes cover ~2.4 gigabases (Gb) of high-quality sequence, including 89 Mb from chromosome X and 7.5 Mb from chromosome Y.

有2.4Gb 匹配的很好,做个简单的算术,人类基因组是3.2G, 2.4÷3.2=75%,在去掉3%左右的核算替代引发的差异

This difference corresponds to ~3% of both genomes and dwarfs the 1.23% difference resulting from nucleotide substitutions

结论呢:

72%!人类和黑猩猩基因的相似度,只有72%!

500

上面这种算法相对简单粗暴,不过也有学者进行了更加全面的以及算法角度改进后的计算。

结论是88-89%!但是,必须注意的是:

这里的88-89%,均指可以比对的部分(即排除了大量无法匹配的序列)———88-89%———

其实人类基因组和黑猩猩基因组差异,已经多次被发现了,比如在这篇文章

Tomkins J. Genome-Wide DNA Alignment Similarity (Identity) for 40,000 Chimpanzee DNA Sequences Queried against the Human Genome is 86-89%[J]. Answers Research Journal, 2011, 4(2011): 233-241.

作者通过比较保守基因组序列,发现人类和猩猩的相似度也只有86-89%。而且这还是去掉了大量无法匹配的序列后的结论(excluding data for the large amount of chimp sequence that did not align)。如果加上那些序列,肯定会越来越低。

另外mon1st提到一篇文章里对于算法的改进

Anomaly Recent Versions BLASTN Algorithm Nucmer LASTZ

不过该文章依然是去掉了不可比对部分后的相似度为88%

【the alignable portions】 of the current chimpanzee genome assembly are 88% similar on average to human.

500

总体上看,无论如何,人类和黑猩猩的基因组相似度不会超过90%

本文参考文献

1,99%相似度 King M C, Wilson A C. Evolution at two levels in humans and chimpanzees[J]. 1975.

2,人类基因组文章 Lander ES L L M, BIPREN B. Initial sequencing and analysis of the human genome[J]. Nature, 2001, 409(6822): 860-921.

3,黑猩猩基因组文章 Mikkelsen T S, Hillier L D W, Eichler E E, et al. Initial sequence of the chimpanzee genome and comparison with the human genome[J]. Nature, 2005, 437(7055): 69.

全部专栏