常识性错误——人类和黑猩猩的基因相似程度99%
【作者:李雷 中国科学院遗传学博士(授权转载)】
经常看到各种问题,比如,
人类和黑猩猩的基因相似程度有99%,为什么人和猩猩差异这么大呢?
然而,这句话论据就是错的。
————哪里来的99%?————其实,99%这个数据并不是无中生有,这个内容是来自1975年的一篇science文章。
在这篇文章里,作者通过比较了人和黑猩猩的部分蛋白质结构,得出了人和黑猩猩基因相似度99%的结论。
(上图是比较的部分内容,红框为相似度)
于是,作者得出结论是:
That is, the sequences of human and chimpanzee polypeptides examined to date are, on the average, more than 99 percent identical
但是,这个内容是有适用范围的
只是部分比较由于当时的技术限制,所以,作者只是比较了人和黑猩猩的43个蛋白质差异,发现相似度很高。
然而,这只是人体蛋白质的沧海一粟啊。
人体有多少蛋白质呢?
答案是25万-100万左右。
用43个相似度去推论100万个的相似度,比盲人摸象还夸张。
————真实的相似度 72% or 88-89%————
那么,人类和黑猩猩真实的相似度有多少呢?
2001年,人类基因组全部组装完成,这意味着,有史以来,我们第一次看清楚了人类基因组这30亿个碱基对的真实情况。
而既然有了基因组的信息,那么,直接比较就可以了。
不过,不要着急,因为,黑猩猩的基因组还没测呢!
2005年,黑猩猩基因组测序完成
于是,我们真正的比较人类和黑猩猩基因组有了材料。
那么,首先最简单的比较染色体,发现:
染色体数目不一样
上面的绿色是人类的染色体,下面的红色是猩猩的染色体。
最直观的是,黑猩猩比人类多了一对染色体,图中标识的是2A,2B。
染色体都差异这么大,你还说相似99%,这不是欺负人嘛。
以1号染色体为例:
图中,蓝色是差异,绿色是G+C含量,红色是重组率。
具体选几个转座子瞅瞅
左边是黑猩猩,右边是人类,这差异……
进一步,直接比较二者的基因组差异。
Best reciprocal nucleotide-level alignments of the chimpanzee and human genomes cover ~2.4 gigabases (Gb) of high-quality sequence, including 89 Mb from chromosome X and 7.5 Mb from chromosome Y.
有2.4Gb 匹配的很好,做个简单的算术,人类基因组是3.2G, 2.4÷3.2=75%,在去掉3%左右的核算替代引发的差异
This difference corresponds to ~3% of both genomes and dwarfs the 1.23% difference resulting from nucleotide substitutions
结论呢:
72%!人类和黑猩猩基因的相似度,只有72%!上面这种算法相对简单粗暴,不过也有学者进行了更加全面的以及算法角度改进后的计算。
结论是88-89%!但是,必须注意的是:
这里的88-89%,均指可以比对的部分(即排除了大量无法匹配的序列)———88-89%———其实人类基因组和黑猩猩基因组差异,已经多次被发现了,比如在这篇文章
Tomkins J. Genome-Wide DNA Alignment Similarity (Identity) for 40,000 Chimpanzee DNA Sequences Queried against the Human Genome is 86-89%[J]. Answers Research Journal, 2011, 4(2011): 233-241.
作者通过比较保守基因组序列,发现人类和猩猩的相似度也只有86-89%。而且这还是去掉了大量无法匹配的序列后的结论(excluding data for the large amount of chimp sequence that did not align)。如果加上那些序列,肯定会越来越低。
另外mon1st提到一篇文章里对于算法的改进
Anomaly Recent Versions BLASTN Algorithm Nucmer LASTZ
不过该文章依然是去掉了不可比对部分后的相似度为88%
【the alignable portions】 of the current chimpanzee genome assembly are 88% similar on average to human.
总体上看,无论如何,人类和黑猩猩的基因组相似度不会超过90%
本文参考文献
1,99%相似度 King M C, Wilson A C. Evolution at two levels in humans and chimpanzees[J]. 1975.
2,人类基因组文章 Lander ES L L M, BIPREN B. Initial sequencing and analysis of the human genome[J]. Nature, 2001, 409(6822): 860-921.
3,黑猩猩基因组文章 Mikkelsen T S, Hillier L D W, Eichler E E, et al. Initial sequence of the chimpanzee genome and comparison with the human genome[J]. Nature, 2005, 437(7055): 69.