财新传媒

王传超:走出疑古时代——用遗传学重构东亚人群历史

2016年04月27日 10:20 来源于 财新网
现代人从哪里产生?又怎样来到东亚?这是人类起源研究一个非常重要却又悬而未决的问题

  主讲 | 王传超

  整理 | 吕美霖

  责编 | 陈晓雪

  “中国在三千年前、五千年前是什么样的?”

  最初去国外交流的时候, 国外的同行往往会问我这样一个问题。我通常会告诉他们,中国的文明可以追溯到五千年前,有非常光辉灿烂的历史。

  “你有什么证据吗?” 

  我列举出司马迁写的《史记》,因为这本书可以追溯到五千年前,我也会列举出很多遗址,比如仰韶、大汶口等,它们是古代中华文明的例证。

  “你们还有什么别的证据吗?曾生活在这些遗址里的古人和现代中国人是什么关系?”

  面对这样的反问,我竟哑口无言。

  虽然我可以举出很多遗址、很多史学材料来说明我们的文明历史可以追溯到多久前,但材料只是一部分, 最重要的还是人的证据。人在历史中扮演着核心的角色。如果人的历史研究不清楚的话,很多历史和文化的问题没有办法得到全面的回答。

王传超
王传超正在学术沙龙上讲解。摄影:郭物

  01 研究人类活动的方法

  历史上发生过什么,就可能留下一定的痕迹。这些痕迹可以从多个学科、用不同方法去看,比如说历史学、语言学、考古学、古生物学、气象学,又因为人本身是生物,所以还有人类学、遗传学等方法。但是这些不同的学科所能探究的时间深度是不一样的。

  比如,我们可以通过阅读史学材料,比如《二十四史》,去看四五千年前来的历史,但是它们的真实性、准确性是无法保证的。语言学的话,我们可以通过构建各个语言之间同源词汇的关系,推测不同人群和文化的演化。比如,根据同源词汇,大致可以推算出汉族和藏族分离的时间大概在六千年前——不过学界对于这一推算的争议也很大。考古学基本上可以跨到200万—300万年的时间尺度,主要靠发掘到的材料进行判断,局限在于运气够不够好,能不能挖到材料。古生物学可以追溯到更远的时间,可以到三十多亿年前,气象学也可以追溯到三十多亿年,当然这跟人类几万年来的迁徙史就不太相关了。古人类学是在五百万到七百万年前,这是发现人类最初在非洲出现的一个时间。遗传学研究的时间跨度特别大,从几十年、千百年甚至一直到三十多亿年前的生命起源,只要有数据,我们就都可以回答与之相关的问题。比如,遗传学可以准确无误地告诉你某些遗址的古人遗骸的生物学关系,而这是单纯比较遗存的器物、墓葬形式等文化特征所难以准确回答的。

  要回答东亚人群历史的问题,我们首先需要回答“东亚人从哪里来”、“中国人从哪里来”这些根本性的问题。

人类活动
From Jobling et al.

  02 遗传学与人类的起源

  我们知道,人猿分离之后,地球上出现的人科物种有许多种。人科这一谱系中已知的最古老的人科物种化石,是在非洲发现的、距今大约700万年前南方古猿阶段的撒海尔人乍得种,而在亚洲和欧洲发现的最早的人类化石都属于直立人阶段,距今不超过200万年,因此,对于人类起源的最初地点是非洲这一论断,学界普遍是接受和认同的。人类起源最大的争议是现代人从哪里产生,又怎样来到东亚的问题。这其实也是涉及到人类起源和迁徙,也就是源和流的问题。我所做的,就是试图从遗传学的视角来回答人类源和流的关系。

  人的DNA主要是有23对染色体,其中22对常染色体中,每一对染色体都有一条来自父系,一条来自母系,两条染色体在传代过程中对应的部分会发生交换,从而造成混血的效应,就是遗传学上说的重组。另一对性染色体包括X染色体和Y染色体。在女性体内,X染色体也是成对的,分别来自父母双方,所以也不能避免混血的影响。而在男性体内,却只有一条来自母亲的X染色体和一条来自父亲的Y染色体,也就是说男性的Y染色体只能来源于父亲,所以人体性染色体的遗传方式决定了Y染色体遵从严格的父系遗传。

  科学家们通过人类Y染色体的研究已经形成共识,现代人可追溯到二十万年前的在非洲的共同的父系祖先。这一父系始祖类型再不断衍生出新的分支,一直遍布全球,这是一场波澜壮阔的人类大迁徙。我们的祖先从东非走出非洲,进入欧亚大陆,沿着海岸线迁徙由南向北进入东亚,最后在大概一万五千年前的时候,跨过白令海峡,进入美洲。在这个过程中,人类的体貌特征产生了一些适应性的变化,比如赤道附近的人肤色会很深,而欧亚地区的人肤色很浅,这是为了适应环境产生的基因突变。

  和Y染色体类似的是线粒体,线粒体仅能通过母亲传给儿女,反映的是母系的历史,它也构建出根植于非洲的谱系树,讲述了和Y染色体一样的人类出非洲迁徙的故事。

  基于这两种证据,上世纪80年代末,遗传学家就提出“现代人出非洲”学说,指的是10万到20万年前,在非洲完成进化的现代人扩散到世界其他地方。后来,不单是通过Y染色体和线粒体,我们通过全基因组测序也可以发现,非洲人群是在谱系树的最根部,属于比较原始的祖先群体,然后分出欧亚人群,谱系树最末端是美洲土著。我们可以观察到,不同地区的族群在谱系树上的分布是和人类迁徙的路线是吻合的。换句话说,DNA水平的证据都是支持人类有一个非常近的共同祖先,而这个共同祖先生活在非洲。

  对东亚而言,早在2000年,复旦大学金力教授的实验室对东亚地区12127份男性随机样本的Y染色体进行分型研究,发现这一万多份样品无一例外都是走出非洲的突变型。也就是说从父系角度看,现存的东亚人群都是走出非洲的后裔。此后十多年间的Y染色体和线粒体研究反复验证了这一结论。而且,2013年发布的北京周口店地区 4万多年前的田园洞人的线粒体也是 “出非洲” 的支系之一,其21号常染色体也落在了现代欧亚人群的变异范围内。

  以上都是很强的证据证明现代人起源于非洲,东亚人群也不例外。

  2010年,德国马普所全测序了尼安德特人(Homo neanderthalensis)的基因组。尼安德特人在三万年前左右在欧洲灭绝,是我们现代人的一个旁系,和现代人相当于是堂兄弟的关系。德国马普所的研究发现,尼安德特人为现代人贡献了大约3%的DNA,也就是说,我们现代人体内还保留了祖先堂兄弟的DNA。不过这个贡献的分量非常小,并没有推翻“现代人出非洲”学说。

  那么,在东亚地区又有没有类似于尼安德特人这样的现代人旁系对我们有基因贡献呢?目前东亚地区的古DNA研究还未有效开展起来,还不能百分之百确定有还是没有。对东亚几万年前的古人,甚至是十多万年前的古人进行全基因组测序以后,将可以更详尽地回答这一问题。当然,这是后话。至少现在来讲,可以确定的是,我们东亚人群基因组里有95%来自于几万年前出非洲的遗传贡献。

  03 汉族的起源和演化

  汉族有着悠久的历史,其起源和发展是一个持续不间断的过程。“汉人”这个名字源于汉朝,还可追溯到先秦时代的“华夏”,也有说法是汉人甚至可上溯到新石器时代的炎黄部落。“汉族”是到19世纪末以引入了“民族”一词之后给“汉人”的族名。汉族的语言统称汉语,汉语可以分成十大方言,即北方官话、吴语、湘语、客家话、赣语、粤语、闽语、晋语、徽语和平话,和地理区域很一致,汉族按照这十大方言分成十类群体。

  从遗传学角度来看,各汉族群体也有着地理上的细微差异,但远没有语言上的差异大,比如汉族可以长江为界分为两个遗传亚群,北方汉族和南方汉族。跟南方汉族相比,中国北方和西伯利亚说突厥、蒙古和通古斯语的各族群与北方汉族更近,同样地,跟北方汉族相比,南方土著的侗傣、苗瑶、南亚和南岛语人群和南方汉族更近,这是由于汉族和各少数民族杂居,人群不断混合的结果。汉族各群体最大的特点还是遗传上极大的相似性。

  复旦大学、中科院马普计算所以及新加坡基因组研究院等机构曾对全中国范围的汉族进行过大规模的遗传学调查,发现南北汉族在常染色体上的遗传差异很小,小到什么程度?举个简单的例子,我们都知道咱们中国人和西方人差异很大,假设汉族和法国人的遗传差异为1,那么南北汉族的总体差异与之相比就仅仅只有0.02左右。在父系上,北方汉族和南方汉族的Y染色体单倍群分布频率非常相近,O-M122这一类型高频分布于各汉族群体,北方汉族在37-71%之间,平均53.8%;南方汉族在35-74%之间,平均54.2%,这一类型是和北方阿尔泰族群中常见的C、N、Q和R等明显不同,也和南方土著里高频分布的O-M119,O-M95和O-M7不同,可认为是汉族父系的代表类型。南北汉族的遗传差异主要体现在母系上,东亚北部主要单倍群(A,C,D,G,M8a,Y,Z)在北方汉族中的频率(平均约55%)比在南方汉族中(平均约36%)高得多。另一方面,南方土著族群的代表性单倍群(B、F、R9a、R9b、N9a)在南方汉族中的频率(平均约占55%)要比在北方汉族(平均约33%)高得多。这可能是由父系主导的汉族南下迁徙所造成的(详情参考:Wen B, et al. Nature, 2004, 431: 302-305)。

  说到这里,就有一个很有趣的问题,汉族遗传上的同质性是何时形成的,能否真的追溯到传说中的炎黄时代?我们从不同角度去回答这一问题。首先,我们对中国的男性进行了大规模Y染色体非重组区捕获测序,测序的好处在于我们可以知道所测区域上每个位点的突变情况,据此,我们根据一定的突变率可以推算各个支系分化的时间,发现在O-M122支系上有三个比较明显的星状扩张。什么叫“星状扩张”?我们可以理解为,有三位超级男性祖先,他们娶了很多老婆,生了很多孩子,他们的孩子又生了很多孩子,这样他们的Y染色体传递就像爆炸一样,以他们为中心往外扩张开来,以致现今中国一半的男人都是他们这三个超级祖先的后代。更有趣的是这三个星状大扩张发生的时间分别是在5400年、6500年、6800年前,而中国北方全面转入农业阶段的时间也正好是6800年前,这也与黄河中游的6900-4900年前的仰韶文化、黄河上游6000-4900年前的马家窑文化以及黄河下游7400-6200年前的北辛-6200-4600年前的大汶口文化等的时间相契合。由此,我们认为这三个在新石器时代晚期快速扩张的支系奠定了东亚的父系遗传基础,汉族甚至是中国人的传承有着很好地连续性。另一个角度来说中国的农民是本土扩张的,与中国农业的本土起源是一致的。这与欧洲的情形不一样,欧洲的农业是由中东的农民扩张而带入的,同样地,欧洲现有的大部分Y染色体支系也是由中东农民贡献的。 

  也许会有人问,你怎么能保证从几千年前一直到现在的两三百代的时间里面,没有发生人群的大规模替换呢?毕竟Y染色体只是一个单独的遗传标记,不能代表全基因组信息。这就牵涉到一个很重要的问题:中华的五千年文明历史是本土的一直演化的,还是中间经历了很多变迁,发生过不同的人群大规模替换?通过现代人的DNA信息,我们确实没办法回答是不是这样一直延续下来的。如果我们可以直接把新石器时代的古人的全基因组做出来,直接进行古今对比,就能够知道谱系是不是连续的。于是,我们就转向了古DNA。最近,我们完成了一些重要遗址的古DNA分析,研究结果也会在稍后的论文中陆续披露,大家有兴趣可以继续关注。

  04 汉藏同源

  藏缅人群也是东亚乃至亚洲人口众多的一个重要族群。藏缅语现存350多种语言,其使用者分布在东亚、南亚和东南亚的多个国家和地区。在中国,藏缅语族人群主要居住在中国北部的青海,以及中国西南部的西藏、四川、云南、湖南等地区,总人口占到中国所有少数民族的1/4以上。据史料记载,藏缅群体源于古老的氐羌部落,与古汉族同源,最初居住在中国西北。在春秋时期(距今约2600年),藏缅群体展开了大规模南迁,通过藏缅走廊,进入南亚语系、壮侗语系、苗瑶语系这三个南方土著人群的分布区,开始了人群混合。从考古资料来看,青藏高原上最主要的石器——细石器,既有华北细石器的特点,也承袭了一些当地旧石器的特色,考古学家从而推断藏缅群体是北方新石器人群和青藏高原土著混合的结果。肤纹学调查发现藏族与汉族亲缘关系较近,而与印度人和孟加拉人的亲缘关系较远。在语言学上,汉语和藏缅语族之间的关系已经非常清楚了,原始汉语和原始藏缅语有数百个同源词。基于词汇以及系统进化原理,语言学家曾估算汉语与藏缅语约在六千年前分开。

  过去二十年里,遗传学研究,特别是父系Y染色体和母系线粒体DNA,为藏缅群体的源流历史提供了更详细有价值的参考。

  在父系Y染色体方面,与汉族一样,几乎全部的藏缅人群都有一个共同的遗传特征,那就是高频出现的Y染色体O3-M122支系。藏缅人群还有自己独特父系标记,那就是Y染色体单倍群D-M174也在藏族中高频出现,这一类型还在日本和安达曼群岛高频分布,但在东亚的其他群体中几乎没有出现。Y染色体单倍群D是一个非常古老的类型,甚至可追溯到3万多年前,可能是旧石器人群的遗留。

  在母系方面,几乎所有存在于东亚的单倍群都出现在藏缅群体中。藏族中高频的mtDNA单倍群A,D, G和M8揭示其可能的北方起源。藏缅族群线粒体中也发现了可能的旧石器时代人群的遗存,例如单倍群M62。

  与汉族类似,藏缅族群形成过程中的遗传混合有性别差异,南部藏缅群体的遗传结构主要由两个亲本群体形成:北方移民和南方土著。在混合中,男性和女性世系是有差异的,在现存南部藏缅中北方移民对男性世系影响力更强(∼62%),而南方土著人群对女性世系做出的贡献更多(∼56%)。在常染色体上,总体而言,与藏族亲缘关系最近的是汉族,而且也没有发现藏族有更多的中亚、西亚、南亚、欧洲、中东和非洲遗传成分,藏族还是处于东亚人群的变异范围之内的。而一些彝缅语人群,比如彝族、纳西和拉祜等,有着明显的南方土著的遗传混合。

  遗传学的结果和考古、历史和语言学相互印证,都指向了藏缅的东亚本土起源,且与汉族的遗传近缘性。

  05 中国回族的起源与演化

  中国回族的先民最早可以追溯到唐宋时期,当时不少信仰伊斯兰教的阿拉伯人、波斯人陆续来到中国,他们中有一些人定居下来,成为后来回族的一部分祖先。不过,回族真正开始其多民族、多人种的融合之路是在元代。研究中国中亚文化的林干在《试论回回民族的来源与形成》一文中提出回回民族主要源于元代由波斯、阿拉伯及突厥各民族分布地区等地迁居到中国来的移民。回族史学家杨怀中也认为蒙元时代大批中亚穆斯林入居中国,为回族最终形成一个民族共同体奠定了人口数量基础。此外,汉族、藏族、蒙古族等民族成分融入回族的情况也受到学者的关注,尤其是汉族成分的加入是十分重要的力量。总的说来,学者们普遍认为回族的族源成分相当复杂,是由外来成分、边疆内附成分和其他民族吸纳成分长期融合的结果。

  在体质人类学方面,甘肃临夏回族的体质特征接近新疆的哈萨克、柯尔克孜等少数民族,具有伊斯兰民族的独有特征,同时明显显示出东亚人种的体质特点。宁夏回族具有蒙古人种的一般特征,也具有本民族的特点。湖南回族的体质特征与湖南其他民族有相似之处,具有东亚民族的特征。这些研究都指出各地回族都有明显的蒙古人种特征,也有自己的民族特点,比较接近西北的少数民族。

  相比一般的体质形态特征,肤纹的遗传率更高,不受环境影响,能够更好地代表群体的遗传特征。肤纹学专家张海国等分析了中国所有的少数民族的肤纹特征,发现各地的回族都与南北方的各个民族群体错落聚类在一起,而并不在回族内部聚为一群,也不仅限于靠近北方民族。这就提示了回族的遗传结构中受到周边民族的影响是十分显著的。

  回族的DNA研究虽然常常见诸报道,但都是针对零星位点或者局限地区的研究。各项研究普遍指出,回族虽然带有部分西方人群的遗传特征,而族群总体的遗传结构却最接近当地的汉族。例如兰州大学的谢小冬等分析了甘肃临夏的回族群体的少数法医学常用的常染色体STR 位点,发现甘肃回族与甘肃汉族最为接近,但也带有高加索类型的等位基因。对新疆回族的线粒体研究显示,新疆回族的线粒体单倍群有93.3%属于东部欧亚特征单倍群,这如果不是近期的汉族基因流动的结果,很有可能是历史上与汉族通婚中,汉族母系的贡献。这说明这一回族群体的遗传结构总体倾向于当地汉族。

  我们对全国范围的回族有过遗传调查,这里对结果做下总结。与汉族类似,在Y染色体上回族中也是东亚本土单倍群O-M122的频率较高,回族中还明显高频的有单倍群J和R,以及低频的E、F*、G、H1、I、L1和T,这些单倍群是典型的欧亚大陆西部或中东地区的特征支系,在东亚群体中几乎未有发现,而在回族中这些支系约占到20%多。这印证了回族的来源极其复杂,是由中东、欧洲、中亚、南亚等地区的穆斯林或其他族群零散来到东亚,随机融入中国的本土族群形成的。而在常染色体上,回族与非洲、欧洲和中东各人群的遗传距离最大,而与东亚族群,尤其是各地汉族的遗传距离最小,其遗传组成也与东亚其他群体非常相近。这说明回族的融合过程是有性别差异的,回族人群的形成主要源于回回男性与汉族等人群的女子通婚,经过漫长历史时期的人群遗传混合,现今的回族常染色体已看不到最初的外来遗传成分,而Y染色体由于其不重组、稳定父系遗传等特性就还可以检测到。

  调查过程中有一个特殊的例子——海南岛的回辉人。回辉人人口相对较少,虽然他们有独特的语言,但并不被认为是一个单独的民族,而是划入回族。虽然民族识别没有问题,但是他们的起源并不明确。回辉人的民间故事认为他们的祖先一直是穆斯林,起源于中亚,一如中国其他回族。回辉人同时也被认为是占城王国(7世纪至18世纪)为躲避越南入侵而流亡的占城人后裔。我们对回辉人的Y染色体和线粒体研究表明相比于占城人和其他中南半岛人群,回辉人与海南原住民黎族最为接近。这说明,占城流亡的回辉人遗传世系已被海南本土成分替换。

  总结

  最后总结一下考古学和历史学该如何去使用遗传学这种工具。遗传学是一种非常强大的工具,不受其他学科知识的影响,可以最真实地反映人群和人群之间的关系。当然,它得出的结果需要和其他学科综合解读。就像我前面举的这几个例子,遗传学可以告诉你一些现象,解读这些现象需要跟考古学、历史学与语言学的专家学者合作,从中挖掘出更多的信息。

  未来,最需要我们努力去解决的是东亚人群的古DNA研究。我们的众多科研成果都是基于东亚现代人群的,近年来古DNA研究在国外取得突破性进展,中国有着丰富的历史和遗传资源,考古遗址众多,存在许多独特的古代DNA研究材料。通过对不同时代、不同地点的古人遗骸进行DNA研究,可以为了解古代人群的基因多样性及其演化特征提供最直接的证据。相信更先进的技术,更广泛地进行跨学科合作,能够为考古、历史和语言学提供更多的自然科学的证据,让我们真正地走出“疑古时代”。

  《知识分子》是由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,致力于关注科学、人文、思想

知识分子

责任编辑:崔筝 | 版面编辑:邱祺璞
财新传媒版权所有。
如需刊登转载请点击右侧按钮,提交相关信息。经确认即可刊登转载。
推广

财新微信