谢小冬 陕雪梅
近年来,回族学研究正在蓬勃兴起,各个方面都已取得了许多丰硕的成果。正如回族学目前的发展所展示出的,它是一门综合性的学科。应用现代DNA分析技术,研究回族的起源、迁徙、融合、演变,探讨回族与其他民族之间的关系及有关发展规律,为传统的回族学研究提供新见解和新方法,理所当然地成为21世纪回族学研究的一个值得重视的方面。
我们知道,每一个体在遗传上是不同的,而本质的差异不是在基因产物上,而是在于DNA的差异上,这些差异是由于不同编码蛋白的区域和没有重要调节功能的区域发生了中性突变,这些中性突变构成的DNA变异,被称为“DNA多态性”。DNA多态性碱基顺序,对于一个个体来说保持终生不变,并按孟德尔规律世代相传,对于一个群体而言,DNA多态性千差万别,可以说,世界上没有两个DNA分型是完全相同的。
人类基因组中有一类特异DNA序列,被称为短串联重复序列(short tandem repeats,简称STR),其主要由于核心重复单位数目的变化构成了STR基因座的遗传多态性。人类基因组中,平均每15Kb就有1个STR基因座,其等位基因一般在100350kb,提供了丰富的遗传标记来源,是目前理想的DNA遗传标记。随着人类基因组研究的不断深入,科学家们发现过去将这些重复序列看做是“废料”的观点是不科学的,其很可能与人类的进化、寿命和疾病有着密切关系。如果不同种族STR基因座等位基因频率不同,其等位基因分布能够代表某一种族或某一群体特征,STR遗传标记就可作为人类学研究以及民族学等相关学科进行种族识别和群体基因遗传结构、分析基因流动的新手段。
通常,某一基因座的某一等位基因在某一地区范围内的人群中的分布,是不均匀的,有的地方频率高,有的地方频率低。造成单个基因在不同地域上分布不均匀的原因是多方面的。首先,基因流动,如入侵或和平迁徙,这是大规模的基因流动,但也可以是长时间内通过零星的短距离迁居、婚嫁等,缓缓地扩散、渗透;其次,自然选择,由于某些自然条件的差异及与此相关的疾病的流行等,产生自然选择,使某一等位基因产生更多(或更少)的后代,于是使该等位基因在该人群增多(或减少);第三,由于随机漂变及隔离所造成的某些等位基因频率与母群体不同;第四,突变,产生某些新的等位基因,如果是有利的突变,则通过自然选择增加其频率,不利突变则被淘汰,如果是中性的,或者随机地淘汰,或者有时也有机会通过漂变及隔离而长期存在。因此,研究单个等位基因在生态地理环境上的分布,可以使人们了解小至一个地区范围内、大至全世界某一等位基因的分布状况,通过分析,以了解其起源与人口迁移及自然选择的关系。
回族在全国呈大分散、小聚居的状态。临夏回族自治州是回族主要聚居区之一。据史书和方志记载,临夏回族来源大体可分三个时期。
唐宋时期,“乐江湖而不归者”的西域人是其来源之一。盛唐时丝绸之路南道自内地经临夏、乐都而到敦煌,然后穿新疆,经葱岭至伊朗、伊拉克、阿富汗、巴基斯坦等地。西域使者不绝于途,入居临夏者不在少数。宋哲宗以后,重开东西交通,宋徽宗在熙州(今临洮县)设驿站,同时在河州(今临夏)、湟州设专卖机构,进行茶、马、绢帛交易。故宋代留居的回回色目人亦为数不少。
元帝国时期,西域签军、工匠、回回色目人等,随军屯戍河州是其来源之二。公元1227年,河州成为蒙古军的屯戍点。公元1272年,河州成为安西王忙哥剌属地,西域签军、工匠、回回色目人等大批随军来此,后来成为回族的基本组成部分。
明清以来的移民是其来源之三。明朝回族大将沐英曾屯戍于此。清中叶以后,由于战乱和天灾,又有许多回族被迫迁往河州[1]。从临夏回族的形成过程可以看出,回族历史悠久,族源成分复杂。但以群体角度从DNA水平来阐明回族的起源、迁徙、演化等问题的研究,目前尚未见报道。
本文以临夏回族人群为对象,主要研究回族群体基因多态性及其起源、迁徙、演化等问题。血样采自甘肃临夏回族自治州临夏市,所有个体三代均为族内通婚,血液均采用EDTA抗凝。DNA采用Chelex-100抽提法,对已被证明适于人类学研究以及民族学等相关学科进行种族识别和群体基因遗传分析的STR遗传标记——THO1基因座、D13S317基因座采用特异性扩增法;均用银染显色方法检测扩增产物,检测结果根据Ladder Marker确定其DNA基因型。此外,甘肃汉族、东乡族与藏族基因资料来源于本实验室积累,[2],其他族群基因资料来源于已公开的相关报道[3]。应用“PowerStarts”软件评价多态性,应用种族混杂度、迁入率、遗传距离、遗传系统树来研究分析群体遗传结构和动态。
以TH01基因座等位基因频率为基础计算的遗传距离及系统树显示(见文末附图):在遗传距离0.625水平上,可分为两大类群,基本对应于亚洲人群和欧洲人群。欧洲人群内,美国白人和欧洲白人在遗传距离0.165水平上聚为一类。在亚洲人群内,回族与甘肃汉族聚类成一组,他们和东乡族与藏族聚类的另一组遗传距离较近;云南汉族与苗族聚类为一组,而广西汉族和壮族聚类在一起。基本反映了各个人群的地理分布,各小组的聚类结果基本符合传统人类学上的划分,并与国内利用红细胞血型抗原、人类白细胞抗原及免疫球蛋白进行研究所得出的结果有相似的趋势。证明以TH01基因座等位基因频率为基础计算的遗传距离及系统树分析能够适用于群体遗传学和人类学上的研究。
从TH01STR系统树可以发现,临夏回族与甘肃汉族遗传距离最近,这是长期以来同一地域内人群间相互渗透、融合,基因交流共同作用的必然结果。通过迁入率的计算,发现如果自元代(1272年)河州成为安西王忙哥剌属地,西域签军及工匠、回回色目人等随军大规模进入该地以来算起,假设已历经36代,则汉族进入回族群体的基因流动的速率相当于每代平均10.3%,进一步从分子生物学的角度证实了以往大多数人类学调查的结果,即回族与北方汉族之间有相当大的融合[4]。临夏回族与东乡族、藏族遗传距离也较近,这首先与临夏的地理位置有关。临夏地处汉藏地区交汇处,又是自古以来丝绸之路的贸易点,各民族长期相处过程中的基因交流是不可避免的。同时,回族和东乡族有着共同的宗教信仰,而且在两个民族的形成和发展中很可能有着相同或相近的渊源,因此遗传距离相近。另一较能与其他遗传标记相映证的STR遗传标记是D13S317基因座。从以D13S317基因座等位基因频率为基础计算出的遗传距离及系统树可以发现,在遗传距离0.209水平上大致可分为三个类群,即由汉族、回族、藏族、东乡族及壮族构成的蒙古人种组群,由美国白人、葡萄牙白人和阿拉伯人构成的高加索人种组群和美国黑人构成的尼格罗人种组群。而西班牙裔美国人实际上是由操西班牙语的白人、拉美地区的土著印第安人及较早生活在那里的原非洲黑人后裔相混杂融合形成的一个大群体,故独立于三大类群之外,这一聚类仍反映出了地域的影响效应。
如果说遗传距离的计算及系统树分析可以大致勾画出一个民族的起源、演化、迁徙、融合图式的话,那么通过混杂度则更能较准确地反映人群迁移和混杂效应。鉴于D13S317基因座第11号等位基因频率在高加索人种中明显高于蒙古人种,故以该等位基因频率为指标,计算种族混杂程度m。结果发现,在本文所列蒙古人种的各族群中,只有回族和东乡族的混杂程度m大于25%,分别是74.1%和43.5%。虽然这些计算只是近似值,但使我们对回族和东乡族中的高加索人种血缘混杂有了较为明确的了解。在赵桐茂等人[5](1993)的“中国人免疫球蛋白同种异型的研究:中华民族起源的一个假说”中,提到以Gm3;5作遗传标记,发现回族和东乡族中高加索人种血缘混杂程度m大于25%。结合本项研究结果,并参考有关历史文献、当地的地理、民俗和文化人类学研究的成果,我们认为:回族中有较大比例的高加索人种的混杂程度,这种基因流动应该与唐宋时期西域商贾、使者留居和蒙元时期蒙古人西征有密切关系,而后者应是更主要的因素。
这种大规模的种族迁徙,元代以后在这一地区再未出现过。而基因交流是人群迁徙的必然结果,毫无疑问会将高加索人种血缘带入本地区。从本实验室已有的遗传距离的计算及系统树分析发现,无论采用哪一种遗传标记,回族总是与本地汉族、东乡族及藏族接近,反映了与这些民族间的渊源。这说明进入临夏地区的这部分回回色目人随着历史的发展,逐渐与本地汉、东乡、藏、蒙古等各民族相融合,形成了今天的临夏回族。
诚然,解决一个民族起源的重大问题,仅靠几个遗传标记的测定、分析是不够的。但综上所述,对民族的源与流、人群间的血缘关系,可以从历史、考古、语言、文化、体质特征、基因频率等各方面进行研究,相互印证补充。可是历史与考古资料往往受条件限制,残缺不全或记载失真;语言与文化则容易受战争征服、同化渗透等影响,以致在一二百年内发生急剧变化;体质特征则在相当大程度上受外界影响,不同源人群在相同环境条件下,可以朝相同方向演化而形成趋同的体质特征。而基因是遗传物质DNA的核苷酸序列,在自然界以一定的频率发生变异,所产生的变异大部分是中性的,只有小部分受环境因子影响,却能稳定地世代遗传。因此根据基因频率研究人群间的迁徙与混杂及血缘关系更具有特殊的重要性。相信随着今后我国群体遗传学研究的深入开展,回族学研究的方法和手段将会越来越完善和准确,回族学研究的基础资料也将会更加丰富、更加科学。
[1]《临夏回族自治州概况》,甘肃民族出版社,1986年;杨应忠:《甘肃少数民族地方》(第1版),甘肃民族出版社,1993年;杨建新:《蒙元时期甘肃的少数民族》,《西北史地》,1992年第2期,第16~24页。
[2]Xie Xiaodong,W-ang Xunling et al.Population study of three S“TIiloci一HUM‘fHOI,’fPOX,and CSF1P0in Donl,”xiang,Hui,andHan from Northwest China.Forensic Science International.2001,119(2);258-259.
[3]朱少建等:《广西壮、汉人群3个基因座的遗传多态性》,《刑事技术》,1999年第6期,第10~12页;E:dwanls A ,liammond HA ,Jin L,Casket‘CT,Chakraborty I1:Genetic variation at Gve trimeric and tetrameric repeat loci in four human population groups Genomics.1992,12;241~253;Perez-Lezaun Aalafell F,Clarimon J,I31sch F,Mateu E,Cusmao L,Amorin A,13enchemi N,I3ertranpetit J Allele frequencies of 13short tandem ripeats in population samples from the Ibeiran Penin-sula and northirn Africa.Int J Legal Med 2000,113:208~214.
[4]袁义达,杜若甫:《中国十七个民族间的遗传距离的初步研究》,《遗传学报》,1983年第10卷第5期,第398~405页。
[5]赵桐茂,张工梁,朱永明等:《中国人免疫球蛋白同种异型的研究:中华民族起源的一个假说》,《遗传学报》,1991年第18卷第2期,第97~108页。