下面我们讨论一下从滇缅走廊,也就是从今天的云南省和缅甸交界地区进入中国的晚亚洲人。当然在他们不停迁徙的路上,也总会有些人不时地就地停下来,不再跟随同伴继续往前走。
沿滇缅走廊北进的人群中最早沉淀在西南中国的部分,后来演化为说孟-高棉语[5]的各个人群。历史上所谓的“百濮”[6],其主体可能就由他们构成。顾名思义,我们不难想象,现代说孟-高棉语的民族,就应该包括高棉人,也就是柬埔寨人,以及伊洛瓦底江下游的孟人。
古代孟人的分布空间后来受到从北方南下的缅人的严重挤压。后者属于藏人的亲缘人群,在语言上同属于藏-缅语族。越南语也属于孟-高棉语族。如今在中国境内,只有在云南边界还生活着三个人口极少的孟-高棉语民族,即佤族、布朗族和德昂族。但在古代,孟-高棉语人群在中国的分布,还可能从西南地区大规模地向外扩展。
就像我们后面会提到的,当原先居住在华北的上古时期的汉语祖先人群,沿着汉水到达长江,并且入乡问俗,向当地的土著询问如何称呼长江时,当地人回答他们说,它叫krong。这个词在孟-高棉语里的意思就是大河流,南下的汉语祖先人群把它误解为长江的专名,用“江”这个汉字来记录krong的发音。
上古汉语里是存在着诸如kr-、pl-等双声母的,也就是字头辅音包含两个辅音的元素。“江”字就是以kr-为首辅音的双声母字,所以正好用它来记录外来名词krong的读音。汉语里的“江”就这样变成长江的专名。只是到后来,它变得可兼指流入长江的大支流,再转义为可以泛指一般大河流的普通名词;而它的读音则从最先的krong演变为kjang,而后随16或者17世纪的汉语新产生出j-、q-、x-三个辅音,最终演变为今天普通话里的jiang。
“江”从土语中泛指大河流转义为汉语中对一条大河流的专称,与到达南美的欧洲人把印第安语里泛指大河的普通名词“密西西比”误解为今天密西西比河的专名,道理完全相同。另外据文献记载,中国南方当时有人称死亡为“札”,孟-高棉语就把“死”叫作chad。而“札”在古汉语里是一个带尾辅音-t的收声字,所以用来记录chad的读音也正好。可见孟-高棉语人群在上古中国的南部呈大面积分布的状态。
这一批晚亚洲人当然没有全体止步在中国的西南一角。其中折向东偏北继续前行者,在今天华中地区发展成说苗、瑶语的各支人群,是今天湖北、湖南地区苗族、瑶族等人群的祖先。而从继续朝着大体上正北的方向前行的那部分群体里,最终分化出占今天中国人口90%之多的最大民族,也就是汉族的祖先人群。
由南向北穿越四川盆地的晚亚洲人,看来在翻越秦岭之后获得了很大的拓展,一路分布到太行山的东麓。这部分人曾经说一种原始汉藏共同语。在公元前大约4000年左右,也就是距今6000年前,他们又分化为说原始汉语和原始藏缅共同语的两群人。
这也就是说,几乎囊括今河南、山西和陕西省范围的仰韶文化(公元前5000—前3000年),其创造者很可能是原始汉藏共同语的人群。在仰韶文化形成发育约千年之后,共同创造了这一文化的人们开始分化成两个分别说原始汉语与说原始藏缅共同语的人群。造成这一分化的主要原因,可能是身处仰韶文化西部边缘的一部分人,因生态环境不宜于进一步的农业开发,而选择把原来从事的农业和流动畜牧混合经济逐步推向专门化流动畜牧业的发展方向,因此逐步从他们原先的居地迁往更西更南的宜牧地区。中国学者新近发表在《自然》杂志上的文章,综合分子生物学、考古和语言史领域的研究,把上述分化的年代定位于5900年前。由此可见,继碳十四测定技术的发明之后,基因研究对于推动第二次“考古学革命”起到了何等重大的作用。
与上述过程同时,位于西进人群之东的仰韶人,不但与它更东面的其他人群发生频繁密切的交往,还在西面逐步占据了由于原始藏缅共同语人群的向西退却而留出来的旧地盘。而原始汉语就是在他们中间逐渐形成的。
研究汉语史的人早就认定,汉语和藏语起源于同一种远古的共同语言。证据实在太多了,现在只举一个同源词作为例证。古藏语“鱼鳞”“盾甲”读作khrab,上古汉语里把“甲”读作khrap,这两者是千真万确的同源词。只不过“甲”的读音在汉语复声母分化后变成kjap。入派三声后变成kja,然后在汉语首辅音j-、q-、x-产生后,变成它今天的语音jia。经历此种复杂音变后,一般人很难再从语音角度直接感知两者之间的同源性。现在分子生物学以基因为根据,推断汉藏两族拥有一个共同的祖先人群。出于两种完全不同的学科领域的结论,恰好可以在这里互相印证。
除了上面提到的汉藏共同语人群以外,活动在河西走廊到今新疆一带的,主要是从更西面的中亚地区迁移进来的若干支印欧语系的人群。不过他们的历史大概超不过4000年,远远不及活动在东亚的人群那样久远。从东亚也有人往西一直走到那里的,但是他们基本上被吸纳进文化上占支配地位的印欧语人群之中去了。
绝大多数研究者认为,印欧语人群的起源地在黑海和里海以北的草原地区,原始印欧语人群的最初一波扩张,可以粗分为三支,分别到达西欧、今天土耳其所在的小亚,以及东部哈萨克斯坦草原和阿尔泰山—萨彦岭山地。
上述第三支人群在4000年前移居塔里木盆地东部的各个绿洲,他们所说的语言被后人称为“吐火罗语”,是著名学者季羡林深感兴趣的研究对象之一。他们一直在该地生活到公元9世纪,被在那里建立统治的回鹘人,也就是维吾尔族人征服,并且最终淹没在其语言归属于突厥语族的维吾尔族人里面。
天山以北和塔里木盆地西部,也被从西方进入的东伊朗语人群所占据,分别是游牧的月氏人和靠绿洲农业以及过境贸易为生的于阗塞人。于阗塞人大致与吐火罗人同时被它西面的邻国喀喇汗王朝征服,并且也很快融合进突厥语人群之中。
在今天中国境内,除了维吾尔族,还有哈萨克、克尔克孜、撒拉等六个讲突厥语族诸语的民族。原始突厥语人群的起源地应该是在蒙古高原的西部。从遗传结构上看,这个人群中除有O、C等源于东亚和东北亚的染色体基因成分外,还含有在印欧语人群中高频分布的父系单倍型R1a1。因此,原始突厥语人群与原蒙古语和原始通古斯语人群,不像是从同一个祖先人群分化出来的。过去学术界曾经把这三个语族合称为“阿尔泰语系”,但是从20世纪70年代以后,这个语系是否成立,遭到越来越多专家的怀疑。
本世纪初,一位博学的俄罗斯语言学家出版了三卷本的巨著《阿尔泰诸语辞源学词典》。但是另一个以分析新波斯语中的突厥语与蒙古语成分而享誉全球的德国语言学家在对这本书的书评里指出:读完这本试图肯定阿尔泰语系身份的书以后,他最深刻的印象就是阿尔泰语系不可能成立。语言学和分子生物学又一次以各自不同的切入路径,达成了彼此非常接近的认识。
好,我们已经接触到了中国境内讲各个主要语系属下各种语言的上古人群。但说到这里为止,“中国”其实还没有出现。然而由于上古人群付出了成千上万年的、自南向北逐渐打开自己生存空间的努力,“中国”很快就要从一片混沌的东亚大陆上逐渐浮现它的身影了。