牛津通识课：语言学入门(斯蒂芬·安德森)_第三章系统发生语言学：建立语言关系（1 / 1）_牛津通识课：语言学入门最新章节免费阅读无弹窗

第一章提到，定义物种的方法之一是将其视为拥有共同祖先的最小生物群，直至再无其他独特派生特征使亚群体之间相互区别。这种定义方法有两大基本属性：一是存在共同祖先，二是没有个别基因突变。从这个角度来看，这一方法本质上还是历史性的。

若将这一方法运用到语言分类上面，一种“语言”可以定义为：某个单一祖先语言系统的历史分支集合，直到亚群体语言使用者之间再无明显区别。这种历史方法具有一定的优势：我们可能会说“英语”在英格兰的使用时间已有千年甚至更久，但是，住在伦敦说着现代“英语”的人肯定无法理解（当然也无法被理解）乔叟时代甚至莎士比亚时代的“英语”使用者。“英语”的定义有一个历史维度，这一维度超越了我们所理解的所谓“相同”语言的概念。

对比生物学上将物种分为属、目、门等（或者用当前流行的“高阶进化支”的说法）的做法，可以进一步将语言间的历史关系扩展至虽拥有共同祖先却历经变化早已各不相同的语言群，因此可以根据语言的不同历史将其归入不同的语系。对此，达尔文在《人类的由来》中再次做出预判：“同其他物种一样，语言也可以被层层分类，可以根据自然演化分类，也可以通过其他特征来进行人为分类。”彼时正值1871年，关于语言的历史分析及其相互关系风头正劲，并逐渐被奉为唯一的科学方法。在这一背景下，达尔文的这一说法相对来说可信度较高，并且直到今天仍然值得我们反思。

语言变化

本章所讨论的话题就是建立这种语言关系的基础。而提到语言关系，很重要的一点在于历史发展过程中不可避免的语言变化。此话怎讲？先来看下面这个思维实验。暂且不论“民族语”定义的6906这一数字是否准确，甚至无须在意这一数字是否有意义。提到世界语言多样性，我们都明白这意味着世界上有很多种不同的语言。现在想象一下，这种多样性在瞬间神秘消失。想象一下出于某种语言魔法，世界上的人突然之间开始使用同一种语言，比方说世界语（有些人真的是很乐于见到这种现象）。先不管这到底是好事还是坏事，也不要考虑如此一来是否会造成知识流失等，现在只要想象一下这种情形就对了。

你觉得接下来会发生什么呢？事实上几乎可以确定，在接下来的20~30年间，一定会出现地方变化，至少会有地方口音。考虑到世界在变化且在不同文化中变化方式不一，不仅会出现地方特色文字和表达方式，语言也会产生乡土特色。可以说，50年内将会出现明显的方言差异，而一个世纪之后，方言间的差别会继续增大，某一地区的人们将很难理解另一地区人们的语言。至于多久可以将两种方言定义为不同语言，就要看语言差别同社会和政治现实在多大程度上保持一致了。

将这个实验继续推进，会得到一个无法逆转的结果：上述语言间的差异会不断增大，达到现代罗曼语言如西班牙语、葡萄牙语、法语、意大利语、罗马尼亚语等之间的差异程度。但所有这些语言的历史发展仍然表现出单一源语的线性发展，我们的思维实验中的“单一源语”就是世界语。语言学家们所谓的语言间的“基因”关系也正是此意：所有语言其实都是单一原始共同“祖先”向不同方向发展的结果。

需要注意的是，这里所说的“基因”关系与字面意义上的生物关系无关。关于匈牙利语的起源就存在一些争议。从严格的语言学角度来看，匈牙利语与芬兰语和爱沙尼亚语相关，属于乌拉尔语系。但基因研究发现芬兰人和匈牙利人之间并无明显的生物学联系，因此关于其起源又有了其他多种假说。其中最合理的一个解释是：一个移民自中亚的乌戈尔部落来到了被称为现代匈牙利的区域并征服了当地居民，后者很快开始使用征服者的语言。因此，虽然这三种语言使用者之间的生物关系有所不同，但从语言学角度来看，匈牙利语与芬兰语和爱沙尼亚语存在“基因”关系。

这一情形也有例外。当一小股维京人（或斯堪的纳维亚人）征服现代法国的部分地区后，开始使用当地语言——古法语，促进了诺曼法语的发展。这一语言接着被引入英国，虽不至于被完全接受，却也极大地影响了英语的发展。具有讽刺意味的是，入侵者的语言实践（罗曼语，而不是日耳曼语）改变了英格兰人说的日耳曼语。在大多数情况下，这些入侵者和英国人的生物联系可能比语言联系要近得多。

回到讨论的关键之处，一旦人群中出现可以限制同质化的分界线，语言统一必然会带来语言多样性。明显的内部分界线大多是地理分界线。如果河流、群山、沙漠等将不同人群分隔，那么一个地区的语言变化将无法在另一地区得到显现，反之亦然。这就足以产生不同的表达方式，最终形成不同的语言。

但是语言为什么会变化呢？为什么我们想象场景中的那些人不能一直说着魔法赋予的世界语呢？事实是，即便忽略科技和社会发展带来的词汇变化，语言也处在不断变化中。关于这一点原因有很多，而历史语言学家的工作正是要找到一个全面综合的解释。

产生变化的两大主要原因：（一）说话者倾向于简化发音；（二）听者所听并非言者所言，听者按照所听内容进行相应的语言实践。

第一类情况的很多例子都可以归入语音同化范畴。例如，拉丁语中“octo”的两个辅音字母发音位置不同：第一个是软腭音，发音时舌头要触及硬腭的后部，而第二个是齿音，发音时舌头要触及上齿。这就意味着舌头要快速完成两个不同动作。若在同一位置发音，情况将得到简化，比如在意大利语“otto”（奥托）中，软腭辅音由一个稍长的齿塞音代替。这样做的人数越多，次数越频繁，有些使用者就会认为这才是该单词的正确发音方式，“octo”也就会被“otto”代替，意大利语的发展历史显然如此。与之类似，瑞典语“dricka”（喝）和“tacka”（谢）同样存在同化过程：刚开始有鼻音辅音且有一个塞音紧随其后（如英语“drink”“thank”中的“nk”），后来舍去鼻音部分，仅保留了一个较长塞音。

在现代英语中，我们也可以观察到语音同化现象在时时发生。例如，有人把“football”（足球）读作 [fubb?l]。与常见的规范书写不同，此处（包括其他地方）的方括号代表音标，同字典中的发音指导类似。音标的价值在这里显而易见：[u] 是指“foot”中的元音，而 [?] 是指“ball”中的元音。

还有一些概念上类似同化的变化是出于发音考虑，但也有一些变化来自错误认知。发音清晰度不够造成的误听便是其中一种。例如，鼻辅音 [m]、[n] 若处于塞音 [p]、[t] 前，要比在单词开头之类的其他位置更难区分。听者可能会对说话者的发音产生误解，比如可能会把 [gr?npa] 听成 [gr?nmpa]（其中 [?] 代表“grand”一词中的元音）。当然，在这个例子中说话者可能已将鼻音同化为塞音，但就算没有，听话者也很难判定该词中的鼻辅音来自 [n] 而不是 [m]，除非他早就认识这个单词。

错误认知的另一个来源是言语信号天然的模糊性。因此，在某些语言中，无论音节中前后的 [bh] 部分如何，浊音送气辅音 [bh]、[dh]、[gh] 都带有一种特别的“呼气”特性，这也可能是辅音的送气特质的主要声学证据。因此，[b] 和 [d] 中间的送气音 [a] 可以代表任何的“bhad”“badh”或“bhadh”。如果说话者倾向于默认送气特质来自前面的辅音，那么原先的“badh”就可能被理解成“bhad”或最终被其取代。

几乎每一个单词的发音都会产生一定程度的变化，要想对单词有一个恒定的理解，听者必须绕过这些变化。而他们一旦绕行错误，就会造成语言变化。例如，单词“athlete”的辅音顺序相对困难，在其中加入一个短元音变成“athelete”的发音现象时有发生。对于不认识这个单词的听众来说，他听到的一会儿是“athlete”，一会儿又成了“athelete”，他可能因此得出结论：这个单词原本是“athelete”，发音时缺少元音是出于发音省略考虑。单词中间的元音在发音时确实经常被省略，比如将“family”读成“famly”。因此，元音的偶然出现无法清晰佐证它们是不是原单词的有机组成部分。虽说两种推论都不无道理，但在某个具体个案中，错误推断将会使语言发生变化。

在我们周围，诸如此类的重组和误解无时无刻不在发生。重点在于任何一种特定的变化既非必然出现，也非完全可测。也就是说，我们能够预见可能会发生何种变化，但变化却不具备单一性和独特性；更重要的是，我们无法判定某种变化一定会出现。因此，语言社区不同，即便基本体系相同，产生的变化也会有所不同，进而会导致社区语言的不同。而那些进入语言体系的变化则会通过一代又一代人得到内化。儿童通过周围环境学习语言，而他们自身的语言实践又再次成为语言的新基准，这一新基准本身又会经历多次变化，以此类推。这些变化不断累积，社会语言差异也会随之增大，就像最初的罗马拉丁口头语发展成多个地方罗曼语言一样。

语言变化的规律

上文提到的变化看起来似乎会对单个词语造成影响，但19世纪末有研究发现情况并非如此。一般说来，如果某种发音变化影响某些单词的某个位置，这一变化在其他地方会产生同样效果。在德语的早期发展阶段，位于单词结尾的浊塞音 [b]、[d]、[g] 被相应清音 [p]、[t]、[k] 替代（可能出于在单词尾部保持声带振动的困难），这一变化的影响范围并不仅限于少数单词，而是涉及所有满足条件的单词。19世纪60年代的一群历史语言学家注意到了这一点，并提出发音变化规律的普遍原则。从这个角度来看，改变的并非单个单词，而是发音类型。另一个学派——新语言学派则提出了对立观点，他们认为“每个单词都有其历史”，但这一理论很快陷入空洞的论述，在很大程度上遭到了遗弃。

在这一理论的发展过程中，德语发展史上一系列被称为格林定律（Grimm's Law）的语音变化产生了重大作用。格林定律这一名称源自格林兄弟之一，他既是一位历史语言学家，同时也是一位民间恐怖故事收集者。请看表2中的对比。

表2　语言间词汇发展变化与类似特征

表格信息量巨大，我们可以把关注点放在前三个单词上。最初本该有清塞音 [p]、[t]、[k]，后面两个有浊塞音 [d]、[g]，最后三个应该有送气浊音 [bh]、[dh]、[gh]。此推断基于从所有语言得来的大量证据，而非仅由于某个语言相对于其他语言的“古老”地位。德语的发展历史似乎可以看作是以下三类变化的组合：

轻塞音变成清擦音（例如，[p] → [f]）；

浊塞音变成清音（例如，[b] → [p]）；

浊音送气音变成简单浊塞音（例如，[bh] → [b]）。

这一系列被称为格林定律的变化是一条普遍原则，能够解释为什么大量德语单词的形式不同于其他印欧语系语言。通过对该法则的进一步修正，一些明显的例外也被迅速囊括进来。但总有一些单词“拒不服从”，如表3所示，表示同一个单词的古英语和梵文形式不同，可以看出古英语中的t或d其实源自t。

表3　“变成”一词的梵文与古英语单词形式对比

同一个单词，为什么原先的t在某些形式中如预期一样变为t，而在其他形式中却变成了d？从适用性来说，这一发音变化是非常规的，只适用于部分词汇。

语言学家卡尔·维尔纳（Karl Verner）给出了一种解释：t变成t需要同时满足以下三个条件：（一）t不位于句首；（二）其周围音节为浊音（包括元音，鼻音，[r]，[l]）；（三）原重音不在前面音节。维尔纳这一解释的关键之处在于对原重音的考量。表3所列梵文单词中的重音位置则是另一回事了。

维尔纳的解释解决了格林定律存在的明显问题，看似不过细枝末节，在当时却至关重要。针对格林定律中发音变化反复无常的特点，维尔纳大大降低了这一概率。他指出发音变化总是会遵循一定规律，即便有所例外也是互不相关的变化各自作用的结果。

语音变化的这种无例外性原则成为语言历史研究的基础。随后几年，美国语言学家莱纳德·布龙菲尔德（Leonard Bloomfield）指出：无论是印欧语系那种语言体系完整、拥有书写文字历史的语言，还是阿尔冈昆语系（Algonquian family）那种没有书写文字的语言，这一原则全都适用。这一激动人心的发现使得这一原则进一步得到了强化。近期，在澳大利亚土著语言中同样发现了这一规律。澳大利亚土著语是帕马启恩永甘语族（Pama-Nyungan family）的重要组成部分，该语言号称有让语言比较方法全部失效的历史。

现代语言的发展过程中总有一种发音法则贯穿其中，毫无例外。这一说法似乎颇有神秘色彩，但威廉·拉波夫（William Labov）在20世纪70年代对美国城市居民发音变化的研究为其注入了更多实质性内容。简单来说，拉波夫发现：除去地理因素，大量发音变化与一系列社会因子相关。他的研究还清晰表明，发音因素与年龄明确相关。从本质上来看，可以通过追踪代际间单个发音因子变化来观察发音变化过程。这一发现加上人们对发音变化中语音和感觉因子鉴别力的提高，使得这一规则的可信度更高了。

语言变化与语言间关系

这一切跟我们关心的问题关系何在？答案分为两方面。一方面，语音变化的产生虽有规律，其发生率却不可预估。同诸如词形变化、句法变化、语义变化以及词汇变化等其他语言变化一样，这也是语言多样性产生的因素之一。另一方面，要评估一组不同语言从同一语言发展而来的可能性，即其是否具有历史相关性，发音变化也提供了一种方法。

推论如下：如果说一组不同语言代表同一祖先的不同发展分支，那么其中每一种都应该代表这一祖先受一系列常规变化影响的结果。生物演化亦是如此。物种虽由同一祖先进化而来，但由于后续基因突变不同最终会形成不同物种。当然，源语中的某些单词可能会消失或者通过借用外来词被其他单词替代，但这种变化起码在可控范围内（或者至少被我们牢记在心）。语言变化的常规性允许我们将每种语言都视为源语的系统性变形，这是由产生这种状态的特定系统性过程决定的。这反过来又意味着源自同一祖先的每种语言都代表着源语的一种变化。

以此为基础，在一组源自同一祖先的不同语言中，对应单词之间的不同（以非发音变化为模板）同样应该呈现出系统性：不同系统变化结果之间的不同。也就是语言对比研究的基本方法——比较法。

简单来说，要想比较一组（或更多）语言来确定其是否相互关联，应该从两种语言中抽取大量单词样本，以判定是否存在系统性相似。例如，对比拉丁语和英语就会发现大量单词的区别在于拉丁语词汇含p、t、c (c = [k])，而英语词汇含f、th、h。以此为依据可以认为，先前这些单词的同一位置发音相同，都是[p]、[t] 或者 [k]。要注意，我们做出这一推断并非因为拉丁语要比英语“古老”得多，而是因为众多古代和现代语言（如希腊语、梵语、俄语）的证据显示，应该如此解释上例所涉及的语音变化。

因此可以假定单词“father”中的f原始发音为 [p]，并将这一重构发音记为*p（当然我们无法确定其准确音值）。在历史语言学中，若某个音或单词前面带星号（*），则表示这是基于相对证据重构而非直接观察的结果。在语言学的其他领域，星号还经常被用于表明一组单词在当前语言中并非语法完整的句子。第六章对句法功能的讨论中将会出现这类星号。

现在可以确定，拉丁语将*p以[p]（如“pater”）的形式保存下来，而英语在其对应单词“father”中将*p转换为 [f]。我们越是能够在源语的基础上解释对比语言中大量词汇形式的独特变化，就越能证明二者是相互联系的。

这一论述的逻辑其实以费尔迪南·德·索绪尔（Ferdinand de Saussure）以及随后的语言学家提出的“符号任意性”为基础。除去一小部分拟声词（例如动物叫声），绝大多数单词的形式与其意义无关。“树”在英文中叫“tree”，在芬兰语中被称为“puu”，但这两个单词的所指没有任何差别。不同的语言对于同一个事物有不同的说法是很正常的；但要是反过来，意义相同（或相似）的单词形式上也有系统性联系，那就得好好解释解释了。

当然，也有一种可能性——其中一种语言仅仅是从另一种语言那里借用词汇（或者是二者都从第三方借用）。还有一种可能性，也是我们感兴趣的地方，就是这两种语言都由同一共同语发展而来，并且共同语中的单词在发展过程中经历了不同变化，最终形成上述两种语言。能排除越多单词借词的可能性，就越能证实语言间的常规联系，也就越能说明二者的相似性来自历史关系。事实上，对于外部历史已无法考证的语言，这也是能证明其历史关系的唯一科学办法。

要确保这一说法逻辑完整，关键在于两种语言间相关性是否呈现系统性。要证实语言A和B源自同一祖先，就要证明两种语言中大量存在可追溯至同一形式的表述。这些相同形式都来自其共同语，并经历了一系列常规变化。在解决这一问题时总是会被其他因素干扰，做到绝对确定是奢望，但获取压倒性优势却并非妄想。目前很多被广泛认同的语系就是这种情况：印欧语系与其分支日耳曼语族、意大利语族以及斯拉夫语族等，还有南岛语族、乌拉尔语族以及其他。还有一些语系，关于其是否存在仍然富有争议，原因就在于这类“铁证”仍然很少。所谓的“阿尔泰语系”（Altaic family）就属于这种情况。如果这一概念成立，阿尔泰语系将囊括突厥语、蒙古语以及满-通古斯语族（使用地区为东西伯利亚和中国东北）。虽说其中每一种分组都自成单位，清晰可见，但它们彼此间的关系却很模糊，这些语言均来自同一共同语的说法也并非板上钉钉。

在此需要再次强调，比较法的运用确实是建立语言间联系的唯一科学方法。即便方法正确，仅凭生物学意义上的遗传基因仍然不足以判断语言关系，上文提到的匈牙利语和诺曼法语就是例证。其他诸如寻找类似句法规则或单词形式的对比也不足以成为有力证据，因为在没有共同祖先的语言中也可以轻易找到这些相似点。若要论证“阿尔泰语系”的存在，不能仅靠指出其三大构成语都重后缀轻前缀、都使用元音和谐律（一个单词中所有元音某些特性须保持一致）等规律了事。不同于单词形式（本应该是任意的）间的系统联系，这种宽泛的结构平行对于建立语言间共同起源关系并无助力。

虽说比较法是证明语言历史关系的一大利器，在实际运用过程中却障碍重重。研究者必须确保他们处理的皆为真正的传承词，而非借用词汇。还有那些形式比较固定的词汇也必须排除在外，比如育儿词汇、拟声词以及其他类似的词汇。这些词汇在不同文化中的形式都相类似，但其原因与共同遗传并不相关。

这类词中最常见的是“父亲”“母亲”这一组出现在儿童早期语言中的词语，其形式部分取决于儿童早期的语音能力。虽说类似“妈妈”“爸爸”这类词出现在很多不相关的语言中，但它们并非完全保持一致。有趣的是，在一小部分彼此之间没有任何历史联系的语言中，这组单词的意思完全相反。例如，格鲁吉亚语中“mama”指“父亲”，“deda”指“妈妈”。但就算发现被比较的两种语言中“mama”都指“母亲”（或父亲），也并不代表二者之间有联系。

很显然，对于要研究的语言需要严格把控，以便明确具体的比较内容。很多错误提议之所以构思不当，就在于提出议案的学者受到误导，没有充分理解研究系统，将苹果和橘子胡乱比较。

同时还须警惕语言之间的偶然性相似。现已消亡的澳大利亚语言“Mbabaram”中，读音为 [d?g] 的单词就是英语中的“dog”，但该语言与英语没有任何共同祖先，也不存在借用。“Mbabaram”中的 [d?g] 不过是原始形式*gudaga经过常规发音变化的结果。

即便一切操作都准确无误，对比研究有时也无法得出确切结论。语言在发展历程中会经历流失、替代、重建，随着时间流逝，同一语言的两大分支语言间的共享词汇（形式有变化）会不可避免地减少。目前的估算显示，任何两种源自同一共同语的语言在经过8000年的发展变化后，二者间的系统性相似点将不复存在。虽说具体的时间期限很难确定，但相比于语言起源的10万年或更久之前，这一时间点毫无疑问离现在更近。因此，即便所有现代语言都确实源自单一“原型语”，我们也可能永远无法证实其科学性。

不论是从语言关系还是从语言定义的连续性来看，语言定义都有一个历史维度。探索语系的深度和广度虽对量化语言数目并无益处，却可以让我们更好地了解世界语言的多样性。无论过去多种语言的历史如何，现代世界的状态表明，这一切或将立刻终止，语言大消亡即将到来。这就是第四章的话题。