在第五章我们讲到,就世界语言种类而言,按照常规定义区分无法得出满意结果。以国家来定义显然社会意义重大,但这跟纯语言层面的区分不应混为一谈。以相互理解为标准看似顺理成章,实则困难重重,结果也不尽如人意。更糟糕的是,语言和方言的严格分界线到底在哪儿?这个问题几乎无法回答。
科学的语言学能否为计算世界语言种类提供一个更好的方法?从语言学中语言形式的系统性差异来看,结果自然清晰明了,却也相当惊人。
这种计数方法基于一个基本的语言分类:外化语言(I-language)和内化语言(E-language)。具体来说,前者将语言视为一系列通过言语、手势(或衍生出来的书写)形式实现的语音、单词、短语和句子的集合;而后者将其视为语言使用者的知识体系,以此为基础,他们能够运用话语表达自己,理解他人。
我将后者称为内化语言,指话语使用者的认知组织。正是得益于这种认知组织,我们才说某人“说”或“懂”某种语言。这样的人能够说出并理解对应语言中的句子(这些句子本身就是外化语言的一部分)。这一过程得以进行,要依赖内化语言知识同外部环境(例如嘴里的食物、血液中的酒精等)、认知的其他方面(包括记忆以及人对世界的认知等)以及其他一系列因素的交互作用。
语言差异之语法差异
内化语言和外化语言的差异可以粗略类比为生物学上基因型和表现型的差异。前者指语言或生物体的抽象模式,后者指这一模式在具体环境中的表现形式。当然,这一类比并非完全准确,但至少能说明部分问题。基因型是构建生物体的“菜谱”,表现型则是这一“菜谱”在某一特定环境中的具体表现形式。同样,内化语言提供建构语言结构的“菜谱”,并同外化语言中通过单词、短语、句子进行表达理解的其他体系协同作用。
当然,个人的内化语言是其生物表现型的一部分,而不是其基因型,这一点在第八章还会重申。这里的类比是抽象层面的,与生物学现实无关。
第一章提到,在生物学中,人们试图通过表型差异来区分生物体,从而产生了形态种概念。对于这一方法,生物学家普遍不太看好,认为其容易夸大偶然性差异,他们更多倾向于将生物基因组成的差异作为定义物种的依据(至少自基因技术及遗传物质确定机制取得进展以来便是如此)。这又进一步促进了遗传种概念的产生,对应到语言研究中,就是识别两种内化语言的差别并将明显不同的两种体系区别对待。
通过外化语言表面可观察到的词汇和句法等“表型”特征来区分语言,会遭遇诸多问题。截然不同的语言可以共享词汇(通过借用),而“相同”语言的不同使用者可能会因受教育情况或表达方式的不同在词汇选择方面天差地别。不同的语言可能会表现出同样的句型,而同一种语言也有可能呈现出多种句型。语言学家发现,就区分世界语言这个目的来说,无论语言的外围使用情况多么有趣,外化语言至多算一个棘手的研究对象,不仅抓不住还不可靠。相比之下,内化语言要可靠得多。使用者可以凭借语言相关的抽象知识表达自身、与人交流并进行阅读。
下面以英语的过去式为例来说明这种知识。英语中有很多“不规则”动词,如“吃”(eat/ate)、“带”(bring/brought)、“找”(find/found),还有特殊的系动词“是”(be/is/was),这些都必须单个记忆。但对大多数动词来说,过去式和现在式的构词方式类似,只须添加后缀。过去式的后缀统一写为-ed,发音要么是[?d](例如,waited [weit?d];[?] 属于中性元音,如appetite中第二个音节中的短、弱元音),要么是[t](例如,missed [mist]),要么就是[d](例如,rowed [r??d])。这些不同形式的语音形态并非随意分布,动词t或d结尾时-ed发音为 [?d],以清辅音(如 p,t,k,f,s或者ch)结尾时发 [t],其他时候(以元音或浊辅音结尾)发 [d]。
-ed的三种不同发音形式不过是英语词汇的知识点之一,同不规则动词的过去式(ate,brought和found等)一样,需要一一学习。但学起来远没有那么简单。只要给说英语的人一个新的动词,他们都可以毫不犹豫地说出其过去式,并且词形变化遵循同样的原则。假设让他们看一幅图,上面写着“The man is dending/plipping/sprimming his cat”,然后问“发生了什么事”,得到的回答都将是“那个男人在 [dend?d]/[plipt]/[sprimd] 那只猫”。也就是说,语言使用者不仅了解自身语言中的单词,同时还了解支配单词形式的原则(或规则),并且能够利用这一规则来创造与熟悉新词。因此可以说,英语使用者内化语言的部分特征包含了单词变化规则。
现在我们将上述事实同苏格兰语使用者的内化语言进行比较。苏格兰语是低地苏格兰的一种语言,与英语密切相关。但从中古英语时期到大约15世纪末的这段时间,二者相互分隔。第五章我们也提到,说苏格兰语是英语的一种变异方言也好,说它是一种独立语言也罢,这种区分并非基于语言自身的事实,而是取决于苏格兰语使用者及其邻居的社会和政治观点。
同其近邻标准英语一样,苏格兰语的动词过去式变形方法也多种多样,不规则动词很多,须一一学习。例如:bite/bate,“bite/bit”(加引号的是英语,未加引号的是苏格兰语,下同);rive/ruive,“tear/tore”;begin/begoud,“begin/began”等。但大多数动词(即规则动词)都有三种语音变化形式,也是以动词词尾的发音为依据。变化原则局部有些不同(苏格兰语中,单一标准原则的影响力不及标准英语,因此局部变化的标准化程度不及英语),但有一条原则却一样。以塞辅音(p, t, k, b, d, g)结尾的动词,添加-it(如drap/drappit,“drop/dropped”;want/wantit,“want/wanted”;keek/keekit,“peep/peeped”;sab/sabbit,“sob/sobbed”;mynd/myndit,“remember/remembered”;big/biggit,“build/built”)。以s,sh等清阻音(非塞音)或响辅音(l, m, n, r, ng)结尾的动词,添 -t,例如:loss/lost,“lose/lost”;fash/fasht,“brother/brothered”;dirl/dirlt,“vibrate/vibrated”;ken/kent,“know/knew”;soum/soumt,“swim/swam”等。最后,以除d之外的浊音响辅音如v,z,[d?](judge的第一个和最后一个音)结尾或者是元音结尾的动词,添加 -d。例如:deave即“deafen”的过去式为deaved;lowse即“loosen”的过去式为lowsed;wadge即“wadge”的过去式为wadged;lue即“love”的过去式为lued;pey即“pay”的过去式为peyd。
对苏格兰语使用者来说,上述规则是其内化语言的组成部分,如同另一规则是标准英语使用者内化语言的组成部分一样。面对“dend”“plip”和“sprim”之类的新单词,苏格兰人会得出诸如“dendit”“plippit”和“sprimt”之类的过去式,而英语使用者得出的则是“dended”“plipped”和“sprimmed”。综上所述,这两种系统构建过去式的“菜谱”不尽相同,这也意味着,“语言基因”不同会导致表型的不同,具体体现在两种可能的新词构成法上。
上述两种语言的内部知识、内化语言或简单说来是语法,至少存在一条不一致的规则,因此可以说它们呈现出两种不同的体系(或语言)特征。就此不妨提议,与其通过不同的外部形式,不如通过语法差异来评估语言种类。如此一来,结果可能与我们通常理解的“不同语言”相吻合,也可能会有所冲突,但至少有一点好处——起码我们描述的都是客观语言现实,而不是社会和政治观念的主观问题。
语法中的常数和变量
这会很自然地引出一个问题:到底什么因素才有潜力将一种内化语言同另一种区别开来?事实上,语言使用者的知识中有一部分是恒定不变的。请看下面的句子:
(1)a. Doris expected to appoint her as the new chair.(多丽丝期待任命她为新的主席。)
b. I wonder who Doris expected to appoint her as the new chair.(我好奇多丽丝期待谁来任命她为新主席。)
两句话中的代词“her”分别指谁?很显然,第一个例子中的“her”可以指世界上任何一位女性,唯独不能是多丽丝。人们就这个结论可以达成共识,不是出于其意思(多丽丝所处位置可能可以决定新主席人选,但上句的表述无法表达这一意思),而是出于其语法形式。在第二个例子中,虽然单词顺序相同,将“her”解读为多丽丝完全有可能(如果不考虑上下文,甚至大多数人会倾向于如此理解)。
下面第二组句子情况类似,不过这次代词
(“she”或者“her”)在句中出现在多丽丝前面。
(2)a. She intended to appoint Doris as the new chair.(她有意任命多丽丝为新主席。)
b. Her mother intended to appoint Doris as the new chair.(她的母亲有意任命多丽丝为新主席。)
同样,第一句中代词“she”可以指多丽丝除外的任意女性,而第二句中对“her”的解读则没有这一限制。事实很清楚,这一次的推论也并非来源于句子意义,而是其语法结构。
下面第三组句子的形式稍微有点复杂,却同样可以作为例子进一步说明问题。
(3)a. Doris was amazed at how quickly she recovered.(多丽丝惊讶于她恢复得如此之快。)
b. How quickly Doris recovered amazed her.(多丽丝恢复得如此之快,让她很惊讶。)
c. She was amazed at how quickly Doris recovered.(她惊讶于多丽丝恢复得如此之快。)
d. How quickly she recovered amazed Doris.(她恢复得如此之快,让多丽丝很惊讶。)
上例中,除了(3)c的句子,其他情况下代词“she”或者“her”都可以和多丽丝指涉同一人,而在(3)c句子中,“she”必须指多丽丝之外的其他人。
因此,语言使用者内部知识中必然存在一条语法原则。依照该原则,代词在某些情况下可以指涉相同句子中的其他个人,而在某些情况下则不可以。相关原则可以简单表述如下:
(4)共指关系,即满足下述两种情况,代词可以共指同一句子中的另一个体(其先行词):a. 代词位于先行词之前;b. 代词在结构上属于“上位”。
所谓语法结构上的“上位”到底是什么意思?语言学文献有诸多探讨,但上述例句中的含义还是相对容易理解的。
一个很有趣的问题在于,我们关于上述原则的知识到底来自哪里?有一点毋庸置疑,那就是从来没人教过我们这些。据我所知,这一现象直到1967年左右才由语言学家约翰·罗斯(John Ross)和罗纳德·兰盖克(Ronald Langacker)发现。在此之前,几乎没人注意到这一点。更加让人惊讶的是,对上述原则加以阐明,人们发现:作为一种语言内部知识,这一原则适用于被认真研究过的所有语言。
语法差异:参数
由此看来,某些语法知识(例如代词意义阐释)共存于所有语言。英语中的形容词一般位于名词前(英语中说“红色的气球”,而不是“气球红色”),法语则相反。如果能够全面收集此类变量参数,那么语言使用者内化知识中所有该类型参数的对应值都可以被视为一种独立语言。
但若把这一规则运用到某个语言地区,如意大利北部,结果会怎样呢?以否定句为例。标准意大利语中否定词位于动词之前(Maria non mangia la carne,“玛利亚不吃肉”),而皮埃蒙特语里否定词位于动词之后(Maria a mangia nen la carn,“玛利亚她吃不肉”)。标准意大利语和皮埃蒙特语的语法有所不同,因此可以被视为两种不同的内化语言。
这两套体系中否定语法还有其他的不同之处。在标准意大利语中,否定形式不能与第二人称祈使动词同时出现,而要使用不定式:“不要吃”是“Non mangiare”,意为“不要去吃”,而不是*“Non mangia”“不吃”(注意在本章中,一组单词前加*表示这组单词并非符合语法规范的句子,语义上至少不是字面意思)。而皮埃蒙特语允许出现否定祈使句:“不要吃”就是“Mangia nen”,直译为“吃不”。在标准意大利语中,“Non ho visto nessuno”(没有见过某人)之类的句子需要使用双重否定,而皮埃蒙特语却不需要使用否定词。诸如此类,不一而足。这里的否定词至少从三个方面说明了两种语法的不同之处。
不过,这才只是个开始。详细考察意大利北部不同地区的语法体系可以发现更多变化,可以相互区分很多内化语言。从理论上来说,若地域不同,参数之间也相互独立。仍以北意大利地区为例,假设有10种维度来区分两种内化语言。从目前已发现的变量来看,记录在案的已超过10种,所以这一估计其实相当保守。如果这10个维度各自不同,那一共会产生210种,也就是1024种不同的语法。但事实上,学者们在这一地区发现的语法种类在300 ~ 500种之间。
即便考虑到简化情形,情况也同样如此。在上述讨论中,标准意大利语和皮埃蒙特语否定语法的不同之处体现在三个方面,这是否意味着在另一种内化语言中也存在这三方面的差异呢?实际上,关于意大利北部地区语言体系的研究表明情况并非如此。研究发现,以动词前否定、不定式否定祈使和双重否定为特征的标准意大利语模式在热那亚、威尼斯、特兰托和特里雅斯特等差别很大的地区语言中得到了完全复现。同样,以动词后否定、否定祈使句和非双重否定为特征的皮埃蒙特模式在都灵、米兰、奥斯塔和帕维亚地区得到了复现。由此看来,与其说是三种独立的对比体系,不如说存在一个单一势能参数。选择这个参数的其中一个维度值时(例如,否定标记词的前置还是后置),其他两个维度值也会随之改变。
要想认真讨论这些问题,必须以对语法结构的清晰分析为基础,以便对语言中否定词差别有一个系统的认识。理想情况当然不是只罗列一大堆语法特征,而是提供语法结构分析。如此一来,改变一处语法就能自动按逻辑推演出最终的结果。
即便限定在意大利北部地区的语言范围内,本书也不足以在这方面进行深入探讨。但仅仅是浮光掠影地简单看看,其价值也不容小觑。有可能的话,我们应该尝试用一个参数来总领各种最小的语法差别。这样做显然好处多多,内化语言系统中的语言千差万别,通过一个抽象概念将多种差异联系并统一起来至少能使其条理清晰。当然,具体能有多少好处还要看这一方法能推进到何种程度。
“无主”参数
有些语言要求句子中必须明确呈现出主语,即便可以从上下文中推测,而有的语言却允许无主语的句子存在。这一语言差异知名度高,貌似是作为统一参数的不错选择。在标准意大利语中,句子“Ha già telefonato”完全正确,可以根据语境解释为“她已经打过电话了”或者是“他已经打过电话了”。但在英语中省略主语却不可能,“已经打过电话了”本身不是一个完整句子,没有主语,不符合英语规范。
即便主语本身没有实质内容且不指涉实物,英语仍然强制要求主语出现。“It is raining/snowing/hailing/thundering”(它在下雨/下雪/下冰雹/打雷),在这些句子中,“it”本身并无对应指涉物,和意大利人直接说“piove/nevica/grandina/tuona”(下雨/下雪/下冰雹/打雷)意义是相同的,不过意大利语省略了显性主语。事实上,意大利语中压根儿没有相关元素可以充当主语。上述场景中,英语使用“it”或“there”等无意义(或虚词)主语,意大利语中没有(也不需要)这些主语,无主句用起来也很得心应手。
两种语言还有一大区别,意大利语中的主语可以随意接在动词后面。“Ha telefonato Gianni”(打电话吉阿尼)这个句子完全没有问题,但其英语对应句*“has telephoned John”(打了电话约翰)却不符合语法,必须表述为“John has telephoned”(约翰已经打了电话),主语要按常规置于动词前。
还有一个区别相对而言稍显隐晦,但同样跟主语有关,那就是疑问句的形式。在两种语言中,特殊疑问句(不可以用“是/否”来回答的疑问句)都涉及将部分句子内容用疑问词替换并前置。因此,我们可以用英语说:“Who did you say that John met?”(你刚才说约翰见了谁?)或者用意大利语说:“Chi hai detto che Gianni ha incontrato? ”但要想在英语中用从句提问主语的内容,就没那么简单了。我们不能说:*“Who do you think that will come?”(你觉得谁会来?)期待的答案可能会是我觉得约翰会来。相反,我们必须省略“that”,说:“Who do you think will come?”意大利语却无须这样调整,对应的问题就是:“Chi credi che verrà? ”这里的“che”直接对应英语中的“that”。
英语和意大利语的主语有四大不同:(1)存在删除谈话双方都明了的主语的可能性;(2)天气动词及其他类似动词是否需要虚词主语;(3)陈述句中主语是否可以接在动词后;(4)用从句对主语提问时,是否可以直接将问题前置而无须其他变化。表面上看,这些差异互不相关,但有可能跟前面提到的否定词一样在语法中处于共变关系。
带着这样一个思路,语言学家希望在研究其他语言时,也能发现上述几方面的规律。他们确实发现一些语言整体上要么与意大利语一致,如西班牙语、罗马尼亚语和希腊语,要么与英语一致,如法语、罗曼什语、德语、尼日利亚埃多语等。在某些语系尤其是罗曼语族内部,这种二元对立貌似没有问题。但罗曼语族之外有个例子,简明扼要却颇具典型性。在黎凡特阿拉伯语中,空主语相关属性符合意大利语模式,而约旦地区以及与其关系密切的巴尼哈桑贝都因阿拉伯语遵循的却是英语模式。
可是,很快就出现了例外的情况。首先,汉语和日语等语言中代词省略相当自由,主语位置和其他语言现象与意大利语却没有特别联系。还有些语言中,主语在某些情况下可以省略(例如,芬兰语中第一人称和第二人称主语;希伯来语中的过去式),但与上文提及的语法现象也不甚相关。
很显然,这些案例与我们通过对比英语和意大利语概括出的主语省略原则相互独立,它们并没有直接将上述推论证伪,而是提供了代词被认定为“可以推知”的其他情况。不过,很快就有其他语言被发现似乎能说明英语和意大利语的差异无法形成体系。例如,在冰岛语中,主语在通常情况下都不可以省略,也不可随意置于动词之后,这一特点与英语或德语相同。冰岛语的天气词汇中同样需要使用虚词主语,而且在补语从句中对主语进行提问时无须更改从句的结构:
(5)Hver heldur pú aδ hafi framie gl?pinn?
Who believe you that has committed the-crime?
你认为是谁犯了罪?
非洲(班图语支)邓亚语(Denya)给上述关联假设提出了一个重大挑战。除了不允许主语位于动词之后,该语言整体上与意大利语类似。与我们的第一印象不同,对多种语言的深入研究发现,语言的语法特征并非如我们所愿——保持步调一致并处于共变关系之中。
英语和意大利语间的主语差异并非放之四海而皆准,人们也早已放弃用一个单一参数来统括多种差异。但宏观参数派和微观参数派的争论仍在继续。前者认为寻找世界语言中的大规模联系应该是语言研究的中心目标,而后者认为这种大规模联系要么不存在,要么由于目前人类语言语法结构知识过于细碎而不足以支撑我们识别这些联系,因此当前应该更多关注语法中的一些细微离散差异。
解决二者之间的分歧对于普遍语言结构理论当然十分重要,但这不是本书探讨的重点。语言变化最终无论是用少数几种宏观参数来标记,还是用大量微观参数来描述,又或者是处于二者之间,我们都可以说,根据语法来为某种语言定位使得我们能将各种内化语言区别开来。用这种方法来区分(并计算)世界语言,可确保其完全立足于语言本身,而不受社会、政治等外部因素的影响。本章开篇也提到,从某种程度上说,可以将内化语言系统的语言特征视为其基因型,用语言学研究发现的一系列结构参数来表示。将语言差异弱化为其语法差异可以化解其他方法中存在的问题。
就算能将语言变化的独立维度最小化,也还是会有大量参数无法弱化。仅在意大利北部地区,类别就在10种以上。若就世界范围来说,必须对世界语言可能存在的语法差异进行彻底研究才能得出结论。伦敦人到意大利听到的形形色色的“意大利语”其实可能有很多共同之处,而这些语言作为一个整体可能又和世界其他地区的语言差异显著。
随着参数的增加,可能的语法体系呈指数增长。即便参数控制在25~30之间,可能的语言种类也可以用巨大来形容。假设有30个独立参数,语言数量会超过10亿;40个二元参数则会产生上万亿种语言;若有100个参数,可能的语言数目将不可想象。从这个角度来考虑内化语言,一个好处是语言学习者完全不能也无须考虑所有参数再进行选择。另一好处是,如果在掌握某种语言系统时只需简单确定一系列固定参数的对应值,那这个操作就很容易实现。
显然,并非每一种变量组合都会实现,但如果所有参数都能像意大利北部地区那样统一在一种语法之下,那么世界语言的种类绝对会远远多于“民族语”所说的6909种。