云英语:因学术而改变
加入收藏 | 设为首页

英语的词汇量最大?

Stephen Fry 这位我喜欢的评论家声称(在大约六点十分时的电视节目上):

“(英语)无疑有最多的词汇……远远老远地多。英语词汇数量之多,一如中国人口数在世界人口中的地位。”

一位朋友发邮件问我:这是真的吗?

答案有点长。要看总结版,直接跳到结尾。一言以蔽之,答案则是“对不起,Fry先生。”英语的词汇量固然丰富,不过几乎总是那些英语狂热粉丝才说英语词汇多得不得了,他们对英语之外的众多语种是怎样的不清不楚。并不是说别的语种词汇更多,而是这种比较压根就是扯淡。

最简单的问题是词形曲折变化。难道我们会将"run"、"runs"、"ran"算作不同单词吗?下一个问题是词义多重性。"Run"既是动词又是名词:算一个词还是算俩词呢?又该如何看待在"in the long run of a play on Broadway(一部戏剧在百老汇长期连演)"中"run"含义呢?它与“绕着公园慢跑”的区别足以另设一个词条吗?而进入有足够差别吗?与“在打板球中奔跑”有足够区别吗?

我们将合成词也算进来吗?"home run"到底是一个词还是俩?新化学合成物的名称(其数量几乎是无限的)是词汇吗?正字法扮演着啥角色?"home run"是两个词的话,那"homerun"(常见拼写形式)算一个词?这到底有啥意义?

讨论这些似乎是在找茬,但是当讨论其它语种的时候,它们就变得十分重要了。一些与中国远比英语曲折。西班牙语的动词就有几十种的形式-estoy, estás, está, 分别表示英语的"I am," "you are," "he is" 以及诸如此类等等。一些语种则不怎么曲折(汉语以无词尾变格闻名)。因此,我们是否将这些曲折形式算作词汇,对最终的词汇统计数影响巨大。

再者,许多语种习惯性地从短词中构造长词。德语在这方面很明显,为一个新情境构造出一个新合成词不过小事一桩,就像这里提到的那样。合成词是新单词吗?德语Unabhängigkeitserklärung(独立宣言)是一个词吗?当然在德语中它就是那样写的。鉴于合成词的无限可能,随着新的合法词汇(德国人对这些词眼也不眨一下就照单全收)每天被合成,德语词汇数很快就会超过英语的。瞥一下Frankfurter Allgemeine Zeitung的主页,就可以找到Abschiedsvorstellung("告别演出",南非为告别世界杯的法国队而举办),Weltmarktführer(世界市场领导者),Stromtarifrechner (电子账单计算器)等等这样的词语,我们没有理由说――德国人居然有个词表示"告别演出",逆天了――因为在德语中造出这样的词实在是家常便饭。这对土耳其语来说更是如此。这种造词方式不仅将单词挤在一起,而且以生成完整而富有意义的句子来实现。"Were you one of those people whom we could not make into a Czechoslovak?"这句话翻译成土耳其语只有一个单词。这个单词写下来时也不留空格,讲出来时发音一气呵成,总之就是不能被打断,如此等等。

因此土耳其语和德语以及一系列其他类似语种比英语有“更多的词汇”。并且,不将土耳其语和德语灵活造词算进来的话是不公平的。如果我们这样做,我们也必须将英文的合成词丢掉;"shoelace (鞋带)"、"windowsill(窗台)、"phrasebook(外语常用手册)"、"boatswain(水手长)"等等词汇统统不算。我们同样也必须丢掉比如"television(电视)"和"geography(地理)"等外来衍生复合词。疯了。

那么如何看待如“英语有更多的基础词汇”或“词根”之类的说法呢?现在,我们进入到了语言学家称之为“语素”的领域,语素指可用词根或词汇片段。但是在语素的领域我们也必须将"un-"、"methyl-"和其它很多不被传统主义者视作“词汇”的词汇片段看作语素,这也看不出来英语有最多的语素。同时,这种比较方式不利于阿拉伯语和希伯来语等闪族语言。它们使用极小数量的三字母词根而创造了巨量单词。ktb 的基本含义是"写",但它可以产生出至少三十个单词(许多这些单词,比如动词,还可以通过曲折变化生成更多的形式)。从katib(作家)到istiktab(命令),这些单词在我的字典中将会占据整整两页。因此,仅仅计算"词根"或者“基础词汇”也是行不通的,因为ktb算一次的话是没意义的。

那么如果只是问“哪个语种有最大的字典呢?”同样,答案会因很多与词汇丰富性无关的原因而不同。哪个国家有发展得最完善的词典产业?最好的档案库?废弃词算在呢吗?方言词呢?多少科学名词包括在内?再想想之前提到的外语,德语没有将Stromtarifrechner放进词典中,因为它的词义可从构词部分轻易拼出来,如果将每一个看似可接受的合成词都纳入的话简直会使词典篇幅达到超级百科巨无霸的数量级。(现在我也能造出新词Wortschatzprahlerei,(词汇吹牛)来描述Fry先生所热衷的事。)西班牙语词典中不会为"estoy"和"estás"分别设立词条。中国人甚至不理会我们关于“词”的概念――他们语言的基本单位是一个个单音节的汉字,即使这些字常常组成词。Zhongguo(中国)表示"China",然而在字典中你甚至不能翻到"Zhongguo"这个词。你会查到"zhong(中,middle)",然后这个词条会告诉你哪些字和“中”结合从而获得不同含义。汉语教学部分课程在于学习这些字在不同组合中的含义。印刷中字与字之间并无空格。难道这意味着"Zhongguo"不是一个词吗?

我们可以沿着这条思路继续探讨一会儿,不过到此也可以了。对于"英语是否有最大的词汇量"这个问题,真要给个简短答案的话,我会说,“管它呢?”英语是一门丰富而美丽的语言,不只是因为英格兰曾经被维京人和诺曼人占领,并且在历史上幸运地接受了外来语种的影响。我们对很多英语珍稀词汇了解更多,因为英语已经被书写了一千多年,并且它的许多方言被很好地描述了。对我来说这就足够好了。我们无需最大的词汇量――这压根就没法合理界定――来享受英语。

转译自:http://www.economist.com/blogs/johnson/2010/06/counting_words