语言系属分类
语言系属分类(英语:Language family)是指根据语言的演化关系,对语言进行分类的方法,具有相同祖先的语言被归为一类,类似生物分类法。分类依据为各语言语音、词汇、语法之间的对应特征和演变规律。
分类方法
概论
现今全世界现存的语言约7000种,根据系属分类的方法,确定每种语言的祖先,称为“祖语”。所有人类语言的祖语被称作原始人类语言(又名“原世界语”),被假定为智人出现后走出非洲前所使用的语言,但这一观点争议巨大。
任何语言都会相互影响而产生新语言,因此判断语言系属分类并非易事,并常常引发巨大争论。
当没有适合的分类单元可以用作后缀时,习惯称为“某某某诸语言”,例如:巴布亚诸语言、中国诸语言。
语系、语族、语支
英语中,一般将语言的最早出现的分类单元称为“语系”(language family)。语系之外英语中参照生物的分类系统命名。汉语中,习惯上将语系的下一级分类单元称为“语族”,语族的下一级分类单元称为“语支”,语支下为具体的语言,如英语属于印欧语系日耳曼语族西日耳曼语支。
级别 | 说明 | 分类单元 | 例子 |
---|---|---|---|
1 | 此系内的语言差异较大,如英语和俄语 | 语系 | 印欧语系、汉藏语系、南岛语系 |
2 | 差异缩小,如丹麦语和德语 | 语族 | 日耳曼语族、罗曼语族、汉白语族、斯拉夫语族 |
3 | 语言间的差异最小,如英语和德语,但通常不能互通 | 语支 | 西日耳曼语支、西伊利比亚语支、闽语支 |
法语
法语的分类比较复杂,主要是因为此语言是先发展成拉丁语后再发展而来的:
印欧语系 |
特殊分类
事实上的语言分层情况远多于这三层结构,因此也有“亚语族”、“亚语支”等分类单元。有人提出在语族和语支之间增设“语群”,在语支和语言之间增设“语组”或“语团”。而在语系之上,则有“超语系”、“大语系”,或称为“语门”,语系之上的研究工作始于20世纪末期,目前存在较大争议。
英语
在英语中,一般直接用 languages 称呼各分类单元,但 language family 也可以指代“语系”。
“方言”或“语言”
原则上,现代语言分类学将两者在语言学意义上(不考虑逻辑和知识性)可以相互听明白的视为同一种语言,不能相互听懂的视为不同语言。同一种语言还可再细分为不同的方言,各方言间可相互听懂但存在一些差别。
但在实际运用中,受习惯、传统、政治和文化等方面因素的影响,“语言”与“方言”间的区分常常不符合上述定义——
如在中国,官方通常将闽语、粤语、瓯语、瓦乡话、湘语、赣语、客家话等除了普通话以外的其他汉语族语言称为方言,象征着中央凌驾于地方之上的统治权力[1],而其子语言被称为“片”,如闽南语的潮汕片、漳泉片,粤语的粤海片、莞宝片等。“方言”在中国通常只是一个政治概念,实为“地方语言”,又称“白话(英语:vernacular)”、“土话”和“地方话”,指区别于官方标准语的、限于某一地区使用的语言,并不考虑语言间的互相理解性;只有在对译了近代西方语言学的dialect(法语:dialecte 德语:Dialekt)之后,“方言”一词才有了以口头互通性为区分的含义。
在日本,通常也将津軽弁、冲绳、八重山、奄美语称作方言(日语:方言/ほうげん hōgen)。
而能大量互通的前南斯拉夫的塞尔维亚语、克罗地亚语、波士尼亚语、黑山语,伊利比亚半岛的西班牙语、葡萄牙语,从德国北部低地到荷兰的低地德语、荷兰语则因政治原因被称作不同语言。
系属分类方法
世界上语系数量的估计可能差异很大。据《民族语:全世界的语言》(Ethnologue)估算,现存人类语言有 7,151 种,分布在 142 个不同的语系中[2][3]。 Lyle Campbell (2019) 则总共划分了 406 个独立语系,包括孤立语系[4]。以下分别以母语使用人口及语言种类的数量两方面为语系作排序:
以母语使用人口排列
- 印欧语系(约32亿)
- 汉藏语系(约14亿)
- 尼日尔-刚果语系(约8亿)
- 亚非语系(约5亿)
- 南岛语系(约2.7亿)
- 达罗毗荼语系(约2.5亿)
- 突厥语系(约2亿)
- 南亚语系(约1.2亿)
- 日本语系(约1.2亿)
- 壮侗语系(约9300万)
- 朝鲜语系(约8100万)
- 尼罗-撒哈拉语系(约7000万)
- 乌拉尔语系(约2500万)
- 苗瑶语系(约1000万)
- 克丘亚语系(约720万)
以语言种类多少排列
以《民族语:全世界的语言》“Ethnologue”(2024)分类,种类最多的15个语系如下[5],不包含孤立语言(104种)、手语(159种)、克里奥尔语(92种)、皮钦语(17种)、未分类语言(56种):
其他语言分类
语言联盟
语言联盟(德语:Sprachbund)是一个拥有多种具有共同语言结构的语言的地理区域。这些语言之间的相似性是由语言接触引起的,而不是偶然或共同起源,并不被视为定义语系的标准。语言联盟的一个例子是分布在印度次大陆上的语言[6]。
混合的语言
“语系”的概念是基于“一种语言会发展出不同方言”的历史观察而确立的。随着时间的推移,不同方言便可能分化成不同的语言。然而,语言祖先不像熟悉的生物祖先那么明确(生物物种不会杂交)[7],语言更像是微生物的进化,具有广泛的基因水平转移。亲缘关系较远的语言也可能会透过语言接触而相互影响,在极端情况下可能会导致语言没有单一的祖先,例子如克里奥尔语及混合语。此外,许多手语是孤立发展的,通常没有任何亲缘关系。但尽管如此,接触性语言的情况相对较少,大多数语言在经过充分证明后还是可以明确地归类为属于某一个语系,即使该语系与其他语系的关系尚不清楚。
注释
参考文献
- ^ 王杉杉. “普通话”与方言的历史博弈:现代中国的语言政治学. 经济观察报·书评. 2019, (4).
- ^ How many languages are there in the world?. Ethnologue. 3 May 2016 [26 March 2021] (英语).
- ^ What are the largest language families?. Ethnologue. 25 May 2019 [3 March 2020] (英语).
- ^ Campbell, Lyle. How Many Language Families are there in the World?. Anuario del Seminario de Filología Vasca "Julio de Urquijo" (UPV/EHU Press). 2019-01-08, 52 (1/2): 133. ISSN 2444-2992. S2CID 166394477. doi:10.1387/asju.20195 . hdl:10810/49565 .
- ^ Welcome to the 24th edition. Ethnologue. 2024-04-13 (英语).
- ^ Joseph, Brian. The Balkan Sprachbund (PDF). linguisticsociety.org. 2017 [2 October 2020].
- ^ List, Johann-Mattis; Nelson-Sathi, Shijulal; Geisler, Hans; Martin, William. Networks of lexical borrowing and lateral gene transfer in language and genome evolution. BioEssays. 2014, 36 (2): 141–150. ISSN 0265-9247. PMC 3910147 . PMID 24375688. doi:10.1002/bies.201300096.
延伸阅读
- Boas, Franz. Handbook of American Indian languages. Bureau of American Ethnology, Bulletin 40. Volume 1. Washington: Smithsonian Institution, Bureau of American Ethnology. 1911. ISBN 0-8032-5017-7.
- Boas, Franz. (1922). Handbook of American Indian languages (Vol. 2). Bureau of American Ethnology, Bulletin 40. Washington: Government Print Office (Smithsonian Institution, Bureau of American Ethnology).
- Boas, Franz. (1933). Handbook of American Indian languages (Vol. 3). Native American legal materials collection, title 1227. Glückstadt: J.J. Augustin.