![AI智能语音技术与产业创新实践](https://wfqqreader-1252317822.image.myqcloud.com/cover/262/53256262/b_53256262.jpg)
1.2 语言与语言科学
1.2.1 人类语言概况
人类语言的数量众多,有6000~8000种。在确定语言数量时,一个主要难题是很多语言与方言的划分标准存在争议。因此,如果采用一个更加宽泛而“安全”的标准,也可以说,世界语言有4000~10000多种。
世界上各种语言的使用人数和影响力很不均衡。据统计,使用者最多的20种语言(含方言)的母语者人数占了世界人口的57%。其中,影响力最大的语言是汉语和英语。汉语的使用人数最多,超过10亿;英语的使用范围最广,使用人数超过了5亿。除了汉语和英语之外,使用人数较多的语言还有印地语、西班牙语、俄语、孟加拉语、葡萄牙语、德语、法语、日语、乌尔都语等。世界影响力排名前20的语言的发源地基本都在东亚、南亚和欧洲大陆。这些地区的特点一般是地理位置便利、经济发达、宜居。与这些较大的语种相比,其他绝大多数语言的使用人数则很少,甚至有很多语言的使用者只有几个人,成为名副其实的濒危语种。据人类语言学专家估计,世界上每年消失的语言有几十种。这一现象值得我们关注,相关机构应当采取必要的语言保护措施,保护人类濒危的语种。
人类语言虽然众多,但它们具有一些共同特点,例如,一些语音系统、语法系统和语义系统。此外,人类语言还具有其他特点,主要包括任意性、线条性、层级性、系统性、递归性、移位性、创造性等。
从语言的类型看,语言可以分为屈折语、孤立语、黏着语,以及复综语(多式综合语、编插语)等。具体如下。
屈折语以词形变化作为表示语法关系的主要手段,以印欧语系语言为代表,例如,俄语、英语、法语等。
孤立语也称为词根语,以汉语为突出的代表。
黏着语也有丰富的词形变化,但一般只是通过词尾变化表示不同语法意义,且变词语素与词根结合不紧密,其代表语言为土耳其语、日语等。
复综语的突出特点是词、句合二为一,多个成分互相编插组合在一起,难以分出独立使用的词,只能连缀成句子使用,其代表语言为印第安语等。