首页 > 其他分享 >论人类下一代语言的可能—3.2.4乔姆斯基的语言观

论人类下一代语言的可能—3.2.4乔姆斯基的语言观

时间:2022-10-16 12:13:31浏览次数:57  
标签:文法 语言 符号 语法 3.2 自然语言 乔姆斯基

前面对自然语言的探讨,主要是从语法角度进行的。以语法形式的知识来总结理解自然语言,这是传统语言学中进行得最充分的工作。这一方向是否是最有效的,答案并不明显。在对第二语言的学习中,以中国人学习英语为例,教学上很强调对语法的掌握,认为这是正确使用的基础。大量的时间与精力会用于对语法规则的记忆与练习,整个学习过程经年累月,最后的效果是多数人都不能应付日常的会话。人类婴幼儿对母语的学习,是从父母、周围其他人的讲话,不断接收实际例子,以熟悉不同场景下字、词、复合词、词组等素材的使用,以及各种组合方式的使用;然后自己不断实践、反馈与校正,在这过程中有意识无意识地会对言语的使用进行分析与总结,形成相应的语感与直觉。看似幼稚的方式,实际也在三年左右的时间有效地掌握了母语。这里的比较显示我们并未理解清楚语法与语义及语言的其它方面的关联。

语言学家们也研究语言的语义、语用,以及更多的主题。今天,这些方向的研究综合起来,也不能给出对自然语言令人满意的解释。传统上,语言学家的研究主要是从言语,即人们说出的话,或写下的文本来进行观察与总结。自然语言的使用需要说出或写下符号才算完成,怎么说,怎么写,这些思考发生在人脑中。从外部对言语行为进行的观察总结,是否刻画了人脑中语言使用的真实机制与过程?这个问题的答案更多是倾向于否定。接近于对大脑中语言使用机制的描述,我们可以找到索绪尔“联想关系”与“句段关系”的说法。“联想关系”主要意思是:语言的任何素材会按任意一种意义上的相似形成记忆里的聚类;可以是语义上的相关,也可以是形式上的部分相似,或者在各类组合里占据相同的位置……“句段关系”就是指语言里的符号单位的组合性,这里强调是对组合应用的场景、使用目的、上下文、配列的单位、可替换性等的潜意识分析与整理。索绪尔的这些观点不全是观察可见的事实,还包括了通过内省才能得到的认识。这些观点也只是说明性的,并没有形成一种详尽的描写。目前,语言学家对自然语言形成的认知,主要是通过自然语言的符号方式来进行描述与说明的,这种表达方式是否有效也是一个问题。使用现代计算机,应用统计方法,对大量语料进行计算,在此基础上形成对部分人类言语行为的模拟,这是当前在做的自然语言处理的研究。由此方法建立的系统,可能更接近于大脑里的真实机制。但这更多是一项技术,并没有输出系统的观点,指导人们理解自然语言。

如何认识语言?怎样对语言有效地描写?这仍是一个基本问题。美国语言学家诺姆·乔姆斯基(Avram Noam Chomsky,1928-至今)于1957年出版了《句法结构》一书,开创了转换-生成语法理论,对这一问题给出了不一样的回答。乔姆斯基把语言分为语言能力与语言行为二方面,相当于索绪尔的语言与言语。语言能力追溯到人类智力上天赋的“普遍语法”,普遍语法加上不同的参数形成各种具体的自然语言,这些参数是由历史选择与积累,并体现为社会拥有的母语的特征、使用规则、甚至直觉。语言行为是语言的具体使用与结果。传统语言学是从语言行为研究语言的,这被乔姆斯基认为是经验主义的做法。乔姆斯基的语言学是以语言能力为研究对象,期望通过对语言能力的研究可以解释人类语言的习得机制。相对于经验主义,乔姆斯基的语言研究具有理性主义色彩,他借鉴逻辑与数学的方式,从假设出发,期望可以构建形式的符号系统,通过符号系统规则的递归应用,可以从基本的词库生成所有人类语言语句,包括已有的语句以及潜在无穷的语句。然后通过对这个符号系统的逐步求精可以认知到人类的语言能力。

乔姆斯基的转换生成理论历经多个阶段,目前仍处于探索与变动之中。本节中我们简单介绍下乔姆斯基理论早期的短语结构语法,以及该学派建立的四种文法。短语结构语法的生成规则可图示如下:

 

 

(图3-2:短语结构树)

图中的每一符号表示一个语法类别,最下面的竖线表示每一叶子结点可由对应类别的具体词汇替换。

S   :表示一个待定句子

NP  :表示一个名词短语

VP  :表示一个动词短语

Det :表示一个定冠词

AP  :表示一个形容词

N   :表示一个名词

V   :表示一个动词

示意来说,一个句子通过下面的程序进行替换改写生成。

第一步:初始S

第二步:S=NP+VP

第三步:S=DET+AP+N+VP(替代NP)

第四步:S= DET+AP+N+V+NP2(替代VP)

第五步:S= DET + AP + N + V + DET + N(替代NP2)

第六步:具体的单词替换上面各位置值,得到具体句子

其中S=NP+VP、NP=DET+AP+N、VP=V+NP、NP=DET+N中右边表达式对左边表达式的替换,以及实际单词对(N、V、AP、DET)的替换就是乔姆斯基理论中的语法规则。

短语结构语法也称为0-型文法,或无约束文法。一门语言里如果构建一个规则集:P,P能够生成所有可被接受语句,或者基于P能判断每一语句是否能被接受,这个P称为一个文法。除0-型文法外,乔姆斯基及其学派的其他人还研究了其他的三种文法,并将这些文法理论形式化。P中每一规则可表示A->B,即出现A时可以用B替代,如果B字符串长度大于A,也称为产生式规则。能够出现于所有A->B规则的A与B位置的字符,其组合的集合称为字母表,字母表中包括了如NP、VP这样的语类的变项,这样字母表的内容组成可分为非终结符号与终结符号,终结符号是不能再分解的符号,比如说基础词汇、标点符号,终结符形成的集合表示为∑。字母表中终结符以外的内容就是非终结符,它们是生成过程中的非叶子结点。非终结符的集合表示为N,N交∑为空集。每一次生成过程,能作为起始的非终结符号称为识别符号,比如语句类型的变项,识别符号形成的集合表示为S,S是N的一个子集。这样一门形式的语言可表示为:

G=(N,∑,P,S)

字母表+P={语言里所有的语句}

四种文法从0-型文法开始,每一文法在前一文法基础上增加对P的约束得到,增加的约束可以是针对产生式P的左边,也可以是右边:

无约束语法:0-型文法

语法形式:A->B

约束:

P中至少有一规则A位置出现非终结符号

在满足约束的条件下,A改写为B

 

上下文相关文法:1-型文法

语法形式:XAY->XBY

新增约束

|A|<=|B|:绝对值符号表示字符长度

且,B位置不能出现S集中字符

在满足约束的条件下,A改写为B,当A位于左边是X右边是Y的序列中

 

上下文无关文法:2-型文法

语法形式:A->Z

新增约束:

A位置有且仅有一个非终结字符

在满足约束的条件下,A改写为B

 

有限状态文法:3-型文法(正则文法)

语法形式:A-> Αb /A-> Bα /A->a。

新增约束:

出现在B位置上字符最多只能是二字字符,两个字符时必须一个为非终结符,另一个为终结符(小写字母),而当只有一个字符时,必须为终结符。

在满足约束的条件下,A无条件改写为Αb、 或Bα、或a。

乔姆斯基的理论中,产生式规则替代了我们前述的组合性机制。言语的表达输出更多来自意义的驱动,同一意义可采用不同形式来表达,组合性的说法与经验更加符合。正是在看待经验与语义上,乔姆斯基理论自有其特点。乔姆斯基理论可由形式文法系统来体现,这些形式系统被看作语言的核心部分。并且这些语法的形式系统是自足自洽的,并不依赖于意义或者语音,它们只在最后形成表述时产生相互作用。将意义视为表层作用的因素使乔姆斯基理论很难直接作为自然语言的模型。乔姆斯基的工作类似于严格限制环境条件下的思想实验,这类实验所得到的结论,总会与真实的状况有差距。另一方面,这种更纯粹、抽象的理论,在不依赖于经验语义的人工语言领域,如计算机程序设计语言领域,成为了一种真实的理论基础。后来的研究揭示,乔姆斯基理论所述的语言机制可与自动机器关联起来。四种文法正好对应了四种自动机:无约束文法对应图灵机;上下文相关文法对应线性有限自动机;上下文无关文法对应下推自动机;正则文法对应有限状态自动机。正是乔姆斯基理论能够延伸与交叉出的内容,显示出其特别的意义。

标签:文法,语言,符号,语法,3.2,自然语言,乔姆斯基
From: https://www.cnblogs.com/CHARACTER2/p/16795915.html

相关文章