显示全部前言
汉语语法研究面临来自两方面的挑战:一是对外汉浯教学,一是中文信息处理。前者迫切要求对于种种的语言现象,特别是对于语言对比中相同和相异的语言现象做出理论上的解释;后者迫切要求对于人类的语言机制,特别是对于通过语言来进行知识处理的大脑机制做出认知理论的探索和电脑软件的模拟。
本书的作者毕业于哈尔滨工业大学计算机系,长期从事中文信息处理的科研和教学工作。1987年当选中国中文信息学会首届计算语言学专业委员会主任。在陈力为院土领导的“八五”国家重点科研项目“中文信息处理应用平台工程(905工程)”中担任《汉语谓词语意组合词典》课题组负责人。
本书根据上述科研成果写成,是作者在实际工作中长期坚持学习汉语语法的心得笔记,是为电脑编制汉语语法规则集的经验总结,也是从中文信息处理的角度撰写的一本汉语语法专著。可供关心中文信息处理事业的读者以及语言专业(中文系、外语系)和信息专业(计算机系、自动化系、通信工程系)本科生和研究生阅读,也可供语言学家、语言教师和广大的汉语学习者参考。
信息时代已经到来,电脑正在从数据处理过渡到知识处理。电脑对自然语言的理解就是对语言中显性和隐性的知识的发掘。
语言是知识的载体。语法是语言的结构规则。适用于电脑的语法就是电脑通过语言来进行知识处理时所遵循的结构规则。
本书汲取了百年来国内外语言学者的研究成果,重点参考了吕叔湘先生《中国文法要略》和转换生成语法、格语法、依存语法、角色参照语法、认知语法的理论。
一、贯穿本书的基本理论主要有下列六个论点
1.谓词是句子结构的中枢
《中国文法要略》和“依存语法”都提出了“动词中心论”。汉语动词和形容词都是谓词,本书的论点是“谓词中枢论”。
句法平面上:在一个单句中,一个由谓词充当的述语支配着主语、宾语、状语、补语等句子成分。
语意平面上:在一个事件中,一个由谓词充当的“中枢事元”支配着若干个相关的”周边事元”。
2.语意平面是汉语语法的基础
汉语语法研究的三个平面:语意平面研究语言的意义内容,句法平面研究语言的结构形式,语用平面研究语言的交际效果。说话首先从传递“语意内容”的目的出发,然后找到符合句法结构的多种形式,最后选定一种语用效果最佳的表达方式。这体现了“语意的先决性,句法的强制性,语用的选定性”。
英语有形态,是“形合法”语言,注重句法平面。
汉语无形态,是“意合法”语言,注重语意平面。本书以“意合网络”的形式全面讨论了汉语语意平面上的各种问题。
3.语块是三个平面同构分析的单位
“语块”是心理学的术语。美国心理学家米勒(G.Miller)指出:人脑短时记忆限度是7±2个语块。本书将“语块”移植到语法学中以取代“短语”。短语(phrase)种类繁多,在不同的层次中长度不定,不适于“同构分析”。语块(chunk)总共只有两种(中枢语块、周边语块),长度确定,边界清晰,特别适于句法平面、语意平面和语用平面互相对照的“同构分析”。
4.分清语言中的客观信息和主观信息
用语言传递客观信息的同时,不可避免地要附加说话者的主观信息。主观信息表达说话者在观察客观事物时的主观视角和参照系,以及说话者在叙述客观事物时的主观情绪、态度和交际意图等。主观信息表现为主观因素和主观标记。
实词主要表达客观信息。隐含在实词内的主观信息叫做主观因素,如表达说话者主观态度的褒贬因素等。
虚词主要表达主观信息。虚词本身就是显露在客观信息(实词)之外的主观标记,如表达说话者主观情绪和态度的“情态标记”(情态辅词和情态助词)等。
5.汉语语序的理据是临摹性
汉语的编码机制是“援物、取象、比类、尽意”。“援物”就是汉语的编码以客观物质世界为依据。汉语语序的理据就是对客观有序世界的“临摹性”(iconicity)。本书在海内外的语言学者研究成果的基础上,归纳出下列三条基本语序规律:
①时空事理先后律:时空早的先说,时空晚的后说。
原因条件先说,结果推理后说。
②时空地位大小律:时空大的先说,时空小的后说。
地位高的先说,地位低的后说。
③信息旧新轻重律:旧知信息先说,新传信息后说。
次要信息先说,重要信息后说。
6.里层网络和表层序列相互转换
转换生成语法提出语言有“深层结构”和“表层结构”。我国学者范继淹先生和邢福义先生指出“深层”应为“里层”。
本书提出:语言的“里层结构”是多维的“网络”。
“里层网络”是由“结点”和“联线”所组成的图式。每个结点中是一个实词,作为标记的虚词依附在结点之上,结点间的联线中断处注释各种“语意关系”和“语意依附”。
语言的表层结构是一维的序列。从语用的角度来看,主要是安排话题和焦点的顺序以达到最佳的交际效果。
里层网络体现语言信息的“完备性”和知识的“显露性”。
表层序列体现语言信息的“简洁性”和知识的“隐含性”。
电脑对人类语言的理解表现为能把表层序列转换成里层网络。
电脑对人类语言的生成表现为能把里层网络转换成表层序列。
二、本书以大规模语料库的成果作为研究的依据
“语法”来源于全部词汇的“用法”。本书的研究基于大规模的语料库,所依据的“八千常用谓词”和“八百常用虚词”是语料库中的高频词。本书对这些语料进行“逐个分析、归纳分类、探求解释、揭示规律”,所列出的“128个基本句模”是从语料库中大量现代汉语句子中抽象出来的实用模式。
三、本书以汉语的特点作为研究的基点
在本书的概论中,论述了现代汉语语法的下列六个特点:
①最小语法单位是字,
②语法组合是意合法,
③语法理据是临摹性,
④语言节奏的和谐律,
⑤语言表达的简缩化,
⑥语言铺排的话题链。
汉语以“话题—说明”为框架,英语以“主语—谓浯”为框架。
本书只借鉴英语语法的理论和方法而不生搬硬套其语法体系。在书中各有关章节中还进行了汉语跟英语的对比。
在本书写作过程中得到北京信息工程学院软件工程研究中心周锡令教授和各位同事的支持和帮助,在此—并致谢。
在本书出版的时候,我衷心地感谢直接领导我们科研攻关的陈力为院士:感谢国内外语言学界和计算语言学界的良师益友们。最后要特别感谢商务印书馆的张万起先生和周洪波先生,他们为本书的审订和出版倾注了大量的心血。
由于作者水平所限,书中多有不当之处,敬请批评指正。
鲁 川
1998年11月于北京信息工程学院软件工程研究中心
本书的作者毕业于哈尔滨工业大学计算机系,长期从事中文信息处理的科研和教学工作。1987年当选中国中文信息学会首届计算语言学专业委员会主任。在陈力为院土领导的“八五”国家重点科研项目“中文信息处理应用平台工程(905工程)”中担任《汉语谓词语意组合词典》课题组负责人。
本书根据上述科研成果写成,是作者在实际工作中长期坚持学习汉语语法的心得笔记,是为电脑编制汉语语法规则集的经验总结,也是从中文信息处理的角度撰写的一本汉语语法专著。可供关心中文信息处理事业的读者以及语言专业(中文系、外语系)和信息专业(计算机系、自动化系、通信工程系)本科生和研究生阅读,也可供语言学家、语言教师和广大的汉语学习者参考。
信息时代已经到来,电脑正在从数据处理过渡到知识处理。电脑对自然语言的理解就是对语言中显性和隐性的知识的发掘。
语言是知识的载体。语法是语言的结构规则。适用于电脑的语法就是电脑通过语言来进行知识处理时所遵循的结构规则。
本书汲取了百年来国内外语言学者的研究成果,重点参考了吕叔湘先生《中国文法要略》和转换生成语法、格语法、依存语法、角色参照语法、认知语法的理论。
一、贯穿本书的基本理论主要有下列六个论点
1.谓词是句子结构的中枢
《中国文法要略》和“依存语法”都提出了“动词中心论”。汉语动词和形容词都是谓词,本书的论点是“谓词中枢论”。
句法平面上:在一个单句中,一个由谓词充当的述语支配着主语、宾语、状语、补语等句子成分。
语意平面上:在一个事件中,一个由谓词充当的“中枢事元”支配着若干个相关的”周边事元”。
2.语意平面是汉语语法的基础
汉语语法研究的三个平面:语意平面研究语言的意义内容,句法平面研究语言的结构形式,语用平面研究语言的交际效果。说话首先从传递“语意内容”的目的出发,然后找到符合句法结构的多种形式,最后选定一种语用效果最佳的表达方式。这体现了“语意的先决性,句法的强制性,语用的选定性”。
英语有形态,是“形合法”语言,注重句法平面。
汉语无形态,是“意合法”语言,注重语意平面。本书以“意合网络”的形式全面讨论了汉语语意平面上的各种问题。
3.语块是三个平面同构分析的单位
“语块”是心理学的术语。美国心理学家米勒(G.Miller)指出:人脑短时记忆限度是7±2个语块。本书将“语块”移植到语法学中以取代“短语”。短语(phrase)种类繁多,在不同的层次中长度不定,不适于“同构分析”。语块(chunk)总共只有两种(中枢语块、周边语块),长度确定,边界清晰,特别适于句法平面、语意平面和语用平面互相对照的“同构分析”。
4.分清语言中的客观信息和主观信息
用语言传递客观信息的同时,不可避免地要附加说话者的主观信息。主观信息表达说话者在观察客观事物时的主观视角和参照系,以及说话者在叙述客观事物时的主观情绪、态度和交际意图等。主观信息表现为主观因素和主观标记。
实词主要表达客观信息。隐含在实词内的主观信息叫做主观因素,如表达说话者主观态度的褒贬因素等。
虚词主要表达主观信息。虚词本身就是显露在客观信息(实词)之外的主观标记,如表达说话者主观情绪和态度的“情态标记”(情态辅词和情态助词)等。
5.汉语语序的理据是临摹性
汉语的编码机制是“援物、取象、比类、尽意”。“援物”就是汉语的编码以客观物质世界为依据。汉语语序的理据就是对客观有序世界的“临摹性”(iconicity)。本书在海内外的语言学者研究成果的基础上,归纳出下列三条基本语序规律:
①时空事理先后律:时空早的先说,时空晚的后说。
原因条件先说,结果推理后说。
②时空地位大小律:时空大的先说,时空小的后说。
地位高的先说,地位低的后说。
③信息旧新轻重律:旧知信息先说,新传信息后说。
次要信息先说,重要信息后说。
6.里层网络和表层序列相互转换
转换生成语法提出语言有“深层结构”和“表层结构”。我国学者范继淹先生和邢福义先生指出“深层”应为“里层”。
本书提出:语言的“里层结构”是多维的“网络”。
“里层网络”是由“结点”和“联线”所组成的图式。每个结点中是一个实词,作为标记的虚词依附在结点之上,结点间的联线中断处注释各种“语意关系”和“语意依附”。
语言的表层结构是一维的序列。从语用的角度来看,主要是安排话题和焦点的顺序以达到最佳的交际效果。
里层网络体现语言信息的“完备性”和知识的“显露性”。
表层序列体现语言信息的“简洁性”和知识的“隐含性”。
电脑对人类语言的理解表现为能把表层序列转换成里层网络。
电脑对人类语言的生成表现为能把里层网络转换成表层序列。
二、本书以大规模语料库的成果作为研究的依据
“语法”来源于全部词汇的“用法”。本书的研究基于大规模的语料库,所依据的“八千常用谓词”和“八百常用虚词”是语料库中的高频词。本书对这些语料进行“逐个分析、归纳分类、探求解释、揭示规律”,所列出的“128个基本句模”是从语料库中大量现代汉语句子中抽象出来的实用模式。
三、本书以汉语的特点作为研究的基点
在本书的概论中,论述了现代汉语语法的下列六个特点:
①最小语法单位是字,
②语法组合是意合法,
③语法理据是临摹性,
④语言节奏的和谐律,
⑤语言表达的简缩化,
⑥语言铺排的话题链。
汉语以“话题—说明”为框架,英语以“主语—谓浯”为框架。
本书只借鉴英语语法的理论和方法而不生搬硬套其语法体系。在书中各有关章节中还进行了汉语跟英语的对比。
在本书写作过程中得到北京信息工程学院软件工程研究中心周锡令教授和各位同事的支持和帮助,在此—并致谢。
在本书出版的时候,我衷心地感谢直接领导我们科研攻关的陈力为院士:感谢国内外语言学界和计算语言学界的良师益友们。最后要特别感谢商务印书馆的张万起先生和周洪波先生,他们为本书的审订和出版倾注了大量的心血。
由于作者水平所限,书中多有不当之处,敬请批评指正。
鲁 川
1998年11月于北京信息工程学院软件工程研究中心