显示全部序言
什么是汉语的“词”,长期以来是一个众说纷纭、莫衷一是的老大难问题。过去中国人研究写文章,只说“字”,所谓“积字成句,积句成文”,就是说,一个字一个字连接起来就成了一句句子,一句句子一句句子连接起来就成了一篇文章。即使是口头说话,也说“你一个字儿一个字儿慢慢地说”,“字”在这里就等于音节。在说汉语的人的语感中,“字”是最容易感知的“音义结合的最小的单位”,因此也是天然的语言单位,以汉语为母语的人很容易懂什么是“字”,不管是书面的独立的书写单位,还是口头的相当于音节的语音单位。应该说,“词”的概念是从西方语法引进的,西方语言的“词”由于有形态变化,并且形态变化一般都在“词”的尾巴上,既然每一个词都有一条晃动着的小尾巴,那就很容易辨认,所以从小就会说有形态变化的西方语言的人很容易懂什么是“词”,就像我们很容易懂什么是“字”一样,对他们来说“词”也是最容易分辨的天然的语言单位。马建忠写《马氏文通》的时候就只说“字”和“字类”,不说“词”和“词类”。马建忠研究的是文言语法,而文言文中一个“字”绝大多数等于一个“词”,所以他这么说,也还勉强行得通;可是一旦要研究现代汉语,由于现代汉语多数的“词”是双音节的,单音节的“字”在多数情况下只是“词”的一部分,或者说是“词素”或“语素”,而不等于“词”,因此“字”和“词”必须有所区分。这样,语法学家就引进了西方语法理论中的“词”的概念。但是因为“词”在汉语中没有明显的形式标志,不是人人都很容易分辨的天然单位,即使是语法学家也不那么容易分辨清楚,而且分清楚了也说不清楚。
最早引进“词”的概念和术语的是章士钊的《中等国文典》(1907),第一次区分了“字”和“词”。他说:“句,集字而成者也。如《孟子》云:‘齐宣王见孟子于雪宫’,共九字为一句。分视之则为字,合观之则为句,此字与句之区别也。右所引句,共九字也,而自文法上视之,则‘孟子’‘齐宣王’‘雪宫’,皆名词;‘见’,动词;‘于’,前置介词。名词三,动词一,前置介词一,共五词也。是一字可为一词(如‘见’字为动词,‘于’字为前置介词之类),而一词不必为一字(如‘齐宣王’三字,‘孟子’两字,始为一名词之类),泛论之则为字,而以文法规定之则为词,此字与词之区别也。”(1907,1页)今天看来,从一开始,章士钊的“字”和“词”就区分得不太清楚,传统的“字”的概念在他身上的影响实在是太深了,所以他一开始就要说“句,集字而成者也”。黎锦熙的《新著国语文法》是一部系统全面的现代汉语语法的奠基性著作,明确地区分了4级语法单位:字、词、短语、句子。他给“词”下的定义是:“语词简称词,就是言语中间一个一个观念的表示,观念一名意象,英文Idea。在此处是用它的广义:一切外界的感觉、反映的知觉,想像乃至概念等,凡是有认识作用而来的,都可以叫做观念。用声音或文字来代表这些单体的整个的意象,都叫做词。”(1924,15页)他还区分了字和词:“有时一个字就是一个词,如‘人’、‘马’、‘红’、‘来’等。有时要两个字以上组合起来才成功一个词,如‘鹦鹉’、‘老头子’、‘便宜’、‘吩咐’等。文法中组织句子,分别词类,是把词作单位;不问它是一个字或是几个字,只要是表示一个观念的,就叫做词。”(1924,15页)黎锦熙说得具体一些,但是他给词下的定义是从意义着眼的,缺乏可操作性,因为一涉及意义,就免不了见仁见智,公说公有理,婆说婆有理,是非难分了。后来赵元任想从语音角度来给词下定义,吕叔湘想从语法角度来给词下定义,因此就有了所谓“语音词”、“词汇词”、“语法词”以及“形式词”、“理论词”等等的说法,这就是“众说纷纭”,实际上是承认实在解决不了什么是“词”的问题,只得限定在某个范围以内来说“词”的问题了。这以后计算机专家为了制定计算机用的词表,不得已又发明了“切分单位”、“信息词”、“工程词”等等术语,也同样说明了没法解决汉语中“词”的确切定义,只得在名词术语上变花样。1988年国家教育委员会和国家语言文字工作委员会联合公布了《汉语拼音正词法基本规则》,似乎什么是“词”的问题终于解决了。但是实际情况并非如此。正词法基本规则尽管规定了分词连写的规则,但是并没有得到社会的公认,更没有起到规范汉语拼音实践中分词连写的作用,也没有起到解决汉语中什么是“词”的问题。这并不令人感到意外,因为世界上所有分词连写的拼音文字,都是先有约定俗成的分词连写的文字,后有正词法的规范,古今中外还没有先由专家制定了正词法规则,然后老百姓遵照专家的规定去分词连写的先例。那么现有各种拼音文字分词连写的历史是怎样的呢?是谁给这些语言的“词”下的定义的呢?实际上使用拼音文字的语言,一开始,没有人给大家规定必须分词连写,也没有人关心什么是“词”的问题,谁觉得怎么写合适就怎么写,但是使用同一种语言的人什么地方分写,什么地方连写的想法和写法都差不多,经过一段时间的实践,也就约定俗成了,而由于使用同一语言的人的语感基本一致,所以分写的单位也就基本一致,语言学家制定的所谓规范也只能是追认广大群众的实践而已,因为任何违反群众语感的规范都是行不通的。
汉语长期使用汉字,没有使用拼音文字,所以什么是“词”的问题就不容易解决了。但是这并不等于汉语中没有相当于英语的word,或法语的mot,德语的Wort那样的语言单位,语法学家分析语法从来没有由于对“词”的认识不同而引发争论,几乎所有的争论都是由对各个“词”所担任的句子成分功能的认识不同而引发的。这样看来语法学家对什么是“词”实际上存在一个共同的认识,尽管在理论上可以争论不休。例如在“台上坐着主席团”这句句子中,哪是主语、哪是宾语可以争论不休,可是从来没有人说“台”是主语,“上坐”是谓语核心,“着主”是间接宾语,“席团”是直接宾语这一类胡话,而总是把“台上”、“坐着”、“主席团”认定是句法分析的最小单位,最多也就是进一步把“台上”分析为名词“台”加方位词或方位助词“上”,把“坐着”进一步分析为动词“坐”加动态助词“着”而已。由此可见,汉语中不是根本没有“词”,只是汉语中的“词”跟西方语言中的word等等不完全相同而已,而且也证明不同的语法学家对“词”的语感也是基本一致的;另外,连什么是“词”都不知道,可是词类问题的讨论却始终很热烈,各种词典照编不误,并且越编越多,真是咄咄怪事!这种似乎不可思议的怪现象只有一种解释,那就是语法学家也好,一般人也好,对相当于“词”一级的语言单位都有一种基本一致的语感,仅仅是说不清楚而已,而这正是语感的特点,知道怎么使用和分辨,但这只是一种感性认识,说不清楚,因为还没有上升到理性认识的阶段。至于这样一种语言单位用一个什么样的名称那倒并不重要。大概正由于这样的现实,20世纪50年代就有人认为可以从语感着手来解决什么是“词”的问题。1956年6月赵恩柱在《中国语文》上发表《从语感就能判定词儿》的文章,指出:“就现代汉语的词儿看,使用现代汉语的人的看法大体一致,这意味着他们的感觉基本上是一致的。当然,我们也可以用语法形式来判定词儿,但这不是根本办法,而且,能不能有某种形式,还要决定于我们的语感。”
我在80年代初学习了社会语言学的调查统计分析方法之后萌生一种想法:能不能用社会语言学的调查统计分析方法在广大群众中进行调查,看看使用现代汉语的广大群众是怎么看待“词”这一级语言单位的。但是,我始终没有这样去做,因为既没有足够的勇气和精力,也缺乏必要的经费。因此当90年代末我看到武汉江汉大学王立同志在《语言文字应用》等刊物上发表的一系列有关汉语“词”的公众语感的社会语言学调查文章时就非常高兴,从心底里赞同和支持。后来我把她的调查统计分析成果告诉了陈松岑教授,她知道以后立即在北大进行了类似的调查,而且更为惊人的是得出了完全相同的结论,尽管陈松岑的调查对象包括了系统地受过语法教育的英文系和中文系的学生。
现在王立同志准备把她这几年来关于汉语“词”的公众语感的社会语言学调查统计分析成果著书出版,我当然举双手赞成,并很乐意为这样一本有特殊价值的著作作序。
王立同志是学社会学出身的,从事社会语言学的调查研究工作比我这种野狐禅式的人更有条件,做得也更细致科学。因为我国绝大多数从事语言研究的人都是纯文科出身的,对社会学和社会语言学的调查统计方法很不了解,因此当70年代社会语言学传入我国以后,从事宏观研究的人不少,而从事社会调查的微观研究工作的人却很少很少。王立同志的这部著作不仅公布了汉语社团公众关于“词”的语感的调查数据,同时也是不了解社会语言学调查统计分析方法的读者了解和学习社会语言学调查和统计分析的具体方法的很好的教材,因为里边有大量的语言材料,而且作者详细地交代了她是怎样一步一步运用什么理论和方法来设计调查问卷的,是怎样收集和统计资料的,又是运用什么方法来核查调查数据的可靠性的,比起泛泛而论的介绍社会语言学方法的书来说,初学者更容易理解和掌握。这也是我支持她出版这部著作的一个重要原因。当然,社会语言学的调查数据还是没法跟自然科学的实验数据相比的,但是作为一种重要的参考数据还是有足够分量的,完全否定是缺乏科学根据的。过去有个别人完全否认社会调查数据的可信性,那是由于不了解社会调查的科学性和具体操作过程,这部著作的出版也许也有助于消除他们的疑虑。
胡 明 扬
2002年9月18日于北京
最早引进“词”的概念和术语的是章士钊的《中等国文典》(1907),第一次区分了“字”和“词”。他说:“句,集字而成者也。如《孟子》云:‘齐宣王见孟子于雪宫’,共九字为一句。分视之则为字,合观之则为句,此字与句之区别也。右所引句,共九字也,而自文法上视之,则‘孟子’‘齐宣王’‘雪宫’,皆名词;‘见’,动词;‘于’,前置介词。名词三,动词一,前置介词一,共五词也。是一字可为一词(如‘见’字为动词,‘于’字为前置介词之类),而一词不必为一字(如‘齐宣王’三字,‘孟子’两字,始为一名词之类),泛论之则为字,而以文法规定之则为词,此字与词之区别也。”(1907,1页)今天看来,从一开始,章士钊的“字”和“词”就区分得不太清楚,传统的“字”的概念在他身上的影响实在是太深了,所以他一开始就要说“句,集字而成者也”。黎锦熙的《新著国语文法》是一部系统全面的现代汉语语法的奠基性著作,明确地区分了4级语法单位:字、词、短语、句子。他给“词”下的定义是:“语词简称词,就是言语中间一个一个观念的表示,观念一名意象,英文Idea。在此处是用它的广义:一切外界的感觉、反映的知觉,想像乃至概念等,凡是有认识作用而来的,都可以叫做观念。用声音或文字来代表这些单体的整个的意象,都叫做词。”(1924,15页)他还区分了字和词:“有时一个字就是一个词,如‘人’、‘马’、‘红’、‘来’等。有时要两个字以上组合起来才成功一个词,如‘鹦鹉’、‘老头子’、‘便宜’、‘吩咐’等。文法中组织句子,分别词类,是把词作单位;不问它是一个字或是几个字,只要是表示一个观念的,就叫做词。”(1924,15页)黎锦熙说得具体一些,但是他给词下的定义是从意义着眼的,缺乏可操作性,因为一涉及意义,就免不了见仁见智,公说公有理,婆说婆有理,是非难分了。后来赵元任想从语音角度来给词下定义,吕叔湘想从语法角度来给词下定义,因此就有了所谓“语音词”、“词汇词”、“语法词”以及“形式词”、“理论词”等等的说法,这就是“众说纷纭”,实际上是承认实在解决不了什么是“词”的问题,只得限定在某个范围以内来说“词”的问题了。这以后计算机专家为了制定计算机用的词表,不得已又发明了“切分单位”、“信息词”、“工程词”等等术语,也同样说明了没法解决汉语中“词”的确切定义,只得在名词术语上变花样。1988年国家教育委员会和国家语言文字工作委员会联合公布了《汉语拼音正词法基本规则》,似乎什么是“词”的问题终于解决了。但是实际情况并非如此。正词法基本规则尽管规定了分词连写的规则,但是并没有得到社会的公认,更没有起到规范汉语拼音实践中分词连写的作用,也没有起到解决汉语中什么是“词”的问题。这并不令人感到意外,因为世界上所有分词连写的拼音文字,都是先有约定俗成的分词连写的文字,后有正词法的规范,古今中外还没有先由专家制定了正词法规则,然后老百姓遵照专家的规定去分词连写的先例。那么现有各种拼音文字分词连写的历史是怎样的呢?是谁给这些语言的“词”下的定义的呢?实际上使用拼音文字的语言,一开始,没有人给大家规定必须分词连写,也没有人关心什么是“词”的问题,谁觉得怎么写合适就怎么写,但是使用同一种语言的人什么地方分写,什么地方连写的想法和写法都差不多,经过一段时间的实践,也就约定俗成了,而由于使用同一语言的人的语感基本一致,所以分写的单位也就基本一致,语言学家制定的所谓规范也只能是追认广大群众的实践而已,因为任何违反群众语感的规范都是行不通的。
汉语长期使用汉字,没有使用拼音文字,所以什么是“词”的问题就不容易解决了。但是这并不等于汉语中没有相当于英语的word,或法语的mot,德语的Wort那样的语言单位,语法学家分析语法从来没有由于对“词”的认识不同而引发争论,几乎所有的争论都是由对各个“词”所担任的句子成分功能的认识不同而引发的。这样看来语法学家对什么是“词”实际上存在一个共同的认识,尽管在理论上可以争论不休。例如在“台上坐着主席团”这句句子中,哪是主语、哪是宾语可以争论不休,可是从来没有人说“台”是主语,“上坐”是谓语核心,“着主”是间接宾语,“席团”是直接宾语这一类胡话,而总是把“台上”、“坐着”、“主席团”认定是句法分析的最小单位,最多也就是进一步把“台上”分析为名词“台”加方位词或方位助词“上”,把“坐着”进一步分析为动词“坐”加动态助词“着”而已。由此可见,汉语中不是根本没有“词”,只是汉语中的“词”跟西方语言中的word等等不完全相同而已,而且也证明不同的语法学家对“词”的语感也是基本一致的;另外,连什么是“词”都不知道,可是词类问题的讨论却始终很热烈,各种词典照编不误,并且越编越多,真是咄咄怪事!这种似乎不可思议的怪现象只有一种解释,那就是语法学家也好,一般人也好,对相当于“词”一级的语言单位都有一种基本一致的语感,仅仅是说不清楚而已,而这正是语感的特点,知道怎么使用和分辨,但这只是一种感性认识,说不清楚,因为还没有上升到理性认识的阶段。至于这样一种语言单位用一个什么样的名称那倒并不重要。大概正由于这样的现实,20世纪50年代就有人认为可以从语感着手来解决什么是“词”的问题。1956年6月赵恩柱在《中国语文》上发表《从语感就能判定词儿》的文章,指出:“就现代汉语的词儿看,使用现代汉语的人的看法大体一致,这意味着他们的感觉基本上是一致的。当然,我们也可以用语法形式来判定词儿,但这不是根本办法,而且,能不能有某种形式,还要决定于我们的语感。”
我在80年代初学习了社会语言学的调查统计分析方法之后萌生一种想法:能不能用社会语言学的调查统计分析方法在广大群众中进行调查,看看使用现代汉语的广大群众是怎么看待“词”这一级语言单位的。但是,我始终没有这样去做,因为既没有足够的勇气和精力,也缺乏必要的经费。因此当90年代末我看到武汉江汉大学王立同志在《语言文字应用》等刊物上发表的一系列有关汉语“词”的公众语感的社会语言学调查文章时就非常高兴,从心底里赞同和支持。后来我把她的调查统计分析成果告诉了陈松岑教授,她知道以后立即在北大进行了类似的调查,而且更为惊人的是得出了完全相同的结论,尽管陈松岑的调查对象包括了系统地受过语法教育的英文系和中文系的学生。
现在王立同志准备把她这几年来关于汉语“词”的公众语感的社会语言学调查统计分析成果著书出版,我当然举双手赞成,并很乐意为这样一本有特殊价值的著作作序。
王立同志是学社会学出身的,从事社会语言学的调查研究工作比我这种野狐禅式的人更有条件,做得也更细致科学。因为我国绝大多数从事语言研究的人都是纯文科出身的,对社会学和社会语言学的调查统计方法很不了解,因此当70年代社会语言学传入我国以后,从事宏观研究的人不少,而从事社会调查的微观研究工作的人却很少很少。王立同志的这部著作不仅公布了汉语社团公众关于“词”的语感的调查数据,同时也是不了解社会语言学调查统计分析方法的读者了解和学习社会语言学调查和统计分析的具体方法的很好的教材,因为里边有大量的语言材料,而且作者详细地交代了她是怎样一步一步运用什么理论和方法来设计调查问卷的,是怎样收集和统计资料的,又是运用什么方法来核查调查数据的可靠性的,比起泛泛而论的介绍社会语言学方法的书来说,初学者更容易理解和掌握。这也是我支持她出版这部著作的一个重要原因。当然,社会语言学的调查数据还是没法跟自然科学的实验数据相比的,但是作为一种重要的参考数据还是有足够分量的,完全否定是缺乏科学根据的。过去有个别人完全否认社会调查数据的可信性,那是由于不了解社会调查的科学性和具体操作过程,这部著作的出版也许也有助于消除他们的疑虑。
胡 明 扬
2002年9月18日于北京