显示全部序言
南开大学周荐教授主编的《2006汉语新词语》出版,嘱我写一篇序言,我有些惶恐。为什么呢?因为我已经有些时日没有系统地摸过新词语了。
说来话长,我对汉语新词语产生兴趣是在20多年前。那时候我正在中国社会科学院语言文字应用研究所进修,《辞书研究》上发表了吕叔湘先生《大家来关心新词新义》的文章,语言文字应用研究所响应吕先生的号召专门成立了“新词新语新用法”课题组,着手搜集、研究新词语,我也参加了其中一部分工作。当然,我的主要任务并不在此,参与此课题只能利用闲暇时间顺手做一点儿。记得当时我们从读报、做卡片等基础训练入手,培养语感;书证和例句搜集得差不多了,就试着把研究心得整理成1000字左右的文章;随着“千字文”一篇一篇变成了铅字,我们积累的材料也慢慢多了起来,从中发现了一些带有规律性的东西,便着手撰写学术论文。进修结束回到原单位后,我有比较充裕的时间进行新词语研究了,于是边编写《新词新语词典》边写论文,不知不觉间居然积累了几十万字的成果,发表的论文也有10来篇。后来调京工作,虽然无法再专注于新词语研究,但是朋友们有新词语辞书问世时就喜欢找我写写书评,成立这方面研究的课题组时仍然愿意吸收我参加,包括周荐教授有关新词语的讨论也曾经几次邀我……这样我与新词语就结下了不解之缘。此次周荐兄命我作序,想想可能也正是基于本人的这些经历,想到此也就不便推辞了。
汉语年度新词语,既包含词,也包含语,还包含固有词语的新义、新用法。我一向认为:新词语研究可以有多种不同的形式和侧重点。考察可以是某一时段(一般以二三十年为宜,大约一代人为一个时段,比如改革开放以来至今可以作为一个时段)的,这类研究能够清晰地看出新词语的变化轨迹;考察也可以以一个年度为限,这类研究对新词语的新、异特征可能看得更明显一些。有计划、分年度地对汉语新词语进行动态滚动式的研究考察,既有社会语言学价值,又有汉语词汇学意义,是一项十分重要的基础性工作。
上世纪90年代初期,国家语委曾经启动过年度新词语研究项目,连续编纂、出版过4本年鉴式的《汉语新词语》工具书,使得我们对那一时段新词语的动态变化有了一本“账”。后来这项工作因故中断,我们对汉语新词语的动态变化轨迹看得就不那么清晰了。这项工作停顿下来十分可惜,因为这不仅使我们对汉语词汇最近发生过的动态变化轨迹不甚明了,也难以让我们为后人留下一份较为翔实客观的词汇变化资料,同时前面进行过的分年度新词语研究也因此而失去了它应有的分量。有鉴于此,国家语委科研规划领导小组办公室于2005年下半年重新启动了“新词语编年本”课题(项目编号BZ2005—09),具体研究工作由周荐教授领衔的“南开大学词汇学与词典学研究中心”承担。摆在读者面前的这本《2006汉语新词语》,就是这一项目的初步成果。
本项目语料的来源是:《新京报》《北京晚报》《中国体育报》《三联生活周刊》《新周刊》《北京青年报》《南方周末》《南方日报》《深圳特区报》《光明日报》《工人日报》《羊城晚报》《每日新报》《球迷报》《中国青年报》《参考消息》《作家文摘》《老年时报》《中国商报》《法制日报》《深圳晚报》《人民日报》《大河报》《今晚报》《新民晚报》《文汇报》《市场报》《半月谈》《扬子晚报》《华西都市报》《瑞丽》等30余份报刊,基本上照顾到了不同地区、不同性质的文本。此外,每一位参与研究的学者还通过网络查找新词语,利用百度、谷歌等搜索引擎查询每一个词语最初出现的时间,以确定、核查其新词语的身份。
抽取年度新词语,目前采取“先手工后机器”的方式。先由课题组成员按分工从报刊和网络上查找新词语,然后课题组定期研讨交流。待初步确定备选词条后,再请国家语言资源监测与研究中心的平面媒体、有声媒体和网络媒体的三个语言分中心借助国家语言资源动态流通语料库进行跨年度语料(主要是2005年度、2006年度的语料)的回查、验证,根据相应词条各自在不同年度语料中的频次和文本数,确定其是否具有该年度新词语的身份。回查的过程中,如果发现某词条在以往年度语料中曾经出现过,一般不再收入当年度的编年本中;但经查实确属新增的义项、用法的,尽管表面上看这个词语是“旧面孔”,也需要收入。比如,“晒”乍一看不是年度新词,但它在2006年度增加了“将私人生活的内容在网上公开,和网友们一起谈论”的义项,按规则便可收入。凡属旧词语而有新义、新用法者,本书都在该条目前加星号(*)以示区别。
抽选年度汉语新词语词条,最理想的方式是利用现代信息技术手段,在已经建立的国家语言资源动态流通语料库中自动提取。但囿于目前研究和技术手段的某些局限,计算机自动提取汉语新词语的研究尚未取得明显的进展和实质性的突破。国家语言资源监测与研究中心2006年下半年起已将此一课题列为研究任务,提上工作日程,加紧进行探索。期待通过语言研究工作者和中文信息学界的密切协作,联合攻关,能够最终实现较高水平的汉语新词语的自动提取,这将对“新词语编年本”课题的研制有更实质的帮助。
今年8月,教育部召开新闻发布会,国家语委公布了周荐教授和他的课题组的初步研究成果——171条2006年度汉语新词语的选目。作为尝试,这171条新词语虽然不能全面反映2006年度汉语新词语的全貌(一个年度产生的新词语绝不仅仅171条,课题组实际搜集、整理、研究的新词语也不止这171条),但这些条目都是经过层层筛选、过滤和语料库验证的,并非课题组妙手偶得,而是凝聚着几十位专家、学者的心血和学术智慧。将年度新词语发布出来,正是为了真实、客观、及时地反映语言生活的“实态”,引起人们对词语新质要素的关注,同时也是政府信息公开的一个重要举措。
此次《2006汉语新词语》结集出版,所收词条仍以正式公布的这171条新词语为蓝本。全书按音序排列,罗马字母打头的词语排在最前面,阿拉伯数字打头的词语次之,然后才是汉字构成的词语。每个词条都标注了汉语拼音注音和词性,并做了简要的提示性释义,附以例句作为书证。上述内容,为读者正确理解和认识新词语、共享语言信息资源提供了方便。
编撰新词语编年本是探索性科研活动,周荐教授和他的团队还会继续做下去。这样一年一年滚动编写、深入研究,哪些词语最终得以保留下来,哪些词语成了来去匆匆、昙花一现的过客,我们就会账目清楚,对新时代汉语词汇的变化轨迹也就会看得比较清楚一些。相信课题组一定会注意吸纳各方面的意见,及时总结经验,在前人已有工作的基础上有所创新,不断提升编年本的质量,为公众提供更为优质的语言服务。
王铁琨
2007年12月28日
说来话长,我对汉语新词语产生兴趣是在20多年前。那时候我正在中国社会科学院语言文字应用研究所进修,《辞书研究》上发表了吕叔湘先生《大家来关心新词新义》的文章,语言文字应用研究所响应吕先生的号召专门成立了“新词新语新用法”课题组,着手搜集、研究新词语,我也参加了其中一部分工作。当然,我的主要任务并不在此,参与此课题只能利用闲暇时间顺手做一点儿。记得当时我们从读报、做卡片等基础训练入手,培养语感;书证和例句搜集得差不多了,就试着把研究心得整理成1000字左右的文章;随着“千字文”一篇一篇变成了铅字,我们积累的材料也慢慢多了起来,从中发现了一些带有规律性的东西,便着手撰写学术论文。进修结束回到原单位后,我有比较充裕的时间进行新词语研究了,于是边编写《新词新语词典》边写论文,不知不觉间居然积累了几十万字的成果,发表的论文也有10来篇。后来调京工作,虽然无法再专注于新词语研究,但是朋友们有新词语辞书问世时就喜欢找我写写书评,成立这方面研究的课题组时仍然愿意吸收我参加,包括周荐教授有关新词语的讨论也曾经几次邀我……这样我与新词语就结下了不解之缘。此次周荐兄命我作序,想想可能也正是基于本人的这些经历,想到此也就不便推辞了。
汉语年度新词语,既包含词,也包含语,还包含固有词语的新义、新用法。我一向认为:新词语研究可以有多种不同的形式和侧重点。考察可以是某一时段(一般以二三十年为宜,大约一代人为一个时段,比如改革开放以来至今可以作为一个时段)的,这类研究能够清晰地看出新词语的变化轨迹;考察也可以以一个年度为限,这类研究对新词语的新、异特征可能看得更明显一些。有计划、分年度地对汉语新词语进行动态滚动式的研究考察,既有社会语言学价值,又有汉语词汇学意义,是一项十分重要的基础性工作。
上世纪90年代初期,国家语委曾经启动过年度新词语研究项目,连续编纂、出版过4本年鉴式的《汉语新词语》工具书,使得我们对那一时段新词语的动态变化有了一本“账”。后来这项工作因故中断,我们对汉语新词语的动态变化轨迹看得就不那么清晰了。这项工作停顿下来十分可惜,因为这不仅使我们对汉语词汇最近发生过的动态变化轨迹不甚明了,也难以让我们为后人留下一份较为翔实客观的词汇变化资料,同时前面进行过的分年度新词语研究也因此而失去了它应有的分量。有鉴于此,国家语委科研规划领导小组办公室于2005年下半年重新启动了“新词语编年本”课题(项目编号BZ2005—09),具体研究工作由周荐教授领衔的“南开大学词汇学与词典学研究中心”承担。摆在读者面前的这本《2006汉语新词语》,就是这一项目的初步成果。
本项目语料的来源是:《新京报》《北京晚报》《中国体育报》《三联生活周刊》《新周刊》《北京青年报》《南方周末》《南方日报》《深圳特区报》《光明日报》《工人日报》《羊城晚报》《每日新报》《球迷报》《中国青年报》《参考消息》《作家文摘》《老年时报》《中国商报》《法制日报》《深圳晚报》《人民日报》《大河报》《今晚报》《新民晚报》《文汇报》《市场报》《半月谈》《扬子晚报》《华西都市报》《瑞丽》等30余份报刊,基本上照顾到了不同地区、不同性质的文本。此外,每一位参与研究的学者还通过网络查找新词语,利用百度、谷歌等搜索引擎查询每一个词语最初出现的时间,以确定、核查其新词语的身份。
抽取年度新词语,目前采取“先手工后机器”的方式。先由课题组成员按分工从报刊和网络上查找新词语,然后课题组定期研讨交流。待初步确定备选词条后,再请国家语言资源监测与研究中心的平面媒体、有声媒体和网络媒体的三个语言分中心借助国家语言资源动态流通语料库进行跨年度语料(主要是2005年度、2006年度的语料)的回查、验证,根据相应词条各自在不同年度语料中的频次和文本数,确定其是否具有该年度新词语的身份。回查的过程中,如果发现某词条在以往年度语料中曾经出现过,一般不再收入当年度的编年本中;但经查实确属新增的义项、用法的,尽管表面上看这个词语是“旧面孔”,也需要收入。比如,“晒”乍一看不是年度新词,但它在2006年度增加了“将私人生活的内容在网上公开,和网友们一起谈论”的义项,按规则便可收入。凡属旧词语而有新义、新用法者,本书都在该条目前加星号(*)以示区别。
抽选年度汉语新词语词条,最理想的方式是利用现代信息技术手段,在已经建立的国家语言资源动态流通语料库中自动提取。但囿于目前研究和技术手段的某些局限,计算机自动提取汉语新词语的研究尚未取得明显的进展和实质性的突破。国家语言资源监测与研究中心2006年下半年起已将此一课题列为研究任务,提上工作日程,加紧进行探索。期待通过语言研究工作者和中文信息学界的密切协作,联合攻关,能够最终实现较高水平的汉语新词语的自动提取,这将对“新词语编年本”课题的研制有更实质的帮助。
今年8月,教育部召开新闻发布会,国家语委公布了周荐教授和他的课题组的初步研究成果——171条2006年度汉语新词语的选目。作为尝试,这171条新词语虽然不能全面反映2006年度汉语新词语的全貌(一个年度产生的新词语绝不仅仅171条,课题组实际搜集、整理、研究的新词语也不止这171条),但这些条目都是经过层层筛选、过滤和语料库验证的,并非课题组妙手偶得,而是凝聚着几十位专家、学者的心血和学术智慧。将年度新词语发布出来,正是为了真实、客观、及时地反映语言生活的“实态”,引起人们对词语新质要素的关注,同时也是政府信息公开的一个重要举措。
此次《2006汉语新词语》结集出版,所收词条仍以正式公布的这171条新词语为蓝本。全书按音序排列,罗马字母打头的词语排在最前面,阿拉伯数字打头的词语次之,然后才是汉字构成的词语。每个词条都标注了汉语拼音注音和词性,并做了简要的提示性释义,附以例句作为书证。上述内容,为读者正确理解和认识新词语、共享语言信息资源提供了方便。
编撰新词语编年本是探索性科研活动,周荐教授和他的团队还会继续做下去。这样一年一年滚动编写、深入研究,哪些词语最终得以保留下来,哪些词语成了来去匆匆、昙花一现的过客,我们就会账目清楚,对新时代汉语词汇的变化轨迹也就会看得比较清楚一些。相信课题组一定会注意吸纳各方面的意见,及时总结经验,在前人已有工作的基础上有所创新,不断提升编年本的质量,为公众提供更为优质的语言服务。
王铁琨
2007年12月28日