显示全部序言
北京语言大学语言信息处理(后为应用语言学)研究所所长张普教授,早在上个世纪70年代就步入了中文信息处理工作的领域,当时他在武汉大学中文系任教,他与计算机系的一些老师一起利用计算机编纂文学名著语言资料索引,以供汉语研究和汉语辞书编纂之用。1983年第一本为计算机编纂的现代汉语语言资料索引《<骆驼祥子>逐字索引》问世,吕叔湘先生还专门为之写序,给予充分肯定。但是他真正专注动态语言更新研究,那是上个世纪80年代中期之后。引发他从事这一研究的,是日本语言学者引例看重所引文本的印数、发行量、销售排行榜上的位置之举。他开始意识到关注动态语言知识更新的重要。
1986年他由武汉大学转到北京语言学院(北京语言大学的前身)任教,由他实际主持北京语言学院刚成立的语言信息处理研究所的工作(研究所成立的第一年学校聘请北京大学马希文教授任所长),从事中文信息处理的研究教学工作。这使他能更多地了解国际上和中国国内自然语言处理的进展情况,也更有条件来思考动态语言知识更新的问题。上个世纪90年代初,他向学校提出建立“大规模现代汉语动态语料库”计划,以进行语言动态更新的研究。此计划得到北京语言学院领导和校内外专家学者的一致支持。但真要建设一个“大规模现代汉语动态语料库”谈何容易,必须有人力、财力的支持,更要有理论的准备。为此,张普教授一方面注意物色人才,并努力争取校方的财力支持,另一方面广泛向业内专家学者虚心请教,并认真查阅有关文献资料,进行理论武装。进入21世纪,随着“DCC博士研究室”(DCC是英文Dynamic Circulating Corpus的缩写,意为“动态流通语料库”)的成立,随着他所带的一届届博士研究生的入学,通过网上下载的方式,逐步形成基于报纸语料的“现代汉语动态流通语料库”。所选取的报纸是发行排行榜上前100种里发行量最大的报纸(先选取了10种,后又增至15种)。这使动态语言知识更新的研究有了基本的保证。在有关方面的支持下,他们开展了“中国主流报纸十大流行语跟踪与发布研究”,从2002年开始每年发布一次,受到广泛的重视;2004年,北京语言大学又和教育部语信司合作共建了“国家语言资源监测与研究中心平面媒体分中心”,这使动态语言知识更新的研究进入了良性发展的新时期。20多年来,张普教授不仅自己,而且带领一批年轻学子,耕耘不止,撰写、发表了一篇又一篇有关动态语言知识更新的学术论文,为中文信息学界和现代汉语学界所瞩目。现在,呈现在读者面前的《动态语言知识更新研究》一书,就是他对自己所撰写、发表的有关这方面内容的文章精选、结集而成的。正文分“思考篇”、“控制论篇”、“理论篇”、“应用篇”四个部分,外加一个“附录”。这可以看做是他对动态语言知识更新研究的阶段性总结。他将自己的论文结集成书后,要我为书写序。我不好推辞,因为我是他在北大念书时的老师,给他们班讲授过“现代汉语”课,还跟他们班一起外出进行过田野调查。但是,也让我感到为难,因为我对动态语言知识更新问题,不要说没有任何研究,而且知之甚少。在这方面,应该说张普是我的老师。......
1986年他由武汉大学转到北京语言学院(北京语言大学的前身)任教,由他实际主持北京语言学院刚成立的语言信息处理研究所的工作(研究所成立的第一年学校聘请北京大学马希文教授任所长),从事中文信息处理的研究教学工作。这使他能更多地了解国际上和中国国内自然语言处理的进展情况,也更有条件来思考动态语言知识更新的问题。上个世纪90年代初,他向学校提出建立“大规模现代汉语动态语料库”计划,以进行语言动态更新的研究。此计划得到北京语言学院领导和校内外专家学者的一致支持。但真要建设一个“大规模现代汉语动态语料库”谈何容易,必须有人力、财力的支持,更要有理论的准备。为此,张普教授一方面注意物色人才,并努力争取校方的财力支持,另一方面广泛向业内专家学者虚心请教,并认真查阅有关文献资料,进行理论武装。进入21世纪,随着“DCC博士研究室”(DCC是英文Dynamic Circulating Corpus的缩写,意为“动态流通语料库”)的成立,随着他所带的一届届博士研究生的入学,通过网上下载的方式,逐步形成基于报纸语料的“现代汉语动态流通语料库”。所选取的报纸是发行排行榜上前100种里发行量最大的报纸(先选取了10种,后又增至15种)。这使动态语言知识更新的研究有了基本的保证。在有关方面的支持下,他们开展了“中国主流报纸十大流行语跟踪与发布研究”,从2002年开始每年发布一次,受到广泛的重视;2004年,北京语言大学又和教育部语信司合作共建了“国家语言资源监测与研究中心平面媒体分中心”,这使动态语言知识更新的研究进入了良性发展的新时期。20多年来,张普教授不仅自己,而且带领一批年轻学子,耕耘不止,撰写、发表了一篇又一篇有关动态语言知识更新的学术论文,为中文信息学界和现代汉语学界所瞩目。现在,呈现在读者面前的《动态语言知识更新研究》一书,就是他对自己所撰写、发表的有关这方面内容的文章精选、结集而成的。正文分“思考篇”、“控制论篇”、“理论篇”、“应用篇”四个部分,外加一个“附录”。这可以看做是他对动态语言知识更新研究的阶段性总结。他将自己的论文结集成书后,要我为书写序。我不好推辞,因为我是他在北大念书时的老师,给他们班讲授过“现代汉语”课,还跟他们班一起外出进行过田野调查。但是,也让我感到为难,因为我对动态语言知识更新问题,不要说没有任何研究,而且知之甚少。在这方面,应该说张普是我的老师。......