欢迎光临商务印书馆,返回首页
图书搜索:

动态语言知识更新研究 平装

分享到:

定价:¥25.00

  • 出版时间:2009年05月本印时间:2009年05月
  • 版次:1印次:1页数:403页
  • 开本:32
  • ISBN:978-7-100-05925-1
  • 主题词:动态语言知识更新研究
  • 人气:186

显示全部序言

  北京语言大学语言信息处理(后为应用语言学)研究所所长张普教授,早在上个世纪70年代就步入了中文信息处理工作的领域,当时他在武汉大学中文系任教,他与计算机系的一些老师一起利用计算机编纂文学名著语言资料索引,以供汉语研究和汉语辞书编纂之用。1983年第一本为计算机编纂的现代汉语语言资料索引《<骆驼祥子>逐字索引》问世,吕叔湘先生还专门为之写序,给予充分肯定。但是他真正专注动态语言更新研究,那是上个世纪80年代中期之后。引发他从事这一研究的,是日本语言学者引例看重所引文本的印数、发行量、销售排行榜上的位置之举。他开始意识到关注动态语言知识更新的重要。
  1986年他由武汉大学转到北京语言学院(北京语言大学的前身)任教,由他实际主持北京语言学院刚成立的语言信息处理研究所的工作(研究所成立的第一年学校聘请北京大学马希文教授任所长),从事中文信息处理的研究教学工作。这使他能更多地了解国际上和中国国内自然语言处理的进展情况,也更有条件来思考动态语言知识更新的问题。上个世纪90年代初,他向学校提出建立“大规模现代汉语动态语料库”计划,以进行语言动态更新的研究。此计划得到北京语言学院领导和校内外专家学者的一致支持。但真要建设一个“大规模现代汉语动态语料库”谈何容易,必须有人力、财力的支持,更要有理论的准备。为此,张普教授一方面注意物色人才,并努力争取校方的财力支持,另一方面广泛向业内专家学者虚心请教,并认真查阅有关文献资料,进行理论武装。进入21世纪,随着“DCC博士研究室”(DCC是英文Dynamic Circulating Corpus的缩写,意为“动态流通语料库”)的成立,随着他所带的一届届博士研究生的入学,通过网上下载的方式,逐步形成基于报纸语料的“现代汉语动态流通语料库”。所选取的报纸是发行排行榜上前100种里发行量最大的报纸(先选取了10种,后又增至15种)。这使动态语言知识更新的研究有了基本的保证。在有关方面的支持下,他们开展了“中国主流报纸十大流行语跟踪与发布研究”,从2002年开始每年发布一次,受到广泛的重视;2004年,北京语言大学又和教育部语信司合作共建了“国家语言资源监测与研究中心平面媒体分中心”,这使动态语言知识更新的研究进入了良性发展的新时期。20多年来,张普教授不仅自己,而且带领一批年轻学子,耕耘不止,撰写、发表了一篇又一篇有关动态语言知识更新的学术论文,为中文信息学界和现代汉语学界所瞩目。现在,呈现在读者面前的《动态语言知识更新研究》一书,就是他对自己所撰写、发表的有关这方面内容的文章精选、结集而成的。正文分“思考篇”、“控制论篇”、“理论篇”、“应用篇”四个部分,外加一个“附录”。这可以看做是他对动态语言知识更新研究的阶段性总结。他将自己的论文结集成书后,要我为书写序。我不好推辞,因为我是他在北大念书时的老师,给他们班讲授过“现代汉语”课,还跟他们班一起外出进行过田野调查。但是,也让我感到为难,因为我对动态语言知识更新问题,不要说没有任何研究,而且知之甚少。在这方面,应该说张普是我的老师。......

显示全部后记

  现在,这本论文集终于算是杀青了。
  我在三月写本书《前言》时说:“DCC博士研究室对词语的稳态部分的研究可以说是由史艳岚博士开始的。她在2006年毕业。”并且那时我还说:“真正专门研究词语的稳态也就是常态部分的,是2007年即将毕业的赵小兵博士和韩秀娟博士。”“当然,这些也仍然是对现代汉语字词语的稳态考察的发端而不是终结。”我一边指导她们的博士论文研究,一边写作《论稳态》一文,没想到我的论文集还没有出版,甚至《论稳态》还没有完成,而她们两个都已经完成了博士论文并顺利通过了答辩,获得博士学位了。
  不是她们做得太快了,更不是她们做得草率了,而是我放慢了节奏。正如我在前言中说的:“我目前的健康状况,确实不再允许只争朝夕。再争下去,就会朝不保夕。”“但是,不争朝夕,绝不是止步不前,只是需要‘稳态’。要用稳态作为常态来代替过去的非常态。”“按照控制论,稳态,是健康态,稳态前进,是健康前进。我们得学会自我‘控制’。你不能在朝夕之间做太多的事,世上自有后来人,让后人去做,会做得更好。”
  时间真是过得太快了,我的确是不能再等待后续的论文发表了。《动态语言知识更新研究》论文集必须结束并且发稿了。在3月完成《前言》之后,4、5、6三个月,主要做了两件事:第一件,今年要毕业的学生,博士论文和硕士论文必须按时送出审查,按时答辩;今年报考的博士和硕士要在这个期间完成考试和录取;还有明年准备毕业的博士和硕士要完成中期考核和开题。每年这个时期都是唱的“急急风”,有人称为“黑五月”,样样事情都是“稳不得也莫哥”。第二件,是对两项已经到期的研究课题进行验收和结题,其中就有“流行语跟踪研究”的课题。既然是“到期”的研究项目,当然也是“稳不得也”。做老师的人,教学生,做科研,这两件事就是本职工作了。尽管《论稳态》应该收入本书的“第二部分控制论篇”,并且是控制论部分的很重要的核心概念,但是唯一可以“稳得”的就是它了,谁让《论稳态》的核心就是一个“稳”字呢?我必须先完成唱“急急风”的那些事情。
  书稿还在推进,只是插空来进行了。
  我在3月初将《前言》写完的时候,请北京语言大学出版社退休的资深编审陈华兰老师帮我审读《动态语言知识更新研究》全书,并经商务印书馆的总经理助理周洪波同意,按照商务印书馆的体例提出修改意见。4、5、6三个月,除了忙上面的教学和科研的本职任务之外,就是和陈华兰编审一起将书稿又细细地过滤了三遍。在我健康的情况下,这件事情本来应该进行得更快一些,但是现在,一忙起来,我除了保证正常的教学科研任务之外,唯一可以压缩或暂停的就是减少我应该写的论文和整理准备出版的论文集了。
  陈老师很快就审读完毕第一遍,并提出了修改的建议,主要是我随后的修改延误了时间。经过我们的三次审议,书稿从最初的26万字压缩、修订到21.4万字,减少了4.6万字;书中的相关图表从45幅压缩为29幅,减少了16幅。……

显示全部作者简介

  张普,男,1966年北京大学中文系语言专业毕业。北京语言大学教授,博士生导师,获国务院特殊津贴。中文教学现代化学会理事长、中国中文信息学会常务理事。
  曾参加《汉语大字典》编纂,教授《现代汉语》、 《汉语信息处理概论》等课程。研究涉及汉字编码、汉字字形库建造,汉字部件分析统计、汉语语料库的建设、汉语自动分词、汉语古籍整理研究现代化等领域。在北京语言大学期间主要从事普及型汉字输入方法研究、汉语信息处理术语国家标准研制、汉字部件国家标准研制、信息处理用现代汉语语义分析、多媒体光盘评价、汉语教学课件制作、网络远程汉语教学等领域的研究。著有《汉语信息处理研究》、 《汉字编码键盘输入文集》等,主编《中华小百科全书•语言文字分卷》、 《对外汉语教学与现代化教育技术》等。
  近10年来致力动态流通语料库建设和国家语言资源监测与研究,提出了“共时中有历时和历时中有共时”的“相对时间观”以及计算机的“语感模拟”等创新观点,在动态流通语料库建设的理论、方法论、实践方面均有建树。

显示全部内容简介

  本书是北京语言大学张普教授的第三部个人选集,收录了他的与“动态语言知识更新”研究有关的论文19篇,附录7篇。从第一篇发表到最后一篇写成,跨度10年。但是,如果从有想法算起,到付诸实践,到将阶段论文结集出版,前后却历经25年(参见前言)。   26篇论文分为5个部分:   第一部分 思考篇(5篇)   第二部分 控制论篇(4篇)   第三部分 理论篇(4篇)   第四部分 应用篇(6篇)   第五部分 附录篇(7篇)   五个部分涉及作者在总结上个世纪国内外语言资源建设的基础上,对新世纪的语言资源研究的深入思考,并分别论述了对“动态语言知识更新”研究的理论、方法论、实践和相关的研究与成果。在此期间作者负责建立了北京语言大学的应用语言学研究所,特别是建立了以“动态语言知识更新”研究为主要目标的“DCC博士研究室”,DCC即为英文Dynamic Circulating Corpus(动态流通语料库)的缩写。同时在此基础上,在教育部语信司和北京语言大学的领导与支持下,建立了“国家语言资源监测与研究中心”的第一家分中心——平面媒体分中心。   本书的创新点主要就在于作者力主建立“动态流通语料库”;在语言研究的时间观的争议中,强调历时研究与共时研究双重(音zhong),并基于现代大众传媒的发展,提出“共时中有历时和历时中有共时”的“相对时间观”;对于语感进行了一些基本分类,包括对于个人语感和大众语感、共同语感和差别语感、语感的空间特征和语感的时间特征等分类,提出通过测量大众传媒的流通度这个“白箱”来相似计算大众语感这个“黑箱”,提出计算机的“语感模拟”,把重要的语言规律“约定俗成”推向可计算。   尽管已经过去25年,但作者认为动态语言知识更新的思考、理论、方法、实践还是初步的,未臻成熟。不过,毕竟对语言的动态部分(例如新词新语新义、流行语、字母词语、术语等)和语言的稳态部分(例如通用词语、基本词汇、基本字集等)的监测和研究都已经开始,并引起了国内外的关注。   本书对语言研究、应用语言学研究,特别是对于语言规划、语言规范化、社会语言学、计算语言学的研究,对词典编纂、语言教学、汉语海外传播、语言信息处理、自然语言理解等方面均有参考价值。

显示全部目 录


前言

第一部分 思考篇
关于大规模真实文本语料库的几点理论思考
关于语感与流通度的思考
关于网络时代语言规划的思考
信息处理用语言知识动态更新的总体思考
关于汉语语料库的建设与发展问题的思考

第二部分 控制论篇
控制论与语言学的关系极其密切——主持人的话
关于控制论与动态语言知识更新的思考
关于种族信息量的测定与语感模拟
关于“约定俗成”的约定俗成

第三部分 理论篇
语言信息处理领域的一个新的命题——主持人的话
论历时中包含有共时与共时中包含有历时
关于动态语言知识更新与流通度问题
当前字、词、语量化研究的五个深化方向

第四部分 应用篇
1997中文报纸媒体流通度分析
流通度在IT术语识别中的应用分析
       ——关于术语、术语学、术语数据库的研究
基于DCC的流行语动态跟踪与辅助发现研究
“突发事件”专题解读
       ——兼评“2004中国主流报纸十大流行语”发布
2005新增“教育类”“安全专题”“联合国专题”解读
  ——兼评“2005春夏季中国主流报纸十大流行语”
字母词语的考察与研究问题

第五部分 附录篇
语言的意义及其获取
关于“监控语料库”的评述
古代汉语语料库建设
现代汉语语料库建设
汉语字频和词频研究
论多媒体技术在语言信息处理中的作用
语言的多媒体性与多媒体语言知识的作用
参考文献
后记