欢迎光临商务印书馆,返回首页
图书搜索:

语料库语言学

分享到:

定价:¥15.00

  • 出版时间:2007年07月
  • 页数:288页
  • ISBN:7-100-03364-0
  • 主题词:语料库语言学
  • 人气:128

显示全部出版说明

<FONT size=3><STRONG>      “语言与计算机”丛书出版说明
</STRONG></FONT>
  商务印书馆在1997年提出了出版“语言与计算机”丛书的设想。这套丛书共包括《中文文本自动分词和标注》、《计算语言学基础》、《机器翻译》和《语料库语言学》等。作者承担了《中文文本自动分词和标注》的编纂任务。1998年5月中旬在京召开了丛书样稿讨论会。关于“语言与计算机”丛书的定位问题,经过讨论,大家认为本套丛书应是有一定学术性、一定专业水平的读物,是大专院校语言文字应用、计算机应用等专业师生、语言文字和计算机工作者及大专以上文化程度读者的参考书。清华大学黄昌宁教授针对编辑这套丛书的意图,作了进一步的深化和明确的论述,他指出:这套丛书实际上是一座桥梁,它把语言学和计算机科学紧密地联系在一起,一方面向语言学工作者介绍语言学知识在计算机领域中的应用,计算机研究和处理语言现象、语言信息的方法及成果;一方面把计算机处理各种语言信息过程中遇到的语言学方面的问题、难题告诉语言学工作者,把更多的语言学工作者吸引到这一领域来,使之为解决计算机处理中的语言学问题提供更多的、更有针对性的帮助,从而促进计算语言学的发展。
  作者从事语言信息处理的教学与研究已有近二十年的历史,先后多次得到国家863智能机主题组和国家自然科学基金、国家社会科学基金、国家语委等资助,并长期得到中国中文信息学会理事、中国工程院资深院士陈力为教授,以及国内外计算语言学界同行的支持与帮助,取得了一些较满意的研究成果。借此机会,归纳并吸收了国内外最近的研究成果,整理成了这份资料。在体系和取材上,遵循理论上系统、科学,技术上先进、可行,论点正确,论据翔实、可靠等基本原则。在写作风格上,力求做到通俗易懂。考虑到读者的接受能力,对复杂的计算模型和计算技术问题,伴有语言例证,尽量简化处理。初稿完成于1999年初,由于教材上的需要,先行少量装订成册,一方面供我们研究生、本科生教学上使用,便于征求他(她)们的意见,另一方面可以请国内有关专家提出审阅意见。1999年末,参照中文信息处理一年来的最新进展和Internet上wordnet和hownet等在线词典的最新资料,并参考各方面的建议,重新进行整理,并在某几个章节上做了较大的修改和补充。
  本书编写过程中正值著名语言学家许嘉璐教授主持的国家“九五”社科基金重大课题《信息处理用现代汉语词汇研究》启动,作者有幸承担了《歧义切分和专名识别软件》子课题,得到一次研究和学习的机会。在此同时,我们承担了国家社科基金“九五”规划重点课题《中文信息处理用词性、词的切分》,历时三年,已经圆满结题并取得了可喜成果。这些研究为本书的编写作了关键性的支持。另外冯志伟教授、王惠临研究员审阅了本书初稿,并提出许多宝贵意见。责任编辑刘玲女士在书稿内容及其出版方面都做了精细的工作。山西大学郑家恒教授、周晓强、谭红叶、李鑫、李竟、雒自清等师生都为本书的编写工作提供了许多帮助,我谨在此一并表示深深地感谢。
  由于作者水平有限,遗漏和错误难免,殷切希望读者批评指正。

                   山西大学计算机科学系 刘开瑛
                            2000年元月

显示全部内容简介

  语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。本书将系统地介绍语料库语言学这门新兴学科的研究内容和方法,既包括用计量方法来研究词汇学、词典编纂学、语法学和语义学等方面的内容,也包括语言素材的计量与计算的运用,开发众多的自然语言信息处理系统。主要章节有:语料库语言学研究的现状与展望,语料库的设计与开发,语料库的加工和管理技术,基于语料库语言学研究,语料库方法在计算语言学中的应用。

显示全部目 录

第1章 绪论
 第一节 什么是语料库?什么是语料库语言学?
 第二节 语料库语言学的发展历史
 第三节 语料库语言学的发展方向及前景
 第四节 计算机在语料库语言学中的作用
 第五节 语料库语言学的研究内容
 第六节 本书的编排

第2章 语料库的设计与开发
 第一节 语料库设计和编纂中的问题
 第二节 建设一个语料库
 第三节 语料库的类型
 第四节 国外语料库介绍
 第五节 汉语语料库的建设

第3章 语料库的加工和管理技术
 第一节 语料的索引及其应用
 第二节 语料库语言学中的统计
 第三节 逐词索引软件及其应用
 第四节 语料库标注

第4章 基于语料库方法的语言学研究
 第一节 语言研究中的语料库方法
 第二节 现代汉语句型统计与研究
 第三节 词典学研究
 第四节 汉语名词的语义分类研究
 第五节 词汇一语法问题调查
 第六节 语域变体(register variation)研究

第5章 语料库方法在计算语言学中的应用
 第一节 汉语文本中交集型切分歧义的研究
 第二节 汉语基本名词短语识别研究
 第三节 基于结构词义空间的汉语词义排歧模型

附录 词性标记集

参考文献