显示全部编辑推荐
基于模糊等价矩阵的传递闭包法对古汉语同义词的模糊聚类分析
本书属于跨学科研究,模糊数学和古代汉语同义词的现有研究都比较成熟,以模糊数学的角度对词语义素分析结果进行量化表达,在研究方向和理路上较为新颖。这种对同义词相似程度进行量化和形式化描述的研究,或可对帮助计算机处理机器翻译和信息检索等的语言信息服务,有一定的推动作用。
定价:¥78.00
基于模糊等价矩阵的传递闭包法对古汉语同义词的模糊聚类分析
本书属于跨学科研究,模糊数学和古代汉语同义词的现有研究都比较成熟,以模糊数学的角度对词语义素分析结果进行量化表达,在研究方向和理路上较为新颖。这种对同义词相似程度进行量化和形式化描述的研究,或可对帮助计算机处理机器翻译和信息检索等的语言信息服务,有一定的推动作用。
从模糊数学的视角来看,语言中词语的同义关系属于模糊相似关系,具有自反性和对称性,因此可以此为前提,运用模糊聚类分析法来揭示一组同义词聚合的层次性。在本书前三章中,作者介绍了模糊聚类分析法的原理、目前古代汉语同义词研究的现状,以及将该分析法应用到同义词研究中的具体步骤;第四章中,作者基于王凤阳教授的著作《古辞辨》,择取其中三大类共十八组古代汉语同义词进行了模糊聚类分析。
第一章 绪 论
所谓聚类分析,就是用数学的方法对事物按一定的要求进行分类。在模糊数学产生之前,聚类分析已是数理统计多元分析的一个分支,有着广泛的实际应用。聚类的实质就是把具有相似性质的事物区分开来,传统的聚类分析是一种硬划分,即把每个待辨识的对象严格地划分到某类中,具有非此即彼的性质。然而在现实世界中,特别是在社会、经济、哲学、心理、教育等人文学科当中,大多数对象并没有严格的类属特性,它们在性态和类属方面存在着位于两个极点之间的中间状态,即具有亦此亦彼的性质,国外有人把这些学科称为“软科学”,因此更适合进行软划分。事实上,“这些学科之所以难于运用数学,不是因为它们太简单而没有资格运用数学,恰恰相反,是因为它们所面对的系统太复杂而找不到适当的数学工具。其中最关键的问题就是在这些系统中大量存在模糊性”。当模糊理论由美国系统控制论专家扎德(L.A.Zadeh)于1965年首次提出后,“模糊数学的一条重要的历史使命就是要为各门学科、尤其是人文学科提供新的数学描叙的语言和工具,使软科学研究定量化”。在这样的背景下,模糊聚类分析法也就应运而生了。
应用模糊数学的理论和方法,在模糊相似关系的基础上所进行的聚类分析,称为模糊聚类分析。模糊聚类分析的基本思想是:首先将所研究的n个样本各自分为一类,然后计算它们之间的相似程度或距离,并将最相似(或距离最短)的两类归为新的一类,如此反复进行,直到所有样本都归为一类为止。迄今为止,模糊聚类分析法已在诸多领域得到了广泛应用,比如模式识别、图像处理、信道均衡、天气预报、灾害预测、环境保护、食品分类、地质研究、石油与天然气勘探、工程设计、经济管理、医学诊断等等。
人文学科对模糊聚类分析法的应用较少,因为人文学科中的研究对象一般不是用数据信息来刻画的,这一点不同于自然学科,也成了我们选用数学方法来进行研究的障碍。一旦我们意识到这个问题,就可以想办法将研究对象具有模糊性的表征信息数量化,从而为传统的研究方法开辟新的道路。
模糊聚类分析法要求以模糊相似关系为前提,我们认为,语言中的同义词就符合条件,即从模糊数学的视角来看,词语之间的同义关系首先是一种模糊关系,其次它具有自反性和对称性,属于模糊相似关系,可以尝试使用模糊聚类分析法。本书以此为切入点,重点论述了对语言学当中的词汇现象使用模糊聚类分析法的可行性,以及使用这种新方法获得的不同
以往的新发现。
模糊聚类分析法原则上适用于语言中所有的同义词,本书选择古代汉语同义词作为研究对象,现代汉语同义词的模糊聚类分析是我们下一步的研究目标。对同义词进行模糊聚类分析,我们认为主要有以下几个方面的意义和价值。
首先,可以揭示出同义词聚合的层次性。以往对同义词的研究只停留在判断某词与某词是否具有同义关系上,通过对同义词进行模糊聚类分析,我们可以发现,处于同一个同义聚合体中的各个词语,它们相互之间的聚合并不在同一平面上,而是有着不同的层次。模糊聚类分析法不仅揭示出了这种聚合层级的存在,而且还可以确定出每一层的聚合水平值,使我们能够对词语的同义现象有更为深入的认识,这对汉语词汇研究本身是一个补充和突破。
其次,研究词语的聚合可以为词语的组合提供选择。组合关系的每个位置上可能会出现的词要到有关的聚合里去选择,一般而言,组合上的不同要从聚合上去找原因。在同义词这个聚合体中,并不是每个成员都能出现在不同组合关系的同一位置上,这是因为同义词之间存在着差异。通过对同义聚合体中的词语进行义素分析,我们可以清楚地看到这种差异并分
析造成这种差异的原因,进而满足不同组合的需要。
最后,可以用数值精确表示出同义词之间的相似程度,从而帮助计算机处理语言信息服务。在机器翻译和信息检索领域,同义词之间的差异规定着词语在翻译和检索中可以相互替换的程度:差异大的,词语可替换的程度就低;差异小的,词语可替换的程度就高。这种差异实际上反映了同义词之间的相似程度。我们对该相似程度进行了量化和形式化的描述,这样就可以把自然语言转化为机器能够识别的形式语言,从而实现计算机对同义词的信息处理。
……
京ICP备05007371号|京ICP证150832号|京公网安备 11010102001884号 版权所有 2004 商务印书馆
地址: 北京王府井大街36号|邮编:100710|E-mail: bainianziyuan@cp.com.cn
产品隐私权声明 本公司法律顾问: 大成律师事务所曾波律师