欢迎光临商务印书馆,返回首页
图书搜索:

现代汉字特征分析与计算研究 平装

分享到:

定价:¥15.00

  • 著者:3791 
  • 出版时间:2007年07月本印时间:2007年07月
  • 版次:1印次:1页数:225页
  • 开本:32册数:2
  • ISBN:7-100-05310-2/H•1277
  • 读者对象:高校中文系师生,语言研究者
  • 主题词:现代汉字特征分析计算研究
  • 人气:121

显示全部后记

  从1990年开始,我就跟随我的硕士导师张普教授从事语言信息处理方面的研究工作,特别是汉字字形方面的研究工作,至今已积累了大量的数据库资源。这期间,我也参与了大量的语料库的建设与加工研究,并积累了一定的来源于语料库的相关统计数据,这些资源是我后一阶段汉字计算机模拟研究中的表征研究的基础。
  从1998年开始,我进入北京师范大学心理学院学习,师从舒华教授,期间有幸能够到美国里士满大学进修,跟随李平教授学习计算机模拟研究。这期间我曾经利用将近一年的时间致力于汉字字形的表征研究,并将该研究成果运用到基于自组织模型的计算机模拟研究中。2002年发表的汉字计算机模拟研究的文章曾经获得过专门奖励在读研究生的马尔奖的提名奖。
  2004年《认知科学杂志》(Journal of Cognitive Science)发表了我和舒华教授、李平教授合作的论文"The acquisition of Chinese characters:Corpus analyses and connectionist simulations",审稿的专家和编辑都希望能够有专门的文章详细介绍关于汉字表征的方法。从2004年初开始,我就着手对这两方面的研究进行整理。至今已经完成,希望通过这本专著使更多的人能够了解汉字的字形特征和汉字计算机模拟研究,也希望更多的人能够关注汉字字形表征方法,并能够运用到相关研究之中。
  本书分为两部分:汉字字形特征分析和汉字形声字命名的计算机模拟研究。这两部分内容也是笔者两个阶段主要研究成果的总结。上编的内容主要是基于统计的汉字属性研究,这部分内容主要来源于我十几年来汉字字形的研究积累,下编是在我的博士毕业论文的基础上写成的,特别是模拟研究,基本保持原貌。
  本书的研究内容是一种跨学科的研究,能够取得这样的一点成绩,首先我要感谢我的导师张普教授,张先生不仅领着我走进了中文信息处理这个领域,我还跟随张先生在这个领域默默耕耘了十几年。我也要感谢我的博士导师舒华教授,舒先生眼界开阔、思维敏锐、治学严谨、为人正直,是我治学道路上永远的楷模。我要感谢美国里士满大学的李平教授,是他使我获得了将我积累的计算机资源应用到对我来说是一个全新的领域——计算机模拟研究的机会,我们面对面在餐桌上、在汽车里讨论着关于模型的训练方法和汉字字形的表征问题,那情景终生难忘。在那里,我不仅学到了计算机模型相关的知识,更重要的是开阔了眼界。
  感谢商务印书馆为本书提供了出版的机会,感谢商务印书馆的周洪波先生在本书的修改和出版过程中给予的支持和帮助,感谢责任编辑余桂林先生认真细致地进行编辑工作。北京语言大学的王建勤教授对我的汉字表征研究和计算机模拟研究给予了高度的关注,并鼓励我将相关的内容整理出版。由于作者水平有限,不足之处在所难免,恳请读者批评指正。
       邢红兵
       2007年2月

显示全部内容简介

  该书从汉字字形特征的统计属性研究出发,详细分析了汉字的特点及其使用情况,同时借助于数据库的方法,统计了五套小学语文教材的分布情况。在此基础上,结合心理学的实验研究结果,将这些知识运用到计算机模拟研究中,并对2万汉字进行完全表征。

显示全部目 录

上编 汉字的特征分析
第一章 汉字的使用
  1.1 汉字的字量
  1.2 汉字字集
    1.2.1 “GBl3000.1字符集”
    1.2.2现代汉语常用字表
    1.2.3 “现代汉语研究语料库系统”汉字
    1.2.4小学语文教材汉字
  1.3 汉字的使用
    1.3.1 从小学语文教材看汉字的使用
    1.3.2从语料库看汉字的使用
第二章 汉字字形特征
  2.1 汉字的笔画
    2.1.1 汉字的笔形
    2.1.2汉字的笔画数
    2.1.3 汉字笔画趋简率
  2.2 汉字的基础部件
    2.2.1部件的类型
    2.2.2基础部件的数量
    2.2.3 成字部件和非成字部件
    2.2.4基础部件的构字能力
    2.2.5 基础部件的典型位置
    2.2.6基础部件的构形
  2.3 汉字的构造
    2.3.1 汉字的结构类型
    2.3.2汉字的结构层次
    2.3.3汉字的构造
第三章 汉字形声字声旁表音研究
  3.1 汉字的构字法
  3.2 形声字声旁表音的统计研究
  3.3 小学语文教材形声字表音情况分析
    3.3.1 小学语文教材形声字数据库的建立
    3.3.2 小学语文教材形声字数量
    3.3.3 小学语文教材形声字的使用
    3.3.4 小学语文教材形声字的家族
    3.3.5 小学语文教材形声字的表音特点
第四章 形声字的认知研究
  4.1 早期的汉字认知研究
  4.2 80年代以后的汉字认知研究
    4.2.1 汉字的构成成分和汉字的正字法规则
    4.2.2 汉字的亚词汇加工
    4.2.3汉字的语音意识
    4.2.4儿童发展性阅读障碍
  4.3 形声字字音加工的认知研究
    4.3.1 形声字的规则性效应及其发展
    4.3.2形声字的一致性效应及其发展

下编 汉字的计算与模拟研究
第五章 联结主义理论和自组织模型
  5.1 语言习得理论
  5.2 联结主义理论
  5.3 神经网络模型
    5.3.1 主要的神经网络模型
    5.3.2 神经网络的学习
    5.3.3 神经网络中的信息表征
  5.4 自组织理论
    5.4.1 自组织模型简介
    5.4.2 赫布学习法
  5.5 语言习得的自组织模型
    5.5.1 DISLEX及其相关研究
    5.5.2 DevLex及其相关研究
  5.6 汉字命名的计算机模拟研究
    5.6.1 模型的结构
    5.6.2 汉字字形字音的表征
    5.6.3 模型的模拟结果
第六章 汉字表征研究
  6.1 汉字字形的表征方法
    6.1.1 前期研究
    6.1.2 汉字字形表征
  6.2 汉字字音的表征方法
  6.3 形声字字形的复合表征
第七章 自组织模型的建造
  7.1 模拟软件DISLEX
  7.2 汉字表征数据库及表征程序
    7.2.1 汉字属性数据库
    7.2.2 基础部件属性数据库
第八章 形声字命名的计算机模拟研究
  8.1 汉字输入、输出词典中字形、字音的储存方式
    8.1.1 主要术语和参数说明
    8.1.2 前期研究
  8.2 形声字命名模拟研究
    8.2.1 模型命名形声字的策略
    8.2.2 模型命名形声字的规则性效应及其发展
    8.2.3 模型命名形声字的一致性效应及其发展
  8.3 计算机模拟研究的本质特征
    8.3.1 语言材料库的建设及其在模型中的应用
    8.3.2 汉字的字形和字音的表征
    8.3.3 模型的知识获得和知识输出
    8.3.4 进一步的研究

参考文献
附录1:《信息处理用GB 13000.1字符集汉字部件规范》中的“基础部件表”
附录2:部件视觉属性分组
附录3:汉语音素表征方法及赋值表
附录4:模型文件样例
附录5:五年级模型命名不熟悉形声字测试材料
附录6:模型命名形声字的规则性效应及其发展测试材料
附录7:模型命名形声字的一致性效应及其发展测试材料
后记