学科分类
/ 1
2 个结果
  • 简介:现代汉语词语搭配识别是汉语信息处理的研究热点。动词次范畴作为一种重要的语法信息,也是词语搭配识别的一种有效的先验知识,将成为统计方法和语义分析的有益补充。本文将动词划分为24个次范畴,并给出了次范畴标记,主张通过清华树库、语法信息词典等现有研究成果,将定性与定量研究相结合,构建搭配专用的动词次范畴信息库,进一步提高语法知识在搭配识别中的利用效率。

  • 标签: 词语搭配 动词次范畴 信息处理
  • 简介:英语人名的汉译名(CTEN)识别是未登录词中专有名词识别的重要内容。在英汉平行语料库的加工中,CTEN的识别成绩大大影响了其中汉语文本的分词和词性标注精确率。基于CTEN用字与英语人名字母串的音字匹配思想,本文运用平行处理法,在10万句对的大规模英汉平行语料中作了CTEN识别,精确率为99.46%,召回率为92.88%,F值为96.06%。

  • 标签: 英语入名 汉译名 平行语料 自动识别 中文信息处理