汉语内层最长名词短语的识别研究

汉语内层最长名词短语的识别研究

论文摘要

汉语名词短语的内部结构复杂,找出名词短语内部嵌套的最长名词性成分,有助于消解底层句法歧义,挖掘论元结构和语义关系。文章分析了汉语内层最长名词短语的多层级分布特征,指出数据稀疏、结构歧义和边界歧义是识别的难点,并提出了一种基于条件随机场模型和基本名词块提升规则的识别方法,取得了85.23%的结构正确率和78.71%的结构召回率。实验结果表明,上层结构误识、联合结构、"v n n"格式、De后主谓结构和特殊歧义序列等造成的歧义是制约识别效果的主要原因。解决这些问题需要更多句法语义知识的参与,如在词汇层面收录含v简单组块,在句法层面引入句法规则验证机制等。

论文目录

  • 一、引言
  • 二、iMNP的层级分布
  • 三、iMNP识别的难点与策略
  •   (一)识别难点
  •   (二)识别策略
  • 四、多层级iMNP识别
  •   (一)系统流程
  •   (二)特征及标记集
  • 五、基于规则的修正
  •   (一)iMNP与基本名词块
  •   (二)基本名词块提升规则
  •     1. 上下文提升规则
  •     2. 限制性规则
  •     3. 结构化提升规则
  •   (三)识别算法
  • 六、实验结果及分析
  •   (一)多层级iMNP识别效果及分析
  •   (二)基本名词块提升规则的修正效果及分析
  • 七、结语
  • 文章来源

    类型: 期刊论文

    作者: 钱小飞

    关键词: 内层最长名词短语,识别,条件随机场,基本名词块提升

    来源: 浙江外国语学院学报 2019年06期

    年度: 2019

    分类: 社会科学Ⅱ辑,哲学与人文科学,信息科技

    专业: 中国语言文字,计算机软件及计算机应用

    单位: 上海大学文学院

    分类号: TP391.1;H136

    页码: 59-67

    总页数: 9

    文件大小: 1640K

    下载量: 10

    相关论文文献

    标签:;  ;  ;  ;  

    汉语内层最长名词短语的识别研究
    下载Doc文档

    猜你喜欢