论文摘要
汉语名词短语的内部结构复杂,找出名词短语内部嵌套的最长名词性成分,有助于消解底层句法歧义,挖掘论元结构和语义关系。文章分析了汉语内层最长名词短语的多层级分布特征,指出数据稀疏、结构歧义和边界歧义是识别的难点,并提出了一种基于条件随机场模型和基本名词块提升规则的识别方法,取得了85.23%的结构正确率和78.71%的结构召回率。实验结果表明,上层结构误识、联合结构、"v n n"格式、De后主谓结构和特殊歧义序列等造成的歧义是制约识别效果的主要原因。解决这些问题需要更多句法语义知识的参与,如在词汇层面收录含v简单组块,在句法层面引入句法规则验证机制等。
论文目录
文章来源
类型: 期刊论文
作者: 钱小飞
关键词: 内层最长名词短语,识别,条件随机场,基本名词块提升
来源: 浙江外国语学院学报 2019年06期
年度: 2019
分类: 社会科学Ⅱ辑,哲学与人文科学,信息科技
专业: 中国语言文字,计算机软件及计算机应用
单位: 上海大学文学院
分类号: TP391.1;H136
页码: 59-67
总页数: 9
文件大小: 1640K
下载量: 10
相关论文文献
标签:内层最长名词短语论文; 识别论文; 条件随机场论文; 基本名词块提升论文;