论文摘要
实体关系抽取的目标在于探测实体之间的显式关系和隐式关系.现有研究大多集中在显式实体关系抽取,而忽略了隐式实体关系抽取.针对旅游和新闻领域文本经常包含许多由协陪义动词引发的隐式实体关系,本文研究了基于协陪义动词的中文隐式实体关系抽取问题.将机器学习方法与规则相结合,借助于显式实体关系对隐式实体关系进行推理.首先,利用依存句法分析,设计了协陪义候选句型分类算法以及相应的协陪义成分识别算法;其次,根据协陪义成分和协陪义动词作用范围的特点,设计了三种句内基于协陪义动词的隐式实体关系推理规则;最后,利用协陪义句中零形回指的先行词,建立不同句子中协陪义动词的主体成分与客体成分之间的联系,实现句间基于协陪义动词的隐式实体关系抽取.另外,本文还提出了趋向核心动词特征提取算法,进一步提高了动词特征对显式实体关系抽取的效果.基于真实的旅游领域和新闻领域文本数据集进行了详细的实验测试,实验结果表明了方法的有效性.
论文目录
文章来源
类型: 期刊论文
作者: 万常选,甘丽新,江腾蛟,刘德喜,刘喜平,刘玉
关键词: 关系抽取,隐式关系,协陪义动词,显式关系,动词特征
来源: 计算机学报 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 江西财经大学信息管理学院,江西财经大学数据与知识工程江西省高校重点实验室
基金: 国家自然科学基金项目(61562032,61662027,61173146,61363039,61363010,61462037),江西省自然科学基金项目(20152ACB20003,20161BAB202057),江西省高等学校科技落地计划项目(KJLD12022,KJLD14035),江西省教育厅科技研究项目(GJJ150819,GJJ160783),江西省高校人文社会科学研究项目(JC161001)资助~~
分类号: TP391.1;TP181
页码: 2795-2820
总页数: 26
文件大小: 2561K
下载量: 382