面向叙词表更新的新术语分布特征研究

面向叙词表更新的新术语分布特征研究

论文摘要

[目的/意义]为增强叙词表实用性,需要不断地将领域中出现的新术语更新到叙词表中,更新维护过程中,从时间及词频等角度对新术语分布特征进行探索研究,可以为新术语发现方法提供参考。[方法/过程]基于新术语相关特征,结合对应文档频率在时间点和时间段上的发展分布,通过相关统计分析,研究术语在不同成长时期的分布特征,尤其界定术语在开始期与成长期的分布差异。[结果/结论]实证分析表明新术语一般处于术语发展的成长期,当候选新术语保持正向增长趋势超过一定年限,可以认为该术语同时具有新颖性、时间持续性及术语性特征。基于该分布特征进行领域新术语的识别,结合词表编制专家的判断,该方法在新术语收录判断中具有较高的准确率,且能有效识别实际应用中占比较多的低频词。

论文目录

  • 1 相关研究
  •   1.1 候选术语获取
  •   1.2 新词识别判断
  • 2 新术语相关特征及成长分布特征
  •   2.1 新术语相关特征
  •   2.2 基于新颖性及时间持续性的新术语时间分布特征
  •   2.3 基于术语性的新术语文档词频分布特征
  •   2.4 4个不同类别术语的分布特征
  • 3 实证与分析
  •   3.1 数据来源介绍
  •   3.2 新术语分布特征验证
  •   3.3 基于分布特征的新术语识别
  • 4 结论与展望
  • 文章来源

    类型: 期刊论文

    作者: 雷晓,常春,刘伟

    关键词: 叙词表更新,新术语,时间分布,文档词频分布

    来源: 图书情报工作 2019年20期

    年度: 2019

    分类: 信息科技

    专业: 图书情报与数字图书馆

    单位: 中国科学技术信息研究所

    基金: 国家社会科学基金项目“面向知识组织系统的新术语抽取研究”(项目编号:16BTQ087),国家科技图书文献中心“下一代国家科技创新知识服务开放系统”先期研发任务课题“STKOS超级科技词表内容建设机制与发展研究(工学部分)”(项目编号:XQYF0101-2)研究成果之一

    分类号: G254.24

    DOI: 10.13266/j.issn.0252-3116.2019.20.014

    页码: 121-128

    总页数: 8

    文件大小: 721K

    下载量: 129

    相关论文文献

    标签:;  ;  ;  ;  

    面向叙词表更新的新术语分布特征研究
    下载Doc文档

    猜你喜欢