[目的/意义]为增强叙词表实用性,需要不断地将领域中出现的新术语更新到叙词表中,更新维护过程中,从时间及词频等角度对新术语分布特征进行探索研究,可以为新术语发现方法提供参考。[方法/过程]基于新术语相关特征,结合对应文档频率在时间点和时间段上的发展分布,通过相关统计分析,研究术语在不同成长时期的分布特征,尤其界定术语在开始期与成长期的分布差异。[结果/结论]实证分析表明新术语一般处于术语发展的成长期,当候选新术语保持正向增长趋势超过一定年限,可以认为该术语同时具有新颖性、时间持续性及术语性特征。基于该分布特征进行领域新术语的识别,结合词表编制专家的判断,该方法在新术语收录判断中具有较高的准确率,且能有效识别实际应用中占比较多的低频词。
类型: 期刊论文
作者: 雷晓,常春,刘伟
关键词: 叙词表更新,新术语,时间分布,文档词频分布
来源: 图书情报工作 2019年20期
年度: 2019
分类: 信息科技
专业: 图书情报与数字图书馆
单位: 中国科学技术信息研究所
基金: 国家社会科学基金项目“面向知识组织系统的新术语抽取研究”(项目编号:16BTQ087),国家科技图书文献中心“下一代国家科技创新知识服务开放系统”先期研发任务课题“STKOS超级科技词表内容建设机制与发展研究(工学部分)”(项目编号:XQYF0101-2)研究成果之一
分类号: G254.24
DOI: 10.13266/j.issn.0252-3116.2019.20.014
页码: 121-128
总页数: 8
文件大小: 721K
下载量: 129
本文来源: https://www.lunwen66.cn/article/2468f17d63f8b67e129ba65c.html