导读:本文包含了关键词集论文开题报告文献综述及选题提纲参考文献,主要关键词:文献计量,关键词集,词频,共现网络
关键词集论文文献综述
袁润,李莹,王婧怡[1](2019)在《作者关键词集的文献计量分析——以图情学科为例》一文中研究指出[目的/意义]以图情学科为例,探索作者关键词集的特征,为这一层面的知识挖掘提供一个新的视角。[方法/过程]提出作者关键词集的概念,以图情领域的18种CSSCI源刊10年内的全部论文为研究对象,采用R语言编程技术,生成作者关键词数据集,包含作者发文量、关键词总量、关键词种数、低频关键词占比、中频关键词占比、高频关键词占比、Top关键词、关键词集的相似度、关键词共现网络参数等,探索作者关键词集的词频、相似性比较和共现网络。[结果/结论]图情学科作者的关键词特征为低频关键词占比较高,高频关键词占比较低,相对分散。同时指出作者关键词集能够表征作者研究主题和兴趣,借助作者关键词集相似度指标,可以构建作者共现网络,而作者关键词共现网络中心性指标可以揭示作者研究领域、研究主题或研究方向。(本文来源于《图书情报研究》期刊2019年01期)
袁润,李莹,王琦,王婧怡[2](2018)在《用R语言分析关键词集共现网络研究》一文中研究指出[目的/意义]提出关键词集的概念,探索R语言编程实现关键词集共现网络的创建和可视化,为进一步研究基于关键词集的数据挖掘和知识发现提供更为通用的途径和方法。[方法/过程]运用R语言编程技术及igraph等贡献包,自编了关键词集共现网络的创建和可视化函数,分析了图情学科领域的18种CSSCI源刊的载文数据。[结果/结论]计算了关键词集共现网络的中心性等特征参数,绘制了关键词集共现网络图。研究表明,关键词集共现网络揭示了关键词集的分布、聚类和关系特征,能更为直观的揭示分析对象的主题内容及其关联关系,其特征参数的构建及其表征等理论问题值得系统而深入的研究。(本文来源于《现代情报》期刊2018年07期)
李莹[3](2018)在《面向图书馆学科服务的关键词集及其网络分析研究》一文中研究指出我国的图书馆学科服务不断发展,随着数据环境和用户需求的演变,图书馆需可以通过提供更加丰富的数据资源、数据产品、数据工具等等,以满足用户日益增长的信息需求。关键词是作者精炼出的概括文章主题的词汇,是研究者对主要研究内容、主要学术思想、主要研究方法的高度概括~([1])。本研究通过文献综述,梳理了国内外学科服务模式和关键词分析的相关理论和方法。并借鉴国内外关键词分析经验,在目前关键词分析及其相关概念的基础上,以学术论文中不可缺少的“关键词”为切入点,提出了关键词集的概念。基于cssci十八种核心期刊10年中的学术论文,并按照“学科——期刊——论文——关键词”这一逻辑关系采集数据,构建图情领域核心期刊关键词集。首先对采集的关键词集进行计量分析,在词频分析的基础上,初步探讨了词序信息、词长信息等,丰富了关键词计量分析。并借鉴社会网络分析(SNA)理论,以作者、期刊、机构等微观视角构建关键词集共现网络,计算了网络特征参数,网络中关键词的中心度和网络的密度聚类系数等。最后利用R语言编程技术,对关键词集共现网络进行了可视化处理,构造了关键词集的特征“画像”,将抽象的数据服务理论具象到应用层面,为知识挖掘提供了一个新的视角。对关键词集深入研究,能够有效把握该学科的整体现状与研究特征。本文以图情学科为例,以期通过设计一套通用的流程和计算机编程方法并将之推广到更多学科,不断丰富图书馆学科服务。(本文来源于《江苏大学》期刊2018-04-01)
李湘东,曹环,丁丛,黄莉[4](2015)在《利用《知网》和领域关键词集扩展方法的短文本分类研究》一文中研究指出【目的】实现短文本特征扩展,提高短文本分类性能。【方法】按照特征词和隐含主题两种特征粒度,分别抽取训练集中各类别的高频词和主题核心词作为领域关键词集。利用概率主题模型提取待分类文本的主题概率分布,将概率大于某一阈值的主题对应的关键词扩展到待分类文本中。借助《知网》计算待分类文本与各领域关键词集的语义相似度。【结果】与LDA模型的短文本分类算法相比,本文提出的分类算法在复旦语料、Sogou语料和微博语料上的Macro_F1分别平均提高4.9%、5.9%和4.2%,在Micro_F1上分别平均提高4.6%、6.2%和2.8%。而与VSM的短文本分类算法相比,本文方法在各语料上都提高13%以上。且实验证明结合领域高频词和主题核心词的特征扩展方法的分类性能优于仅使用领域高频词或主题核心词进行特征扩展的方法。【局限】短文本中存在很多《知网》未收录的特征词,无法利用《知网》计算相似度,影响分类效果。【结论】本文方法能有效提高短文本分类性能。(本文来源于《现代图书情报技术》期刊2015年02期)
许爱琴,王梦洁,刘永坚,王卫华[5](2013)在《一种新的生成候选关键词集的方法》一文中研究指出在传统的基于N-Gram法提取西文候选关键词集的基础上,提出了根据关键单词集的前后拓展产生候选关键词的算法,并与现存的N-Gram法对比,发现其将生成的候选关键词集的大小减小了将近1/2以上,并且没有增加计算复杂性,这对以后的特征工程计算具有重要意义。(本文来源于《武汉理工大学学报(信息与管理工程版)》期刊2013年06期)
关键词集论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
[目的/意义]提出关键词集的概念,探索R语言编程实现关键词集共现网络的创建和可视化,为进一步研究基于关键词集的数据挖掘和知识发现提供更为通用的途径和方法。[方法/过程]运用R语言编程技术及igraph等贡献包,自编了关键词集共现网络的创建和可视化函数,分析了图情学科领域的18种CSSCI源刊的载文数据。[结果/结论]计算了关键词集共现网络的中心性等特征参数,绘制了关键词集共现网络图。研究表明,关键词集共现网络揭示了关键词集的分布、聚类和关系特征,能更为直观的揭示分析对象的主题内容及其关联关系,其特征参数的构建及其表征等理论问题值得系统而深入的研究。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
关键词集论文参考文献
[1].袁润,李莹,王婧怡.作者关键词集的文献计量分析——以图情学科为例[J].图书情报研究.2019
[2].袁润,李莹,王琦,王婧怡.用R语言分析关键词集共现网络研究[J].现代情报.2018
[3].李莹.面向图书馆学科服务的关键词集及其网络分析研究[D].江苏大学.2018
[4].李湘东,曹环,丁丛,黄莉.利用《知网》和领域关键词集扩展方法的短文本分类研究[J].现代图书情报技术.2015
[5].许爱琴,王梦洁,刘永坚,王卫华.一种新的生成候选关键词集的方法[J].武汉理工大学学报(信息与管理工程版).2013