citespace知网数据去重
2022-12-19阅读(864)
问:citespace不同关键词如何筛选重复
- 答:单击CNKIFomatConversion(2.0)按钮进行删选,就可以在output文件夹里面自动生成筛选后的txt文件。
对将要分析的数据进行时区分隔,其中yearsperslice指按多少年进行切割。对于参考文献和施引文献,前者的时间段和时间切片的设置要比后者更加丰富,时间切片的不同会影响到突发性探测的结果,显著性较强的节点受到的影响会比较小。
Citespace是一款基于Java语言开发的引文可视化分析软件,它能帮助我们挖掘到热门主题、关键性文献,分析出某领域的发展历程。其灵感来源于库恩的《科学革命的结构》“科学研究的重点随着时间变化有时比较迟缓,有时比较剧烈”。由于是通过可视化的手段呈现科学知识的结构、规律和分布情况,因此最后得到的可视化图形被称为“科学知识图谱”。
问:citespace多少数据合适
- 答:200条以上数据,效果会比较好。
citespace去重操作前,需建两个文件夹。“input”文件夹放待去重数据,“output”文件夹放去重后的数据。具体去重操作为:
(1)点击软件菜单栏的“data”,继续点击“import/export”。
(2)选择“WOS”,导入“input”及“output”路径,点击remove duplicates进行去重。
将得到的去重数据(output文件夹中),复制粘贴到“data”文件夹,完成去重步骤。
问:citespace去重后后的数据为什么timeslicing不对
- 答:使用版本的bug,可以在创建project时将数据来源改为CSSCI即可。
时间分割(TimeSlicing)包括时间跨度和时间分区长度2项参数。时间跨度指定引文发表的年份(PY字段值)范围,取值由引文年份分布和分析者所关注的时间段决定。时间分区长度是对整个时间跨度的划分,以年为单位,最短为一年,最长到整个时间跨度,建议采用等长时间分区(年数除以时间分区长度为整数),在时间分区内引文按阈值独立筛选,各时间分区阈值可不同,这取决于阈值的设置方式。