复杂网络下社区检测算法的有效性评估

复杂网络下社区检测算法的有效性评估

论文摘要

复杂网络科学已经成为复杂系统问题研究的强有力工具,现实生活中存在很多复杂网络系统例如社交网络、生物网络、计算机通信网络等,几乎所有复杂系统都可以理解为由节点和其连接关系组成的网络。而对网络拓扑关系的研究,可以帮助我们发现一些更深层次的网络构造,进而更深刻地了解网络特性。社区检测就是一种典型的网络节点拓扑关系的聚类分析方法,通过社区挖掘算法对网络进行分割,可以发现网络中节点间的深层次关系、挖掘网络中蕴含的组织结构信息、揭示网络中存在的规律等,而对社区检测结果的分析又可以作为数据挖掘工作的理论支撑。总之对于社区检测算法的深入研究具有重要的理论和现实意义。在复杂网络社区挖掘领域,前人已经做过许多工作,提出了众多解决此类问题的算法,比如基于信息论的Infomap方法;基于非负矩阵分解的BigClam方法,可以提取网络中的重叠社区结构;基于模块度优化的方法如Louvain、Fastgreedy等,而这些方法在大部分网络上均可以产生较为理想的结果。但是,对于不同结构的网络,即产生于不同领域的网络,一些算法又具有一定的偏向性,例如基于模块度优化的方法存在分辨率限制的弊端。本文在现有理论研究的基础上,提出将社区检测方法进行归类研究,同时介绍属于该类主流的社区检测算法。由于不同算法在形成社区时的理论假设存在偏向性,导致不同的算法形成的社区结构多种多样。我们探究了其在不同领域、具有不同结构属性网络上的有效性以及偏向性。据此结果,我们给出了指导意见,对于给定网络,该如何选择性能最高的社区检测算法。具体而言,本文的主要工作包含以下几个方面:1.本文在现有社区检测理论的基础上,根据算法形成社区时理论假设的不同,提出将社区检测方法进行归类研究。主要包括以下5个类别:基于全局函数优化领域的方法、基于团的方法、基于局部扩散的方法、基于统计特性的方法以及基于节点相似性的方法。2.本文选取了社交网络、科学家协作网络中6种应用广泛且具有典型结构差异的网络,利用网络拓扑属性指标,统计不同网络在指标上的差异,并通过数理统计知识对结果进行呈现,观察分析不同网络在内部结构上的偏向性。3.本文提出通过精确度指标与拓扑属性指标相结合的方式对不同算法在网络中发现的社区进行综合评估。根据其结果的差异,总结相同范畴以及不同范畴算法在产生社区的相似性以及偏向性。根据实验得出的结果,我们给出详细的指导意见,对于不同规模、不同结构的复杂网络,该如何选择性能最高的社区检测算法。

论文目录

  • 摘要
  • ABSTRACT
  • 符号说明
  • 第一章 绪论
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •   1.3 论文研究内容
  •   1.4 文章结构
  • 第二章 相关知识介绍
  •   2.1 复杂网络基本概念
  •     2.1.1 复杂网络
  •     2.1.2 聚类系数
  •     2.1.3 网络密度
  •     2.1.4 社区结构
  •   2.2 社区检测算法的评估
  •     2.2.1 基于划分的精确度指标
  •     2.2.2 基于拓扑属性的指标
  •   2.3 社区检测算法的比较研究
  •     2.3.1 提取精度
  •     2.3.2 提取效率与社区的分布
  •     2.3.3 可扩展性
  •   2.4 社区检测的分类研究
  •     2.4.1 问题驱动视角
  •     2.4.2 社区形成形态
  •     2.4.3 社区结构属性
  •     2.4.4 社区结构优化目标
  •   2.5 本章小结
  • 第三章 社区检测方法的归类研究
  •   3.1 社区检测过程
  •   3.2 基于全局函数优化的思想
  •     3.2.1 基于Q函数优化的方法
  •     3.2.2 基于WCC优化的方法
  •   3.3 基于局部扩散的思想
  •   3.4 基于局部紧耦合结构的思想
  •   3.5 基于节点相似性的思想
  •     3.5.1 结构等价性(直接邻居决定相似度)
  •     3.5.2 可达性(间接邻居决定相似度)
  •   3.6 基于统计特性的思想
  •   3.7 本章小结
  • 第四章 数据集选取及实验结果分析
  •   4.1 实验数据集
  •   4.2 数据集预处理及结果分析
  •   4.3 实验环境介绍
  •   4.4 实验结果及分析
  •     4.4.1 传统的精确度指标
  •     4.4.2 拓扑指标的评估
  •     4.4.3 算法选取指导意见
  •   4.5 本章小结
  • 第五章 总结与展望
  •   5.1 本文总结
  •   5.2 下一步展望
  • 参考文献
  • 攻读硕士期间发表的论文
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 郑润

    导师: 李树青

    关键词: 复杂网络,社区挖掘,精确度指标,拓扑指标,数据挖掘

    来源: 南京财经大学

    年度: 2019

    分类: 基础科学

    专业: 数学

    单位: 南京财经大学

    分类号: O157.5

    DOI: 10.27705/d.cnki.gnjcj.2019.000205

    总页数: 57

    文件大小: 2517K

    下载量: 36

    相关论文文献

    • [1].操作系统常见的几种算法举例分析[J]. 湖北三峡职业技术学院学报 2010(02)
    • [2].一种改进的混合蝙蝠算法[J]. 南华大学学报(自然科学版) 2019(01)
    • [3].基于“反学习”理论的人工蜂群算法在订单分批问题中的应用[J]. 物流技术 2017(12)
    • [4].算法传播的风险批判:公共性背离与主体扭曲[J]. 华中师范大学学报(人文社会科学版) 2019(01)
    • [5].从算法伦理图谱揭示算法中的伦理悖论[J]. 传播力研究 2019(30)
    • [6].双核因素蝙蝠算法[J]. 中南民族大学学报(自然科学版) 2018(01)
    • [7].天空优化的数字图像暗通道先验去雾算法[J]. 激光与光电子学进展 2018(08)
    • [8].基于动态距离的模糊社区识别算法[J]. 计算机工程与应用 2019(21)
    • [9].基于动态参数的人工搜索群算法[J]. 控制与决策 2019(09)
    • [10].几种仿生优化算法综述[J]. 软件导刊 2019(02)
    • [11].ROHC算法在LWIP上的仿真与实现[J]. 计算机仿真 2017(12)
    • [12].基于改进K-SVD算法的傅里叶叠层成像识别技术研究[J]. 生命科学仪器 2018(06)
    • [13].大数据背景下的聚类算法的相关研究[J]. 电脑编程技巧与维护 2019(01)
    • [14].个性化经济中的算法规制和(不)完美执行[J]. 环球法律评论 2019(06)
    • [15].ISO 18000-6 Type C中的防冲突机制分析[J]. 广西科学院学报 2008(04)
    • [16].应用驱动的基于流式框架的实时数据分区算法[J]. 计算机应用研究 2018(04)
    • [17].基于改进投票专家算法的专有协议模糊测试方法[J]. 计算机工程与应用 2018(12)
    • [18].数字社会权力的来源:评分、算法与规范的再生产[J]. 交大法学 2019(01)
    • [19].一种改进的灰狼优化算法[J]. 电子学报 2019(01)
    • [20].基于PMVS算法的古建筑虚拟重建研究[J]. 计算机仿真 2019(08)
    • [21].基于向量化稀疏重构解相干改进算法[J]. 空军预警学院学报 2018(01)
    • [22].单调链与二分法的Douglas-Peucker改进算法[J]. 测绘科学 2019(02)
    • [23].分层递进的改进聚类蚁群算法解决TSP问题[J]. 计算机科学与探索 2019(08)
    • [24].基于z值的分布式密度峰值聚类算法[J]. 电子学报 2018(03)
    • [25].基于CamShift改进算法的人脸跟踪识别系统[J]. 山西电子技术 2018(03)
    • [26].基于DP-TBD的分布式异步粒子滤波融合算法[J]. 现代雷达 2018(10)
    • [27].无人驾驶碰撞算法的伦理立场与法律治理[J]. 法制与社会发展 2019(05)
    • [28].基于KNN算法的改进K-means算法[J]. 青岛科技大学学报(自然科学版) 2019(05)
    • [29].一种并行ACS-2-opt算法处理TSP问题的方法[J]. 计算机科学 2018(S2)
    • [30].基于局部划分的匿名算法研究[J]. 计算机应用研究 2019(10)

    标签:;  ;  ;  ;  ;  

    复杂网络下社区检测算法的有效性评估
    下载Doc文档

    猜你喜欢