基于动态组织膜系统的谱聚类集成算法研究与应用

基于动态组织膜系统的谱聚类集成算法研究与应用

论文摘要

随着信息时代到来,数据量激增,数据复杂度高,如何从这些数据中挖掘有用信息正成为数据挖掘的一个重要研究方向。聚类研究是数据挖掘的一个主要方法,是一种有效分析数据、挖掘有效信息的方式。传统的聚类算法如k均值算法、k中心点算法等在处理日渐复杂的数据时显得力不从心。谱聚类是一种建立在图论基础上的新型聚类算法,近年来谱聚类算法因其具有坚实的理论基础和优异的聚类效果吸引了越来越多的学者对其进行研究。但是只采用一种聚类算法通常无法处理各类异构数据集和计算过程中面对的问题。聚类集成的思路是通过一定的方式整合多个学习器产生的基聚类以产生新的聚类结果,因其结合了学习器的差异性和精确性,所以集成算法泛化能力强,生成聚类结果更优。膜计算是仿照生物细胞膜工作机制提出的一种高效、新颖的计算模型,它涉及计算科学与生命科学两大领域,是一门综合学科。本文主要对谱聚类算法、谱聚类集成算法以及膜计算进行了研究,具体研究内容如下:首先,介绍了本文涉及到的膜计算、谱聚类算法、聚类集成算法的研究现状及国内外研究趋势。细胞型膜系统、组织型膜系统和神经型膜系统三种膜计算模型的结构、规则;图划分准则、谱聚类概述;聚类集成算法原理、学习器合并策略以及各自研究应用和本文的创新的与难点。其次,本文提出两种新型组织型膜系统—动态组织膜系统(Dynamic Tissue-like Membrane System,简称DTP系统)和混合型动态组织膜系统(Hybrid Dynamic Tissue-like Membrane System,简称HDTP系统)。前者可以根据输入数据调用膜内规则动态调整结构,实现自动聚类;后者在DTP系统基础上将组织型膜系统与细胞型膜系统结合,使之成为适合聚类集成算法的结构。同时利用寄存器证明了DTP系统和HDTP系统的图灵可计算性。然后,提出两种基于膜系统的聚类算法。第三章提出基于动态组织膜系统的改进谱聚类算法(Improved Spectral Clustering Algorithm,简称为ISC算法),将基本谱聚类算法中用到的K-means算法初始点的选取方法进行了优化,使K-means算法不易受初始聚类中心和离群点的影响提高算法准确性,并将改进算法与膜系统结合,用实验证明改进算法在聚类准确性和处理球面数据集方面的优越性。第四章以ISC算法为学习器,利用Bagging技术和选择性集成策略设计了基于Bagging技术的改进谱聚类选择性聚类集成算法(Improved Spectral Clustering Selective Clustering Ensemble Algorithm Based on Bagging Technology,简称为ISCBE算法),再将此算法与HDTP系统结合,利用其并行计算优势提高算法有效性。本章将HDTP-ISCBE算法与DTP-ISC算法、谱聚类算法及K-means算法进行比较,在UCI数据集上显示出较好的聚类效果。最后,本文将提出的HDTP-ISCBE算法应用到微博用户和小红书用户细分研究中,用网络爬虫软件分别爬取两个平台用户数据,对数据进行清洗、编码、特征选择等一系列操作后利用HDTP-ISCBE算法对数据进行聚类,以聚类效果衡量算法效率,从实际意义方面分析细分后用户类型的特征,以此为依据为企业针对不同类型微博用户设计营销方案提出意见与建议。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究课题背景和意义
  •   1.2 国内外研究现状
  •     1.2.1 膜计算模型研究现状
  •     1.2.2 谱聚类算法研究现状
  •     1.2.3 聚类集成算法研究现状
  •     1.2.4 组织型膜系统与聚类分析研究现状
  •   1.3 理论概述
  •     1.3.1 谱聚类概述
  •     1.3.2 膜系统概述
  •     1.3.3 聚类集成算法概述
  •   1.4 论文主要研究内容及框架结构
  •     1.4.1 论文的主要内容框架
  •     1.4.2 论文的创新点与难点
  • 第2章 结构可变的动态组织膜系统
  •   2.1 基于结构可变的动态组织膜系统(DTP系统)
  •     2.1.1 DTP系统规范化表示
  •     2.1.2 DTP系统结构设计
  •   2.2 DTP系统计算能力分析
  •     2.2.1 寄存器
  •     2.2.2 计算能力证明
  •   2.3 混合型DTP系统(HDTP系统)
  •     2.3.1 HDTP系统规范化表示
  •     2.3.2 HDTP系统结构设计
  • 第3章 基于DTP系统的自动谱聚类算法
  •   3.1 改进谱聚类算法(ISC算法)
  •   3.2 基于DTP系统的自动谱聚类算法(DTP-ISC算法)
  •     3.2.1 DTP系统规则设计
  •     3.2.2 DTP-ISC算法流程
  •   3.3 实验分析
  • 第4章 基于ISC算法的聚类集成算法
  •   4.1 基于Bagging技术的自动谱聚类集成算法(ISPBE算法)
  •     4.1.1 学习器设计及集成方法
  •     4.1.2 ISCBE算法设计
  •   4.2 基于HDTP系统的ISCBE算法(HDTP-ISCBE算法)
  •     4.2.1 HDTP-ISCBE算法基本思想
  •     4.2.2 HDTP系统规则设计
  •     4.2.3 HDTP-ISCBE算法基本流程
  •   4.3 实验分析
  • 第5章 HDTP-ISCBE算法在用户细分问题上的应用研究
  •   5.1 用户细分问题描述与评价指标选取
  •     5.1.1 用户细分问题描述
  •     5.1.2 评价指标选取
  •   5.2 新浪微博用户细分问题分析
  •     5.2.1 数据来源
  •     5.2.2 数据预处理
  •     5.2.3 实验结果与分析
  •   5.3 小红书用户细分问题分析
  •     5.3.1 数据来源
  •     5.3.2 数据预处理
  •     5.3.3 实验结果与分析
  • 第6章 总结与展望
  •   6.1 论文总结
  •   6.2 进一步研究工作展望
  • 参考文献
  • 攻读硕士期间发表的学术论文和参加科研情况
  • 攻读硕士期间获得奖励
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 胡雪伟

    导师: 刘希玉

    关键词: 膜计算,谱聚类,选择性聚类集成,用户细分

    来源: 山东师范大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 山东师范大学

    分类号: TP311.13;Q811.4

    总页数: 75

    文件大小: 2239K

    下载量: 54

    相关论文文献

    • [1].双图约束谱聚类中的数据不相似图构造[J]. 信息工程大学学报 2017(05)
    • [2].基于谱聚类的多视角聚类算法[J]. 河南教育学院学报(自然科学版) 2018(01)
    • [3].利用谱聚类发现符号化时间序列中的模式[J]. 九江职业技术学院学报 2017(02)
    • [4].融合多特征和谱聚类集成的图像分割方法[J]. 信阳师范学院学报(自然科学版) 2017(04)
    • [5].基于谱聚类带有节点特征的社区发现算法[J]. 中国科学技术大学学报 2018(02)
    • [6].基于半监督谱聚类集成的售后客户细分[J]. 计算机工程与应用 2020(02)
    • [7].一种快速确定聚类中心的光谱聚类方法[J]. 太原科技大学学报 2020(06)
    • [8].谱聚类广义模型和典型算法探析[J]. 通讯世界 2016(23)
    • [9].基于模糊谱聚类的电力系统客户分群算法(英文)[J]. 机床与液压 2020(06)
    • [10].基于谱聚类的二分网络社区发现算法[J]. 计算机科学 2019(04)
    • [11].融入局部几何特征的流形谱聚类图像分割[J]. 模式识别与人工智能 2020(04)
    • [12].基于谱聚类的自适应新生目标强度状态提取[J]. 计算机工程与设计 2019(03)
    • [13].基于马尔科夫判别谱聚类的极化SAR图像分类方法[J]. 雷达学报 2019(04)
    • [14].一种适用于大规模数据的约束谱聚类框架[J]. 信息工程大学学报 2018(04)
    • [15].基于线性谱聚类的林地图像中枯死树监测[J]. 林业科学 2019(04)
    • [16].基于谱聚类的访问控制异常权限配置挖掘机制[J]. 通信学报 2017(12)
    • [17].稀疏谱聚类方法及应用[J]. 兰州大学学报(自然科学版) 2017(05)
    • [18].基于协同谱聚类的推荐系统托攻击防御算法[J]. 北京邮电大学学报 2015(06)
    • [19].一种谱聚类灰度纹理图像分割方法及其在近红外成像仿真中的应用[J]. 红外技术 2018(04)
    • [20].基于信号传递的半监督谱聚类社区发现算法[J]. 计算机工程与设计 2018(05)
    • [21].谱聚类在给水管网分区优化中的应用[J]. 土木建筑与环境工程 2016(06)
    • [22].一种基于谱聚类算法的高光谱遥感图像分类方法[J]. 中国科学院大学学报 2019(02)
    • [23].仿射传播和谱聚类的船舶轨迹聚类[J]. 河南科技大学学报(自然科学版) 2018(01)
    • [24].基于谱聚类的多目标进化社区发现算法研究[J]. 计算机科学 2020(S1)
    • [25].改进谱聚类与遗传算法相结合的电力时序曲线聚类方法[J]. 电力自动化设备 2019(02)
    • [26].利用稀疏自编码的局部谱聚类映射算法[J]. 传感器与微系统 2018(01)
    • [27].基于谱聚类的全局中心快速更新聚类算法[J]. 计算机与现代化 2018(10)
    • [28].基于谱聚类集成的变压器在线故障诊断[J]. 电子学报 2017(10)
    • [29].用于癌症亚分型的生物医学大数据谱聚类技术研究[J]. 科学技术创新 2018(16)
    • [30].改进的谱聚类图像分割方法[J]. 计算机工程与应用 2011(21)

    标签:;  ;  ;  ;  

    基于动态组织膜系统的谱聚类集成算法研究与应用
    下载Doc文档

    猜你喜欢