基于模糊技术的空间co-location模式挖掘研究

基于模糊技术的空间co-location模式挖掘研究

论文摘要

随着全球定位系统的不断发展和移动设备的迅速普及,基于位置信息的空间数据呈爆炸式增长。与传统数据相比,空间数据表示的语义信息更加丰富,形式和性质也更为复杂,使得空间数据挖掘相较于传统的事务数据挖掘更富挑战性。为了从海量空间数据中发现有用的知识,从而对人类的生产生活加以指导,空间数据挖掘应运而生。空间co-location模式挖掘是空间数据挖掘中的一个分支,主要目的是挖掘在空间中具有并置(co-located)关系的空间特征的集合,挖掘空间co-location模式在空间决策、智慧城市建设、环境保护等领域具有重要的作用。传统co-location模式挖掘框架存在诸多局限性。第一,传统co-location模式挖掘框架使用单一的邻近阈值来判定空间邻近关系,这会造成邻近关系的丢失,也没有考虑距离大小的不同对实例间邻近程度的影响。第二,传统co-location模式挖掘框架使用最小参与度衡量co-location模式的频繁性,会导致挖掘不出带稀有特征的co-location模式,同时算法对最小参与度非常敏感。为了解决以上传统co-location模式挖掘框架带来的局限,基于“物以类聚”的原理,Huang等人提出了采用聚类算法将邻近程度高的特征聚集在一起的方法,然而该方法提出的描述特征间相关程度的度量值与co-location模式的定义不甚相符,同时该方法采用的凝聚层次聚类算法也存在不具有再分配性,类簇间不重叠等问题,会影响聚类结果的准确性,因此凝聚层次聚类算法不适用于co-location模式的挖掘。针对上述问题,考虑到邻近是一个模糊的概念,本文将模糊集理论引入到了co-location模式挖掘中。首先,提出了一种能解决传统0-1邻近关系问题的邻近关系度量——模糊邻近关系;其次提出了模糊邻近度的定义,此度量不仅满足了co-location模式的定义,其具有的非负有界性、对称性、非自反性等性质,也使其能很好地应用在特征聚类算法中;同时,由于模糊聚类算法具有重叠聚类和模糊隶属等优点,本文提出了基于模糊聚类算法的co-location模式挖掘算法——FCB算法,并在初始聚类中心选取、最佳分类数确定等方面也做了有意义的尝试;最后,在模拟数据集和真实数据集上进行了广泛的实验,证明了提出的挖掘算法的实用性和高效性,同时证明了算法对阈值的敏感度较低,拥有较高的鲁棒性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 研究背景和意义
  •   1.2 研究现状
  •     1.2.1 空间co-location模式挖掘
  •     1.2.2 模糊集理论与模糊聚类
  •   1.3 本文贡献
  •   1.4 本文组织结构
  • 第二章 背景知识
  •   2.1 空间co-location模式挖掘基础
  •     2.1.1 相关定义
  •     2.1.2 经典co-location模式挖掘方法
  •   2.2 模糊集理论和模糊聚类算法
  •     2.2.1 模糊集理论
  •     2.2.2 模糊C中心点聚类算法
  •   2.3 本章小结
  • 第三章 基于模糊邻近关系和模糊聚类的空间co-location模式挖掘
  •   3.1 相关定义
  •   3.2 挖掘算法FCB
  •     3.2.1 算法形式化定义
  •     3.2.2 初始聚类中心选取
  •     3.2.3 聚类结果选取
  •     3.2.4 最佳分类数确定
  •     3.2.5 阈值选取策略
  •   3.3 本章小结
  • 第四章 实验评估
  •   4.1 实验环境
  •   4.2 实验数据
  •   4.3 真实数据集上的挖掘结果分析
  •     4.3.1 在北京POI数据集上的挖掘结果分析
  •     4.3.2 在高黎贡山植被数据集上的挖掘结果分析
  •   4.4 阈值对FCB算法的影响
  •     4.4.1 距离阈值对算法效率的影响
  • μ阈值和minfp阈值对算法效率的影响'>    4.4.2 minμ阈值和minfp阈值对算法效率的影响
  •   4.5 本章小结
  • 第五章 总结与展望
  • 参考文献
  • 在学期间研究成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 雷乐

    导师: 王丽珍

    关键词: 空间模式,模糊集理论,模糊邻近关系,模糊聚类

    来源: 云南大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 云南大学

    分类号: TP311.13;O159

    总页数: 62

    文件大小: 3457K

    下载量: 29

    相关论文文献

    • [1].面向校园超市交易数据的判别模式挖掘与分析[J]. 电子制作 2020(10)
    • [2].对比模式挖掘研究进展[J]. 科研信息化技术与应用 2017(05)
    • [3].对比模式挖掘研究进展[J]. 网络安全技术与应用 2017(01)
    • [4].空间同位模式挖掘研究进展[J]. 地理空间信息 2013(06)
    • [5].基于时空数据的城市人流移动模式挖掘[J]. 计算机科学 2020(10)
    • [6].基于自适应分段粒度的时空模式挖掘方法[J]. 计算机应用研究 2018(03)
    • [7].时空轨迹数据智能处理与模式挖掘技术研究[J]. 电信快报 2018(07)
    • [8].用户日常频繁行为模式挖掘[J]. 国防科技大学学报 2017(01)
    • [9].时间序列周期模式挖掘算法分析[J]. 中国管理信息化 2016(03)
    • [10].基于频繁特征模式挖掘的期货市场单边运行深度的预测[J]. 中国管理信息化 2015(17)
    • [11].基于频繁项集的条件模式挖掘[J]. 计算机工程与设计 2009(16)
    • [12].基于显露模式挖掘的反恐情报分类对比分析[J]. 现代情报 2020(05)
    • [13].基于到达时间的行为模式挖掘[J]. 计算机与数字工程 2020(09)
    • [14].交通数据的时空并置模糊拥堵模式挖掘[J]. 清华大学学报(自然科学版) 2020(08)
    • [15].分布式事务型内嵌树模式挖掘[J]. 武汉大学学报(理学版) 2018(06)
    • [16].基于密度约束和间隙约束的对比模式挖掘[J]. 计算机科学 2018(04)
    • [17].垂直模式类高效用模式挖掘的改进算法[J]. 微型机与应用 2016(22)
    • [18].时空轨迹群体运动模式挖掘研究进展[J]. 南京航空航天大学学报 2016(05)
    • [19].特定空间对象同位模式挖掘算法研究[J]. 电脑知识与技术 2015(04)
    • [20].多粒度时间文本数据的周期模式挖掘算法[J]. 计算机科学 2013(S2)
    • [21].基于密度约束的对比模式挖掘[J]. 计算机科学 2019(12)
    • [22].一种新的基于时空轨迹的汇合模式挖掘算法[J]. 南京大学学报(自然科学) 2018(01)
    • [23].基于时间序列的模式挖掘研究[J]. 科技资讯 2014(17)
    • [24].顾及距离衰减效应的网络空间同位模式挖掘[J]. 测绘科学 2020(06)
    • [25].面向移动时空轨迹数据的频繁闭合模式挖掘[J]. 西安科技大学学报 2016(04)
    • [26].基于大数据的物联网用户行为模式挖掘[J]. 计算机技术与发展 2019(12)
    • [27].军事情报监视与侦察系统中一种目标同现模式挖掘算法[J]. 海军工程大学学报 2019(06)
    • [28].基于网络的时空同现模式挖掘算法[J]. 计算机科学 2018(03)
    • [29].点集数据不规则形状时空异常聚类模式挖掘研究[J]. 武汉大学学报(信息科学版) 2017(07)
    • [30].移动通信网络环境下的用户运动模式挖掘[J]. 东南大学学报(自然科学版) 2011(02)

    标签:;  ;  ;  ;  

    基于模糊技术的空间co-location模式挖掘研究
    下载Doc文档

    猜你喜欢