逐段均匀条件下的参考分布研究

逐段均匀条件下的参考分布研究

论文摘要

聚类分析的目标是对一组对象进行聚类,使同一集群之间的对象之间在某种意义上比其他集群中的对象更相似,它是探索性数据挖掘的主要任务。聚类分析主要研究两类问题:一是对给定簇数如何合理的进行聚类,二是如何合理的估计簇数。本文研究第二个问题中GS方法的参考分布问题。Tibshirani R等人在2000年提出GS(Gap Statisic)方法,该方法引入一个参考分布,通过比较参考数据集和样本数据集的类内离差程度来估计最佳聚类数,并得到在分布为对数凹且一维情况下,参考分布为均匀分布的结论。因此,根据已有结论,GS方法适用于一维且对数凹情况下的数据集,但并不知道是否适用于不满足该条件数据集的最佳聚类数估计。本文提出研究逐段均匀条件下GS方法不同维度的参考分布问题。首先,应用Lagrange乘数法求解最小化类内平方和条件下的参数估计问题,其次,从范数的角度对同样的问题进行更深层次的论证。针对一维、二维的情况,得到了该条件下参考分布仍为均匀分布的结论,在此基础上证得在多维边缘为逐段均匀的条件下,其参考分布仍为均匀分布的结论。由此做出总结:针对任何有限维,逐段均匀分布条件下GS方法的参考分布都是均匀分布。在论证的过程中,也得到了在满足上述条件且簇在坐标轴上的投影两两不交,边缘分布呈均匀分布的情况下,点集6)的计数测度为k的阶乘的结论。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 课题的研究背景及意义
  •   1.2 研究现状
  •     1.2.1 聚类分析中最佳聚类数的研究现状
  •     1.2.2 GS方法研究现状
  •   1.3 论文研究的主要内容
  •     1.3.1 论文的组织
  •     1.3.2 论文的主要工作与创新
  • 2 预备知识
  •   2.1 聚类分析的定义
  •   2.2 聚类分析算法
  •   2.3 样本间距离
  •   2.4 最佳聚类数k的估计
  •   2.5 k-means算法
  •     2.5.1 k-means算法概况
  •     2.5.2 k-means算法定义
  •   2.6 GS方法
  •     2.6.1 选择参考分布
  •     2.6.2 GS方法运算步骤
  •   2.7 本章小结
  • 3 基于Lagrange乘数法的GS方法参考分布研究
  •   3.1 一维情况下GS参考分布研究
  •   3.2 二维情况下GS参考分布研究
  •   3.3 n维情况下GS参考分布研究
  •   3.4 实证分析
  •   3.5 本章小结
  • 4 基于范数的GS方法参考分布研究
  •   4.1 范数的定义
  •     4.1.1 向量范数的定义
  •     4.1.2 矩阵范数的定义
  •   4.2 一维情况下GS参考分布研究
  •   4.3 多维情况下GS参考分布研究
  •   4.4 本章小结
  • 5 结束语
  • 致谢
  • 参考文献
  • 附录
  • 文章来源

    类型: 硕士论文

    作者: 张乃今

    导师: 赵慧秀

    关键词: 方法,算法,均匀分布

    来源: 南京理工大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 南京理工大学

    分类号: TP311.13;O212

    DOI: 10.27241/d.cnki.gnjgu.2019.001563

    总页数: 43

    文件大小: 1914K

    下载量: 8

    相关论文文献

    • [1].基于均匀抽样的二阶差分聚类数确定方法[J]. 计算机与现代化 2017(10)
    • [2].一种社会经济系统模糊C划分聚类数的确定方法[J]. 统计与决策 2011(12)
    • [3].一种新的最佳聚类数确定方法[J]. 电子技术应用 2013(01)
    • [4].气象数据概化中的最佳聚类数研究[J]. 华中师范大学学报(自然科学版) 2008(03)
    • [5].基于密度和最优聚类数的入侵检测方法[J]. 西南师范大学学报(自然科学版) 2018(12)
    • [6].确定最佳聚类数的二阶差分统计法[J]. 安徽大学学报(自然科学版) 2017(02)
    • [7].聚类数的自动确定[J]. 科技信息(科学教研) 2008(14)
    • [8].基于可变聚类数k值的聚类算法在绩效考核中的应用[J]. 节能 2013(07)
    • [9].SPSS两阶聚类法如何自动确定聚类数[J]. 中国卫生统计 2010(02)
    • [10].一种引入参数无需确定聚类数的聚类算法[J]. 河北工业科技 2015(02)
    • [11].基于泛化能力的K-均值最佳聚类数确定方法[J]. 计算机技术与发展 2017(09)
    • [12].基于稳定性的三支聚类[J]. 南京大学学报(自然科学) 2019(04)
    • [13].一种确定最佳聚类数的新算法[J]. 陕西师范大学学报(自然科学版) 2012(01)
    • [14].一种基于类间距阈值的模糊聚类算法[J]. 计算机应用与软件 2008(09)
    • [15].海量中文短信文本最佳聚类数研究[J]. 计算机工程 2010(08)
    • [16].基于聚类数和初始值的K-means算法改进研究[J]. 组合机床与自动化加工技术 2011(04)
    • [17].基于聚类数的评分矩阵恢复算法[J]. 计算机工程与应用 2015(21)
    • [18].一种新的K-means最佳聚类数确定方法[J]. 现代计算机 2013(30)
    • [19].基于K-means的最佳聚类数确定方法研究[J]. 电脑知识与技术 2014(01)
    • [20].利用FCM求解最佳聚类数的算法[J]. 计算机工程与应用 2008(22)
    • [21].优化加权多视角K-means聚类算法[J]. 计算机技术与发展 2019(03)
    • [22].K-means聚类蚁群优化算法求解大型TSP问题[J]. 物流科技 2018(02)
    • [23].一种基于密度的分布式聚类改进算法[J]. 微电子学与计算机 2018(05)
    • [24].复杂经济系统FCM划分最佳聚类数的确定[J]. 计算机应用研究 2011(05)
    • [25].基于微粒群算法的聚类算法改进[J]. 计算机技术与发展 2010(11)
    • [26].面向WSN的聚类头选举与维护协议的研究综述[J]. 现代计算机(专业版) 2018(27)
    • [27].K-means算法最佳聚类数评价指标研究[J]. 软件导刊 2017(11)
    • [28].高效率的K-means最佳聚类数确定算法[J]. 计算机应用 2014(05)
    • [29].基于特征关系的加权投票聚类集成研究[J]. 计算机工程与应用 2018(03)
    • [30].一种启发式确定聚类数方法[J]. 小型微型计算机系统 2018(07)

    标签:;  ;  ;  

    逐段均匀条件下的参考分布研究
    下载Doc文档

    猜你喜欢