学习驱动的概率重构与数据可视化

学习驱动的概率重构与数据可视化

论文摘要

在这个信息爆炸的时代,处理与分析大规模的高维数据已经成为数据挖掘与机器学习领域的重大挑战之一。为了获取以及直观理解隐藏在大数据下的潜在信息,一种有效的数据可视化技术是不可或缺的。数据可视化技术能够将复杂的高维数据信息展示在低维的图表上。根据低维的数据图表,我们能够对原始数据的结构信息有一个直观地理解,而且有助于后续的数据探索与模式识别。在一些传统的数据可视化算法的基础上,本文做了如下工作:(1)提出了基于ANNOY的快速近邻搜索算法。该算法在随机投影树的基础上通过近邻拓展的方法进行近邻点的搜索,在保证近邻搜索准确率的基础上大大提升了近邻搜索的速度。(2)提出了基于近邻关系与类别信息的概率重构算法。该算法首先通过近邻拓展的方法构建近邻关系图,然后基于近邻关系与类别信息对原始数据样本之间的相似性进行概率重构。该算法可以更为准确的描述高维数据样本之间的相似关系。(3)提出了基于P-BGLL的可视化算法。该算法在BGLL算法的基础上,使用概率作为空间中样本之间的连接权值,从而提出了P-BGLL算法,并基于P-BGLL算法进行可视化操作。相比于传统的数据可视化算法,基于P-BGLL的数据可视化算法能够更好的保留高维数据的全局结构与局部结构,取得良好的可视化效果。(4)提出了基于Feature-Net的可视化算法。该算法首先利用Feature-Net网络模型对数据特征进行提取,以便过滤掉噪声与冗余信息,然后利用获取的类别信息与近邻关系对概率进行重构。该算法对于原始样本间的相似性描述更为准确,其在可视化上的表现更加优秀。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 课题的研究背景和意义
  •   1.2 国内外研究的现状
  •     1.2.1 线性降维可视化算法
  •     1.2.2 非线性降维可视化算法
  •     1.2.3 数据可视化的应用
  •     1.2.4 算法小结
  •   1.3 相关工作回顾
  •     1.3.1 聚类算法
  •     1.3.2 复杂网络聚类
  •     1.3.3 卷积神经网络
  •   1.4 主要工作与章节安排
  • 第二章 基于树结构的随机近邻嵌入算法
  •   2.1 基于学生T分布的随机近邻嵌入算法(t-SNE)
  •   2.2 基于树结构的随机近邻嵌入算法(Accelerating t-SNE)
  •     2.2.1 高维空间中概率矩阵的近似求解
  •     2.2.2 基于树结构的梯度优化
  •   2.3 Accelerating t-SNE算法的不足
  •   2.4 本章小结
  • 第三章 基于ANNOY的快速近邻搜索与概率重构算法
  •   3.1 近邻搜索
  •     3.1.1 ANNOY搜索算法
  •     3.1.2 基于ANNOY的快速近邻搜索
  •   3.2 概率重构
  •     3.2.1 基于近邻关系的概率重构
  •     3.2.2 基于类别信息的概率重构
  •     3.2.3 概率重构具体计算方法
  •     3.2.4 概率重构的总结
  •   3.3 算法总结
  •   3.4 本章小结
  • 第四章 基于无监督学习的概率重构与数据可视化
  •   4.1 聚类算法的选择
  •   4.2 P-BGLL聚类算法
  •   4.3 基于P-BGLL的数据可视化算法
  •   4.4 本章小结
  • 第五章 基于有监督学习的概率重构与数据可视化
  •   5.1 特征提取
  •   5.2 Feature-Net
  •     5.2.1 Feature-Net网络
  •     5.2.2 基于分类结果进行概率重构
  •   5.3 基于Feature-Net的数据可视化算法
  •   5.4 本章小结
  • 第六章 实验结果与分析
  •   6.1 实验相关数据集
  •     6.1.1 MNIST数据集
  •     6.1.2 CIFAR-10 数据集
  •     6.1.3 SVHN数据集
  •   6.2 实验设置与评价标准
  •     6.2.1 实验设置
  •     6.2.2 评价标准
  •   6.3 基于ANNOY的快速近邻搜索的实验结果与分析
  •   6.4 P-BGLL算法与BGLL算法的可视化实验结果对比与分析
  •   6.5 基于P-BGLL的可视化算法的实验结果与分析
  •     6.5.1 MNIST数据集实验结果与分析
  •     6.5.2 CIFAR-10 数据集实验结果与分析
  •     6.5.3 SVHN数据集实验结果与分析
  •   6.6 基于Feature-Net的可视化算法的实验结果与分析
  •     6.6.1 MNIST数据集实验结果与分析
  •     6.6.2 CIFAR-10 数据集实验结果与分析
  •     6.6.3 SVHN数据集实验结果与分析
  •     6.6.4 Feature-Net网络与常见网络结构的实验对比与分析
  •   6.7 实验结果总结
  •   6.8 本章小结
  • 第七章 总结与展望
  •   7.1 全文总结
  •   7.2 展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间已发表或录用的论文
  • 文章来源

    类型: 硕士论文

    作者: 廖晓辉

    导师: 王利生

    关键词: 近邻搜索,概率重构,数据可视化,卷积神经网络,聚类

    来源: 上海交通大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用

    单位: 上海交通大学

    分类号: TP311.13;O211

    DOI: 10.27307/d.cnki.gsjtu.2019.002495

    总页数: 105

    文件大小: 4546K

    下载量: 12

    相关论文文献

    • [1].影响桥梁船撞概率的主要因素分析[J]. 科技视界 2019(35)
    • [2].基于平行语料和翻译概率的多语种词对齐方法[J]. 中文信息学报 2019(12)
    • [3].概率定义的一种新描述[J]. 内江科技 2020(01)
    • [4].如何培养孩子在学习音乐中的概率意识和权衡智慧自我[J]. 音乐生活 2020(03)
    • [5].小议遗传概率的计算[J]. 科学咨询(科技·管理) 2020(06)
    • [6].煤矿高概率险兆事件界定及其研究意义[J]. 西安科技大学学报 2020(04)
    • [7].基于关联系数的概率不确定语言集多属性决策方法[J]. 统计与决策 2020(19)
    • [8].不要对“大概率”事件视而不见[J]. 雷锋 2018(02)
    • [9].现代社会离不开统计与概率[J]. 科学世界 2020(01)
    • [10].概率综合演练A卷[J]. 中学生数理化(高一使用) 2020(03)
    • [11].我们能否计算“幸运”——身边的概率思想[J]. 知识就是力量 2020(05)
    • [12].高中数学概率的相关知识点概述[J]. 问答与导学 2019(27)
    • [13].概率小结与复习[J]. 新世纪智能 2020(45)
    • [14].直线与圆、统计与概率综合演练[J]. 中学生数理化(高一使用) 2020(Z1)
    • [15].“用频率估计概率”的教学疑难与课堂尝试[J]. 中学数学 2020(14)
    • [16].复数、算法、概率、统计、计数原理[J]. 新世纪智能 2020(30)
    • [17].统计与概率之中考答题规范及技巧[J]. 课程教材教学研究(中教研究) 2020(Z4)
    • [18].高中数学概率教学方面的探讨[J]. 考试周刊 2019(37)
    • [19].日语“可能性”认知概率探析——以「かもしれない」为例[J]. 唐山文学 2019(08)
    • [20].概率思维在投资理财中的运用[J]. 课程教育研究 2019(12)
    • [21].循循善诱 促进发展——对“概率的性质”一课的点评[J]. 中国数学教育 2019(08)
    • [22].“概率”能确定“事件”吗?[J]. 中学数学研究(华南师范大学版) 2019(15)
    • [23].中美高中学段“统计与概率”内容的比较与启示[J]. 中学数学教学参考 2008(17)
    • [24].谈概率中变角度思考的误区[J]. 中学数学研究 2008(06)
    • [25].重在对概率本质的教学[J]. 中学数学教学 2008(04)
    • [26].教学“统计与概率”要突出趣味性[J]. 小学教学参考 2013(17)
    • [27].统计与概率在实际生活中的运用[J]. 教学管理与教育研究 2017(02)
    • [28].事件的关系与概率运算[J]. 中学生数理化(高一数学) 2018(03)
    • [29].孤独比肥胖更致命[J]. 新长征(党建版) 2018(12)
    • [30].“统计与概率”中常见错题辨析及对策[J]. 新高考(升学考试) 2015(12)

    标签:;  ;  ;  ;  ;  

    学习驱动的概率重构与数据可视化
    下载Doc文档

    猜你喜欢