论文摘要
不完整数据处理是数据挖掘、机器学习等领域中的重要问题,缺失值填充是处理不完整数据的主流方法。当前已有的缺失值填充方法大多运用统计学和机器学习领域的相关技术来分析原始数据中的剩余信息,从而得到较为合理的值来替代缺失部分。缺失值填充大致可以分为单一填充和多重填充,这些填充方法在不同的场景下有着各自的优势。但是,很少有方法能进一步考虑样本空间分布中的邻域信息,并以此对缺失值的填充结果进行修正。鉴于此,本文提出了一种可广泛应用于诸多现有填充方法的框架用以提升现有方法的填充效果,该框架由预填充、空间邻域信息挖掘和修正填充三部分构成。本文对7种填充方法在8个UCI数据集上进行了实验,实验结果验证了本文所提框架的有效性和鲁棒性。
论文目录
文章来源
类型: 期刊论文
作者: 严远亭,吴亚亚,赵姝,张燕平
关键词: 不完整数据,缺失值填充,邻域信息,数据挖掘,机器学习,填充方法,单一填充,多重填充
来源: 智能系统学报 2019年06期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 安徽大学计算机科学与技术学院
基金: 国家自然科学基金项目(61806002,61872002,61673020,61876001,61602003),安徽省自然科学基金项目(1708085QF143,1808085MF197),安徽大学博士科研启动基金项目(J01003253)
分类号: TP311.13
页码: 1225-1232
总页数: 8
文件大小: 1915K
下载量: 154
相关论文文献
- [1].一种不完整数据的清理方法的应用研究[J]. 军事运筹与系统工程 2011(02)
- [2].基于不完整数据的EM算法初值选取[J]. 太原师范学院学报(自然科学版) 2010(01)
- [3].基于ICA与SOM的不完整数据处理[J]. 计算机工程与应用 2008(04)
- [4].基于模糊决策的不完整数据分类算法[J]. 淮北师范大学学报(自然科学版) 2015(02)
- [5].基于MCMC的不完整数据插补方法研究[J]. 通讯世界 2016(01)
- [6].基于压缩的海量不完整数据近似查询方法[J]. 计算机研究与发展 2016(03)
- [7].网络环境中不完整数据挖掘方法研究与仿真[J]. 计算机仿真 2016(10)
- [8].不完整数据的聚类研究[J]. 河南科学 2014(11)
- [9].分组截尾数据下离散型寿命概率分布的估计方法[J]. 江苏师范大学学报(自然科学版) 2012(02)
- [10].基于符号语义的不完整数据聚集查询处理算法[J]. 软件学报 2020(02)
- [11].不完整分组数据下离散概率分布的迭代估计方法[J]. 仲恺农业工程学院学报 2011(04)
- [12].瞬变电磁法利用不完整数据进行一维反演的可行性分析[J]. 物探化探计算技术 2012(05)
- [13].一种利用不完整数据检测交通异常的方法[J]. 计算机科学 2016(S1)
- [14].基于不完整数据的异常信号检测方法[J]. 计算机工程 2011(14)
标签:不完整数据论文; 缺失值填充论文; 邻域信息论文; 数据挖掘论文; 机器学习论文; 填充方法论文; 单一填充论文; 多重填充论文;