基于SMOTE的机器学习算法准确度影响研究

论文摘要

随着互联网的发展,大数据时代的到来,各个领域都存储了海量的数据,为机器学习的分析与预测提供了必要条件,但非平衡数据广泛存在于各个领域,例如电话欺诈、网络欺骗、医学诊断等。在机器学习中,一般用预测准确度来评估分类器的好坏,但在样本不均衡且正负比例差异显著时,这种评估方式显然是不合适的。以KNN算法为例,对比它在应用SMOTE样本均衡算法前后的预测准确度的差异,同时用ROC曲线对算法在样本均衡化前后的效果各个维度进行了详细对比,模型预测效果均比之前有了显著提升。

论文目录

文章来源

类型: 期刊论文

作者: 沈锐

关键词: 机器学习,样本均衡算法

来源: 廊坊师范学院学报(自然科学版) 2019年04期

年度: 2019

分类: 社会科学Ⅱ辑,信息科技

专业: 自动化技术

单位: 西华师范大学

分类号: TP181

页码: 27-29

总页数: 3

文件大小: 1580K

下载量: 45

基于SMOTE的机器学习算法准确度影响研究

论文摘要

论文目录

文章来源

相关论文文献

猜你喜欢