论文摘要
随着互联网的发展,大数据时代的到来,各个领域都存储了海量的数据,为机器学习的分析与预测提供了必要条件,但非平衡数据广泛存在于各个领域,例如电话欺诈、网络欺骗、医学诊断等。在机器学习中,一般用预测准确度来评估分类器的好坏,但在样本不均衡且正负比例差异显著时,这种评估方式显然是不合适的。以KNN算法为例,对比它在应用SMOTE样本均衡算法前后的预测准确度的差异,同时用ROC曲线对算法在样本均衡化前后的效果各个维度进行了详细对比,模型预测效果均比之前有了显著提升。
论文目录
文章来源
类型: 期刊论文
作者: 沈锐
关键词: 机器学习,样本均衡算法
来源: 廊坊师范学院学报(自然科学版) 2019年04期
年度: 2019
分类: 社会科学Ⅱ辑,信息科技
专业: 自动化技术
单位: 西华师范大学
分类号: TP181
页码: 27-29
总页数: 3
文件大小: 1580K
下载量: 45