论文摘要
现代化制造车间无时无刻不在产生大量数据,其中绝大部分以无标签结构化原始数据的形式存储在现代化制造企业的工业大数据平台中。这些制造数据一方面具有很大的潜在价值,另一方面因为其具有高噪声、高冗余性的特点,难以直接分析与利用。因此,针对制造过程原始数据的特点,以去除制造数据冗余性、挖掘原始数据局部结构为目的,提出一种两阶段无监督特征选择方法。该方法的第一阶段采用遗传算法产生的原始数据的低维子集作为径向基神经网络(Radial basis fuction neural network,RBFNN)的输入,利用RBFNN复现原始数据的全部维度,并以降维率及复现精度作为遗传算法(Genetic algorithm, GA)的适应度函数,通过GA多次迭代学习高维特征的低维表示,删除原始数据集中的冗余特征与噪声特征。第二阶段采用拉普拉斯特征得分(Laplacian score, LS)逐维评价剩余特征对于反映数据局部几何结构的作用,挖掘对改善分类性能更有效的特征。通过与LS等无监督特征选择算法对比,验证了提出的两阶段无监督特征选择方法能够有效降低制造数据的冗余性,并提高数据的分类性能。
论文目录
文章来源
类型: 期刊论文
作者: 张洁,盛夏,张朋,秦威,赵新明
关键词: 无监督特征选择,遗传算法,径向基神经网络,拉普拉斯得分,制造过程数据
来源: 机械工程学报 2019年17期
年度: 2019
分类: 工程科技Ⅱ辑
专业: 机械工业
单位: 上海交通大学机械与动力工程学院,东华大学机械工程学院
基金: 国家自然科学基金资助项目(U1537110,51435009)
分类号: TH186
页码: 133-144
总页数: 12
文件大小: 713K
下载量: 102