面向排序学习的层次聚类特征选择算法

面向排序学习的层次聚类特征选择算法

论文摘要

大型搜索系统对用户查询的快速响应尤为必要,同时在计算候选文档的特征相关性时,必须遵守严格的后端延迟约束。通过特征选择,提高了机器学习的效率。针对排序学习中快速特征选择的起点多为单一排序效果最好的特征的特点,首先提出了一种用层次聚类法生成特征选择起点的算法,并将该算法应用于已有的2种快速特征选择中。除此之外,还提出了一种充分利用聚类特征的新方法来处理特征选择。在2个标准数据集上的实验表明,该算法既可以在不影响精度的情况下获得较小的特征子集,也可以在中等子集上获得最佳的排序精度。

论文目录

  • 1 引言
  • 2 特征选择算法
  •   2.1 概述
  •   2.2 特征相关性评测
  •   2.3 特征相似性评测
  •   2.4 优化方式
  • 3 算法流程
  •   3.1 通过层次聚类产生初始点的贪婪选择算法
  •   3.2 结合层次聚类的特征选择
  • 4 实验设置
  •   4.1 数据集
  •   4.2 评价指标
  •   4.3 排序模型
  • 5 实验结果与分析
  •   5.1 MQ2008数据集上的实验结果
  •   5.2 OHSUMED数据集上的实验结果
  • 6 结束语
  • 文章来源

    类型: 期刊论文

    作者: 孟昱煜,陈绍立,刘兴长

    关键词: 特征选择,排序学习,层次化聚类,贪婪搜索

    来源: 计算机工程与科学 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 自动化技术

    单位: 兰州交通大学电子与信息学院

    基金: 甘肃省自然科学基金(1606RJZA003),甘肃省住房和城乡建设厅项目(JK2015-15)

    分类号: TP181

    页码: 2211-2216

    总页数: 6

    文件大小: 760K

    下载量: 127

    相关论文文献

    标签:;  ;  ;  ;  

    面向排序学习的层次聚类特征选择算法
    下载Doc文档

    猜你喜欢