论文摘要
大型搜索系统对用户查询的快速响应尤为必要,同时在计算候选文档的特征相关性时,必须遵守严格的后端延迟约束。通过特征选择,提高了机器学习的效率。针对排序学习中快速特征选择的起点多为单一排序效果最好的特征的特点,首先提出了一种用层次聚类法生成特征选择起点的算法,并将该算法应用于已有的2种快速特征选择中。除此之外,还提出了一种充分利用聚类特征的新方法来处理特征选择。在2个标准数据集上的实验表明,该算法既可以在不影响精度的情况下获得较小的特征子集,也可以在中等子集上获得最佳的排序精度。
论文目录
文章来源
类型: 期刊论文
作者: 孟昱煜,陈绍立,刘兴长
关键词: 特征选择,排序学习,层次化聚类,贪婪搜索
来源: 计算机工程与科学 2019年12期
年度: 2019
分类: 信息科技
专业: 自动化技术
单位: 兰州交通大学电子与信息学院
基金: 甘肃省自然科学基金(1606RJZA003),甘肃省住房和城乡建设厅项目(JK2015-15)
分类号: TP181
页码: 2211-2216
总页数: 6
文件大小: 760K
下载量: 127