广义聚类回归算法研究及其在销量预测中的应用

广义聚类回归算法研究及其在销量预测中的应用

论文摘要

在商品销量预测领域,已有很多相关的建模工作。复杂的数据挖掘模型比如集成树模型、神经网络模型等一般效果较好,但是解释性很差,难以从中挖掘出更多的信息。本文从聚类线性回归算法(CLR)出发,此算法以得到全局最优解为目的,将聚类与回归同时进行,得出的结果解释性强,在商业管理方面具有指导意义。零售业的数据特点是,商品的SKU数目是极多的,每种商品的属性也是很多的。由于商品之间的异质性,某些属性(如季节因素)对不同商品的销量影响可能存在着相反的效应,因此难以通过一个单一的线性回归模型来对所有商品进行建模。同时,每个SKU的销量数据通常是有限的,在这种情形下,如果对每一种SKU建立一个线性回归模型,由于对应数据条目的缺乏,难以得到准确结果。如果先进行聚类,把受属性影响类似的SKU聚成簇,再在整个簇上做回归就可以避免这些问题。但是不同SKU受属性因素变化的影响不同,这些变化又反映在模型中的回归系数上,因此增加了这类问题的解决难度。先聚类后回归是一种解决办法,但一般很难找到一个良好的先验的簇划分。相对地,更好的解决办法是将聚类回归同时进行,即CLR(Clusterwise Linear Regression)问题。从最优化的角度出发,广义CLR问题可以建模为一个混合整数二次规划问题,但由于变量规模、对称性等因素,直接求解这个问题是比较困难的;本文从集合划分角度入手,使用了列生成算法来解决此问题。在应用列生成算法时,为了适用于更大规模的数据,提出了一种启发式的列生成算法。除此之外,还使用了一些其他的启发式算法,比如基于遗传算法的类KMeans算法,实践中应用较多的两步法,以及Spath算法等,并根据具体场景进行了一些改进。最后,利用真实的商品销售数据,编程实现上述算法,并从准确度、稳定性、求解效率、模型解释性等各个方面做出比较,对比展示不同算法在不同场景下的效果,说明了不同算法各自的适用场景。本文还将广义CLR算法与传统的线性回归模型效果进行了对比,证明了其良好的泛化性能与可解释性。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 研究背景与意义
  •   1.2 研究思路与方法
  •     1.2.1 研究思路
  •     1.2.2 研究方法
  •   1.3 创新与不足
  •   1.4 文献综述
  • 2 零售业中销量预测场景的介绍
  •   2.1 销量预测面临的问题
  •     2.1.1 特征工程方法介绍
  •     2.1.2 零售业中商品的特点与其面临的问题
  •   2.2 解决方法
  •     2.2.1 特征选择
  •     2.2.2 广义聚类回归模型
  •   2.3 具体任务介绍
  • 3 广义聚类回归模型的不同形式
  •   3.1 混合整数二次规划公式
  •   3.2 集合分割公式
  • 4 算法原理与实现步骤
  •   4.1 列生成算法
  •     4.1.1 列生成算法中的子问题
  •     4.1.2 列生成算法中分枝定界法的应用
  •   4.2 列生成启发式算法
  •   4.3 GA-KMeans元启发式算法
  •   4.4 两步式启发算法
  •   4.5 Spath算法
  • 5 数值实验
  •   5.1 实验简介
  •   5.2 实验算法效果
  •     5.2.1 最优化算法
  •     5.2.2 启发式算法
  •     5.2.3 最优化算法与启发式算法的对比
  •     5.2.4 广义CLR模型与传统线性回归模型的对比
  •   5.3 模型解释
  • 6 总结与展望
  • 参考文献
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 台延鑫

    导师: 林良才,刘帆

    关键词: 聚类回归,列生成,启发式算法,销量预测

    来源: 南京大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,企业经济

    单位: 南京大学

    分类号: F224;F274

    总页数: 53

    文件大小: 3702K

    下载量: 145

    相关论文文献

    • [1].聚散优化算法:一种新的启发式算法[J]. 计算机集成制造系统 2020(03)
    • [2].几种具有代表性的启发式算法研究[J]. 电子制作 2016(02)
    • [3].共享单车再平衡问题及其容差插入启发式算法[J]. 运筹与管理 2019(10)
    • [4].单体型装配问题的启发式算法研究[J]. 数字技术与应用 2017(01)
    • [5].圆形件下料顺序分组启发式算法的设计与实现[J]. 图学学报 2017(01)
    • [6].装备维修器材生产路径决策的两阶启发式算法[J]. 国防科技大学学报 2020(05)
    • [7].基于一种特设启发式算法的车辆优化调度问题研究[J]. 电视技术 2019(04)
    • [8].求解带硬时间窗车辆路径问题的时差插入启发式算法[J]. 计算机应用 2012(11)
    • [9].求解柔性工件调度问题的启发式算法[J]. 科技风 2018(22)
    • [10].基于超启发式算法的备件供应网络结构优化[J]. 系统工程与电子技术 2020(03)
    • [11].基于启发式算法的自动化跨运车作业调度[J]. 上海大学学报(自然科学版) 2017(03)
    • [12].三层物流网络选址—路径优化及混合启发式算法研究[J]. 计算机应用研究 2017(08)
    • [13].基于混合顺序启发式算法的一维下料问题[J]. 中国机械工程 2014(16)
    • [14].分配问题的启发式算法求解[J]. 甘肃联合大学学报(自然科学版) 2009(03)
    • [15].一种有效求解厌恶设施选址问题的混合启发式算法[J]. 北京化工大学学报(自然科学版) 2017(06)
    • [16].基于混合启发式算法的设备混合布局问题[J]. 工业工程 2017(01)
    • [17].启发式算法的孔群加工路线模糊多目标优化[J]. 现代制造工程 2016(04)
    • [18].多目标飞机和旅客恢复分阶段启发式算法[J]. 计算机应用研究 2014(08)
    • [19].时变车辆路径问题的启发式算法[J]. 系统工程学报 2012(02)
    • [20].阿德兰启发式算法在加油站选址中的应用[J]. 价值工程 2009(06)
    • [21].混合启发式算法在汽车调度中的应用[J]. 电子技术应用 2009(07)
    • [22].基于启发式算法的检测资源分配研究[J]. 锻压装备与制造技术 2018(02)
    • [23].一种求解两级累计式车辆路径问题的两阶段启发式算法[J]. 机电一体化 2014(04)
    • [24].模块度优化启发式算法应用[J]. 现代电子技术 2012(19)
    • [25].基于阿德兰启发式算法的邮政网点选址研究[J]. 邮政研究 2011(05)
    • [26].订货批量问题改进的相关策略启发式算法与仿真分析[J]. 系统仿真学报 2008(18)
    • [27].基于元启发式算法的复杂车辆路径问题研究[J]. 物流技术 2013(21)
    • [28].元启发式算法在校车路径规划中的应用[J]. 地理空间信息 2013(05)
    • [29].无等待流水调度问题迭代启发式算法[J]. 安徽师范大学学报(自然科学版) 2009(01)
    • [30].城市消防站点布局的改进启发式算法[J]. 数学的实践与认识 2008(01)

    标签:;  ;  ;  ;  

    广义聚类回归算法研究及其在销量预测中的应用
    下载Doc文档

    猜你喜欢