基于时间序列的网约车在线司机与乘客发单的供需预测

基于时间序列的网约车在线司机与乘客发单的供需预测

论文摘要

随着移动互联网的兴起,网约车应运而生。在网约车的业务场景里面,特定城市的不同区域的在线司机数差异很大,乘客发单量差异也很大。为了解决区域之间供需不平衡的问题,首先就要对每个区域的供需比有一个准确的预测。而特定区域的供需比随时间变化而变化,与很多外界因数相关,具有周期性,且会因为节假日、恶劣天气等极端事件使得序列出现异常值。用传统的三阶指数平滑处理时不能很好的对异常点做出预测。因此兼顾极端事件的发单量和接单量的预测具有重大的意义。传统的机器学习模型和循环神经网络在时间序列预测的研究方面都取得了一定的成果。本文基于这两个方向,结合具体的业务背景设计出了一种组合预测模型,并且相对现存的方法取得了很大提高。首先我们获取多个城市多个区域在不同时间点的供需比以及区域位置,天气等的历史信息。并对相应特征做了异常值处理、归一化、one-hot、连续特征离散化等初级处理。然后对处理后的特征分别用两种方案做进一步的处理。方案一中,我们分别把供需比序列输入到三阶指数平滑和一阶指数平滑的holt-winter模型里,分别求解模型参数。然后把两个模型线性加权的结果作为一个最终特征。方案二中,我们首先把包含区域特征、天气特征、节气特征、窗口序列特征等的数据整合成[batch,sequence,feature]的形式,把整合的数据同时作为输入和输出去训练一个由五层LSTM构成的自编码器。LSTM包括输入门、输出门和遗忘门。通过前向和后向传播算法迭代到参数收敛得到最佳模型。然后取模型的编码器部分对序列特征进行编码,并把编码器的输出作为最终的多个特征。把前面两个方案输出的数据concat成完整向量,再联合其他特征,一起输入到xgboost模型,并迭代得到最终的模型参数。最后,在测试集上用smape指标度量模型对供需的预测效果。采集前后几个月关于供需的所有数据,输入到上述模型,并训练模型到参数收敛。实验结果表明,通过把一阶指数平滑和三阶指数平滑做加权平均,且融合自编码器,并结合xgboost做预测的方法。比之前传统单一的时间序列预测方法有了显著提高。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 研究背景与意义
  •   1.2 国内外研究概况
  •   1.3 论文的主要研究内容
  • 2 关键技术研究
  •   2.1 时间序列的统计解决方法
  •   2.2 xgboost在预测方面的研究
  •   2.3 LSTM在时间序列方面的研究
  •   2.4 自编码器的设计和研究
  •   2.5 本章小结
  • 3 供需预测算法设计
  •   3.1 数据预处理
  •   3.2 用于提取特征的混合指数平滑的设计
  •   3.3 自编码器的设计
  •   3.4 组合模型的设计
  •   3.5 本章总结
  • 4 实验设计与分析
  •   4.1 数据提取
  •   4.2 数据预处理
  •   4.3 实验设计
  •   4.4 模型评估
  •   4.5 本章小结
  • 5 总结与展望
  •   5.1 全文总结
  •   5.2 展望
  • 致谢
  • 参考文献
  • 文章来源

    类型: 硕士论文

    作者: 朱本常

    导师: 沈刚

    关键词: 时间序列,供需预测,指数平滑,长短时间记忆

    来源: 华中科技大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,交通运输经济,贸易经济

    单位: 华中科技大学

    分类号: O211.61;F724.6;F572.88

    总页数: 58

    文件大小: 1053K

    下载量: 440

    相关论文文献

    • [1].基于非稳态时间序列的生理控制模型研究[J]. 系统工程理论与实践 2020(02)
    • [2].基于多样化top-k shapelets转换的时间序列分类方法[J]. 计算机应用 2017(02)
    • [3].时间序列趋势预测[J]. 现代计算机(专业版) 2017(02)
    • [4].基于分型转折点的证券时间序列分段表示法[J]. 商 2016(31)
    • [5].基于ARMA模型的股价预测及实证研究[J]. 智富时代 2017(02)
    • [6].《漫长的告别》(年度资助摄影图书)[J]. 中国摄影 2017(04)
    • [7].王嵬作品[J]. 当代油画 2017(07)
    • [8].基于模糊时间序列的计算机信息粒构建研究[J]. 粘接 2020(10)
    • [9].基于时间序列挖掘的合成旅装备维修保障能力预测[J]. 系统工程与电子技术 2020(04)
    • [10].风速时间序列混沌判定方法比较研究[J]. 热能动力工程 2018(07)
    • [11].土壤退化时间序列的构建及其在我国土壤退化研究中的意义[J]. 土壤 2015(06)
    • [12].基于信息颗粒和模糊聚类的时间序列分割[J]. 模糊系统与数学 2015(01)
    • [13].不确定时间序列的降维及相似性匹配[J]. 计算机科学与探索 2015(04)
    • [14].时间序列的异常点诊断方法[J]. 中国卫生统计 2011(04)
    • [15].基于独立成分分析的时间序列谱聚类方法[J]. 系统工程理论与实践 2011(10)
    • [16].面向不确定时间序列的分类方法[J]. 计算机研究与发展 2011(S3)
    • [17].一种基于频繁模式的时间序列分类框架[J]. 电子与信息学报 2010(02)
    • [18].超启发式组合时间序列预报模型[J]. 福建电脑 2020(08)
    • [19].基于深度学习的时间序列算法综述[J]. 信息技术与信息化 2019(01)
    • [20].基于时间序列符号化模式表征的有向加权复杂网络[J]. 物理学报 2017(21)
    • [21].基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用 2016(19)
    • [22].基于期货市场行为的时间序列切分及表示方法研究[J]. 中国管理信息化 2015(19)
    • [23].基于形态特征的时间序列符号聚合近似方法[J]. 模式识别与人工智能 2011(05)
    • [24].基于模糊时间序列对我国对外贸易中的进口水平的预测[J]. 统计与决策 2010(23)
    • [25].模糊变量时间序列及其应用[J]. 辽宁工程技术大学学报(自然科学版) 2010(06)
    • [26].时间序列流的分层段模型[J]. 小型微型计算机系统 2009(04)
    • [27].发动机转速时间序列分形特征分析[J]. 机械科学与技术 2008(11)
    • [28].基于HDAD的异构航空数据异常检测的研究[J]. 计算机仿真 2020(03)
    • [29].重庆藕塘滑坡地下水位时间序列混沌性判别与预测[J]. 人民长江 2020(S1)
    • [30].基于能量过滤的不确定时间序列数据清洗方法[J]. 智能计算机与应用 2019(04)

    标签:;  ;  ;  ;  

    基于时间序列的网约车在线司机与乘客发单的供需预测
    下载Doc文档

    猜你喜欢