Print

基于随机森林与FP-growrh算法的山区追尾事故数据分析

论文摘要

传统的离散选择模型在分析事故数据过程中,容易出现模型假定条件不满足的现象。基于此背景,文中收集了2012-2017年昌金及泰赣山区高速公路的948条追尾事故数据,从非参数方法的角度对山区追尾事故进行分析。首先,利用随机森林算法对追尾事故数据进行了模型训练。模型中树的数量为144棵,预测效果最优,精度为0.778;进一步设置因素重要度阈值0.05,剔除了潜在风险因素中的星期、疲劳驾驶、超速、性别4个因素,筛选出10个重要度相对较高的因素。最后,利用FP-growrh算法训练得到40条频繁项集及关联规则。结果表明,FP-growrh算法可以有效说明潜在风险因素间、潜在风险因素与事故严重程度的关联程度。

论文目录

  • 1 模型方法
  •   1.1 随机森林算法
  •     1.1.1 算法原理
  •     1.1.2 算法参数
  •     1.1.3 算法预测精度
  •     1.1.4 变量重要度排序
  • 2 FP-growth算法
  •   2.1 算法原理
  •   2.2 支持度与置信度
  • 3 数据准备
  • 4 分析结果
  •   4.1 变量筛选
  •   4.2 关联规则
  • 5 结论
  • 文章来源

    类型: 期刊论文

    作者: 李贵阳,彭志鹏,王永岗

    关键词: 交通安全,追尾事故,随机森林,算法

    来源: 交通科技 2019年06期

    年度: 2019

    分类: 工程科技Ⅱ辑

    专业: 公路与水路运输

    单位: 长安大学公路学院

    基金: 陕西省科技基金项目(14-29R)资助

    分类号: U491.31

    页码: 5-9

    总页数: 5

    文件大小: 121K

    下载量: 148

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/8df49a81d90b24fc6c21724b.html