基于机器学习的二手房估价模型

基于机器学习的二手房估价模型

论文摘要

伴随着房地产行业的迅速发展,近几年来购房热度逐渐飙升。住房关系人民的生活之本,而房价更关乎整个国民经济和人民生活的幸福感,因此住房价格逐渐成为社会关注的焦点问题。在现有的文献中,研究房价问题一般会采用传统的多元线性回归方法,该方法存在一个弊端是假设不同小区之间、小区与周围环境之间是互不影响的,其房屋估价的准确性很难得到保证。因此,本文在传统特征价格模型基础上加入空间效应,使用机器学习方法,建立一种更加科学准确的二手房估价模型。这种改良的空间特征价格模型能够帮助开发商更好地做出投资决策,为消费者购房时提供更准确的参考依据。本论文的主要内容包括:1、应用爬虫方法搜集了昆明市盘龙区132个小区的1060条数据,针对其中的缺失数据和脏数据进行预处理,将空间分异概念引入传统估价模型中,提出改进的空间特征价格模型。2、运用多种方法对收集的房价数据进行预测。首先介绍了所用方法的相关理论知识,用引入空间变量的最传统的方法—多元线性回归对数据进行分析,发现拟合度不高,F值很小。然后用XGboost和随机森林方法找到对小区单价影响较大的几个特征变量,10折交叉验证后,选出最优的参数。最后分别取70%为训练集,30%为测试集后,用支持向量回归、随机森林回归以及XGboost回归进行建模,得到单价的预测值。3、对比测试集房价预测值的误差和模型拟合优度,分析影响估价模型的主要因素并提出相关建议。结果表明,小区的位置、小区周围的交通条件(如距最近地铁站、公交车站的远近)、小区周围的教育环境(距最近学校的远近)以及房屋建造时间等对房价产生很大的影响。通过提取重要性较高的变量建模后,发现随机森林回归方法相对误差最低,XGboost回归模型拟合优度最高,即引入空间效应的随机森林回归模型和XGboost回归模型更适用于昆明市盘龙区二手房数据的研究。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 背景
  •   1.2 研究目的和意义
  •   1.3 国内外研究现状
  •   1.4 研究方法
  •   1.5 本文结构
  •   1.6 本文创新和不足
  •     1.6.1 本文创新点
  •     1.6.2 不足点
  • 第二章 房地产市场发展现状及住宅价格相关概念
  •   2.1 房地产市场发展现状
  •     2.1.1 全国房地产市场现状
  •     2.1.2 二手房地产现状
  •     2.1.3 昆明房地产发展现状
  •   2.2 相关概念
  •     2.2.1 住宅价格
  •     2.2.2 住宅价格空间分异概念
  • 第三章 预备知识
  •   3.1 回归树
  •     3.1.1 回归树原理
  •     3.1.2 划分选择
  •   3.2 随机森林回归模型
  •     3.2.1 随机森林原理
  •     3.2.2 随机森林回归算法
  •     3.2.3 变量重要性指标
  •   3.3 多元线性回归
  •     3.3.1 原理介绍
  •     3.3.2 模型结构与假设
  •     3.3.3 模型的参数估计
  •     3.3.4 模型的假设检验
  •   3.4 支持向量回归
  •   3.5 XGboost回归模型
  •     3.5.1 有监督学习算法的逻辑组成
  •     3.5.2 XGboost算法概述
  • 第四章 昆明市盘龙区二手房价格实证分析
  •   4.1 统计样本和数据来源
  •   4.2 数据的预处理相关理论
  •     4.2.1 one-hot编码
  •     4.2.2 XGboost中early-stopping机制
  •     4.2.3 机器学习中k-fold检验
  •   4.3 数据的处理以及模型的预建立
  •   4.4 四种方法建模结果分析
  •     4.4.1 多元线性回归结果分析
  •     4.4.2 随机森林回归建模结果分析
  •     4.4.3 支持向量机建模结果分析
  •     4.4.4 XGboost回归建模结果分析
  • 第五章 总结与展望
  •   5.1 本文工作总结
  •   5.2 未来展望
  • 参考文献
  • 攻读硕士学位期间完成的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 梁佩

    导师: 孟捷

    关键词: 机器学习,空间效应,二手房估价,住宅价格

    来源: 云南大学

    年度: 2019

    分类: 基础科学,经济与管理科学

    专业: 数学,宏观经济管理与可持续发展,宏观经济管理与可持续发展

    单位: 云南大学

    分类号: F299.23;F224

    总页数: 51

    文件大小: 2804K

    下载量: 264

    相关论文文献

    • [1].大数据时代:从传统评估到自动估价系统[J]. 中国资产评估 2020(04)
    • [2].估价模型对新股估价的比较分析[J]. 汕头大学学报(人文社会科学版) 2014(01)
    • [3].地铁工程方案设计阶段快速估价模型研究[J]. 项目管理技术 2020(05)
    • [4].股票估价模型的应用研究[J]. 中国商贸 2013(08)
    • [5].房产特征价格估价模型研究及应用[J]. 测绘科学 2011(06)
    • [6].剩余收益估价模型的改进及应用[J]. 统计与决策 2014(02)
    • [7].高速公路建设费用组成及造价估价模型建立[J]. 公路交通科技 2012(06)
    • [8].论实物期权估价模型在公司价值评估中的适用性[J]. 中国管理信息化 2011(13)
    • [9].公司价值评估模型的比较与选择[J]. 中国乡镇企业会计 2008(01)
    • [10].对平息债券贴现估价模型的再认识[J]. 现代物业(中旬刊) 2010(02)
    • [11].平息债券估价模型的比较分析与扩展[J]. 枣庄学院学报 2014(05)
    • [12].利用Excel构建股票估价模型[J]. 宿州教育学院学报 2009(01)
    • [13].不同估价模型之下的债券分析[J]. 时代金融 2017(14)
    • [14].奥尔森估价模型与线性信息模型实证检验[J]. 陕西农业科学 2010(06)
    • [15].基于神经网络的房地产估价模型研究及其Matlab实现[J]. 技术经济与管理研究 2009(01)
    • [16].基于数据可靠性的建设项目生命周期成本估价模型选择方法研究[J]. 许昌学院学报 2013(05)
    • [17].Ohlson剩余收益估价模型研究综述[J]. 财会通讯 2010(27)
    • [18].浅谈企业并购中EVA估价模型的构建[J]. 财会通讯 2010(20)
    • [19].风险项目评价的期权估价模型及应用研究[J]. 科技管理研究 2008(06)
    • [20].浅析财务估价模型及其比较[J]. 经济研究导刊 2014(03)
    • [21].道路工程SOM-RBF神经网络估价模型研究[J]. 铁道学报 2020(01)
    • [22].公允价值计量的稳健性问题——基于金融危机和估价模型的思考[J]. 东方企业文化 2011(20)
    • [23].剩余收益估价模型与主流价值评估模型的比较[J]. 财会月刊 2008(23)
    • [24].四种债券估价模型的运用分析[J]. 企业家天地下半月刊(理论版) 2008(12)
    • [25].基于塑件特征的注射模具估价研究[J]. 科技传播 2014(03)
    • [26].债券估价问题探讨[J]. 现代经济信息 2011(22)
    • [27].浅谈资源导向的工程估价模型[J]. 科技风 2011(01)
    • [28].浅议剩余收益估价模型和动态金融资产计价模型[J]. 当代经济 2011(18)
    • [29].基于GIS和PCA城镇宗地估价模型研究[J]. 中国资产评估 2020(09)
    • [30].论B-S期权估价模型在风险项目投资评估中的运用[J]. 中国商贸 2012(20)

    标签:;  ;  ;  ;  

    基于机器学习的二手房估价模型
    下载Doc文档

    猜你喜欢