统计决策树下的城市地址集中文分词

统计决策树下的城市地址集中文分词

论文摘要

不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。

论文目录

  • 1 基于统计特征的地址后缀点和落差点
  •   1.1 中文地址中的后缀词、后缀点
  •   1.2 地址集数据的落差点
  • 2 基于统计决策树的中文分词方法
  • 3 实验与分析
  • 4 结 语
  • 文章来源

    类型: 期刊论文

    作者: 应申,李威阳,贺彪,王维,万远

    关键词: 中文地址分词,决策树,地址要素,地址集

    来源: 武汉大学学报(信息科学版) 2019年02期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 自然地理学和测绘学,计算机软件及计算机应用

    单位: 武汉大学资源与环境科学学院,深圳市数字城市工程研究中心,国土资源部城市土地资源监测与仿真重点实验室,深圳大学建筑与城市规划学院,湖北师范大学城市与环境学院

    基金: 国家自然科学基金(41671381,41531177),“十三五”国家重点研发计划(2016YFF0201301,2017YFB0503500),国土资源部城市土地资源监测与仿真重点实验室开放基金(KF-2018-03-010)~~

    分类号: P208

    DOI: 10.13203/j.whugis20170072

    页码: 302-309

    总页数: 8

    文件大小: 1339K

    下载量: 313

    相关论文文献

    • [1].警用标准地址信息建库流程探讨[J]. 测绘 2017(06)
    • [2].母婴世界未来星2009·09读者调查[J]. 母婴世界 2009(09)
    • [3].基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法[J]. 中国医疗设备 2019(04)
    • [4].基于城市地址树的地址文本匹配方法[J]. 地理信息世界 2017(06)
    • [5].母婴世界未来星2009·06读者调查[J]. 母婴世界 2009(06)
    • [6].母婴世界未来星读者调查[J]. 母婴世界 2009(01)
    • [7].房屋地址信息管理与应用的探讨[J]. 标准科学 2019(10)
    • [8].利用城建档案结合门牌地址信息提高城建档案查询效率[J]. 办公室业务 2012(09)
    • [9].统一地址标准引领社会治理精细化[J]. 国家治理 2018(02)
    • [10].营销客户地址数据标准化应用分析与研究[J]. 科技与创新 2018(16)
    • [11].母婴世界未来星2009·10读者调查[J]. 母婴世界 2009(10)
    • [12].城市地址模型概念框架的关键问题[J]. 测绘通报 2018(09)
    • [13].上海市地址数据采集更新方法研究[J]. 矿山测量 2018(06)
    • [14].公安标准地址信息管理系统建设[J]. 测绘 2018(06)
    • [15].大型局域网IP地址信息的管理与维护[J]. 科技信息 2009(34)
    • [16].有线电视安装地址信息的规范与管理[J]. 中国有线电视 2012(04)
    • [17].基于大数据技术的家宽覆盖地址数据治理方法[J]. 移动通信 2017(23)
    • [18].顾及位置关系的网络POI地址信息标准化处理方法[J]. 测绘学报 2016(05)
    • [19].SCI数据库中地址信息著录差异与错误分析[J]. 现代情报 2008(04)
    • [20].基于大数据的用户地址规范化存储与电力营销设计初探[J]. 电子测试 2019(02)
    • [21].关于IP地址隐藏的专题分析[J]. 电脑知识与技术 2019(11)
    • [22].基于AC自动机和地址概率模型的地址标准化算法[J]. 计算机与现代化 2018(12)
    • [23].基于用户地址动态变化的防御方法[J]. 计算机工程与设计 2018(08)
    • [24].面向复杂中文地址关联的三维关系评估模型[J]. 计算机应用研究 2018(12)
    • [25].Android手机照片中地址信息添加技术[J]. 信息技术 2014(04)
    • [26].基于GIS的电信网络资源的标准地址快速上图方法研究[J]. 通信电源技术 2019(02)
    • [27].一种基于最小距离编辑法的模糊地址识别模型[J]. 电力大数据 2019(10)
    • [28].输入时快速调用固定信息[J]. 电脑爱好者 2016(08)
    • [29].中文专利数据地址信息清洗框架及实现[J]. 情报理论与实践 2016(04)
    • [30].BOSS地址信息优化整理[J]. 中国有线电视 2018(03)

    标签:;  ;  ;  ;  

    统计决策树下的城市地址集中文分词
    下载Doc文档

    猜你喜欢