地名地址匹配算法研究

地名地址匹配算法研究

论文摘要

地名地址用以描述某一地理实体,其是一种不可或缺的基础地理信息和社会公共信息。传统的地名地址数据获取通常是通过国家地理信息普查,实地获取等人为手段。这种获取地名地址数据的方式存在人力成本较大,工作量较大,工作效率不高以及时效性较低等问题。随着互联网不断发展,大数据的时代到来,互联网上存在各类学科的各种丰富数据。从海量的互联网地名地址信息资源中挖掘、抓取、存储地名地址信息数据成为了地名地址数据获取、更新的新手段。但是互联网中的地名地址数据没有统一的命名规范,结构多样化,形式相对来说也比较复杂,可能会存在有效信息缺失的情况,所有会给获取、更新地名地址数据造成比较大的困扰。这需要利用中文自然语言处理、信息抽取、机器学习等领域的技术与方法,从而实现地名地址信息从大量杂乱无章的互联网数据中抽取。地名地址数据仅仅只是一串描述空间地理位置的字符串,我们需要借助地名地址匹配技术,将用户输入的地址信息,对应至数据库中的某地理实体的准确空间位置坐标,地名地址匹配技术是现代交通导航等空间定位服务的重要依据。综上所述,本文研究主要内容如下:(1)研究标准地名地址数据形式,以及网络地名地址数据与标准地名地址数据之间的差异,为后续在网络中爬取的地名地址数据存储提供前提。(2)结合网络爬虫与中文自然语言处理等技术方法,能够从海量的地名地址数据中获取地名地址相关数据,较好的解决了利用传统的测绘手段获取地名地址信息数据中人力成本较高、工作量较大、工作效率不高以及时效性低等问题。(3)运用中文自然语言处理技术,能够合理的推断用户输入意图,解决输入错别字或缺失地址要素,从而大大提高地名地址匹配的准确性与智能性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 研究背景与研究意义
  •   1.2 国内外研究现状
  •   1.3 本论文主要研究内容
  •   1.4 论文结构
  • 第二章 地名地址分类与匹配
  •   2.1 地名地址标准模型
  •   2.2 地名地址数据现状
  •   2.3 地址的匹配
  •   2.4 本章小结
  • 第三章 地址数据预处理技术
  •   3.1 地名地址的清洗与标准化
  •   3.2 地名地址的拆分
  •   3.3 分词工具
  •   3.4 本章小结
  • 第四章 地名地址数据库
  •   4.1 网址链接的获取
  •   4.2 网页地名地址信息的提取
  •   4.3 地名地址的标准化
  •   4.4 坐标的转换
  •   4.5 地名地址数据库的建立与更新
  •   4.6 本章小结
  • 第五章 基于地名地址数据库的服务
  •   5.1 标准地名地址匹配
  •   5.2 非标准地名地址数据匹配
  •   5.3 地名地址匹配结果分析
  •   5.4 地名地址匹配的展示
  •   5.5 本章小结
  • 第六章 总结与展望
  •   6.1 本文总结
  •   6.2 展望
  • 致谢
  • 参考文献
  • 附录 A
  • 附录 B
  • 文章来源

    类型: 硕士论文

    作者: 艾嘉豪

    导师: 朱大明,周峻松

    关键词: 网络爬虫,地名地址,自然语言处理,地名地址匹配

    来源: 昆明理工大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 自然地理学和测绘学,自然地理学和测绘学,计算机软件及计算机应用

    单位: 昆明理工大学

    分类号: P208;P281

    DOI: 10.27200/d.cnki.gkmlu.2019.000124

    总页数: 88

    文件大小: 4209K

    下载量: 106

    相关论文文献

    • [1].地名问题[J]. 中国行政管理 2019(11)
    • [2].杭州市:加快“智慧地名”建设 助力移动办事之城[J]. 中国地名 2019(11)
    • [3].用法律终结改地名乱象[J]. 中国地名 2019(11)
    • [4].《液压与气动》特殊地名规范用法[J]. 液压与气动 2020(03)
    • [5].基于空间聚类的石城县客家地名景观分布特征研究[J]. 西北师范大学学报(自然科学版) 2020(01)
    • [6].地名读音“名从主人”的思考[J]. 中国地名 2020(01)
    • [7].广东古越语濒危地名的调查研究[J]. 中国地名 2020(01)
    • [8].依法而为 让地名变更不再“任性”[J]. 中国地名 2020(01)
    • [9].从解读地名热看坚定文化自信[J]. 中国地名 2020(01)
    • [10].海外粤侨人名地名与“一带一路”建设[J]. 广州社会主义学院学报 2020(01)
    • [11].多样性城市事件视域下的城市老地名与城市记忆的保护——以长沙老地名为例[J]. 湖南理工学院学报(自然科学版) 2020(01)
    • [12].基于业务联动的地名地址数据协同更新方法[J]. 城市勘测 2020(01)
    • [13].社会语言学视角下内蒙古五原县地名研究[J]. 中国地名 2020(04)
    • [14].故事里的地名[J]. 当代兵团 2020(08)
    • [15].广西第二次全国地名普查档案收集整理存在的问题及原因[J]. 办公室业务 2020(11)
    • [16].基于照片的地名地址采集与更新方法[J]. 城市勘测 2020(03)
    • [17].谈谈“不以外国人名、地名命名我国地名”——兼及地名的命名和管理[J]. 中国民政 2020(10)
    • [18].“十方世”是佛教语,不是地名[J]. 文史杂志 2020(04)
    • [19].浙江海岛地名文化溯源[J]. 今日科技 2020(08)
    • [20].关于地名普查地理信息采集与数据质量控制的研究[J]. 中国住宅设施 2020(08)
    • [21].地名的天文学记趣[J]. 中国地名 2020(08)
    • [22].俄汉方位地名之比较[J]. 河北北方学院学报(社会科学版) 2020(03)
    • [23].先秦“异地同名”现象与地名流动的初步考察[J]. 史学月刊 2020(10)
    • [24].地名何以成为“话题王”[J]. 中国地名 2020(09)
    • [25].地貌视角的诸暨乡村地名空间分布研究[J]. 测绘科学 2020(11)
    • [26].南京含有“马”字的地名[J]. 中国地名 2019(05)
    • [27].六部门联合整治不规范地名[J]. 中国地名 2019(06)
    • [28].洋地名、怪地名该咋“整”[J]. 中国地名 2019(07)
    • [29].地名治理也要防止权力任性[J]. 领导决策信息 2019(24)
    • [30].论地名的方与圆[J]. 长沙民政职业技术学院学报 2019(03)

    标签:;  ;  ;  ;  

    地名地址匹配算法研究
    下载Doc文档

    猜你喜欢