基于条件随机场的非规范化中文地址解析方法

基于条件随机场的非规范化中文地址解析方法

论文摘要

地址解析是地理编码的核心任务之一,而混乱的地址标准、随意的中文地址表达给地址解析带来了极大困难。该文提出一种基于条件随机场的非规范化中文地址解析方法。一方面,综合分析各种非规范化地址要素的类型特征,在现有标注体系基础上设计出一套优化的地址要素分类标注体系,并制定特征模板,然后采用自训练半监督学习与人工标注互补融合的策略,获取大量高质量的已标注语料供模型训练;另一方面,挑选已标注语料训练条件随机场模型,实现对地址要素的自动解析。选取广东省博罗县30 000条地址进行算法验证和解析性能评测。实验表明,与其他语料标注方法相比,该方法在获取有效地址解析的同时,显著降低了标注成本。结果表明,该方法适用于地理编码领域中大规模非规范化中文地址的自动解析。

论文目录

  • 0 引言
  • 1 基于CRF的中文地址解析
  •   1.1 条件随机场
  •   1.2 中文地址解析模型
  •   1.3 基于CRF的地址解析流程
  • 2 中文地址标注语料的获取
  •   2.1 地址标注体系设计与格式转换
  •   2.2 Self-training与人工混合的迭代标注方法
  • 3 语料标注方法评价
  •   3.1 实验与特征模板定义
  •   3.2 语料标注方法对比
  • 4 地址要素解析结果评价
  •   4.1 评价指标
  •   4.2 解析结果分析
  • 5 结语
  • 文章来源

    类型: 期刊论文

    作者: 许也,申柏希,徐翔,李军

    关键词: 条件随机场,中文地址,自训练,地理编码

    来源: 地理与地理信息科学 2019年02期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 自然地理学和测绘学,计算机软件及计算机应用

    单位: 中山大学地理科学与规划学院广东省城市化与地理环境空间模拟重点实验室,电子科技大学中山学院

    基金: 广东省自然科学基金项目(2016A030313254),国家自然科学基金项目(61771496),国家重点研发计划项目(2017YFB0502900),中山市社会公益科技研究项目“基于多源遥感影像的红树林树种的精细分类”(2018B1015)

    分类号: P208

    页码: 12-18

    总页数: 7

    文件大小: 603K

    下载量: 200

    相关论文文献

    • [1].静态二进制翻译中动态地址解析恢复技术研究[J]. 计算机工程与应用 2008(22)
    • [2].网络地址解析实验方法研究[J]. 实验室研究与探索 2008(12)
    • [3].基于异网的ARP地址解析的剖析[J]. 赤峰学院学报(自然科学版) 2011(04)
    • [4].物联网ONS地址解析在食品安全追溯中的应用[J]. 科技创新与应用 2018(03)
    • [5].基于EPC地址解析的食品安全电子追溯技术研究[J]. 中国自动识别技术 2018(01)
    • [6].网络专题数据获取与成图平台的开发与应用[J]. 北京测绘 2018(12)
    • [7].浅析ARP欺骗原理及解决方法[J]. 甘肃科技 2011(18)
    • [8].浅析ARP协议工作原理[J]. 出国与就业(就业版) 2011(08)
    • [9].煤矿测井用经纬度获取和磁偏角计算[J]. 矿山测量 2019(02)
    • [10].mDNSResponder程序惹故障[J]. 网络安全和信息化 2017(09)
    • [11].一种中文门楼址的自适应表达及成分解析方法[J]. 测绘科学 2014(12)
    • [12].VLAN技术在三层交换机中的应用[J]. 微处理机 2009(06)
    • [13].基于百度地图API的网点成图平台的开发与应用[J]. 测绘地理信息 2019(01)
    • [14].基于透明机制的分布式服务器负载均衡的研究[J]. 科技传播 2010(20)
    • [15].中铁快运配送系统设计与实现[J]. 铁道运输与经济 2019(12)
    • [16].以断防断 俄罗斯断网演习的启示[J]. 卫星与网络 2020(03)
    • [17].基于地图API的农资服务网点电子地图设计与实现[J]. 仪表技术 2018(01)
    • [18].DNS欺骗攻击及其防护研究[J]. 软件导刊 2012(03)
    • [19].局域网ARP欺骗攻击及其防御措施研究[J]. 电脑知识与技术 2009(21)
    • [20].电力大数据中文地址解析和规范化方法研究[J]. 电力信息与通信技术 2017(05)
    • [21].网络通在解决网络故障中的应用[J]. 轻工科技 2017(09)
    • [22].ARP攻击防范与解决方案[J]. 商品与质量 2010(S7)
    • [23].利用正则表达式开发动态网页[J]. 数字技术与应用 2010(02)
    • [24].IPv4协议和IPv6协议的比较[J]. 硅谷 2009(11)
    • [25].视频要下了看FLV地址解析看过来[J]. 网友世界 2010(Z1)
    • [26].匿名地址解析模型(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2016(10)
    • [27].简单三招 影音下载无难题[J]. 电脑爱好者 2013(06)
    • [28].浅议电子阅览室如何防范ARP病毒[J]. 中国电力教育 2008(17)
    • [29].基于ARP协议的网络欺骗与防范[J]. 通化师范学院学报 2011(06)
    • [30].基于Google Maps API的基础数据属性空间化研究与实现[J]. 电脑知识与技术 2017(30)

    标签:;  ;  ;  ;  

    基于条件随机场的非规范化中文地址解析方法
    下载Doc文档

    猜你喜欢