基于文本的土壤—环境关系获取方法研究

基于文本的土壤—环境关系获取方法研究

论文摘要

土壤是人类赖以生存的物质基础,是不可或缺和不能再生的自然资源。对土壤空间分布信息的准确认识,是合理利用土壤资源的基础。土壤空间分布信息具有重要的科研与应用价值,因此,土壤空间分布信息的获取具有重要的研究意义。推测性土壤制图是当前获取土壤空间分布信息的主流方法,土壤-环境关系的获取是推测性土壤制图的关键问题。在推测性土壤制图中,用于获取土壤-环境关系的数据源主要分为三类:野外样点、已有土壤图、土壤专家。而土壤志等文本资料中包含了大量的土壤调查数据和成土因子信息,汇集了众多土壤专家对各种土壤类型、属性信息及其变化规律的理解,蕴含了丰富的土壤-环境关系。因此,如果文本资料可以作为一类获取土壤-环境关系的数据源,不仅能增加土壤-环境关系获取的渠道,而且能充分利用土壤文本资料中的土壤-环境关系知识。为了从文本资料中获取定量化的土壤-环境关系,首先要解决的是土壤-环境文本信息抽取及结构化的问题,然后要解决的是定量化的土壤-环境关系获取的问题。针对第一个问题,本文首先设计了适用于表达土壤-环境文本信息的框架结构;然后阐述了抽取目标土壤-环境文本信息所需的领域知识库和语料库的构建方法;最后在分析总结土壤信息、环境因子信息的语言描述特点以及现有信息抽取方法特点的基础上,综合基于规则和基于条件随机场(CRFs)模型两种信息抽取方法抽取不同的待抽取的目标信息,以实现二者的优势互补。当目标信息的表达模式单一、有规律时,采用基于规则的方法,当目标信息的表达模式复杂多变、不规律时,采用基于CRFs模型的方法,并将不同目标信息的抽取结果填充到土壤-环境文本信息框架中。针对第二个问题,本文提出了一种基于土壤-环境文本信息获取定量化的土壤-环境关系的方法,通过假设土壤类型在地理空间的分布与特定环境因子集在属性空间上的组合间具有一定的对应关系,将土壤-环境关系的获取问题转变成特定环境因子组合及其对应的土壤语义信息的获取。该方法首先基于土壤-环境文本信息,采用分区聚类法获取各环境因子组合对应的类簇;然后根据土壤-环境文本信息框架中的环境因子信息与环境因子组合类簇的环境因子信息,计算土壤-环境文本信息框架与环境因子组合之间的综合环境相似度,进而确定各环境因子组合对应的土壤语义信息;最后从各环境因子组合类簇中筛选出其土壤语义信息对应的代表性点集,并采用核密度估计法获取定量化的土壤-环境关系。本文以我国第二次土壤普查期间的土壤志文本为数据源,以宣州研究区为例,对所提方法进行了应用与验证。结果显示:对于土壤-环境文本信息的抽取,基于规则的抽取方法能有效地从文本中抽取高程、坡度等表达模式单一、有规律的目标信息,抽取结果的准确率均大于90%,基于CRFs模型的方法能有效地抽取表达模式复杂多变、不规律的目标信息,如地貌部位、母质信息抽取结果的准确率分别为88.62%、84.15%,土壤-环境文本信息框架能有效地组织与结构化不同目标信息的抽取结果;对于定量化土壤-环境关系的获取,采用本文方法获取的土壤-环境关系在研究区的制图精度可达69.77%,优于直接筛选法的制图精度(48.84%)和传统土壤图的精度(51.16%),说明基于土壤-环境文本信息能有效地获取定量化的土壤-环境关系。综上,本文所提的面向文本的土壤-环境关系获取方法能够有效地从文本资料中抽取土壤-环境文本信息并进行结构化组织,并基于结构化的土壤-环境文本信息获取定量化的土壤-环境关系,同时表明文本资料可以独立地作为一种获取土壤-环境关系的数据源。该方法的提出是对现有的土壤-环境关系获取方法体系的进一步完善。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景及意义
  •   1.2 相关研究及进展
  •     1.2.1 基于野外样点的土壤-环境关系获取
  •     1.2.2 基于已有土壤图的土壤-环境关系获取
  •     1.2.3 基于土壤专家的土壤-环境关系获取
  •     1.2.4 研究现状总结
  •   1.3 科学问题
  •   1.4 研究目标
  •   1.5 研究思路
  •   1.6 研究内容与技术路线
  •   1.7 论文组织
  • 第2章 土壤-环境文本信息的抽取与结构化方法
  •   2.1 引言
  •   2.2 土壤-环境文本信息的描述特点
  •     2.2.1 土壤类型与属性信息的描述特点
  •     2.2.2 环境因子信息的描述特点
  •   2.3 土壤-环境文本信息的结构化表达
  •   2.4 领域知识库及语料库构建
  •     2.4.1 领域知识库构建
  •     2.4.2 领域语料库构建
  •   2.5 土壤-环境文本信息抽取
  •     2.5.1 基于规则的方法
  •     2.5.2 基于统计的方法
  •   2.6 本章小结
  • 第3章 定量化的土壤-环境关系获取方法
  •   3.1 引言
  •   3.2 环境因子组合获取
  •     3.2.1 聚类因子选择及预处理
  •     3.2.2 分区聚类数推测
  •     3.2.3 环境因子组合获取
  •   3.3 环境因子组合语义信息的计算
  •     3.3.1 环境因子文本信息定量化
  •     3.3.2 环境因子组合的语义计算
  •   3.4 代表性样点选择
  •   3.5 定量化的土壤-环境关系获取
  •   3.6 基于土壤-环境关系的推测性土壤制图
  •   3.7 本章小结
  • 第4章 应用案例
  •   4.1 引言
  •   4.2 研究区与数据
  •     4.2.1 研究区介绍
  •     4.2.2 文本数据
  •     4.2.3 环境因子及验证样点数据
  •   4.3 土壤-环境文本信息的抽取与结构化
  •     4.3.1 实验设计与评价方法
  •     4.3.2 基于规则的方法的结果
  •     4.3.3 基于CRFs模型的方法的结果
  •     4.3.4 土壤-环境文本信息的结构化组织
  •     4.3.5 讨论与分析
  •   4.4 定量化的土壤-环境关系获取
  •     4.4.1 实验设计与评价方法
  •     4.4.2 环境因子组合获取
  •     4.4.3 环境因子组合语义信息计算
  •     4.4.4 土壤-环境关系获取
  •     4.4.5 推测性土壤制图结果
  •     4.4.6 讨论与分析
  •   4.5 本章小结
  • 第5章 结论与展望
  •   5.1 主要结论
  •   5.2 研究特色与创新
  •   5.3 问题与展望
  • 参考文献
  • 附录A 土种文本描述实例(《宣州土壤》)
  • 附录B 土种文本描述实例(《中国土种志》)
  • 附录C 《宣州土壤》土壤分类系统表
  • 附录D 土壤-环境关系隶属度曲线集
  • 在读期间发表的学术论文及研究成果
  • 文章来源

    类型: 博士论文

    作者: 王德生

    导师: 朱阿兴

    关键词: 数字土壤制图,土壤志,土壤环境关系,信息抽取,定量关系获取

    来源: 南京师范大学

    年度: 2019

    分类: 基础科学,农业科技

    专业: 自然地理学和测绘学,农业基础科学,农艺学

    单位: 南京师范大学

    分类号: S159

    DOI: 10.27245/d.cnki.gnjsu.2019.000725

    总页数: 141

    文件大小: 15027K

    下载量: 61

    相关论文文献

    • [1].文本类型理论适用科普文翻译的局限性分析[J]. 淮海工学院学报(人文社会科学版) 2019(12)
    • [2].副文本翻译研究的垦拓——《翻译与副文本》述评[J]. 东方翻译 2020(01)
    • [3].目的论视角下中医药术语文本类型及翻译策略[J]. 中医药导报 2020(08)
    • [4].基于文本类型理论的应用翻译教学[J]. 广东第二师范学院学报 2020(04)
    • [5].文本类型理论在大学英语翻译教学中的应用研究——结合教师专业领导力[J]. 江西化工 2018(06)
    • [6].从功能翻译的文本类型理论谈应用翻译实践[J]. 蚌埠学院学报 2016(06)
    • [7].文本类型理论指导下的中医外宣资料英译[J]. 中国中医基础医学杂志 2017(04)
    • [8].基于文本类型理论的服饰翻译实践[J]. 海外英语 2015(23)
    • [9].基于文本类型理论的机器翻译研究[J]. 中国科技翻译 2016(03)
    • [10].文本类型理论视角下的汉语标识语英译研究[J]. 牡丹江大学学报 2015(08)
    • [11].紧扣文本类型 指导高效阅读[J]. 教育 2020(17)
    • [12].从文本类型理论谈旅游文本英译汉翻译技巧——以Bountiful Bruges,a gem in Belgium为例[J]. 英语教师 2020(04)
    • [13].诵读型文本的“文本自足”和“文本突围”——“青春语文”课堂铸炼备课沙龙(之八)[J]. 中学语文教学参考 2018(26)
    • [14].基于文本类型与功能区分的说明文教学新探[J]. 语文教学通讯 2016(35)
    • [15].“非连续性文本”全景透视及解题方略[J]. 语文教学通讯 2017(04)
    • [16].《从图表中获取信息》教学设计[J]. 语文学习 2017(02)
    • [17].从学生的角度解读文本——《中彩那天》文本分析示范[J]. 语文教学通讯 2017(09)
    • [18].诺德文本类型理论在翻译教学中的应用[J]. 读与写(教育教学刊) 2016(06)
    • [19].非连续性文本——让小学语文教学活色生香[J]. 教育艺术 2017(11)
    • [20].紧扣文本信息 铸造高效课堂[J]. 陕西教育(教学版) 2016(12)
    • [21].坚守儿童立场,培育儿童阅读力[J]. 小学语文教学 2017(06)
    • [22].“非连续性文本”全景透视及解题方略[J]. 新高考(语文备考) 2017(02)
    • [23].文体视角下高效课堂的构建策略[J]. 语文世界(教师之窗) 2017(05)
    • [24].文学的意义——对作为语文教材优势文本群落的解读[J]. 小学语文 2017(Z2)
    • [25].文本类型理论在信息型文本翻译中的应用[J]. 唐山文学 2017(08)
    • [26].文本类型理论下的中式菜名英译与翻译策略[J]. 北方文学 2017(20)
    • [27].从文本类型看翻译的多样性[J]. 考试周刊 2017(50)
    • [28].浅析文本类型的流变[J]. 长江丛刊 2017(22)
    • [29].莱斯的文本类型学对高校管理条例英译的启示——以《西南石油大学国际学生手册》翻译为例[J]. 北方文学 2017(21)
    • [30].从文本类型角度看大雁塔的翻译[J]. 校园英语 2017(25)

    标签:;  ;  ;  ;  ;  

    基于文本的土壤—环境关系获取方法研究
    下载Doc文档

    猜你喜欢