导读:本文包含了半结构数据论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:结构,数据,数据模型,晶格,语言,范式,粗糙。
半结构数据论文文献综述
苏慧丽[1](2018)在《面向主题的半结构数据集成方法研究》一文中研究指出目前,互联网的普及和应用改变了人们发布和获取信息的方式,几乎所有的机构与用户都会选择在互联网上发布数据,然而由于互联网提供了多样的发布形式且没有统一的格式要求,同领域的机构和用户发布的半结构数据表往往具有不一致的逻辑结构,这就使需要收集领域信息的用户面临很大的挑战,如何将这些结构不同的数据表统一并规范化存储成为一个亟需解决的问题。本文针对此问题进行了研究,提出了面向主题的半结构数据表的规范化、属性依赖和候选码识别方法,主要贡献如下:(1)提出了半结构数据表集成框架。对于半结构数据表集成方法提出了整体框架,描述了处理数据的完整流程,对规范表、非规范表、单元格、属性约简、差别函数等概念给出了形式化定义。(2)提出了非规范表规范化方法。通过表格的形式化定义,提出了一个可以自动地将不符合第一范式(1NF)的非规范表转化1NF规范表的方法。综合分析非规范表格的表头特征,提出了基于表头的规范化方法,包括识别规范表与非规范表、非规范表头的结构转化、表头中属性依赖关系的提取等。(3)提出了面向主题的属性依赖和候选码识别方法。以粗糙集中信息系统的属性约简算法为启发,提出了基于差别函数属性约简的属性依赖和候选码识别方法。通过非规范表头的嵌套结构提出了类核和非候选码集合的概念,并在此基础上改进了基于差别函数的属性约简算法。该算法利用增量式的同主题表格数据集、每个表格的类核、非候选码集合、核和差别函数、此主题的各个属性等共同计算属性候选码,最终得到此主题在二维表数据集中所有属性之间的依赖关系,并通过实验证明了方法的可行性和准确性。(本文来源于《天津理工大学》期刊2018-03-01)
褚东升[2](2004)在《基于XML的半结构数据查询语言研究》一文中研究指出半结构数据管理的核心问题之一是数据的有效查询问题。文章重点分析、比较了两种基于XML的半结构查询语言,即XQL和XML-QL。在此基础上总结出了XML查询语言的基本需求,并对目前的XML查询语言提出了四点扩充建议。(本文来源于《计算机工程与应用》期刊2004年33期)
孙伟[3](2004)在《基于XML半结构数据索引的研究》一文中研究指出近年来,随着WWW(World Wide Web)的迅猛发展,半结构数据的管理已成为数据库领域中的一个十分重要的研究方向。特别是XML(eXtensible Markup Language)作为一种新的数据交换事实上的标准,使得WWW上的数据交换和集成成为可能。将Web上的半结构数据迁移到XML上是对WWW上巨大数据进行有效管理的一项十分有意义的工作。因而,基于XML的半结构数据管理的研究目前已成为国际数据库界的一个重要研究方向之一。 半结构数据索引的研究是半结构数据管理的研究的一部分。半结构数据索引既有与传统数据库相同的部分,也有不同于传统数据库的部分。传统数据库的一部分成熟技术可以比较方便地移植到半结构数据上来。但是,由于半结构数据的特点,半结构数据索也引带来一些新的研究问题。 由于XML的数据表达能力强大,XML完全可以在互联网和数据库之间扮演十分重要的角色。本文对半结构数据索引的研究都基于XML的图模型。目前对半结构数据索引的研究已较为深入,已经有一些较成熟的基于XML的半结构数据索引。针对半结构数据索引的特点,我们主要从数据表示、索引接口、路径模版的形式、索引的导航方式、节点的定义、索引的更新和索引的存储七个方面对这些半结构数据索引进行分析和分类。我们对已有的半结构数据索引都进行了较为详尽的介绍和其特点的分析。特别地,对BUS索引给出详尽的介绍并分析该索引存在的不易文档动态更新的缺点。于是,我们建立了一个支持文档动态更新的半结构数据索引原型系统。我们建立的原型系统,采用与关系数据库结合的模式,具有适应文档频繁更新的优点,使文档节点的插入和删除实现较为容易。最后,我们通过实验数据的分析和比较,验证了在文档内容和结构频繁更新情况下该原型系统半结构数据索引的执行效率。(本文来源于《哈尔滨工程大学》期刊2004-01-01)
聂培尧,李战怀,胡正国[4](2003)在《一种基于XML的半结构数据的ORDB存储方法》一文中研究指出由于半结构数据缺乏类型信息,因而半结构数据服务器中数据的存储策略将是一个十分重要的研究课题。因为只有有效的存储,才能导致有效的索引及查询处理等技术。正是因为如此,关于如何对半结构数据进行有效的存储亦是目前研究的热点问题。论文在对现有的叁种存储方法进行分析的基础上,提出并实现了一种XML数据的ORDB存储策略。(本文来源于《计算机工程与应用》期刊2003年14期)
聂培尧,李战怀,胡正国[5](2003)在《基于XML的半结构数据的视图问题研究》一文中研究指出1 引言数据库中的视图机制主要是根据用户或应用的需要对数据进行剪裁以增加数据库的灵活性。数据库的视图是适合某一特定用户或应用的数据库中部分数据的一种抽象。视图是依照视图声明语言(View Specification Language)来定义的,视图的声明是施加于源数据库(或等价的基数据库)上的。通常,数据库视图既可以是虚拟的(Virtual)、也可以是实际化的(本文来源于《计算机科学》期刊2003年02期)
聂培尧,李战怀,胡正国[6](2003)在《基于OEM的XML半结构数据的模式描述方法》一文中研究指出半结构数据的类型和模式是提高半结构数据处理效率的关键技术。首先对半结构数据的特点及半结构数据的模式的特点进行了论述,然后对基于XML的模式描述形式进行了研究,提出了一种基于OEM的XMLDTD模式的定义和形式化描述方法。(本文来源于《计算机工程与设计》期刊2003年01期)
胡茂,胡盛[7](2003)在《半结构数据中的结构推理》一文中研究指出当处理在网上遇到的半结构数据时,从中推导出其暗含的结构显得愈来愈重要了,不仅对于用户(如方便查询)而且对于整个系统(如优化访问)来说,其重要性也是不言而喻的.所考虑的问题就是在半结构数据集合中识别一些基本的结构,而这些数据相当不规则,所以说将所研究的数据对象近似地分成"类层"的集合形式组成这些基本的结构,提出一种数据"类层"的概念、得出类型层次的算法、以及将类型赋给数据元素的一些规则.(本文来源于《云南大学学报(自然科学版)》期刊2003年01期)
聂培尧,李战怀,胡正国[8](2002)在《一种基于XML的半结构数据模型》一文中研究指出半结构数据的模型是对半结构数据进行有效管理的基础,也是基于XML半结构数据管理系统的基础。首先探讨了半结构数据的表示形式;然后对XML数据模型进行了研究;最后,在以上研究的基础上实现了一种基于XML的半结构数据模型。(本文来源于《计算机应用研究》期刊2002年12期)
冯建华,王钦克,周立柱,孟宪虎[9](2002)在《半结构数据的存储模型和查询执行》一文中研究指出1 引言半结构数据是指区别于语音和图像文件等“原始数据”,具有一定程度的结构,又不像传统的数据库系统那样存在严格模式的数据。半结构数据广泛存在于各种电子数据源,特别是Internet当中。以WWW为例,其HTML文件格式本身就是由标签和锚点等结构单元组成的,因此文件中的数据常常具有明显的结构。但同时数据的结构又非常不规范,不符合传统数据库的要求,因此不能简单地应用现有的数据库技术和工具对其进行处理,需要研究和开发对半结构数据进行描述和处理的新技术、新工具。(本文来源于《计算机科学》期刊2002年10期)
聂培尧[10](2002)在《基于XML的半结构数据管理及数据集成问题研究》一文中研究指出近年来,随着WWW(World Wide Web)的迅猛发展,半结构数据的管理与集成已成为数据库领域中的一个十分重要的研究方向。特别是XML(eXtensible Markup Language)作为一种新的数据交换事实上的标准,使得WWW上的数据交换和集成成为可能。XML另一个使人感到振奋的是,它的出现将会“把Web变成数据库”。将Web上的半结构数据迁移到XML上是对WWW上巨大数据进行有效管理的一项十分有意义的工作。因而,基于XML的半结构数据管理与集成问题的研究目前已成为国际数据库界的一个重要研究方向之一。 本文对基于XML的半结构数据的管理及集成进行了较为全面而深入的研究和探讨,包括基于XML的半结构数据模型、查询语言、模式发现及抽取、视图机制、XML半结构数据的存储以及数据集成等问题。本文反映了作者自1999年以来的主要研究成果,包括以下内容: 一、在基于XML的半结构数据模型的研究上,首先提出了一种类LISP语言的半结构数据的句法描述形式。使用该句法,可以将半结构数据的描述统一到一种形式化的方法上。本文还对XML数据与半结构数据之间的关系进行了研究,并在此基础上提出了一种带有性质(Property)的基于XML的半结构数据模型,同时给出了将XML数据映象到带有性质的半结构数据模型上的算法,从而将半结构数据中的元数据(性质)与XML文档中元素的属性统一起来。 二、给出了半结构数据查询语言的评价准则。基于这些准则,对一个简单的半结构数据查询核心语言的语法提出了两方面扩充;给出了计算数据图中正规表达式的算法;对半结构数据查询语言的一阶逻辑描述、结构递归和数据图的双态仿真(Bisimulation)等问题进行了研究,提出了一种判定数据图的Bisimulation算法;在XML数据查询语言研究的基础上,设计并实现了一种具有数据库查询特性的Web查询系统原型。 叁、对半结构数据的类型及模式的描述形式进行了研究,并分别给出了使用最大不动点语义计算半结构数据类型划分的算法思想和最大仿真(Simulation)计算方法的思想。本文还对模式的抽取及XML模式的描述形式进行了研究,提出了使用Simulation算法抽取Datalog规则的算法思想和基于OEM(Object Exchange Model)的XML DTD模式的形式描述方法。 四、对半结构数据的视图机制进行了研究,并就半结构数据的虚拟视图和实视图(物化视图)维护困难的问题给出了一些解决策略;提出了一种用于异构 西北工业大学博士学住论文一数据源或Web数据集成系统环境的XML视图的体系结构,并就该体系结构中的各主要组成部分进行了论述。 五、对基于XML的半结构数据集成所涉及到的若干问题进行了研究,对叁种**L数据的存储方法进行了深入分析和比较,提出井实现了一种**L数掂的OapB存储策略;对数据源上的分布查询计算及数据融合问题进行了研究,给出了一种减少WWW站点间通信量、提高查询计算效率的分布查询计算策略;提出并实现了一种可动态配置的、基于XML的半结构数据集成用的数据包装器 (Wrapper)的原型系统。 本文中的部分研究工作得到了国家自然科学基金及山东省教育厅第二批科研发展计划项目的资助。(本文来源于《西北工业大学》期刊2002-03-01)
半结构数据论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
半结构数据管理的核心问题之一是数据的有效查询问题。文章重点分析、比较了两种基于XML的半结构查询语言,即XQL和XML-QL。在此基础上总结出了XML查询语言的基本需求,并对目前的XML查询语言提出了四点扩充建议。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
半结构数据论文参考文献
[1].苏慧丽.面向主题的半结构数据集成方法研究[D].天津理工大学.2018
[2].褚东升.基于XML的半结构数据查询语言研究[J].计算机工程与应用.2004
[3].孙伟.基于XML半结构数据索引的研究[D].哈尔滨工程大学.2004
[4].聂培尧,李战怀,胡正国.一种基于XML的半结构数据的ORDB存储方法[J].计算机工程与应用.2003
[5].聂培尧,李战怀,胡正国.基于XML的半结构数据的视图问题研究[J].计算机科学.2003
[6].聂培尧,李战怀,胡正国.基于OEM的XML半结构数据的模式描述方法[J].计算机工程与设计.2003
[7].胡茂,胡盛.半结构数据中的结构推理[J].云南大学学报(自然科学版).2003
[8].聂培尧,李战怀,胡正国.一种基于XML的半结构数据模型[J].计算机应用研究.2002
[9].冯建华,王钦克,周立柱,孟宪虎.半结构数据的存储模型和查询执行[J].计算机科学.2002
[10].聂培尧.基于XML的半结构数据管理及数据集成问题研究[D].西北工业大学.2002