Web信息集成系统及查询优化方法研究

Web信息集成系统及查询优化方法研究

郑淑丽[1]2003年在《Web信息集成系统及查询优化方法研究》文中进行了进一步梳理Web信息集成系统是为Web数据管理提供了一种全新的方法。它提供了一个访问Web上多个数据源的、统一的和透明的访问界面,其主要目标是支持对Web上的多个数据源的查询,满足用户的查询需求,本文对Web信息集成系统的研究现状和发展趋势进行了深入的分析和探讨,围绕其中的几个关键技术,如构建面向XML的公共数据模型,根据数据源的查询处理能力生成有效的查询执行规划,智能协作信息系统中的协作与学习以及基于Agent的查询优化技术等几个方面进行了研究,本文的主要研究成果如下: (1)本章首先综合分析了Web信息集成系统的研究现状和发展趋势,对信息集成的两种方法:物化方法和虚拟方法以及多数据库集成系统和Mediator/Wrapper集成系统做了分析和比较,此外针对Web信息集成系统查询处理过程的特点设计了一个查询优化器,该优化器具有支持系统进行动态查询优化的能力,可以有效提高系统的查询处理性能。 (2)提出了一种面向XML的公共数据模型XCDM,该模型针对已有的半结构化数据源模型(OEM和OIM)在表达XML文档时存在的缺陷,将OIM的有向图结构与XML语言的相关特性相结合,并补充了OIM对象代数的六种代数操作。XCDM充分考虑了XML语法表达的灵活性,可以为用户提供多级视图,不仅可以表示Web上大量由XML表示的半结构化数据,还可以实现与其他数据模型之间的映射。XCDM可以起到某种元数据的作用,统一描述半结构和无结构数据,它符合公共数据模型的几点准则,完全适合作为Web信息集成系统中的公共数据模型。 (3)提出一种基于遗传算法的多数据源连接查询优化问题的方法以及与此相适应编码方法、交叉算子和变异算子。该算法适用于集成系统中具有约束模式的数据源。我们将遗传算法与数据源的约束模式有效地结合起来,将查询优化分成两个阶段进行,第一阶段利用数据源的查询处理能力划分搜索空间,第二阶段利用第一阶段的结果作为启发式信息,采用遗传算法寻找最优解或次优解。该方法不仅可用于左深度树搜索空间,同样适用于混合搜索空间。同时还引入了Neighbor结构以解决传统遗传算法局部收敛速度慢的缺点,有效的缩短了计算时间,提高了系统的查询效率。 (4)提出一种新的多Agent协作模型MACM及一种改进的分布式强化学习算法。在Web信息集成系统向智能协作信息系统发展的同时,对系统中多个组成部分(Agent)之间如何进行有效协作的研究也得到了越来越多的重视,理论分析表明,如果在智能协作信息系统中引入学习机制,使得每个Agent通过学习协调自身的行为,则能有效的完成共同目标。本章研究基于强化学习的多Agent系统协作机制,提出一种新的协作模型MACM,该模型通过提供灵活 摘 要协调机制支持多Agent之间的协作及协作过程中的学习,并针对MACM模型提出了一种改进的分布式强化学习算法。该算法不仅保留了分布式强化学习算法的优点,即减少了联合Q值表的存储空间,降低学习对系统资源的要求,同时还能确保以较快的速度收敛到最优解。 (5)提出了一种基于Agent的查询优化系统模型,在该系统中,Agent采用了典型的慎思型体系结构,即BDI模型。Agent具有信念库,目标库并在此基础上进行学习和推理,以支持信息集成系统的动态查询优化和规划的执行,提高系统的查询效率。在基于Agent的查询优化系统模型中,利用Agent的学习能力可以根据数据源的负载变化来动态选择参与查询的数据源,详细探讨了一种基于强化学习的数据源选择优化算法,并指出了其不足之处以及未来的研究方向。

梅泽勇[2]2012年在《图书网站信息集成系统的构建》文中指出网络已经快速融入到人们生活当中,特别是B2C与C2C的应用,使得用户通过网络能很容易的搜索以及获取所需要的信息与物品。图书网站是指存在于互联网上的那些大型或者小型的主要提供图书销售及其服务的网站或者模块,书价、物流、商家的存货以及相应的各项服务一直是用户重点关注的地方。然而除了京东商城、卓越亚马逊和当当网等大型网站具有专门的售书以及相应服务以外,其他那些相对较小的图书网站就显得比较孤立。这些网站往往在地理位置和功能结构上相对比较孤立,然而他们对整个网络和用户而言又是非常重要的。信息集成能够将多个相对独立的、分布的、异构的信息源整合起来,通过建立全局而且统一的视图,使得无需考虑数据类型、存储位置等诸多影响因素,随时随地提供对数据统一且透明的访问,为用户提供简单高效的查询方式,最终实现信息资源的共享。本文旨在构建一个图书网站信息集成系统,通过采集与集成各大图书网站的图书信息,以帮助人们快速从各种图书网站中快速准确的找到所需的图书信息。由于本信息系统是针对各种图书网站而建立,因此本系统具有很强的针对性,会为用户提供用户所需要的各方面图书信息,以便用户做出选择。文章第一部分主要讲述了本文的缘起与目的意义,以及国内外在此方面的研究进展与成果;第二章则介绍了本系统中涉及的主要概念,包括深层网络以及网络挖掘等;第叁章详细叙述了本系统涉及的关键问题及其研究,包括图书网站初始检索页面以及检索结果所涉及的信息抓取技术,还包含为了访问目标网站深层信息所需要的表单自动填充技术,最后是对检索结果的处理并抽取所需要的信息抽取技术;第四章主要分析本系统的目标以及对系统进行整体分析与设计,同时提出系统优化与相关安全性与保密性等设计;第五章回顾了整个文章的工作之后提出以后的工作方向与要点。

史军强[3]2005年在《WEB信息集成技术研究》文中研究说明WEB 如同一个庞大的知识库,但其中的知识纷繁复杂、浩如烟海难以使用。WEB 信息集成技术能够对凌乱的WEB 页面进行分析、筛选、集成,为人们提供一个统一的知识视图和访问方式,从而实现对WEB 资源的高效利用。目前的WEB 信息集成技术还很不成熟,尤其是缺乏自动性和智能性。我们将领域本体引入到WEB 集成中,基于领域本体在WEB 信息集成的自动性和智能性方面作了一系列成功的尝试,并提出了完整的解决方案。我们回顾了信息集成系统的发展历程,总结了信息集成的基本原理和经典方法;阐述了WEB 信息集成的功能要求和经典体系结构以及现有的各个功能部分的实现方案;通过与传统信息集成的对比,分析了WEB 信息集成系统的新特点、新需求和关键技术。阐述了本体的基本理论、功能和表示方法,特别分析了利用领域本体进行知识表示、知识匹配的具体方法。为了实现信息集成系统及其构建过程的自动化和智能化,我们为其引入了领域本体。在领域本体的基础上对传统的Mediator/Wrapper 体系结构作了相应的改进,并为一些功能模块设计了新的实现方法。采用RDF 表示本体,设计了领域本体的多文件、树状的存储和访问方法并实现了基于领域本体的知识匹配算法;设计了基于领域本体和XML 的数据源描述方法,并实现了数据源分析和数据源描述生成的自动化;设计了基于领域本体的查询重写、查询分解、查询优化和查询结果处理等一系列的智能化查询处理方法;对于动态WEB 数据源,采用类似于服务的描述和访问方式从而实现了动态数据源的集成。基于本体的WEB 信息集成系统的集成对象将不再是特定的某些数据源,而是随其所用的本体的变化而动态变化的,拥有某一领域的本体就可以集成该领域的数据源,拥有多个领域本体则可以进行跨领域集成。采用上述方法,设计并实现了一个原型系统。对该原型系统进行了充分的查询测试,在查准率、查全率、响应时间和跨数据源查询等方面均得到了不错的性能数据。这也证明了我们的基于本体的WEB 信息集成技术的解决方案的正确性和有效性。

李瑞轩[4]2004年在《异构信息集成中的查询处理与优化研究》文中研究说明近年来,计算机和网络技术的发展呈加速态势,但各种应用的核心——数据,仍以不同形式存储在不同的系统中,分而不聚,聚而不合,呈分布异构状态。随着应用需求的不断增加,越来越多的用户希望能够透明地获取和处理来自这些海量信息源中的有用数据,实现多个软硬件系统以及不同信息源之间的互操作。然而,这些信息源物理上可能分布在异构环境的多个自治域中,有着不同的数据格式、存储方式、访问控制策略,逻辑上则可能在数据模型、操纵语言和数据语义等方面存在着很大差异。同时,这些信息源的可共享性、共享方式、共享内容等也可能随时发生变化。设计一个支持公共数据模型和统一查询语言的异构信息集成系统(HIIS),是实现这种交互操作的一种较好办法。异构信息集成系统可以屏蔽现在已有的各种异构数据管理系统不同的访问方法和用户界面,给用户呈现一个访问多种异构数据源的公共接口,提供一个集成处理多种数据源、整合多个数据查询结果的信息交互处理平台。 数据互操作是异构信息集成领域需要解决的主要问题。联邦数据库系统和多数据库系统是解决分布式异构环境中多个数据源的集成与互操作的两种方法,但这两者各有优缺点。在分析联邦数据库系统与多数据库系统差异的基础上,提出了一种基于多自治域的层次互操作模型(MDHI)。这种框架既满足了局域范围内的信息集成和处理的效率,又提供了一种集成广域范围内多种异构数据源的方法,更加符合当前实际应用的需要。 在分析异构信息集成系统基本模式结构的基础上,提出了一种基于 XML 的集成数据模型(XIDM)作为集成系统的公共数据模型,它将全局模式和输出模式中的数据模型描述成图的结构,可以集成包括数据库系统、文件系统、Web 信息系统等多种异构系统中的数据。为了建立集成系统中不同模式层次之间的联系,给出了全局模式到输出模式之间的全局映射以及输出模式到局部模式的局部映射,解决 XIDM 模型与关系数据模型、面向对象模型以及 HTML/XML 文档模型之间的映射问题。实例证明XIDM 模型及其模式映射方法是合理且有效的。 查询处理是异构信息集成系统的关键技术之一,查询分解、查询调度和查询优化是查询处理的核心内容。通过定义集成系统中查询处理的基本概念,分析 XML 查询的基本特点和要求,选定 XQuery 作为面向 XIDM 模型的查询语言,给出了查询处理 I<WP=4>的基本体系结构。在此基础上,给出了全局查询分解的基本原则和查询分解算法,并对查询分解算法的语义等价性进行了分析。 查询后处理是根据查询计划进行调度并通过后处理操作完成中间结果组装的过程,后处理操作主要由全局查询涉及的所有场地间运算来完成。通过对关系代数中的关系操作进行扩展,定义了面向 XIDM 模型的基于路径的元素簇操作,即 XRA 代数,用于表达查询后处理中子查询结果的合并处理。给出了查询后处理的转换规则,提出了一种连接树结构来表达集成系统的查询后处理操作,并对其进行规范化处理。通过引入连接图的概念,将连接规范树转换为等价的连接图,供查询后处理调度使用,在此基础上,给出了基于连接图的查询后处理多级并发调度算法,以尽可能提高查询后处理执行的并发性。 查询优化是异构信息集成系统中非常重要而又十分复杂的问题。针对查询后处理中的场地间运算代价,分析了影响后处理优化的代价参数,给出了局部数据源代价和通信代价的估计方法。连接运算往往是查询处理中开销最大的运算,以场地间连接和外连接运算组成的连接图为基础,给出了一种基于最小生成树的静态优化算法MST-SO 和一种基于统计推理的动态优化方法 SR-DO,以及结合这两种方法的混合优化策略,并通过实验仿真的方法对它们的优化性能进行了实验分析和性能比较,实验证明混合优化的性能更优。 基于上述理论和实验研究成果,研制和开发了一个基于 Web 服务的多自治域异构信息集成系统 Panorama Web One,它能够提供对 Oracle、Sybase、DB2 等数据库系统以及 HTML/XML 文档等其他文件类数据源的透明访问,主要功能涵盖了模式集成与模式信息管理、查询处理和查询优化等方面,并通过与原有系统的对比测试实验,给出了 Panorama Web One 系统的性能分析与评价。

于红[5]2006年在《综合信息集成及查询优化的研究》文中研究表明随着Internet技术的发展,Web上各种在线信息源不断涌现,这些信息源种类繁多,结构各异。在互联网这样一个动态的环境中,各信息源不断地发生着变化,在这样一个动态、异构、开放的环境下快速、准确地获取信息是十分困难的。因此,研究信息集成系统,为用户提供一个访问异构数据源的统一接口有着非常重要的意义。在这种背景下,本文对信息集成系统的主要技术进行了深入的研究,具体研究工作如下: 信息集成系统体系结构是研究系统的组成模块以及各模块之间关系的。本文对目前几种典型的信息集成系统体系结构进行了分析,总结了这些体系结构的优点和不足。在对实际的信息集成工作中遇到的问题及其他相关需求进行分析的基础上,提出了综合信息集成系统体系结构。该体系结构既考虑对已有投资的保护,又考虑对不断生成的新数据的有效处理;既考虑对传统数据库中的数据和XML数据的处理,又考虑信息检索和辅助决策的需求。是一个面向目前大多数企业的综合信息集成系统。 模式映射的建立是信息集成系统的重要环节之一。本文提出了基于划分的映射模式发现框架——PBMSDF(Partition Based Mapping Schema Discovery Framework)。Dhamankar等提出了iMAP框架,该框架采用搜索器集合和Beam Search的方法,可以自动发现1:1映射、1:n和n:1的复杂映射,但是存在以下不足:一是不能发现m:n的复杂映射;二是该框架需要对属性及属性值实例进行分析,导致系统开销很大;叁是对于Web信息集成,获取属性值的数据实例有时是不可能的,因此该框架不能用于Web信息集成。He等提出了DCM(Dual Correlation Mining)框架,该框架采用对属性在模式中的分布进行分析发现属性之间相关度的方法来发现属性之间的映射关系,可以解决iMAP框架中存在的问题,仍存在以下不足:一是由于该框架采用的相关度衡量标准对部分属性的评价结果不准确,导致发现结果准确性不高;二是该框架中采用的AprioriCorrmining和DualCorrelationmining挖掘算法在由相关e项集生成相关e+1项集的过程中,将整个属性集合中的每一个属性添加到相关e项集中构成候选相关e+1项集,然后再判断该e+1项集是否相关,增加了许多不必要的计算,致使搜索空间过大,算法的效率较低。本文提出了比较适合于衡量属性之间相关度的C-衡量标准,并在PBMSDF框架中采用了该标准以提高发现结果的准确度;提出了基于划分和栈的模式映射发现算法,理论分析和实验结果均证明,该框架较iMAP和DCM具有较高的性能和较好的模式发现能力。 XML成为目前Web上数据表示和信息交换的标准,处理XML数据是集成系统的功能之一,XML查询的效率将直接影响集成系统的性能。本文提出了一种基于递归模

韩民智[6]2008年在《基于WebService的动态可调整的异构数据集成》文中研究指明随着计算机应用的发展及网络的普及,企业对于异构数据集成的需求越来越强烈,而且集成的对象不仅局限于传统的数据库系统中的结构化数据,而且还包括XML等半结构化和非结构化数据。人们也更加重视异构数据集成的研究和实现。我们首先介绍了异构数据集成的研究背景,国内外研究现状等信息。接着在研究一些数据模型的基础上,提出了一种基于XML的实体节点数据模型(XML-based EntityNode Data Model)(简称XEDM)。然后在分析研究现有的异构数据集成系统架构的基础上,采用中介器/包装器模式,在异构数据源之上提供一层Web Service,来完成对数据源的操作。在集成过程中,使用了四层架构:源模式层,局部模式层,全局模式层,用户模式层。各架构层之间有叁层转换,源模式层到局部模式层的转换是基于源模式层的Web Service,转换为统一的数据模式XEDM;局部模式到全局模式的转换通过模式融合和冲突解决来实现的;全局模式到用户模式层的转换是根据用户权限和实时情况动态调整的。文章还详细介绍了集成引擎和数据集成过程,查询引擎及查询的优化处理等内容。最后给出了系统的详细设计与实现的情况。我们在异构数据集成方面所做的研究工作对于解决异构数据源的动态加入和删除方面有很大的帮助。到目前为止,我们己经在异构数据集成的数据模型、体系结构、系统的设计与实现等方面取得了阶段性的成果。不足的是在数据模式集成的过程中还需要人的参与来识别语义等价的实体和消除模式之间的冲突。在此基础上我们对下一阶段研究工作的目标和重点做出了展望。

李冠宇[7]2010年在《基于智能体和本体的语义数据集成研究》文中进行了进一步梳理随着计算机技术和网络技术的迅速发展,网络上的数据量呈指数级增长。网络信息空间中的信息具有信息量大、异构性强、信息内容动态变化和信息源分布自治等特点。这些特点为信息查询、信息共享等服务的实现造成了困难,因此如何将不同应用系统中异质信息资源的跨时间、空间的透明、无缝整合,以便以集成和统一的方式为用户提供更高层的信息服务,即数据集成,逐渐成为热点研究问题。所谓信息源异构是指信息源可以是传统的结构化很强的关系型数据库系统和面向对象数据库系统,也可以是半结构化的文件,或者是彼此间查询接口各不相同的Web信息源。所谓信息源分布自治,是指信息源在物理上是分布的,并且信息集成系统对信息源的组成和提供的服务没有任何发言权。近年来,信息集成研究的焦点从解决信息语法、信息结构层面的异构逐渐发展到致力于消除信息语义层面的异构。Tim Berners-Lee提出了语义网(Semantic Web),使机器可以理解网络资源的内容。在语义网中,信息被赋予定义完好的含义,是计算机可以理解的信息,更利于人机之间的交互,借助于本体就可以实现计算机对信息的理解。本体(Ontology)是领域知识的一种表示方法,它提供了一种明确的定义语义的方式。使用本体描述信息,使机器能够真正“理解”数据的含义,并在“理解”的基础上更好地处理和利用这些信息与知识。随着语义Web中信息量的增多,本体的数量也越来越多。由于Web环境的分布性和开放性,信息表示是结构化的,本体是在并发环境下开发的,这就必然会导致在有可重用本体的情况下,人们还会继续重新开发新的本体,导致在同一个领域内会存在多个本体。这些本体的概念分类可能不同,概念间的关系也可能不同,并且相同的概念可能用不同的术语来表示。另外,本体的构造是一个非常费时费力的过程,一个用户为满足自己的不同需要而建立多个不同的本体是不现实的。在许多场合,单个本体不能充分完成目标任务,必须联合多个本体来完成。由于本体的构造一直没有一个统一的规范和标准,势必造成本体的冗余重复,影响本体之间的重用性和互操作性,导致这些本体所表示的知识之间存在互相冲突。异构的本体之间不能进行互操作,这是本体共享的主要障碍。因此需要进行本体之间的集成,实现本体之间的重用,并检测本体之间的冲突。针对大规模异构数据,本文提出了用于异构数据表示、分类、检索和集成管理的统一数据模型(UDM)。对于不同类型的异构数据源,采用CORBA包装技术和UDM模型来进行包装,研发了智能异构数据包装系统(DWS)、查询系统(IQS)、事务处理系统(TPS)、目录服务系统(DSS)、查询优化系统(QOS)和存储系统(SS)。同时本文设计实现了原型系统SORE,该系统包含了基于本体的个性化查询原型系统PQP,实时监视用户浏览过程,实现个性化查询服务等功能。借助Semantic Web中的本体技术,本文提出了基于本体语义的信息集成,提出了基于本体的信息集成框架,研究了信息表示模型、数据模式抽取、局部本体和全局本体的构建及其映射。本文基于本体的语义集成提出基于本体的智能信息集成系统架构,分析讨论了本体及映射的构建问题,其中包括本地本体和全局本体的构建以及本地映射及全局映射的构建,并结合实例数据研究了基于本体的语义查询方法及查询过程。并讨论了基于E-Connection理论的本体集成和本体模块化及基于结构的本体分解方法等。由于网络的分散性、动态性和开放性,给语义网中的本体集成增加了很大的难度。此外,能够进行本体集成的系统也必然是一个复杂而且庞大的系统。Agent技术和多智能体系统(MAS)为上述研究难题提供了机遇。Agent的动态、自主等特性极大地满足了在语义网中进行本体集成的需求,也为实现本体集成的智能化打下了基础。多智能体系统是由多个Agent形成的松散耦合的网络系统,其研究的是一组具有自治智能Agent之间的行为协调,并且各Agent间存在着交互和联系。本文在对本体和Agent技术理论进行了深入的研究和探讨的基础上,研究基于智能体和本体的语义数据集成技术,设计并实现了一种基于多智能体系统(MAS)的本体集成系统。

张爱民[8]2011年在《一种面向深层网络的查询优化方法研究》文中认为随着深层网络中信息数量的迅速增长,研究者们对其所蕴含的信息进行学术研究已经逐渐成为一项热门的工作。由于深层网络中中有价值的数据大部分隐藏在查询接口之后,同时这些数据具有异构性、自治性等特点,这使得对这一问题的研究遇到了很大的挑战。为了更好的对DeepWeb数据信息进行合理应用,需要对深层网络中的数据进行集成处理,实现在深层网络中高效快捷地满足用户检索高价值数据的目的。在深层网络中数据集成系统中查询优化的处理工作是其重要组成部分,在集成系统中有着重要的地位。深层网络查询优化的目的是将查询规划模块输出的多种可行查询方案作为输入,针对这些可行的查询方案提出行之有效的优化方法,实现从多种可行方案中选择TOP-1或TOP-K种最优方案,以实现最优方案选择的目的。目前基于深层网络查询优化方法的研究正处于起步阶段,现有的方法大多是针对单独查询方案的优化处理。本文针对多种查询方案进行优化选择,提出了智能缓存优化方法和方案代价评估方法。智能缓存中存储了历史的方案查询结果、数据源查询结果和数据源特征信息。利用这些信息可以对优化工作进行预处理,如果预处理成功则可以直接返回结果完成优化工作;否则,采用方案代价评估方法进行代价评估。方案代价评估采用分支界限轮廓查询算法(BBS)来实现,利用主成分分析方法构建出叁维空间主成分参数,以作为衡量方案的查询质量和查询代价的标准;其中叁维空间主成分参数由方案查询结果记录数量、方案查询准确性和方案查询响应时间来获得。通过叁维空间主成分参数的判断以及BBS算法的处理,实现了将多种方案进行优化排序的目的,从而为查询执行工作提供了TOP-K种最优的查询方案。通过对优化模型进行编程实现,很好的完成了系统设计的目标,实现结果和性能达到的预期要求。通过与朴素方法进行对比,论证了优化方法在TOP-K方案排序的正确率,同时在方案的召回率、准确率、响应比上都较朴素方法有极大的改善,这表明了该方法具有良好的优化性能。

罗军刚[9]2009年在《水利业务信息化及综合集成应用模式研究》文中研究说明现代水利需要信息技术。水信息应用问题突显,但有其特点。要共享资源、整合应用,就要水信息综合集成:大手笔的服务平台、组件化的信息处理、创新的应用模式。深入理解需求,用知识图关联信息、组织应用过程、描述事件和主题,把数据、信息、知识可视化,用图来存贮经验、用事例推理来延长应用;把业务处理方法和模型组件化、规范化;按主题提供信息服务、按需要提供计算服务、按个性化提供决策服务;从高性能计算和可视化表现,创建平行系统,开展计算实验;把卫星遥感图片及实景拍摄照片组合应用,由多元信息及全局影像的发展变化,挖掘信息价值;以人为主,实现“人机结合”,在综合集成服务平台下提供信息、知识、决策服务。由平台、组件、主题、知识图、可视化工具组成新模式:由平台支持应用;由组件、主题、知识图快速组织应用;由丰富的多元信息可视化直观表现应用。在个性化定制应用和相关行业标准制订中,发挥行业导向作用,逐步推广新的应用模式。论文取得的主要成果如下:(1)采用知识图实现知识的可视化表达,并把知识图着作工具产品化。①以基于过程的知识获取、表达为手段,建立水信息与知识的知识图,把应用业务知识图化。采用知识图来关联信息、组织应用过程中的信息、描述事件和应用主题。②研究知识图方法支持下的人—机结合机理。从信息感知、融合的角度,运用实证和经验总结的方法,研究水信息应用过程中专家运用知识及知识图的过程,实现知识共享与传递的机制、规律,并研究提高知识传递效率的途径。③研究知识图方法支持的群体智慧形成机理。运用实证的方法,研究基于知识图的个体智慧转变为群体智慧的机制、规律,并支持群体创意,引导专家群体进行深入的分析与论证。通过群体专家之间进行知识传递,形成“群体记忆”,促进群体智慧的产生。(2)与水信息应用中具体业务适应,按照组件开发标准,开发表现层和业务层组件。扩大传统模型对信息的依赖,发展新模型,并逐步组件化。不断丰富,建成应用组件库。利用组件库(已有了一定基础),解决应用系统构造、知识资源共享问题,规范组件应用的流程及服务组合,为快速集成和组建不同应用,创建人机结合综合集成平台打基础,并结合平台促进新模式的推广,逐步构建一个支持专家群体研讨的“知识场”。(3)采用中间件、网格、综合集成研讨厅等技术构建综合服务平台体系。采用平台提供数据、信息、知识的综合集成;用平台提供叁个服务:按照主题提供信息服务、按照需要提供计算服务、按照个性化组织应用提供决策服务;用平台建立具有开放的可以增长的知识体系,使系统具有方便服务、切近实用、长久生命力;在平台上用知识图来存贮经验、用事例推理来延长应用;通过决策知识集成与评价,发掘优秀决策知识,总结、提炼规律,从定性到定量,更好地提供服务。(4)对具体应用主题,采用平台支持的模式,开展个性化的应用。以基于平台的洪水预报、水库调度和应急管理为实例,把主题用一系列的知识图来表达,知识图、平台、用有机结合,在应用过程中,检验信息、知识、决策服务的有效性和实用性。(5)随着业务应用组件库(解决问题的过程或方法组件化)、主题服务标准库(由事件驱动,形成应用主题)、应用知识图库(解决问题的过程或方法、信息融合、知识形成等的图形化)的不断丰富,数据中心就成为了面向服务的主题服务中心,由此提出实用的数据中心建设方案。就目前多分布式数据源,分布存放、相对抽象,在应用中单独提供数据、没有语义,很难理解。只有给数据加以语义,变为信息才能提高应用效率、才有价值。所以,设计可行、可操作的数据中心,就有着重大的实用意义。(6)探讨从主题到知识图形成信息集成,由平台、组件、主题、知识图、可视化工具组成新的应用模式。由平台可以支持应用;由组件、主题、知识图可以快速组织应用;由丰富的多元信息可视化可以表现出更直观应用。把多元信息融合、用知识表达决策过程、用平台提供服务、方便组织应用作为近期应用模式,并逐步加以推广(7)基于平台的MODIS遥感信息分析、处理、应用。在遥感技术的支持下,提高多元信息的利用率,以信息融合和MODIS遥感信息的应用为重点,由多元信息及全局影像的发展变化,挖掘信息价值,通过对MODIS信息的集成,可将点信息、线信息和面信息结合起来,实现叁位一体的洪水预报。(8)结合网格技术、可视化技术,创建水信息应用的人工平行系统。在高性能计算和可视化表现下,从主动、被动两方面,提供计算服务,并开展计算实验。以洪水预报为例进行分析和论证。(9)构建面向服务的水利业务应用服务中心。通过组件实现数据与业务集成,通过知识图和服务组合实现应用集成,通过平台实现综合集成,通过水利应用中心实现水利业务应用集成服务体系。

程叁军[10]2006年在《基于B/S/D的检察业务综合信息系统集成与重构》文中指出从检察系统的业务复杂度和信息化建设的发展趋势看,研究基于B/S/D模式的检察业务综合信息系统集成与重构这一课题,是非常具有前瞻性的。同时对于实现信息系统集成的包括数据交换平台、XML、元数据管理、树形算法、公共数据模型、查询优化等多项技术手段的研究,也是非常有意义的。 信息集成系统的目标是从多个异构数据源中查询所需要的数据,并把这些查询结果进行集成提交给用户。因此,实现信息系统集成的关键在于,如何实现存在于多个数据源中的异构数据的集成。检察系统具有较高的业务复杂度,在了解其体系结构的同时,利用XML及其相关标准,通过算法转换完成关系数据库和对象数据库向由XML Schema定义的公共数据模型之间的转换,从而实现全局模式的数据集成。结合元数据的管理方法,利用XML查询分析标准、定义用户视图,进行数据信息查询操作。采用这种原理并结合检察业务系统架构分析,设计数据交换平台,利用数据交换功能接口实现异构数据库之间的数据共享,以及各类应用系统的完整结合,解决信息孤岛问题。 Web与数据库的集成技术包括数据库与Web的连接技术、查询转换技术和查询结果的浏览和集成。在多数据源数据集成系统中,数据分布在远程的自治结点上,因此我们还需要对多数据源的数据完备性进行评价,分析数据源之间的信息是否重迭,以及查询的分解和转换技术,保证整个系统集成的高效性。 本文主要从系统集成的原理来分析检察业务信息综合系统集成的可行性,以及如何运用数据交换平台、XML语言标准、元数据管理、公共数据模型等多项技术,实现基于B/S/D模式的检察业务综合信息系统的集成与重构。

参考文献:

[1]. Web信息集成系统及查询优化方法研究[D]. 郑淑丽. 合肥工业大学. 2003

[2]. 图书网站信息集成系统的构建[D]. 梅泽勇. 郑州大学. 2012

[3]. WEB信息集成技术研究[D]. 史军强. 电子科技大学. 2005

[4]. 异构信息集成中的查询处理与优化研究[D]. 李瑞轩. 华中科技大学. 2004

[5]. 综合信息集成及查询优化的研究[D]. 于红. 大连理工大学. 2006

[6]. 基于WebService的动态可调整的异构数据集成[D]. 韩民智. 上海交通大学. 2008

[7]. 基于智能体和本体的语义数据集成研究[D]. 李冠宇. 大连理工大学. 2010

[8]. 一种面向深层网络的查询优化方法研究[D]. 张爱民. 哈尔滨工程大学. 2011

[9]. 水利业务信息化及综合集成应用模式研究[D]. 罗军刚. 西安理工大学. 2009

[10]. 基于B/S/D的检察业务综合信息系统集成与重构[D]. 程叁军. 解放军信息工程大学. 2006

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

Web信息集成系统及查询优化方法研究
下载Doc文档

猜你喜欢