容错计算机系统论文_张锋

导读:本文包含了容错计算机系统论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:故障,极值,双机,冗余,计算机,理论,日志。

容错计算机系统论文文献综述

张锋[1](2015)在《事务处理型容错计算机可用性评测系统设计与实现》一文中研究指出事务处理形容错计算机可用性测试中,会出现一些列问题,如目标系统数量较少、对测试时长有限制等问题,针对这些问题设计的可用性评测和相应的系统,主要用于事务处理形容错计算机可用性指标的评测中。(本文来源于《决策论坛——如何制定科学决策学术研讨会论文集(下)》期刊2015-08-21)

赵峰,金海,邹德清,秦攀[2](2014)在《基于动态错误图的容错计算机系统可靠性分析(英文)》一文中研究指出Dependability analysis is an important step in designing and analyzing safety computer systems and protection systems.Introducing multi-processor and virtual machine increases the system faults' complexity,diversity and dynamic,in particular for software-induced failures,with an impact on the overall dependability.Moreover,it is very different for safety system to operate successfully at any active phase,since there is a huge difference in failure rate between hardware-induced and softwareinduced failures.To handle these difficulties and achieve accurate dependability evaluation,consistently reflecting the construct it measures,a new formalism derived from dynamic fault graphs(DFG) is developed in this paper.DFG exploits the concept of system event as fault state sequences to represent dynamic behaviors,which allows us to execute probabilistic measures at each timestamp when change occurs.The approach automatically combines the reliability analysis with the system dynamics.In this paper,we describe how to use the proposed methodology drives to the overall system dependability analysis through the phases of modeling,structural discovery and probability analysis,which is also discussed using an example of a virtual computing system.(本文来源于《中国通信》期刊2014年09期)

吴楠,张东,刘璧怡[3](2013)在《面向高端容错计算机的进程容错系统设计与实现》一文中研究指出高端容错计算机主要应用于银行、电信等关键领域中,对于系统失效极其敏感,保证系统关键进程的可靠性至关重要。常见的容错机制主要依据静态结构冗余原理实现,然而硬件层的冗余成本很高且实现复杂,应用软件层的冗余则不具有通用性。提出一种基于进程冗余的容错机制和策略,对关键进程构造双模冗余或多模冗余,采用进程间同步等手段确保冗余进程按照同样的执行逻辑运行,监控系统并对不同的错误进行相应的错误处理。与传统的容错方式相比,进程容错管理系统具有通用性高、成本低等特点,能在较小的性能损耗下有效地保证系统的高可靠性,同时避免了硬件定制的复杂性,并对应用程序和用户透明。(本文来源于《计算机应用与软件》期刊2013年04期)

韩建亚,吴智博,董剑,张亚勇,刘宏伟[4](2011)在《面向容错计算机的仲裁系统的设计与实现》一文中研究指出为了解决传统仲裁机制故障覆盖率和故障诊断成功率低的问题,针对容错计算机,提出了一种基于仲裁处理器的仲裁机制,并设计了仲裁系统和仲裁算法。其中仲裁处理器使用叁模冗余系统和芯片级的容错设计技术,仲裁算法采用分级方式,同时采用自检测和心跳监测相结合的故障监测机制,有效地解决了单点故障和检测成功率低的问题。最后通过故障注入方式验证了仲裁系统的可用性。(本文来源于《计算机应用研究》期刊2011年12期)

魏晨辉,张展,向琳,王书婷,左德承[5](2011)在《基于高端容错计算机的故障日志分析系统》一文中研究指出高端容错计算机性能评测中,故障库的建立对故障模型、故障传播的研究有着非常重要的意义。该文设计并实现了1个高端容错计算机故障日志分析系统,旨在对日志文件进行故障的抽取和格式化后,构建故障库,并在此基础上运用数据挖掘技术进行关联分析,使系统能够解析尽可能多类型的日志文件。给出了日志分析系统的架构、工作流程及具体实现,并利用该系统对CMU的公共计算机故障集进行统计分析,在其故障库基础上引入极值理论,建立故障分布模型。利用该日志分析系统可建立对高端容错计算机的故障库,从而为相关评测指标的计算、故障模型的建立等提供有效的数据依据。(本文来源于《清华大学学报(自然科学版)》期刊2011年S1期)

魏晨辉,张展,向琳,王书婷,左德承[6](2011)在《一种基于高端容错计算机故障日志分析系统的设计与实现》一文中研究指出高端容错计算机性能评测中,故障库的建立对故障模型、故障传播的研究有着非常重要的意义。本文设计并实现了一个高端容错计算机故障日志分析系统,旨在对日志文件进行故障的抽取和格式化后,构建故障库,并在此基础上运用数据挖掘技术进行关联分析,使系统能够解析尽可能多类型的日志文件,采用了模板库思想。论文详细介绍了日志分析系统的架构、工作流程及具体实现,并在最后利用该系统对CMU的公共计算机故障集进行统计分析,在其故障库基础上引入极值理论,建立故障分布模型。(本文来源于《第十四届全国容错计算学术会议(CFTC'2011)论文集》期刊2011-07-30)

魏晨辉[7](2011)在《高端容错计算机故障日志分析系统的设计与实现》一文中研究指出高端容错计算机作为事务处理能力极强、可用性极高的服务器系统,广泛应用在了金融、电信、能源、交通、航空等国家关键业务领域中。这些关键行业对系统的处理能力和容错能力有严苛的要求,因为系统一旦失效就可能会造成无法挽回的巨大损失,所以高端容错计算机在投入使用之前必须对其处理能力和可用性进行严格的评测,故障注入技术是进行评测的有效方法。日志中记录了系统运行过程的中间状态,通过日志分析可以验证故障注入、容错机制等是否有效,通过对故障日志的提取可构建高端容错计算机故障库,对故障分布、故障传播和故障预测的研究都有非常重要的意义。本文首先对国内外日志分析工具和高性能计算机故障研究的现状进行了分析,发现:1)已有的日志工具中没有专门针对高端容错计算机故障日志进行管理和分析的,并且由于统计分析都是在本地进行,严重影响了被分析服务器对其他用户提供服务的效率;2)我国在高性能计算机故障的研究方面经验不足,可用的故障集有限。因此,本文围绕着数据挖掘技术展开研究,设计并实现了一种基于高端容错计算机的自动化、智能化的故障日志管理与分析系统,旨在对高端容错计算机系统中的各类日志文件进行故障的抽取、格式化和分析,建立初步的高端容错计算机故障库,同时,由于系统采用C/S架构,极大地提高了被分析服务器对其他用户提供服务的效率;并在此基础上,引入极值理论和数据拟合方法,提出了一种基于故障日志分析系统的故障分布研究方案。为实现同时对多台高端容错计算机日志的统计分析,本文将自动化测试框架STAF引入到了故障日志分析系统的设计中,面向HP RX6600和Superdome两台高端容错计算机,成功搭建了一个分布式的实验环境,并通过对Superdome实验结果的详细分析,验证了系统的有效性。最后,本文应用设计的故障日志分析系统,对CMU公布的公共计算机故障仓库中的LANL数据集进行了统计分析,并依据前文提出的故障分布研究方案对特定类型故障的故障间隔时间(Time Between Failure, TBF)进行了建模。(本文来源于《哈尔滨工业大学》期刊2011-06-01)

王力[8](2011)在《高端容错计算机系统监测平台的设计与实现》一文中研究指出计算机系统已经广泛应用于各个领域,用户在使用计算机系统提供的强大服务的同时也非常关心系统本身的运行状况,确定系统是否存在潜在的问题。计算机系统监测正是完成这一任务。如今,计算机系统监测已发展成一个重要的研究方向。高端容错计算机硬件结构复杂,运行的操作系统庞大,提供的服务众多,无论在对其评估和测量还是日常维护过程中,系统监测都是必不可少的。本文面向高端容错计算机设计和实现了系统监测平台。采用远程监控架构,用软件监控方法进行带内监测,又利用计算机的监控硬件实施带外监测,实现对高端容错计算机系统全方位、多层级监测的目标。首先本文研究和分析了国内外现有的计算机系统监测方法和工具,针对高端容错计算机体系结构和操作系统的特点设计监测平台的功能、监测指标和总体研究方案。根据监测指标的层次,设计了叁个监测工具,分别实现对高端容错计算机应用层、系统内核层和硬件部件层的监测。性能监测工具基于内核数据结构获取系统性能数据,实现对系统CPU、内存、网络、磁盘、系统进程等关键应用性能的监测。内核探测工具基于内核调试技术实现动态探测系统内核行为,能够探测CPU寄存器和全局数据结构中的数值,也能探测指定进程的内核栈内容,分析内核执行路径和调度信息。硬件部件监测工具利用智能平台管理接口(IPMI)监测高端容错计算机底层硬件,能够实时监测硬件部件状态。硬件部件监测工具即使在操作系统关机或发生故障无法提供服务时仍然可以实施监测,是一种带外监控方式。最后本文通过实验验证了系统监测平台的有效性,各个监测工具实现了设计方案中指定的监测指标。系统监测平台在高端容错计算机评测过程中发挥了较重要作用,能够验证负载模拟和故障注入结果的有效性,同时也为容错性和可用性评测提供数据支持。(本文来源于《哈尔滨工业大学》期刊2011-06-01)

倪文玺[9](2011)在《容错计算机系统双机容错软件设计与实现》一文中研究指出随着通讯与计算机技术的迅速发展,越来越多的计算机系统用来提供各种及时可靠的服务,如何保证计算机系统运行可靠、稳定和持久是需要解决的关键问题,这就需要系统具备冗余和容错能力。本文在对影响系统可用性因素分析的基础上,考虑到系统成本和企业适用情况以及方案灵活性等因素,设计了一套基于无磁盘阵列的主从结构硬件平台运行的双机容错软件。论文首先概述了容错计算机系统及国内外发展现状,对主要工作做了简要介绍。其次,对双机热备工作模型和主要技术进行综述,比较双机热备的两种实现方式:共享存储和数据同步,根据双机系统Markov模型分析其高可用性。第叁,论文给出了双机容错软件的主要技术,其中单一系统映像和故障诊断及恢复技术是实现的重点。第四,根据双机热备的工作模型和技术分析,在设计中将双机容错软件分为心跳检测模块和资源管理模块两部分。心跳检测模块包括节点故障检测、系统服务故障检测、资源故障检测等,同时保持双机连接;资源管理模块实现主/从机切换,资源状态查询、接管等任务。该系统以双节点的集群系统为目标,并且具有良好的扩展性和可移植性。最后进行实现和说明,测试了双机容错软件基本功能,并进行了双机视频切换的应用实验,测试结果表明能够保持系统稳定运行,实现企业核心业务基本功能,达到设计目标。(本文来源于《西安建筑科技大学》期刊2011-05-01)

揣锦华,姚蔚华,常博[10](2009)在《一种聚类算法在容错计算机系统中的应用》一文中研究指出多数一致表决是常见的表决算法.该算法在选择最终结果之前须要对容错计算系统中N个模块的数据进行分类.以容错计算机系统中的表决算法为应用背景,考虑到该处理模块数量有限,设计一种即能完成预定功能又不过于复杂的聚类算法.仿真的结果显示该算法符合实际要求.(本文来源于《微电子学与计算机》期刊2009年07期)

容错计算机系统论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

Dependability analysis is an important step in designing and analyzing safety computer systems and protection systems.Introducing multi-processor and virtual machine increases the system faults' complexity,diversity and dynamic,in particular for software-induced failures,with an impact on the overall dependability.Moreover,it is very different for safety system to operate successfully at any active phase,since there is a huge difference in failure rate between hardware-induced and softwareinduced failures.To handle these difficulties and achieve accurate dependability evaluation,consistently reflecting the construct it measures,a new formalism derived from dynamic fault graphs(DFG) is developed in this paper.DFG exploits the concept of system event as fault state sequences to represent dynamic behaviors,which allows us to execute probabilistic measures at each timestamp when change occurs.The approach automatically combines the reliability analysis with the system dynamics.In this paper,we describe how to use the proposed methodology drives to the overall system dependability analysis through the phases of modeling,structural discovery and probability analysis,which is also discussed using an example of a virtual computing system.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

容错计算机系统论文参考文献

[1].张锋.事务处理型容错计算机可用性评测系统设计与实现[C].决策论坛——如何制定科学决策学术研讨会论文集(下).2015

[2].赵峰,金海,邹德清,秦攀.基于动态错误图的容错计算机系统可靠性分析(英文)[J].中国通信.2014

[3].吴楠,张东,刘璧怡.面向高端容错计算机的进程容错系统设计与实现[J].计算机应用与软件.2013

[4].韩建亚,吴智博,董剑,张亚勇,刘宏伟.面向容错计算机的仲裁系统的设计与实现[J].计算机应用研究.2011

[5].魏晨辉,张展,向琳,王书婷,左德承.基于高端容错计算机的故障日志分析系统[J].清华大学学报(自然科学版).2011

[6].魏晨辉,张展,向琳,王书婷,左德承.一种基于高端容错计算机故障日志分析系统的设计与实现[C].第十四届全国容错计算学术会议(CFTC'2011)论文集.2011

[7].魏晨辉.高端容错计算机故障日志分析系统的设计与实现[D].哈尔滨工业大学.2011

[8].王力.高端容错计算机系统监测平台的设计与实现[D].哈尔滨工业大学.2011

[9].倪文玺.容错计算机系统双机容错软件设计与实现[D].西安建筑科技大学.2011

[10].揣锦华,姚蔚华,常博.一种聚类算法在容错计算机系统中的应用[J].微电子学与计算机.2009

论文知识图

非相似余度容错计算机系统结构...容错计算机系统结构星载双CPU并行冷备份容错计算机系UMS分布式容错计算机系统结构星载双CPU并行冷备份容错计算机系改进后的聚类算法

标签:;  ;  ;  ;  ;  ;  ;  

容错计算机系统论文_张锋
下载Doc文档

猜你喜欢