(国网陕西省电力公司宝鸡供电公司陕西省宝鸡市721004)
摘要:在计算机信息系统应用监控的发展过程中,运维人员对计算机信息系统运行情况的关注点,逐渐由承载相关服务的服务器硬件设备和网络设备,转变为关键业务的使用情况。在电力系统中进行信息系统应用性能监控,主要为了及时发现计算机信息系统应用中发生故障问题,并及时通知相关运维人员,提高计算机信息系统应用的使用效率,进一步提升用户体验。本文论述了应用监控系统的发展,阐述了应用监控系统在电网系统的实践。
关键词:信息系统应用;监控管理;风险监控
目前,信息化水平直接决定了一个运营商的核心竞争力。市场之争服务之争,在很大程度上已经演进为信息化程度的竞争。受业务驱动影响各运营商对信息化的要求越来越高,因此对各信息系统的安全与性能也提出了较高的要求,必须加强信息系统的健壮性才能为企业的发展提供强有力的支撑。系统性能的下降往往对业务发展造成巨大影响。面对这些问题,需要有一系列工具和方法,能够对系统的性能进行监控和管理并对可能出现的性能问题进行及时、准确的分析和处理从而改善服务品质,减少操作失败和灾难发生的风险减少维护运营的整体成本,提高系统的可用性、缩短响应时间。
一、应用监控系统的概念
计算机应用监控系统即计算机应用监测控制系统,是指对应用系统实施监视、控制的计算机信息系统,它具有实时性、可靠性、可维护性等特点。被广泛应用于电力、通讯、邮电等领域。随着计算机应用系统相关技术的不断发展和规模的不断扩大,计算机信息系统的使用及管理人员,对计算机应用系统服务质量的要求也越来越高。使用人在使用计算机应用系统访问自己更加关心的应用服务时,一般都会对服务质量有一定的关注和要求,为了使需要的计算机应用服务能够得到有效的保证,使用计算机应用系统的用户在使用之前必须与计算机应用系统的提供者就服务的质量、服务的优先级别和服务的责任及义务等方方面面达成各项协议,并需要对服务质量的评估标准达成一致。面对数量种类繁多、结构复杂、庞大且覆盖面广的计算机应用系统,为了使每个关键业务在运作的时候保持通畅,运行维护部门必需及时掌握系统的实际使用情况和效果,这就需要相应的监控手段,及时的发现和定位系统故障。
二、应用监控系统的发展
1、以网络监控基础设施为主。在这个阶段,网络基础设施的水平普遍比较差,而网络基础设施的性能直接决定了计算机应用性能高低,所以在这个时期,计算机系统的性能管理主要集中在对网络基础设施的监督、控制及管理上,主要监控指标包括如下内容:带宽:在计算机信息网络中心,单位时间内点对点传输所能承载的最大传输数据率。速率:计算机网络中的主机,在数字通信中的传输速率。吞吐量:单位时间内,通过网路的传输数据量。往返时间RTT:从数据发送端发出数据开始,到收到来自接收端的确认信息为止,所需要的时间。时延:计算机数据信息,从网络的一端发送到另外一端的所需的时间利用率:分为信道利用率和网络利用率。信道利用率是指某个信道的利用效率,网络利用率是指全网的所有信道利用率的加权平均值,利用率越高网络时延越大。在这个阶段,计算机应用系统的性能管理主要以各类网络管理系和各种系统监控工具为主,主要功能包括计算机应用系统的监视、显示网络拓扑图及状态、端口使用的状态监视与分析、网络性能与状态的图表分析和相关网络设备管理。
2、以监控各种计算机应用系统的相关基础组件为主。在这一时期的应用变得越来越复杂。为了降低应用开发的难度,各种基础组件开始大批量涌现出来,所以这个时期应用性能管理主要是监控和管理各种基础组件的相关性能。
3、以监控应用本身的性能为主。随着移动互联网、云计算技术、大数据技术的兴起及不断发展,各个企业的业务应用与商业需求不断增加,计算机信息系统应用的运营、维护及管理的复杂度开始出现全方位的爆炸式的增长,计算机应用系统的性能管理的重要性,已经开始成为越来越多的用户所关注的重点,并有越来越多的用户意识到,计算机系统应用性能管理的重点应该聚焦在计算机应用系统本身的性能与管理上。主要有以下方面性能计数器:实时采集、分析系统内的应用程序、服务、驱动程序等的性能数据。响应时间:应用系统从发出请求,到接收到系统响应的时间。吞吐量:单位时间内系统处理的系统请求数量。并发用户数:计算机服务承受最大的并发访问数。HPS:每秒钟用户向WEB服务器提交的HTTP请求数。TPS:每秒钟系统能够处理的交易或者事物的数量。
三、信息系统应用性能管理(APM)系统的应用
1、应用服务质量监控
(1)能够监控应用服务器主机的响应时间,主动列出响应最慢的服务器主机的IP地址。
(2)能提供真实的用户访问体验监控,通过对HTTP请求响应的持续时间分析,得到每次用户端与服务器端交互的真实时间;
2、WEB应用分析。能够实现Web页面自动发现,提供可配置的规则,自动发现所有的URL,页面族和用户行为,并能够按照IP地址+应用端口+URL对应用(业务)进行定义,显示各业务页面的访问响应状态。
3、数据报表功能。能够定制基于Web的报告,并在单一页面中创建整合不同层次的监控数据,包括应用和网络监控指标等。
4、故障深度分析。能够对故障数据包进行全面、完整的分析,进行准确故障定位,支持异常回放功能,并能够回放任意用户的访问轨迹以及用户出错的界面。
四、应用监控系统在电网系统的实践
1、应用性能监控常见方法对比
(1)计算机信息系统应用性能监控。主要监控用户体验相关的指标数据,从计算机信息系统应用的使用者请求获得某个应用数据开始,直到返回信息的整个过程。通过各种方法,来及时的发现、解决相关问题,甚至在计算机信息系统应用的使用者发现问题之前就能解决问题,处理的关键在于要知道相关的计算机信息系统应用问题发生在什么地方,并要了解计算机信息系统应用发生这些问题的处理方法。
(2)计算机信息系统应用的关联数据分析。这种分析方法并不是一个能够“快速解决问题”的错误处理工具,它需要通过结合计算机信息系统应用的使用者现有的技术和工具来满足应用系统的目标。这种方法注重计算机信息系统应用的延迟性、数据传输质量和网络利用效率等对计算机信息系统应用的影响,从而向网络管理人员提供网络的可视性管理方案。应用分析系统产生关键指标来具体量化先前未知的信息,通过网络的入口部分和出口部分来收集原始所需的数据,再结合应用软件,这种处理方案显得非常方便,因为在分析的过程中不需要再次部署相关的基础设施以节省成本。
(3)计算机信息系统应用的集成数据分析。这种计算机信息系统应用分析,由几个相对分开的硬件和软件组件组成,从设备以及本地网络接口处收集原始信息,用于获取原始数据。这种计算机信息系统应用分析的主要特点在于能够根据一系列堆积起来的信息,很快的筛选大量字节的原始数据包来获取原始数据。这些堆积起来的提示是处理源数据的过滤器,它允许你查找出哪个工作站及进程的响应正在变慢,哪些工作站及进程的响应正在发生堵塞。
2、应用性能监控在电网系统中的应用
对所有信息系统应用采用旁路的方式完成应用性能检测,该方式不会对被管理的应用系统产生任何直接影响,完全避免了传统监控方式所带来的性能风险,对于已经出现性能问题的计算机信息系统应用则采用嵌入式探针的方式对信息系统进行深入的性能检测。该方式对信息系统运行时的代码、SQL执行语句、API调用过程的性能数据采集与分析,深入到代码层面定位定能瓶颈,快速确定性能下降的真正因素。
通常情况下,计算机信息系统应用的性能测试监控指标主要分为:资源指标和系统指标,如图所示,资源指标与硬件资源的消耗是正相关的,而系统指标则跟用户的使用场景及对服务响应的需求直接相关。响应时间:是指在单次事物中,从发出该事物的请求到到该事物完成所用的时间。错误率:错误率是指应用程序返回异常数据的比率。应用吞吐量:是指应用程序单位时间内被调用的次数,吞吐量可以反映应用系统对于用户请求的响应能力,是分析计算机信息系统应用的重要指标。
随着互联网技术的不断发展,计算机信息系统应用的承载能力和连接规模得到极大的提高,使得复杂环境中较难实现的计算机信息系统应用性能监控,可以在一个连通的网络环境中得以实现。每个计算机信息系统应用的监控端可以容纳不同系统和元素,这样就使得计算机信息系统应用监控的连接能力得到进一步提高。实时监测业务系统的应用情况,可以及时提供系统完善提升的决策分析数据,有效保障业务系统的稳定运行,提升信息系统应用的客户服务满意度。
参考文献:
[1]张威,汤炳富,李忠明.GSM交换网络维护与优化.北京.人民邮电出版社,2015.2.
[2]郭梯云,邬国扬,李建东.移动通信.修订版.西安.西安电子科技大学出版社,2014.7.
[3]蔡亮,李芬.基于APDEX的应用性能分析在气象业务的应用[J].农业网络信息,2014,(10):24-27.
[4]薛永备,廖安平,王鹏.基于地理信息技术的移动通信网络规划和优化.邮电设计技术,2013,10.