闻传庭
安徽广电信息网络股份有限公司安徽230088
摘要:随着全省有线电视网络规模的不断扩大,以及数字电视、高清电视、互动电视、互联网业务的快速发展,机房内各类设备的数目不断增多,省干机房的安全性和可靠性越来越重要。
关键词:安广网络机房预警系统设计
引言:机房安全预警系统是一个综合利用计算机网络技术、数据库技术、通信技术、自动控制技术、新型传感技术等构成的计算机网络,建设预警系统对充分利用人力资源,加强维护支持手段的建设,保障设备稳定运行和机房安全,提高劳动生产率和网络维护水平具有积极的促进作用。
1、安广网络机房预警系统系统现状
安广网络机房成立于2000年,负责全省模拟电视和数字电视节目的传输工作,随着新业务的陆续开展,形成了一个挂靠波分系统,SDH系统,既有传统的电视节目下传,新闻回传,会议电视业务,也有银行,信息中心,党务,省委,监控中心,水利,教育等众多业务的核心机房。传统的维护方式是由各个维护站定期进行巡检,手工记录机房内设备状况及动力环境参数,并提交给省公司运维中心,这种运维方式导致机房动力、环境异常情况下不能在第一时间被发现和处理,若电源设备出现故障而不能及时的被发现,将会造成机房设备供电故障,甚至造成传输设备停电,导致电视信号停播事故,从而导致一定程度的经济和信誉损失。因此,如何保证在最少的人力投入基础之上,能够迅速及时排查故障,如何将原有各种型号不一、运行周期不同、种类多样的设备,纳入统一的管理体系,成为安广网络公司的当务之急。
2、系统架构拓扑图
2.1动力监控子系统:主要包括蓄电池组监控、通信电源和列头柜监控)。蓄电池组作为监控区域操作的最后一个保障,对监控区域的安全运行至关重要,而通信电源负责整个监控区域包括通信系统、自动化系统以及其他智能系统的通信设备的供电任务,其重要程度可想而知,通信电源监控技术在通信电源的应用,标志着通信电源的维护和管理从人工看守式的维护管理模式向计算机集中监控和管理模式转变,其目的:与通信技术管理相适应、提高对通信电源设备的维护管理水平,提高通信电源供电质量,使供电系统有更高的可靠性和经济性,提高维护效率,减少维护成本。
2.2配电监控子系统:主要完成所要监控配电设备数据采集,包括三相电压、三相电流、开关位置等,以及各种设备的供电情况的监视。
2.3图像监控子系统:主要将监控区域重要场合的现场各种设备运行情况、现场环境情况通过远程图像直观的显示出来,确保监控区域的安全运行视频监控,每个机房安装2个摄像头,并储存三个月的数据。
2.4环境监控子系统:主要监视监控区域的环境温度/湿度、将传感器的信号接入到监控系统中,一旦出现警情,系统自动告警。建设机房预警系统对充分利用人力资源,加强维护支持手段的建设,保障设备稳定运行和机房安全,提高劳动生产率和网络维护水平,实现机房从有人值守到无人值守奠定基础,可大大节约设备维护人员。采用监控系统的自动化管理手段,将采集的故障或告警信息根据时长、种类等进行分类,归纳为不同告警级别,通过专家处理软件快速进行故障定位和分析,以短消息等多种手段逐级上报,保证所有重要告警能及时发现和处理,保证现场设备安全、稳定的运行,缩短了故障定位和恢复时间,保障电视信号的正常传输。
3、机房预警系统设计与开发
3.1报警和事件功能
报警指机房运行中出现异常情况,比如停电事故、漏水事故等。报警的发生意味着机房的运行受到影响,其严重程度可用"优先级"的概念来定义。一般监控系统均可设置几十到上千个优先级以区别报警的严重程度。机房内的报警优先级一般划分为10级即可。报警发生后,一般按以下步骤来进行处理:
(1)通知。首要的是将报警信息告知给相关人员。
(2)确认。表明已经知道报警的发生,正在处理。但此时报警仍然存在,没有消失。
(3)消除。经过处理,故障消失,设备恢复正常,报警也随之消失。报警的通知主要采用以下几种模式来实现。
3.2运行历史数据记录和趋势功能
历史数据和趋势功能主要实现对机房运行的关键参数进行长期的记录,通过调用、查看历史趋势图,进行一些统计分析等。对于数据的记录,一定要选择"关键参数",而不能什么参数都进行记录,同时应注意参数记录的频率。因此,详细了解用户的需求非常重要。因为,如果记录数据量太大,对基于PC架构运行的监控系统,其存储能力受到比较大的限制。因此,对于需求的具体分析非常必要。按照机房运行的规律,建议模拟参数记录频率在lOmin以上一次。
3.3远程管理功能
远程管理主要是指利用目前日益完善的网络资源,使操作人员不再局限在监控主机旁操作,而能够在其他地点对系统进行控制。一般监控主机安装在机房的监控室内,但并不是所有的机房都是24h有人职守。
3.4运行设置和控制功能
除了主要的监视功能,系统还应具备控制能力。在大多数机房中,控制对象主要是非电源类设备。由于电源设备的可靠性要求极高,进行控制操作时很可能因为误操作造成机房瘫痪,因此不进行控制,只进行监视。
3.5安全冗余功能
一般通过以下两种方式实现。根据对可靠性要求的高低和实际故障隐患的大小,两种方式既可同时使用,也可单独采用。采控设备的冗余:负责监控计算机与现场被监控设备通信的采控设备承担着双向的数据传输工作,对其备份可以提高传输的可靠性。监控计算机的冗余,由于监控系统一般均运行于PC平台的硬件上,而且操作系统以Windows200O和XP为主,因此,计算机硬件、操作系统和监控软件自身的故障都会造成系统停止工作。双机热备主要是实时数据、报警信息和变量历史记录的热备。主/从机都正常工作时,主机从设备采集数据,并产生报警和事件信息。
4.总结:
安广网络机房预警系统自2012年5月投入运行以来,为中心提供了全省传输机房动力设备及机房环境的遥测、遥信、遥控和遥调功能,实时监视系统和设备的运行状态,监视机房环境状况,记录和分析相关监控数据,达到对通信动力设备及环境的实时集中监控。做到了以下特点:
1.降低维护成本,提高维护效率将分散的机房维护工作由人工定期巡检变为主动提醒模式、由大量人员各机房巡检变为一人中心巡检,实现无人职守或中心1人职守,大大减少维护工作量和降低维护人员数量;专家知识库真正成为用户设备维护的利器,提高维护效率;定时邮件发送统计报表,准确反映机房运行状态,故障率,分布,特点等情况,方便机房维护工作。
2.安全可靠,稳定运行通过对机房视频监控,联动现场声光告警,并通过短信/电话等方式及时通知管理员。管理员可远程打开IE浏览器通过视频监控画面核实和处置,最大程度保障机房防盗安全需求。
3.故障定位,告警过滤系统通过对分机房动力环境系统的告警进行条件过滤,按时间、告警等级,当前告警或已结束告警状态,未确认或已确认状态,告警类型,设备类型等条件,帮助客户快速找出关心的告警,为您提供舒适便捷机房运维平台,准确反映机房运行状态和所需关注的问题。
截至目前为止,该系统平台运行状况稳定可靠,对保障设备稳定运行和机房安全,提高网络维护水平起到了积极的促进作用。
参考文献:
[1]中国电信动力环境集中监控系统设计与分析[J].科技资讯,2011,24.
[2]铁路机房环境监控系统的设计与实现[D].华南理工大学,2011.
[3]机房环境监控系统的研究与实现[D].电子科技大学,2010.