机房动力环境集中监控系统
建议方案
南京××××有限公司
2007年5月
目 录
第一章 设计方案说明 ............................................................................................................2 1.1 设计宗旨 .................................................................................................................................... 2 1.2 设计依据 .................................................................................................................................... 3 1.3系统技术特点 .............................................................................................................................. 3 1.4系统架构说明 .............................................................................................................................. 4 1.5系统性能说明 .............................................................................................................................. 6 1.6 监控数据采集方式 .................................................................................................................... 7 1.7系统软件功能说明 ...................................................................................................................... 9 1.8 监控对象及其监控安装........................................................................................................... 10 第二章 系统验收与培训 .......................................................................................................15 2.1 调试、验收、试运行............................................................................................................... 15 2.2 技术培训与支撑 ...................................................................................................................... 17
1
第一章 设计方案说明
1.1 设计宗旨
随着计算机的发展和普及,计算机系统数量与日俱增,其配套的环境设备也
日益增多,计算机房已成为各大单位的重要组成部分。机房的环境设备(供配电、 UPS、空调、消防、保安等)必须时时刻刻为计算机系统提供正常的运行环境。一旦机房环境设备出现故障,就会影响计算机系统运行,对数据传输、存储及系统运行的可靠性构成威胁,尤其目前国内普遍缺乏机房环境设备的专业管理人员,在许多地方的机房不得不安排软件人员或者不太熟悉机房设备人员值班维护,这对机房的安全运行无疑又是一个不利因素。
由此可见,加强动力设备、机房精密空调的维护和管理,确保设备正常运行,是各行各业计算机信息化迅猛发展的前提条件。机房动力环境集中监控系统正是顺应这种发展趋势的产物,它具有实时监控设备运行状态、预期故障发生、迅速排除故障、记录和处理相关数据、进行综合管理等多重功能。
SuperWare动力环境集中监控系统是中达电通公司积累多年在动力领域的实践经验并针对上述问题提供的专业解决方案,实现了机房设备的统一监控,减轻了机房维护人员负担,提高了系统的可靠性,另外丰富的事件历史记录对系统设备的管理有重要的参考,因而该系统对机房的科学管理有特殊的意义。
为便于统筹规划,可将机房内目前的各种被监控设备分为智能型和传统型两大类:
智能设备是指该设备有数据通信接口,通过该接口可将其协议转换读出数据即能达到监控目的,所以对智能设备的监控关键在于对协议的破解,正确的通信协议和解码经验是关键。目前绝大多数的开关电源、柴油发电机、机房专用空调、UPS、逆变器等大多都是智能设备,近些年来,其便于管理维护的优点越来越得到充分的体现。我们累积了多年的监控经验,已经对一百多种智能设备成功解码。
传统设备是指没有数据通信接口的设备,对这类设备的监控需要在设备上加装传感器、变换器、界面等,在不影响设备使用的同时将各种监控量转变为监控系统能接入的信号。此外对于一些机房周边的环境量如温湿度、烟雾告警、红外
2
告警、水浸等我们也可以把其归为传统设备。对于传统设备的监控应采取分散式采集、多级电气安全隔离等措施。
以维护具体需要和建设投资合理性为基本出发点,我们确定了本期工程的监
控内容如下:
UPS(台达)和机房专用空调:视为智能型设备,通过协议转换将其纳入监控
系统。可实现对其通讯协议所包含所有数据量的监测。
机房环境:视为传统型设备,包括烟感、温湿度、门磁、漏水监测。 机房配电:视为传统型设备,配电柜内配电监测。
对于上述各类智能设备,必须具备可用的监控接口板(RS232和RS485接口),且需要原厂家提供通信协议及原始测试软件。
本设计宗旨是将局机房动力环境集中监控系统建设成为稳定性高,实用性强、
易于使用的综合性管理平台。
1.2 设计依据
系统技术指标符合以下标准: (1)根据用户对集中监控项目的要求 (2)《计算机场地安全要求》
(3)《计算机站场地技术条件》GB2887-89 (4)《工业企业通信接地设计规范》GBJ79-85 (5)《安全防范工程程序与要求》 GA/T75-94
1.3系统技术特点
1、RT-OS实时多任务多用户操作系统下的软件开发体系:是机房动力环境监控的最佳选择。SWARE 系统软件采用组态化设计。
2、浏览器终端+近/远程类UNIX登录的多媒体人机界面。系统处理层与人机应用层分离,可以IP或Modem拨接方式实现远程终端监控接入。可保证系统主处理机RT-OS系统永不中毒,安全性极高。
3
3、现场采集设备采用模块化的设计,针对UPS、精密空调等智能设备监控采用专用模块进行硬件解码(不同于一般厂家的PC机软件解码技术),稳定性高、便于维护管理;高可靠性的监控模块在国内通信领域已安全可靠运行达10年之久;所有硬件设备在系统扩容时保持兼容,确实保障用户前期投资。
4、持续进行新技术的实用化研发。相序推出: SMS短消息维护管理系统、SuperEyEs数字图像监控系统等新的实用功能。
1.4系统架构说明
1、 监控系统网络结构设计
根据局机房具体情况及相应技术规范要求,整个系统组网架构见下图:
机房内监控内容可分为传统设备、智能设备二大部分。
图中的UPC-48智能一体化采集器具有两个智能监控接口,最多可监控2种不同类型的智能设备;另外有24点开关量、16点模拟量、8点控制量的接入能力,
4
可对温湿度传感器、烟雾告警传感器的输出信号进行采集。
根据被监控设备的数量,UPC-48可作数量上的横向扩充,每个本地网络最多可配置64个UPC-48模块,完全满足今后的设备监控扩容需要。
UPC-48采集器和机房专用空调之间以RS485总线方式进行连接组网,通过RS485/232接口转换后将数据接入数据处理主机进行分析处理。
数据处理主机(工控机)采用RT-OS9000实时多任务多用户操作系统,具有定时任务切换能力,可实现对多个进程的同步并发处理,全面提升CPU的工作效率;与一般商用操作系统相比,具有处理速度快、稳定性高、防病毒能力强(可保证主机永不中毒)等优点。
监控操作终端选用普通的商用PC机,采用WindowsXP/2000操作系统,安装监控系统人机界面软件,发挥Windows操作系统强大的多媒体功能,并提供直观简单的操作模式供维护人员使用。
采用系统主机+终端的组态化设计思想, RT-OS系统实时稳定和Windows系统界面友好的优点分别在数据处理层与人机应用层得以充分的发挥。主机与终端之间以TCP/IP标准协议进行数据通讯。
2、 系统组成与功能 监控中心:
设置实时监控处理主机一台(安装OS-OS9000实时多任务多用户操作系统/SWARE 5.0监控软件),多媒体监控操作终端(安装WindowsXP/BROWSE for SWARE 5.0),打印机,可供多个管理人员完成对机房动力设备运行情况的监视,通过相应权限的密码,操作人员还可以实现实时监控网上运行的UPS、机房专用空调等设备工作状态和工作数据,进行遥控、遥调等操作,视需要可查询及打印现场所有资料和故障报告。
可提供维护人员对监控数据的保存、统计,报表、曲线、运行记录等资料的生成与调阅;
监控中心可实现实时监控UPS、空调、环境等设备,可以收集、显示并记录各各监视点的设备运行状态及运行数据资料,指挥设备采集单元执行各种命令;可编辑设备管理报表,可制定时、日、月、年报表,能即时显示现场所有资料,视需要可查询及打印现场所有资料和故障报告。所有告警信息、历史数据、人员操作记录能在监控主机中贮存2年以上。
5
设置远程服务接口,通过主机的内置网络接口或内置MODEM可提供远程访问服务,支持远程维护与操作。
设有短信发送接口,可把告警信息已短信方式发送至维护人员或相关人员
的手机上,并可从手机确认该告警,且可通过手机对所监控设备进行三遥功能,(需要增加无线MODEM及配套软件模组)
1.5系统性能说明 可靠性
监控系统硬件平均故障时间>100000小时,整个系统的平均无故障时间>20000小时。
各种监控器材,设备均提供接地保护, 采用抗干扰特性好的铜网屏蔽和铝箔/铜网双屏蔽信号线。采用国际标准的4-20mA电流源信号可达到更准确的信号传输。并结合光电隔离技术,保证传输信号确实可靠。监控系统的上电、掉电,在线、离线都不影响被监控设备的正常运行和人工操作。
系统具有较强的容错能力,不会因用户的误操作而引起死机。对于外界的各种干扰,监控系统不产生误报警和混乱甚至死机;采用硬件WatchDog监视自动复位功能及软件自我诊断程序和诊断界面。
系统对具体设备监测与控制的信号数据皆采用CRC校验, 进行ERROR_CONTROL。接受方根据校验结果发回回应信息, 并执行后续动作,如:数据错误,要求重发; 或数据正确,接受数据-执行控制。 可扩充性
监控系统软、硬件均采用模块化结构。采用可经由RS422/485总线相连接的分散式前端设备采集单元:通用型采集模块(RTU)、智能型采集模块(UPC-48)、电池组采集模块(BCMS)。由于监控系统使用了模块化设计,使后续扩容时变得简单容易,并应用组态化软件设定,扩容不需修改软件。构成系统的计算机只需激活通讯口即可增强外部通信能力。 实时性
整个系统的数据响应时间不大于五秒。
6
智能设备解码完整性
中达电通在国内通信行业积累了十年的机房监控实施经验,因此对于各类智能设备通信协议具有专业的解码能力,可承诺对智能设备解码100%的完整性,对UPS、机房专用空调的所有数据点(遥测、遥信、遥控)均可纳入监控平台。 安全保障
监控系统对被控设备进行控制或参数设定时,其控制值始终保持在安全极限内;被监控设备处于任何工作状态下监控系统应能正常工作,同时监控设备 本身不会产生影响被监控设备正常工作的电磁干扰;监控系统内所有部件与连线均有金属屏蔽,监控器与被监控设备均用光隔离,监控系统具有良好的电磁兼容性;监控系统能监控不同接地要求的多种设备,且任何监控点接入均不应破坏被监控设备的接地系统。 测量精度
电量精度均优于0.5%。非电量测量精度均优于5%。
电源
所有监控模块均采用DC-24V不间断电源,计算机设备采用AC-220V不间断电源。在市电或油机断电后仍可继续工作。 接地
监控系统采用局(站)内接地系统。各种监控器材, 设备均提供接地保护, 采用抗干扰特性好的铜网屏蔽和铝箔/铜网双屏蔽信号线。
1.6 监控数据采集方式 机房
采用分散式采集方法,根据实际情况,目前使用的是智能一体化监控采集器(UPC-48).
7
智能一体化采集器(UPC-48)
UPC –48 智能型一体化采集器
RS-485至SS 通讯隔离
1组RS232/422/485 通讯接口可分别监 控各种智能设备 智能设备
专用空调
•将RTU、UPC+功能合二为一 •通讯界面隔离设计,保护被监
控设备
模块隔离 传输距离500M以上 •将扩展接口有AI+DI+DO=
16+24+8共48点可监控附属周
边设备
现场隔离 1组RS232通讯接口
可分别监控各种智能设备 模拟量 控制量 开关量
•精干的功能广泛应用在电信
行业的小型局站,如接入网、 模块局、基站…
(隔离传感器4~20mA) (DO控制界面) (DI隔离界面) 智能设备
传 统 设 备
•
开关电源
传统交流屏 传统油机 火警、门禁
智能与通用设备合二为一的监控设备——一体化采集器UPC-48。UPC-48可实现的监控内容为:交流配电、开关电源、柜式空调、各种环境量等等。
功能:对于非智能设备的监控,具有监视、控制和测量能力,接受并执行
监控主机所下达的各种命令。对于智能设备的解码,将各种智能型接口的协议码转换成为同一标准协议码。综合以上两种能力,对各种设备进行集中监控。
规格:每台UPC-48可采集24个模拟量(AI)、16个开关量(DI)、8个控
制量(DO)和2个智能设备接口(RS232/RS485/RS422)。
传统采集对象:传统设备的模拟量、状态量、控制量,如——低压设备的
三相交流电压、开关状态、各告警点;相控电源的输出电压;传统空调的开关控制、状态;以及环境系统的温湿度、火警、水浸、门禁监控点可通过传感器或变送器等界面输入。
智能设备监控特点:智能设备经协议转换并入集中监控网后,其监控功能
完全取决于智能设备本身监控软件所能达到的功能。
解码能力:只要厂方能提供正确的监控软件(监控软件可与设备连线且监、
测、控功能都能正确实现)及必要的通讯协议,该智能设备就一定能纳入集中监控网。
解码成功经验:中达电源、珠江电源、亚奥电源、塞特电源、洲际电源、
8
新电元、侨兴电源、澳新电源、新西兰电源、青浦电源、科华电源、华为电源、卡特比勒油机、辛普森油机、十字军油机、劳斯来斯油机、康明斯油机、斯图斯空调、海洛斯空调、力博特空调、RC空调、ATLAS空调、UPS等百余种。
1.7系统软件功能说明 用户维护操作方面:
实现多人在不同地点同时作不同的操作,提供在线帮助、事件打印、远端监控等功能。每个操作人员都有唯一的用户名和密码,并在进入系统时输入,根据密码等级的不同,操作人员具有不同的操作范围和权限,所有的重要操作如告警确认、遥控等,均记录在系统内部,且不可删除。 系统警报管理方面:
系统提供三级警报能力,可由用户依需要自行定义警报点及警报等级。分别以三种颜色(红紫蓝)显示在相应局站的地理区域点、具体设备及相应的菜单上,并配以三种响声及颜色的闪烁、BP机自动呼叫及打印机自动打印等动作来提醒维护人员注意。自动保存设备警报及人机操作的流水记录,并能透过人机命令进行查阅和输出打印。还提供警报总缆、警报确认等功能。 系统报表管理方面:
可由用户自行编辑修改各类设备维护及管理报表、图形及统计曲线。系统提供报表管理查询及列印功能,可查询设定的各电压、电流、功率、电能、温度及环境变量之值等。并可自动定时打印警报记录及日、星期、月、年报表及曲线等。 系统设定方面:
由用户的自行定义修改人机介面、设备开关动作及监控画面,当动力设备增加、拆除或更换时,操作人员可自行定义该设备名称、警报等级及相关参数(不需重新编程)即可在线更改相应的数据,并纳入监控系统,另外还提供逻辑控制功能、定时控制功能。 系统运行维护方面:
系统具远程通讯能力,系统维护员可透过IP登录或Modem拨接(不需至现场)对系统做在线更新,其数据不会因系统的更新而丢失和变更,方便用户
9
随时更新系统。由于系统采用模块化及开放式设计,提供维护管理功能。当用户需扩充设备时,可自行更改或经由远程维护功能提供服务而不需停机,不影响整个系统运行。
多媒体人机介面:
监控系统使用全中文化、图象化及多媒体化的人机界面技术。在三级监控中心对监控的远端局站不仅有真实的监控对象位置图,实象图或采用与实物相似绘图或采用实拍相片,并配有相应的供电系统的电原理图,使用时非常直观、易于编辑、控制安全性高
1.8 监控对象及其监控安装
低压系统:低压系统以遥测三相交流电压、电流、频率、功率,遥信开关
状态,缺相,过压,欠压等,通过传感器纳入UPC48。
10
UPS: 以智能设备为主,通过通讯协议器UPC48转换入网。主要采集三相输
入电压,直流输入电压,三相输出电压,三相输出电流,输出频率,蓄电池电压,蓄电池温度,同步/不同步状态,UPS/旁路供电,市电故障,整流器故障,逆变器故障,旁路故障等。
11
12
专用空调:机房专用空调主要以智能空调为主,可通过通讯协议转换器UPC+
转换入网。主要采集送风温度,送风湿度,回风温度,回风湿度,压缩机工作积时,电压过高/过低,电流过流,温湿度过高,温湿度过低,压缩机故障,压缩机运行状态,加热状态,制冷状态,风机状态,开关机,升温,降温,温湿度范围设定等
13
机房环境: 机房环境主要侦测温湿度、水浸、烟感、门磁等。
温湿度监测:对机房内重要的区域内的温湿度进行监测。安装1个或多个温湿度传感器,传感器布1根4芯信号线至MAC箱体(箱体的位置安装在靠近监控主机的地板下)。传感器采用TH-100系列产品,其输出为标准的4-20mA电流信号,再经UPC-48采集器采集后送到监控主机进行处理。监控软件画面实时显示并记录每个温湿度传感器所检测到的室内温度与湿度的数值,并可设定每个温湿度传感器的温度与湿度的报警上限与下限值,越限时发生告警。
烟雾告警侦测:通过UPC-48(智能型一体化采集器)采集烟感探测器的报警信号实时监测火灾警状态,当有火警发生,监视系统以直观的画面显示报警信息并作报警通知。
14
第二章 系统验收与培训
2.1 调试、验收、试运行
系统安装完成后,根据“设备采集点清单”逐点验证测试。智能型设备的验收以原设备监控系统的响应性能为基准。验证通过后,证明系统稳定可靠后,视为完工。
测试建议方案如下:
A. 必须将厂商所作的系统,进行逐点测试验证,测试系统数据反应与告警, 我们将测试的部分分为传统设备与智能设备两大类,由于传统设备是属于厂商自己本身的系统,故理论上测试时,反应速度应该是很快的。 我们要求厂商制作一张测试记录表,上面包括操作终端显示数据与现场实际数值, 逐点核对。 B. 传统模拟量: 我们在现场使用电表量测实际数据,并作记录, 马上使用电话联络操作终端显示数据,并同时记录在同一张表格中(为了避免因为传输延迟,影响了测试数据的正确性,测试时,动作一定要快)。另外有关系统模拟量的精确度,由于牵涉到传感器与模块A/D转换的精确度,故最直接的检测,就是要求厂商不得经过“人为校正”,此时在画面上所显示的数据就是最原始的数据,将其与现场测量值相比较,即可很清楚的了解系统测量误差。这里之所以要特别说明的原因,是因为很多系统厂家在验收之前,先行利用软件校正,如果用户无法察觉,当现场值变化的时候,画面上的数据就会产生很大的误差。 C. 传统开关量: 实际产生告警(记录时间并记录), 然后看操作终端是否也有一样的告警,并且将告警出现的时间记录(一般可以查询告警记录时间、正常系统的反应速度在3-5秒)
D. 对于智能设备,由于系统的反应速度,不再是单独系统厂家的事,最主要还是牵涉到设备智能本身的速度。对于速度的测试, 我们可以先使用原设备厂商所提供的软件,先行测试反应速度,比如说告警反应时间平均测试为7秒, 那么监控系统的反应时间应该在10秒左右,超过这个时间,表示系统对于智能设备
15
解码技术比较差。此外,对于局内的每一项智能设备的所有数据,告警,控制,调整,都必须作全功能测试,当然测试时的反应时间也必须记录。 硬件施工验收
E. 由于硬件安装的工艺,对于系统整体的稳定性非常的重要,检查的重点,在于布线是否符合安全要求。(线径大小是否合理,是否有使用信号隔离线…) F. 查询每一个机房的布线、工艺是否大致相同,这个方法为检查 厂商的施工能力。
核对系统的整体功能
G. 依照用户的特殊需求,要求厂商达成要求。 系统稳定度测试
H. 系统能否稳定的运行,是一项非常重要的指标,系统功能再好,画面设计的多漂亮,如果经常的死机,那一切的努力终将白费。 I. 系统稳定度测试:测试时间15天=360小时=21600分钟
1. 测试开始,系统厂商不得进入监控中心,所有值班人员依照正常操作
方法,进行正常值班。
2. 但系统发生死机无法操作时,如果系统可以自启动或监控中心人员可
以自行恢复,则记录重起一次FR,且累积记录由死机开始到恢复正常操作之时间SRTA。
3. 如果系统死机后,无法自行恢复,需要由厂商处理,由电话通知开始
到厂商完全排除故障后,累积记录时间 SDTA 纪录当机一次FD。 4. 当15天试运转完毕
a. FR>10 SRTA>30分钟 不合格 b.FD>4 SDTA>60 分钟 不合格 5. 系统可用率 MTTR= (SRTA+SDTA)/21600 <99.5% 系统不合格 亦即
SRTA+SDTA<108分种 方符合规定。
资料库核对
J. 核对模拟量的每日历史数据是否均相同 K. 核对告警讯息是否均相同
16
2.2 技术培训与支撑 培训内容
:
硬件——在安装现场,对客户技术人员进行专业培训(内容包括各种监控设备
的基本构造与原理、安装技术、维护技术等).
软件——使客户技术人员能够掌握SWARE的各项功能,能独立地在SWA
RE软件平台上对新增局、新增设备进行正确设定和软件流程编辑。
技术支撑
:如客户未来对系统扩容或二次开发上有特殊要求,需技术支撑,将就具体需求开设培训课程。
课程如下:
人员训练 训练项目 1. SuperWare5.0软件基本操作 天数 2天 软件操作 2. 操作系统OS9K基本操作 3. 数据库系统的基本操作 1 智能型采集模块(UPC48)构造、原理、安装和维护 2天 硬件维护 2.监控系统原理、安装、测试和维护 1.SuperWare5.0软件设计思路 2.SuperWare5.0高阶软件编辑: 3天 软件编辑 流程编辑 和数据库 OBJ档的建立 维护 图象界面制作 图象界面投点 RTU及I/O点设定 3.数据库的建立、使用 4.数据库的维护
17
因篇幅问题不能全部显示,请点此查看更多更全内容