• 快捷搜索
  • 全站搜索

通过多维度监控提升系统可用性

2017-12-18 14:03:47作者:招商银行上海数据中心 李荣杰编辑:金融咨询网
如何对新增设备配置监控也颇为棘手。本文提出两种机制来提高监控完整性,一是利用“矩阵监控”交叉校验监控系统和设备,二是通过“健康树”完善各监控节点。

在实际lT运维中,往往由于监控存在死角无法及时发现故障。如何对新增设备配置监控也颇为棘手。本文提出两种机制来提高监控完整性,一是利用“矩阵监控”交叉校验监控系统和设备,二是通过“健康树”完善各监控节点。矩阵监控是自动化运维的一部分,主要完成相关系统及设备的配置文件自动备份,以及根据配置文件内容,通过匹配条件得到系统与监控平台监控状态,实现矩阵式监控报表的展示。健康树是为了检查设备的某项指标是否纳入了监控体系,确保监控的全面性。通过健康树,验证网络设备各个监控点是否可用,是否存在监控盲点。

矩阵监控

  矩阵监控主要通过设备维度以及监控维度校验设备和监控系统的对应关系(见图1所示)。

图片2.jpg
图1 矩阵监控交叉校验示意

  设备维度(X维度):通过每日自动登陆设备获取设备配置,并保存在指定位置提供配置备份。通过检测相关的监控命令,来判断设备是否配置了监控。

  监控维度(Y维度):通过自动化脚本每日导出各监控系统的监控清单,保存到指定位置。通过资产清单导出室组纳管的设备,并按照设备类型进行分类。两者比较,判断是否有资产缺失监控。

  综合比较X以及Y维度产生的数据,输出最后结果。正常状态为设备和监控系统之间双向监控,若有不匹配的情况需要登陆设备或者监控系统进行查看。

健康树

  针对每一台设备,健康树对其监控指标进行梳理,确保每个指标都得到有效监控,通过监控系统或者人工巡检的方式落地。

  健康树的数据源主要有设备资产清单、健康树文件以及各监控巡检报告。健康树的实现逻辑如下:通过资产清单获取到各种设备类型的lP列表;通过脚本讨论的健康树转换为脚本可读的配置文件;通过脚本获取监控系统以及目前的巡检报告中包含的监控项;通过脚本比对每台设备的健康树指标是否都得到了落地;对数据进行处理和统计,将结果进行汇总和展示(见图2所示)。

图片3.jpg
图2 健康树架构图

  本项目通过自动化脚本开发,自动抓取各类配置以及进行数据处理,并将结果传递给WEB进行每日展示。通过矩阵监控校验,能检查设备和监控系统中的错误配置和遗漏配置;通过健康树的校验,确保设备的各项关键指标都纳入了监控体系。

(文章来源:金融电子化杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章