• 快捷搜索
  • 全站搜索

华夏银行:以ITIL为标准提升运维管理能力

2014-09-09 16:01:57作者:华夏银行科技部总经理 吴永飞 华夏银行科技部 王文娟编辑:金融咨询网
华夏银行自2011年起,开启运维体系建设工作,并以ITIL(IT基础构架库)为核心流程,构建了网格化管理平台,完成一体化运维平台监控系统、ITIL流程管理系统、作业调度管理平台及运维操作审计平台子系统建设,初步实现了“监、管、控”等功能,IT服务管理系统的实施全面提升了华夏银行的运维管理能力与水平。

2011年,华夏银行信息系统运维管理模式随着新一代核心业务系统成功上线,完成了从分散管理向集中管理转变。同年9月,华夏银行借鉴ITIL(IT基础架构库)、ISO2000国际标准及同业在IT运维管理方面的先进理念与经验,正式实施运维体系建设工作,对运维体系的建设目标、总体架构及实施演进路线进行规划设计。经过近3年的运维体系建设优化,结合ITIL核心流程形成了华夏银行“运维网格化管理”方法,将人员、岗位、流程纳入网格化并紧密匹配,实现运维管理精细化的要求;将ITIL核心流程固化到运维管理实践工作,有效提升运维管理的服务质量;以ITIL为标准建立了一体化运维平台监控系统、ITIL流程管理系统等多个子系统,初步实现系统异常事件的快速发现、及时定位、有效处置和推演预测。在此期间,华夏银行未发生一起重大信息系统事件,关键系统在主要业务时段的整体可用率始终保持在99.997%以上。

吴永飞-tu.jpg

        ITIL是英国商务部(OGC,Office Government Commerce)开发的一套针对IT行业的服务管理标准库。ITIL经历了3个主要的版本:ITIL V1,基于职能型的实践;ITIL V2,基于流程型的实践;基于服务生命周期的ITIL V3整合了V1和V2的精华,主要强调ITIL最佳实践的执行支持,以及在改善过程中需要注意的细节。ITILV3从IT服务的生命角度,将ITILV2的管理延伸到了服务的策划、服务的实现和服务改进,形成IT服务的PDCA生命周期。ISO20000从管理角度来看待IT服务,并通过一个完整、系统的管理架构保证ITILV2、ITILV3的应用效果,更方便将IT服务融合到现有的其他管理架构中,从而形成一套包含IT服务管理全面组织管理架构。华夏银行已结合ITIL进行了组织架构、流程管理、运维管理平台等运维体系的建设工作,下一步将在完善运维体系建设的同时启动ISO20000体系建设咨询项目。

一、运维体系建设情况

        1. 组织架构建设情况

        2012年底,华夏银行以ITIL为标准,结合行内实际情况,完成了数据中心机构及岗位设置调整。

        为使人员与岗位工作紧密结合,组织架构建设采用与ITIL核心流程相结合的“运维网格化管理”方法,即将事件管理、服务台管理、变更管理、连续性管理等管理节点和操作节点纳入网格,将运行管理岗、服务台管理岗、变更管理岗、运行安全岗等相应岗位人员作为节点执行人、监督人,将岗位职责、工作说明手册等作为管理标准和检查标准,使每个网格节点的每项工作清晰明了、职责明确。同时,通过ITIL流程管理平台网格化管理模块上线,实现了网格化管理流程电子化,进一步提高了运维管理工作质量和精细化管理水平。

        2. 运维管理流程建设情况

        在华夏银行运维体系建设总体架构中,借鉴ITIL核心流程,建立了服务台及事件管理、问题管理、变更管理、发布与部署管理、连续性管理、外包管理、服务级别管理、硬件配置管理、可用性管理、容量管理、知识管理11个维度的运维管理核心流程。

        服务台及事件管理、问题管理等前6个维度已初步建立了闭环的管理流程。各维度均设立了流程经理角色。在满足监管要求前提下修订了相关制度,明确定义了各维度工作范围、工作策略、参与角色及职责,细化了各管理维度中各环节流程。明确了各维度执行后的监督、检查机制,如定期组织召开事件分析会及问题分析会,对发生的重点事件及问题进行深入分析。定期联合业务部门组织演练,对应急预案进行测试和检查,确认其有效性。定义了事件、变更、应急演练、问题之间的接口,明确了各维度间的关系,并将“事件响应时间”、“问题解决率”等运维管理指标作为服务级别评价输入,作为员工绩效考核参考,有效提升各维度工作质量。

        服务级别管理、硬件配置管理等后5个维度目前正在按照总体目标规划逐步建立。一是服务级别管理方面,目前设立了服务级别经理角色,定期回顾服务级别的达成情况,及时调整服务级别各项指标,并定义了较为明确、科学的服务级别管理指标,已确定了12套重要信息系统的服务级别协议。拟在今年进一步完善IT服务目录,细化“操作级别协议”,并在服务目录成熟后扩大签订服务级别协议的范围。二是硬件配置管理方面,目前资源管理系统已经建立了硬件配置管理数据模型,负责维护机房设备配置的数据信息;建立网管平台维护网络设施资源相关的配置信息。但因各系统间缺乏有效的数据集成,生产环境硬件配置信息散落在各运维团队中,难以保证配置信息的准确性。拟建立运维操作管理平台,解决此数据集成及维护问题,并打通与ITIL流程管理子系统接口,实现电子化流程。三是可用性管理方面,制订了可用性监测指标,并通过一体化监控子系统实现可用性管理部分数据的自动采集;明确定义可用性信息的收集、记录、分析和跟踪职责及可用性相关缺陷和问题处理和流转机制,拟待流程验证完成后,将流程固化到制度中。四是容量管理方面,进行了容量管理试运行,明确了容量类问题处理和流转机制,验证了容量管理流程的可行性;同时,已通过一体化监控子系统实现系统容量管理部分基础数据的自动采集与评测。今年拟建设存储监控管理系统利用数学模型逐步开展容量管理分析。五是知识管理方面,通过IT运维管理平台建立运维知识识别、收集、记录、运用等知识管理措施,并在事件管理、问题管理等制度中明确了知识更新要求。为了使流程与具体实施结合更紧密,已在新建立的ITIL流程管理子系统中实现知识管理模块的电子化流程需求,并将在系统上线知识管理流程运转顺畅后固化到制度中。

 1 2 下一页 尾页

扫码即可手机
阅读转发此文

本文评论

相关文章