• 快捷搜索
  • 全站搜索

交通银行:打造数据中心生产运维服务云

2013-06-08 11:58:36作者:交通银行数据中心 郑仕辉 李晋晋编辑:
如何借助“云”的力量,全面提升运维管理能力?交通银行数据中心对业界云计算概念和相关实践进行了深入研究,结合运维现状,开展了系统运维云服务平台项目的建设。

面对当前数据中心日益严峻的运维管理压力,如何借助“云”的力量,全面提升运维管理能力?交通银行数据中心对业界云计算概念和相关实践进行了深入研究,结合运维现状,开展了系统运维云服务平台项目的建设。

一、大型商业银行数据中心运维管理面临的问题及需求

        交通银行数据中心管理的小型机生产分区规模近2000套,同时还负责同城灾备环境及测试环境管理维护,运维工作量很大。为此,数据中心近年来持续大力推进系统运维管理的规范化和自动化建设,包括底层硬件虚拟化管理。自动化工具主要实现任务级的自动化,硬件虚拟化管理仅局限于底层技术层面,但生产环境运维工作却是多步骤、多任务的复杂流程。

        面对外部越来越严格的监管标准及高可用要求,以及内部业务发展需求及成本控制压力,数据中心运维管理面临巨大挑战。即国内外大型银行数据中心的发展趋势:业务系统集中程度越来越高,基础架构规模庞大;外部监管、业务发展对生产系统稳定、高可用要求越来越高,全生命周期管理需求越发强烈。

        云计算的概念已从理论走向实践,但从厂商到客户,对云计算的理解和关注主要侧重在基础架构层面,包括虚拟化、自动化、资源池管理等。大型金融机构在“云”上的探索主要集中在打造开发测试基础架构云方面,还没有在生产环境采用云计算技术的实践项目。

二、云计算技术的应用实践:系统运维云服务平台

        1.项目背景
        交通银行数据中心管理范围覆盖生产环境、测试环境、同城及异地灾备环境;系统平台包括大型机、小型机和PC服务器。系统管理日常运维工作包括系统安装配置、工具软件安装配置:系统检查及信息收集、系统监控及处理;版本补丁管理、数据备份管理;灾备环境管理等。数据中心已经有许多运维管理工具,包括自动化平台Opsware,NIM软件分发平台,监控系统ITM、M2、MASCO、TMON等,备份软件NBU,配置管理系统TADDM和CMDB,ITIL流程管理平台REMDY等。

        数据中心的生产运维面临如下难题:基础架构环境规模越来越大,对生产运行环境的技术架构、安全管理规范要求严格复杂;生产系统可用率要求越来越高,日常运维管理种类复杂、工作量大;多种运维工具独立运行,缺少有效集成与统一管理;每套应用单独搭建独占的物理环境,交付速度慢,后期调整难度大,无法充分利用底层资源。

        2.平台建设规划
        平台的建设思路:把云计算的概念推广至全面的系统运维管理。包括在底层建设实现虚拟化资源池(JaaS)、在上层实现日常运维流程服务(BaaS),以达到有效提高资源利用率,全面提升系统运维管理能力的目的。

        数据中心管理范围包括生产、灾备、测试环境,对运维“云”建设有长期持续发展的规划,考虑在运维过程中两个不同角度实践云计算技术。

        一方面从系统日常运维管理角度,使新系统安装配置、版本升级、健康检查、安全加固、备份管理、系统备份、灾备切换等日常运维工作成为可随时获取的服务,侧重运维流程服务自动化,确保生产环境相关管理及规范,以满足生产中心在安全、ISO20000流程、高可用等方面的要求,更好地应对大规模环境的系统运维管理。即“云化”概念整合IT系统运维管理(如图1所示):将繁重复杂的系统运维流程“云化”,从服务自动化的角度梳理服务目录,将各类运维工具提供的功能看成运维服务的“资源池”,标准化并全面整合现有的各类系统运维流程,设计开发数据中心系统运维云服务平台;在平台上将手工或已利用各类运维工具的自动化操作进行整合,最终实现全面的系统运维流程服务自动化,打造“系统运维服务云”。

        另外一方面从基础架构环境交付及使用角度,全面推广基础架构虚拟化的标准及规范,构建标准资源池,使得数据中心基础设施环境成为按需获取、快速交付、可动态调整并按使用计费的计算资源。即:建设硬件虚拟化资源池,通过底层基础架构的标准化、虚拟化,实现硬件资源虚拟化资源池,结合应用系统的运行情况,实现分配、交付、监控、动态调配、回收资源池等一系列管理功能(如图2所示)。

打造数据中心牛产运维服务云图1.jpg

 1 2 下一页 尾页

扫码即可手机
阅读转发此文

本文评论

相关文章