
- 快捷搜索
- 全站搜索
2018年是农业银行贯彻落实党的十九大精神的开局之年。农业银行数据中心要紧抓金融科技发展和科技体制改革的机遇,始终坚持“安全生产第一要务”,勇于担当,主动作为,实现传统数据中心向智能数据中心的战略转型。
农业银行数据中心经历十余年的发展,实现了生产运行安全平稳,IT治理成效显著,日均交易量保持5亿笔以上,为外部客户和行内业务部门提供了稳定可靠的生产运行环境。随着国际金融安全形势的日趋复杂和国内互联网金融的兴起,农业银行的商业模式、经营模式和组织模式正发生着深层次变革。农业银行在“十三五”科技规划中明确提出全面建成“业务电子化、服务智能化、控制自动化、管理数据化、应用网络化”的“信息化银行”目标,这要求数据中心制定切实可行的发展规划,着力打造符合金融科技发展的精细化运维管理理念和高效自动化运维工具,实现从传统数据中心向智能数据中心的战略转型,为农业银行经营转型和改革发展提供更强有力的科技支撑。
一、形势严峻,金融科技对传统数据中心的挑战
1.自身价值
目前,各界对运维人员的普遍认识是“救火”“背锅”“价值低”,运维人员对于事件、问题、应急处置的响应往往是被动救火式和问题驱动式,工作更多依赖于人工经验。随着运维体量的不断增大,运维自身负荷已严重超载,数据中心自身也有着强烈的改变现状的内在要求:解放运维生产力,从被动救火向主动运维转型,从问题驱动向价值驱动转型,从IT运维向IT运营转型的迫切需求。
2.监管压力
随着我国金融业的高速发展,银行业务已经渗透到大众生活的方方面面,承担的社会责任也越来越大。国务院、人民银行、银监会、公安部、审计署等外部门提出的监管和审计要求愈发严格,例如,银监会对业务连续性提出明确指引,给业务系统的高可用性、灾备管理的有效性、应急管理的全面性、容量管理的及时性带来了现实挑战;银监会、人民银行的监管内容从早期单纯的交易量监管到如今的对性能容量等指标的全面监管,给生产运行工作带来极大压力,银行必须加快运维数据采集、分析和报送能力的建设步伐。
3.技术进步
近年来,互联网金融飞速发展,加速推动了银行学习和应用大数据、云计算、区块链、人工智能等技术的步伐,这些新技术的引入对运维的技术架构、运维模式、职能设置等方面均产生了直接或间接的影响。这些技术的逐步推广和使用,有效提高了系统架构的稳定性、可靠性和应变能力,但同时也在运维管理方面提出了更高的要求。
4.业务发展
随着现代通信技术的普及,普通百姓对银行金融服务的方式有了更多的选择。农业银行也同样经历了柜员交易、电话银行交易、网上银行交易、手机银行交易的金融服务方式的衍变。当前,互联网渠道的交易量已占据较大份额,互联网交易中瞬间交易激增现象不定期出现,各类资源都在加速向电子业务倾斜,这倒逼着农业银行数据中心要在运行调度、性能提升、集中监控和流量控制等方面加强保障措施。
5.运维模式变化
当前不少数据中心都在引入互联网的研发模式,即开发运维一体化(DevOps)。过去数据中心从事基础运维工作,运维工具的研发由软件开发中心完成。现在,为了提高运维工具的针对性和开发效率,各银行在运维人员中成立独立的开发团队,开展了操作运维向开发运维转型,形成运维工具整个生命周期中运维与开发相互融合的管理模式。
此外,为了应对产品多样性和需求的高频变化,应用产品的敏捷、迭代开发、灰度发布等概念逐步应用于软件开发的整个管理过程,传统的投产变更模式已无法完全满足快速的应用产品需求,这也倒逼农业银行数据中心要立足长远,建立符合时代发展需求的运维模式。
二、痛定思痛,制定战略规划谋求转型
农业银行数据中心根据内外部的金融科技形势,制定了自动化发展的规划,其指导思想是:围绕全行发展战略,以“六维方略”为总纲,坚持“统一规划、统一立项、统一开发、统一运维、统一管理”,以信息化银行建设为抓手,立足现有“两地三中心”“总分行一体化”的运维体系,参考同业先进经验,引进新技术,强化全行生产运行自动化统筹管理,弥补短板,提升运维效率、运维能力和运维管理服务水平。
在数据中心的发展历程中,对于陈旧的工具和系统经常是“新三年,旧三年,缝缝补补又三年”,虽然也取得一些实际效果,但由于较多的工作归属于不同的管理部门,造成烟囱式运维工具的功能冗余、数据孤岛等缺陷逐步显现,管理难度和半径也无限扩大。数据中心借鉴过去发展的经验,提出了新的工作原则,避免重走传统数据中心运维模式的老路。
1.坚持全覆盖、平台化建设方向
未来自动化的运维工具需要覆盖运维对象的全生命周期,包括部署、监控、操作、分析、报送以及流程管理等方面。基础技术框架和业务功能架构实现平台化,便于集中开发和灵活扩展,优先发展基础性工具。
2.坚持技术和管理同步发展
数据中心成立自动化部门作为自动化运维工具的管理主体,协同运维部门,同步进行生产运行自动化技术体系建设和管理体系建设,科学统筹,形成运维与开发相互融合的运维模式。
3.坚持数据管理条线化
强化金融数据治理工作,为专业部门提供持续的、可度量的价值。主动把运行数据的分类、采集、存储、加工作为一项重点工作来抓,体现在工具建设中,体现在运行生命周期的各个阶段,为数据挖掘和分析、展示奠定坚实基础。
为确保生产运行自动化的高效推进,数据中心将专业目标与生产运行生命周期相结合,形成运维生态圈的自动化目标。
三、稳步推进,坚持以IT运营为核心理念
数据中心的自动化发展,不是对过去的否定也不是重新造轮子,而是站在历史的舞台,根据金融科技的要求,进一步提升自身价值。提到IT运维,主要是“安全、稳定、合规”,而IT运营的理念更大,包括“体验、效率、效益”,用户体验则是根本落脚点。从“运维”到“运营”,一字之差,却蕴含了IT要从成本中心转变为利润中心,从“活着”转变到“活得好”。
1.确定“生产运行生命周期”的IT运行主线
农业银行在制定自动化规划之初,明确把“生产运行生命周期”作为IT运营主线,把自动化、智能化的改造贯穿于生产运行的各个生命节点,打破了多年来传统数据中心在流程、部门、人员上的界限,从全局视角审视数据中心的自动化发展,分模块实现从人工化向自动化和智能化方向的转变。生产运行自动化生命周期如图1所示。
2.打造去中心化的新一代生产运维平台
传统数据中心历经多年发展,在专业层面,涵盖主机、开放、网络、环境、应用等领域,专业背景差异大,可谓隔行如隔山,精通多个专业领域的复合型人才寥寥无几,导致无论是按架构“由下而上”,还是按业务“由里到外”,都无法摆脱“部门银行”“部门系统”的影子。另一层面,传统数据中心的技术可谓“百花开放”,既有互联网的新应用,也有90年代的老应用系统,硬件从大型机、小型机到X86,数据库从Oracle、Sybase到MYSQL,供应商从IBM到EMC、华为、HP、CISCO等更是不胜枚举。复杂的技术架构给自动化发展带来诸多挑战。
农业银行数据中心在成立自动化部门后,对数据中心历史遗留下来的应用、系统和设备,并未采用“一刀切”的摒弃或保留方式,而是分阶段在创新中予以保留、发展和更替。为此,由各专业运维人员转型组成的研发人员共同打造了新一代生产运维平台,该平台借鉴互联网“连接一切”的技术思维,从生产运行生命周期视野实现了专业层面“互联互通”,把原本割裂的专业信息整合到一起。新一代生产运维平台框架如图2所示。
3.实现专业领域相互渗透
新一代生产运维平台提供了六大模块(如图3所示),应用层在六大模块对生产运行生命周期进行管理,包括全行一体化监控模块、全行标准化服务流程模块、统计分析和决策支持模块、全行一体化操作管理模块、全行一体化资源管理模块和运维信息安全管理模块。六大模块相互关联,各系统不再孤立,形成统一运维整体。最上层为统一门户,支持网页端、移动端和大屏端的操作与展示。数据中心采用了当前流行的DevOps研发理念,在运维与研发中相互渗透,在专业与专业间相互共享,达到提高运维效率和解放运维人力的目的。
四、展望未来,借助新技术实现“弯道超车”
随着云计算、大数据等热门技术的发展和普及,农业银行数据中心深感传统数据中心实现“弯道超车”的转型机会已经来临,在确保安全生产的前提下,数据中心主动拥抱新技术和新理念,实现生产运维转变,为农业银行业务经营和深化改革的大局提供强有力的运行支撑。
1. 科技业务联动化
金融产品的正常销售、银行业务的稳定运转离不开数据中心的科技支撑。数据中心针对部署的金融产品,以交易发起到交易返回整个路径的生产运行单位为成本中心,在展示基本的交易量、成功率、响应率等运行性能指标外,结合人力、物力的标准化过程,通过配置权重规则,合理计算运行成本,将成本收益比通过具体的图2新一代生产运维平台框架数据进行可视化展现,帮助管理层和决策者综合判断金融产品的收效。
2. 操作控制服务化
农业银行通过新一代生产运维平台将各专业的检查和操作等功能服务化,通过工作流进行关联,实现检查和操作的自动化。在2017年实施的核心系统灾备切换实战演练中,通过新一代生产运维平台的驱动,农业银行核心系统切换用时61秒,回切用时56秒,达到了业界领先的水平,演练期间对外开放全业务、全渠道服务。未来,我们将把异常处置标准化和服务化的半径覆盖至全部异常场景,使人均管理的服务数量呈数倍增长,提高运维效率。同时,新一代生产运维平台的规范性操作也能够满足内外部审计要求。
3. 预警分析智能化
通过新一代生产运维平台的建设,农业银行数据中心的自动化率由先前的30%提高到了现今的90%以上。当前,制约生产运行监控和操作的主要问题已从自动化程度低转变为预警分析水平低。农业银行数据中心正在运用大数据技术,以海量的批量节点历史用时数据作为基础,提取周期、趋势分量并生成预测区间,动态计算关键路径并比照原始关键路径,若节点用时超出区间阈值或改变关键路径开销则发出相应告警。通过统计分析与机器学习方法,改变以往单一按照时间长短或者时间窗口的预警模式,提升批量节点预警的智能分析力度和预警精度。
4.应用资源均衡化
通过应用系统的交易路径自动识别,构建端到端的交易路径分析模型,模拟用户体验,增强运行质量的判识精准度,提升设备资源的使用和分配效率。对于系统运行正常,但用户端操作不便的业务,分析“卡壳”环节,根据配置规则要素,自动将有限资源调配到关键业务和关键交易上,实现资源利用的最大化,减少人为操作和管理流程上产生的滞后性。
当前,各家商业银行科技部门正置身于前所未有的金融科技风暴中,我们清醒认识到这场金融科技革命带来的变化不是经济周期层面的循环调整,而是一场“技术为王”的行业革命。农业银行数据中心要在行党委的坚强领导下,紧抓金融科技发展和科技体制改革机遇,扎扎实实推进自动化战略规划,全力保障全行生产运行安全平稳,谱写数据中心建设和发展的新篇章!
(文章来源:中国金融电脑杂志)
当前,商业银行灾备中心建设与运营主要采用自建、共建和外包三种模式。哪种
央行和银监会对中小银行的灾备布局建设十分重视,构建同城灾备中心,发挥其