- 快捷搜索
- 全站搜索
随着互联网、云计算和大数据产业的迅猛发展,我国数据中心数量和规模不断扩大。据不完全统计,中国现有各类数据中心超过43 万个,约占全球总数的13%。如此大规模的数据中心建设给企业运营成本、效率带来了巨大挑战。而新一代数据中心在继承原有安全、可靠的固有基因之外,更多展现出“绿色节能、高效、智能化”等新特征,因此备受关注。由于商业银行数据中心建设起步比较早,建设标准较高,已成为企业级数据中心的标杆。下面结合工商银行在新一代数据中心建设方面的最新实践,从四个方面进行探讨。

中国工商银行信息科技部副总经理 毛宇星
一、“绿色节能”是新一代数据中心的基础
数据中心基础设施(Facility)一般特指动力、空调、机柜、布线、通信等非IT 设施,共同组成了IT 资源运行的支撑环境。新一代数据中心的核心是环保和节能,这个概念除了节能、省地等“显性”因素之外,还包含了安全、无污染、无干扰等“隐性”因素。具体来讲,主要做法如下。
一是采用模块化机房方式。与传统数据中心机房模块一次建成不同,新一代数据中心往往采取模块化设计方式,支持按需启用、按需扩展。在做模块化设计时,不仅要考虑机房空间,也要对机房空调、UPS系统、发电机组、冷却系统、开关系统等进行同步规划,确保后续模块启用时,这些配套设施能够相互适配。而一体式机柜、微模块机房、集装箱式机房等也在一定场景下开始应用。
二是采用高效冷却系统。尽管国外数据中心早就采用水冷空调系统进行制冷,国内大型数据中心使用时间则相对较晚。水冷系统不仅比风冷系统节能20%左右,而且可以利用自然冷却方式进一步节能。以数据中心比较集聚的上海市为例,一年中有26% 的时间可以利用自然冷却。其中适合全年部分自然冷却时间是1064 小时(当冷却水供水温度低于17 摄氏度时,可以自动转换至部分自然供冷模式);适合全年完全自然冷却的时间是1234 小时(当冷却水供水温度低于10 摄氏度时,冷冻机停机,为全部自然冷却模式),节省的电费成本十分可观。
三是采用高效UPS 系统。目前在服务器设备基于直流用电的系统中,很多能量消耗在了交流/ 直流的转换过程中,所以采用高压直流供电技术,不仅运行效率高,供电连续性和可维护性比传统交流UPS更好。实践证明,采用380V 直流供电技术,可节省约7% 的基础能耗和约33% 的空间,可靠性提高了200%,总供电容量节省了15%。对于低等级业务系统和测试研发等设施则可以采用单路或双路市电直入方式,大幅简化UPS 环节和成本投入。
此外,还可以考虑引入太阳能、照明智能化、日光追踪系统、节能环保建筑材料等措施,这样不仅可以达到国家A 级机房或ANSI TIA 942-IV 级等高可靠性要求,还可以达到国家绿色三星级或国际LEED绿色认证标准。
二、“云化设施”是新一代数据中心的核心
数据中心IT 设施主要指服务器、存储和网络资源。对于Google、Amazon 等提供公有云服务的IT 企业来讲,数据中心IT 设施的云化部署及管理似乎是与生俱来的;而对于那些自己运营数据中心的企业来讲,私有云建设则要面临内部客户千差万别的服务需求,以及传统IT 设施烟囱式部署和标准化等问题。2009年工商银行在金融同业中率先自主研发投产了基础设施云管理平台,目前正在推进平台升级改造,以构建完整的企业私有云,并最终走向混合云架构,以服务企业内部和外部客户。主要考虑如下。
一是基础设施云建设方面。围绕生产用户、研发测试用户、办公用户,构建以“池化共享、快速上线、弹性伸缩、运维自动”为核心价值的基础设施云。所谓“池化共享”就是根据不同的服务水平定义,对服务器、存储和网络资源进行池化并分级,扩展服务器数量、存储容量、网络地址等规模限制,最大限度实现资源共享。在全面支持虚拟机、服务器存储(SERVER SAN)等云生资源的同时,也能有效支持物理机、光纤存储(FC SAN)等传统资源。所谓“快速上线”就是改变传统设备、网络、系统专业流水线式投产方式,通过云平台实现一键式自动上线。所谓“弹性伸缩”就是通过对应用预设置策略和感知策略,通过云平台实现基础资源的灵活增加、减少。所谓“运维自动”就是通过与其他运维平台的联动,对云化资源进行可视化管理,确保可监测、可处置。
二是平台云建设方面。在基础设施云的基础上,对各类中间件、应用程序及其运行环境部件进行云化管理,来实现“灵活部署、开发运行一体化、灰度发布”等核心价值。所谓“灵活部署”就是通过容器技术,将应用执行环境的相关部件进行封装,使之可以在不同服务器上灵活部署、迁移。所谓“开发运行一体化”就是保持开发环境随时就绪,缩短研发至投产周期。所谓“灰度发布”就是支持在同一应用的受控范围内部署不同的版本试点。通过平台云的建设,可以实现应用节点端到端的部署和管理。
对企业私有云来讲,不仅要支持新建的云生基础资源和应用,还要能够最大限度地支持传统基础资源和应用。相对而言,传统基础资源和云生基础资源同时纳管是企业私有云的基本目标,而对于应用系统,应该重点聚焦匹配云服务价值的应用开展改造转型,而不是一刀切。
三、“智能运维”是新一代数据中心的关键
数据中心运维工作不仅仅是资源的部署和调整,还包括了大量技术和服务管理工作。对于现有规模数据中心而言,服务管理工作大部分已按照ITIL 或ITSM 理念实现了电子化管理,而对于技术管理工作则存在不同的理解和实施路径。工商银行数据中心将之归纳为“运维操作、运行监测、安装部署、分析评估”四个领域,主要考虑如下。
一是运行操作自动化。经过多年建设,工商银行数据中心各类操作自动化率已达到95% 以上,运行操作日志完全实现电子化,操作步骤实现自动编排、监测和核对。对于数据中心、各分行以及网点设备的各类应用版本,也基本实现自动化远程安装升级。操作自动化不仅极大减少了运行一线人员的工作负荷,也一定程度上避免了人为操作出错的风险。
二是各类变更自动化。变更来自于外部业务和应用变化的需求,也有来自生产问题的解决或主动性维护。工商银行数据中心根据“大平台、微服务”的思路构建了跨专业的统一运维智能化平台,实现对不同资源对象的统一管理和并发操作。通过提供脚本编辑器和流程编辑器,可在线开发各类运维服务脚本,即编即用,较好满足了运维人员变更需求多样性、服务时效性高的要求。
三是感知处置自动化。信息系统健康程度需要准确而及时的感知,工商银行数据中心通过流数据处理技术,实现了个性化的监控策略与动态监控指标。及时发现业务的异常突变和渐变趋势,建立面向专业的技术运行视图,深入发掘系统层面潜在的隐患,建立面向业务全景视图,有助于快速定位故障影响。同时,通过构建智能规则,对部分生产事件进行自动化处理,或者给出专家建议,指导一线人员快速处置。
四是分析评估智能化。数据中心每天产生大量的业务和技术数据,工商银行数据中心利用大数据分析平台,对IT 运行情况进行例行化分析和预测,主动采用有效应对措施,实现数据中心运维从被动应急型向主动预防性转变。同时,通过与应用系统的联动,加大对跨业务数据的分析,及时发现各类业务隐患。
四、“多活部署”是新一代数据中心的趋势
随着各行业“数据大集中”的陆续建成,造就了一批现代化的数据中心,极大地提高了企业经营管理水平和业务创新能力,同时也带来了风险的集中。传统灾备解决方案的不足日益明显。异地灾备系统恢复时间一般在小时级,在非计划场景下仍有一定的数据丢失,还无法应对日常计划性维护停机等场景,灾备资源平时的利用率不高。而要有效解决这些问题,以“双活或多活”为特征的业务连续性解决方案将成为新一代数据中心架构规划的新趋势。
工商银行在同业中率先开展全业务线的双活架构研究和实践,通过近四年技术攻关,于2014 年顺利建成“两地三中心”新架构,实现了从灾难恢复向业务连续性模式的转变。其业务价值具体表现在以下几方面。
一是业务连续性水平有质的飞跃。通过同城双活机制的运用,对于核心系统局部或系统性突发故障,可由同城中心实现分钟级接管。即使在需要停机数小时的应用版本投产期间,也可以利用同城中心提供基本业务服务。
二是提升业务创新能力。在银行处理传统交易性业务的同时,利用同城中心拥有的同样数据,开展内部管理、经营分析甚至风险控制、数据挖掘类业务,更好地满足工商银行客户服务和内部管理多元化和时效性要求。
三是提高资源使用效益。通过负载动态分担机制,当核心系统交易负载增加时,可以将部分查询交易从核心系统自动切换至同城中心运行,实现整体负载均衡,提高资源利用效率。
四是满足全球化服务需求。“两地三中心”新架构的最终建成,通过双活系统的切换机制,为工商银行多时区全球业务的不间断业务服务提供了有力支撑。
面对日新月异的业务发展和更加严格的行业监管,随着新技术和运维管理的逐步成熟,构建以“绿色节能、云化、多活、智能化”为基本特征的新一代数据中心将成为数据中心未来发展的必由之路。
(文章来源:《金融电子化》杂志)
当前,商业银行灾备中心建设与运营主要采用自建、共建和外包三种模式。哪种
央行和银监会对中小银行的灾备布局建设十分重视,构建同城灾备中心,发挥其