金融咨询网近期会进行系统维护,短暂的等待是为了更稳定的服务,感谢您的支持。
  • 快捷搜索
  • 全站搜索

后ITIL时代的保险IT运维管理创新

2015-05-29 17:06:50作者:中国人民财产保险股份有限公司信息技术部副总经理 张化群编辑:金融咨询网
解决IT黑洞问题的关键在于说清IT的投入产出,其中主要是说清运维服务的内容、种类和标准以及相对应的成本,这样才能让IT这座冰山完整地呈现在眼前,这也是本文主要讨论的内容。

  但即便如此,还没有完全解决问题。因为就算实现了“横向”环节的合理折算,但在相同的服务水平下,“纵向”维度上也可能有不同的组合。举例来说,给后台主机加几个CPU和给网络加几M带宽对用户来说完全有可能是一样的感觉提升,但成本却差别很大。“纵向”的不同环节之间是无法虚拟化的,如果要做到合理折算,就必须要对服务水平进行精确的测量,并假定前台用户感受相同的情况下后台的资源组合是等效的。也就是说,我们必须搞清楚“产出”到底是什么,才能在相同服务水平下选择最合理的“纵向”组合。

        同样的,我们可以类比“物”的资源的分摊来解决“人”的资源分摊问题。从前面的讨论来看,解决“物”的分摊问题的思路是先做虚拟化,找到虚拟“单元”,这是从成本上进行分析。难以虚拟化的部分,则采用等效的方法,即对用户来说感受相同的资源组合,我们也认为是等效的,这是从效果上进行分析。类似的,解决“人”的资源分摊问题也可以采用同样的方法。对人力资源来说,所谓虚拟单元就是“工时”,如果我们把运维工作规范化、标准化、工单化,其实这个虚拟单元也就找到了。而众所周知的是,ITIL本来就是用来做运维规范化标准化的,这也就同时也回答了我们前面提出的“ITIL”之后怎么办的问题。那么,会不会有人借机像过去的人民公社一样,“刷单”“骗工分”来提高绩效呢?要解决这个问题,就不能光管过程,而是同样要从结果上进行分析。如果有了定量的“产出”标准来进行约束。对运维产出有意义的才能计算工作量,“刷单”的情况也就可以得到有效抑制了。

四、产出的定量评价标准

  上面谈到投入问题时,提出投入分摊的一种方法是要计量产出。其实,如果没能计量产出,即便我们用其他方法搞清楚了当前情况下的分摊比例,问题也还远没有结束。这是因为能够做“分摊”,其实就有一个假定的前提,也就是用户对于目前的服务水平认为是合适的,可以接受的。但如果我们没能对当前的产出进行计量,也就是当前的服务水平究竟是什么都没说清,分摊本身是无法持续的。这是因为,假定我们认为存在的就是合理的,就按现有服务水平进行分摊,但用户嫌服务水平低了怎么办?嫌分摊费用高了怎么办?如果调整,该如何调整?换句话说,“分摊”不是最终目的,“计费”才是最终目的;“分摊”只意味着一种相对合理的摊派,“计费”才是一分价钱一分货的市场化行为。

  很多领导常说对IT要求不高,不出事就行,孰不知对IT来说,“不出事”已经几乎是对运维管理的最高要求了。如果总是觉得“不出事”是应该的,日久天长,IT服务就越来越像空气,有了也不知道,没了它又不行。花了那么多钱买来一堆“空气”,难怪企业管理层要恼火。其实,不同应用,不同用户对于“不出事”或者说是“出事”的感觉和要求千差万别,也导致了IT成本投入的迥乎不同。不对此进行定义和计量,笼统地说不出事,不宕机,显然不是公平合理的做法。

  实际上,ITIL对运维管理的产出还是进行了定义的,这就是ITIL的服务交付部分,包括财务管理、持续性管理、可用性管理和能力管理。通俗点来说,在不考虑业务系统功能需求的前提下(那是开发服务的部分,不属于本文讨论的范畴),用户对给定业务系统性能的需求可以概括为“断不断”、“慢不慢”和“够不够”。如果业务和IT已经约定好了对业务发展规划的描述,那么“够不够”的问题其实又可以归结为“断不断”、“慢不慢”的问题。

  但是,简单把指标归为“断不断”和“慢不慢”还是不够的,还应当满足以下几个条件:首先,指标的设定、采样和计算应当是客观而非主观的,如果随便哪个用户说“慢”就是“慢”,哪个IT也吃不消。但实际上这就是很多企业的现状:用户随心所欲,IT疲于奔命。其次,指标应当满足“业务能理解、IT可计算”的要求,如果业务难以理解指标的含义,或者IT不能计算产出和投入的对应关系,这些指标就难以发挥其应有的作用了。最后,指标还应当可以归一化。好比高考,尽管考试科目有很多门,但录取就是靠分数线,一分就是一分,科目的区别在于所占权重不同,但结果都是分数。尽管可以对某些科目设定最低要求,但最终评判的标准应当是归一化的。

  我们搞ITIL,搞运维管理规范化,规范的目标是什么?或者说ITIL之后怎么办?应该有一套定量的评价标准。我们搞IT的投入产出分析,“产出”到底是什么?也应该有一套定量的评价标准。其实,根据刚才的分析,要计算“投入”,也需要有“产出”定量评价标准,这几个方面的要求,在“产出”的定量评价上走到了一起。只有对“产出”有了定量的评价标准,才能知道为什么要规范,规范到什么程度为止,以及不同领域间规范程度的关系;也只有有了定量的评价标准,才能对“产出”进行客观的分析,对“投入”进行合理的分摊。

  实际工作中,能够比较好满足要求的指标其实就是对业务系统运行状况监控的定量描述。如果监控了业务系统的关键环节,并对关键环节的响应时长进行监控和采样,这些采样结果就是计算“产出”指标的基础。这个指标应该说是相对比较合理的。有了这个基础指标,不仅可以定义“慢”,还可以根据采样点的分布,慢的程度等等定义各种不同的“慢”,甚至也可以据此定义什么叫“断”。

  运维“产出”的问题可以归结为“断不断”、“慢不慢”和“够不够”的问题,“够不够”的问题其实又可以归结为“断不断”、“慢不慢”的问题。而有了对业务系统关键环节的监控之后,“断”也可以归结为一种特殊意义上的“慢”,而“慢”本身则可以通过对采样点的统计进行各种各样不同的定义和计算。也就是说,这些采样点就是IT与业务之间的桥梁,成为“业务能理解,IT可计算”的技术基础。

        总结上面的讨论,IT黑洞问题的产生主要是因为IT难以说清自身的投入产出关系,而根据IT冰山模型,又主要是IT运维管理难以说清自身的投入产出关系。ITIL作为运维管理的最佳实践,可以把运维管理规范化,并成为运维管理这项“业务”的业务系统需求。但ITIL只能说清运维管理规范化的方向,并未建立投入产出的数学模型。建立投入产出模型的关键在于定量描述“产出”。有了定量描述的产出,再辅之以规范化标准化的运维工作,就可以实现合理的横向折算和纵向折算,并合理分摊投入。而对业务系统关键环节的监控可以作为模型的指标基础。运维管理有了定量的“产出”指标,也有了规范化操作的基础,投入产出模型的建立就是一个时间问题了。然而,如何在实施ITIL的过程中逐步规范,逐步优化;如何确定“人”的资源的虚拟单元,制定合理的考核指标和考核体系以最大限度调动员工的积极性;如何使资源的投入组合和“产出”指标进行合理关联,并使以上这些都朝着客户需要和能够承受的方向不断优化,这些都是要在实践中逐步摸索解决的问题。

 

(文章来源:中国金融电脑杂志)

首页 上一页 1 2

扫码即可手机
阅读转发此文

本文评论

相关文章