• 快捷搜索
  • 全站搜索

颜阳:创新与风险并存

2013-10-25 13:15:31作者:民族证券技术总监 颜阳编辑:金融咨询网
信息系统及其运用的风险控制是一个系统工程,除了高度重视之外,还需要有科学的方法论和持续的标准化、流程的落实,推进IT服务管理。

据报道,8月20日,由于高盛因一个技术事故而意外发出的指令,导致周二美国股票期权市场开盘后出现大量错误交易。这是今年期权市场发生的第二起交易问题。而接着在美国时间8月22日下午12时14分3秒,纳斯达克证券交易突然中断,瞬间造成大部分美国股市陷入瘫痪,直至下午3点,第一只股票才恢复交易。
  
  这起事故造成的冲击前所未有,导致在纳斯达克上市的数千只股票、交易所交易基金(ETF)和期权报价皆暂停更新,诸如黑池(BLACKPOOL)及其他电子交易所也被迫暂停了纳斯达克挂牌证券的交易。一时间,华尔街银行的客户慌乱一团。这起事故可以与2010年道琼斯“闪电崩盘”相提并论。当时一家交易公司的程序出错,直接令道琼斯工业指数暴跌近千点,多家上市公司受到冲击。而在早些时候我国的A股市场上也出现过ETF交易的异常。一时间,大家特别关注创新市场的风险问题。
  
  其实就技术系统来讲,出现异常的情况就概率而言都是存在的。我们常就风险问题,可以用墨菲定律来诠释。就是越是担心的事情就越容易发生,而且总是容易出现最坏的情况。因此,无论何时,风险意识总是需要贯穿在整个IT生命周期中。那么就方法论而言,IT人员需要学习扁鹊三兄弟尤其是老大的本领一一需要将风险(“疾病”)控制在事前。
  
  在风险的问题上,责任心是第一位的,但这不是解决问题的全部。解决风险问题要让大家有一个条件反射一样的习惯,将风险的意识和流程固化在系统中,而不能单单靠多人的手工复核。然而更有效的办法是建立可控的手段,包括统一监测、系统容错以及快速的排错与纠错的办法。统一的监测,可以从前分散监测的状态进行数据勾稽从而提前发现问题;而系统的容错可以规避系统一旦出错就变得风险的无限扩大而失控;而快速的排错与纠错需要有系统的方法和自动手段。
  
  对于运维而言,今年不少公司都开始落地ITIL,而在ITIL的V2中,服务管理是中心,其中包括事件管理、配置管理的10个流程管理构成了ITIL的核心。SLA却在不少公司较难落地。因为零故障常常是人们的“理想”目标,这样的要求其实是耗损了IT的有效资源。在ITIL的V3中,其决策、计划、设计、开放、测试、运行及改进几个方面构成了IT服务的闭环,与我们提到的项目管理的生命周期有些一致。
  
  在IT管理中,不少企业也在开始进行“贯标”。ISO20000着重在IT的服务标准化,这方面贯标的企业越来越多。涉及安全方面的ISO27001,其前身是BS7799,主要包括10个方面的内容:安全策略、组织、资产管理、人力资源的安全、物理环境安全、通讯与操作管理、访问控制、系统采集与开发维护、安全事故管理及安全符合性。
  
  对于业务连续性的要求,主要体现在BS25599上。首先要求系统的可用性及其时间的量化上。这样的要求,其实是和SLA要配套的。具体三个主要的内容包括:业务状态的数据备份与复制、业务处理能力的冗余与切换及外部接口冗余及切换。对于数据方面的问题是,我们常常只关心备份而不太关心恢复的演练(即可用性缺失);对业务处理能力往往受限于工具及手段而简化了切换能力的演练;随着外部互联的系统越来越普遍,相互之间连接的有效性也越来越提出了更高的要求。
  
  综上所述,对于信息系统及其运用的风险控制,是一个系统的工程,除了我们的高度重视之外,还需要有科学的方法论和持续的标准化、流程的落实、推进IT服务管理,才能够成为“扁鹊大哥”而让墨菲定律少“变现”或不“变现”。
  
(文章来源:新金融世界)
 

扫码即可手机
阅读转发此文

本文评论

相关文章

频道最近更新

频道热门文章