• 快捷搜索
  • 全站搜索

银行业大数据:谨慎行动 着眼当下

2014-04-01 15:07:25作者:编辑:金融咨询网
目前,大数据在银行还属于前期投入成本高、商业分析价值低的不成正比的情况。所以银行业一方面可以在大数据领域进行尝试,而另一方面需要聚焦在传统成熟分析技术的深度应用。

银行业缺少数据吗?答案是“否”。因此,大数据在金融业的发展尽管“小荷才露尖尖角”,却已预示出巨大的应用潜力。作为银行业信息科技建设重要合作伙伴之一的文思海辉,从2013年以来,以其在商业智能领域的积累和优势,不断布局金融,获得了市场的广泛关注。近期,《金融咨询网》采访了文思海辉商业智能事业部副总裁贾丕星先生,就银行业大数据的应用与发展、银行业数据管理等相关问题进行了深入的交流。

贾丕星-2.jpg
文思海辉商业智能事业部副总裁 贾丕星

大数据:开放的心态与谨慎的行动

  《金融咨询网》:据我们所知,当前银行业对于大数据具有非常积极的态度和行动;在技术层面,以Hadoop为代表的大数据技术也得到业界的普遍研究。文思海辉作为银行业信息科技建设的主流合作伙伴之一,怎么看待大数据在银行业的阶段性发展?

  贾丕星:大数据技术在国内的行业里应用只是一个起步或者是一种尝试性工作。银行业也是如此。

  银行业大数据典型应用场景有三种类型:首先是外部互联网信息及舆情分析,就是银行能够通过各种手段找到的外部信息,包括互联网的评价、社交媒体和论坛里面的发言,它关注到银行或者关注到了银行客户。这种信息是一种非严谨的获取方式,但它是特别严谨的决策分析的补充。

  其次是银行自身非结构化数据信息。银行自身有大量非结构化信息,体现在网银和呼叫中心的语音等等,但这些信息是不是需要进行大规模的分析?我建议的方式是尝试。因为传统结构化数据或者分析技术还没有在业务决策分析里面发挥到极至。但是尝试大数据分析的态度可以引导我们去体验大数据的场景。第三就是银行自身结构化数据,包括历史归档和查询访问等。这三个方面是我们跟银行探讨的较多的大数据在银行的应用场景。

  大数据更多的是理念优先:它在银行里到底能发挥什么价值。事实上,大数据是多种类型数据的组成,需要使用多种技术。比如图像、视频、文档,每一个识别和监测的手段和方法是不一样的。另外大数据一个比较典型的特征是价值密度很低。

  那么反过来思考,把大量数据存下来再去做统计分析有意义和价值吗?还是通过实时处理的技术把没价值的东西筛掉,再利用技术手段把有价值的数据做结构化的关联分析?这就是大数据给我们带来的思考。

  《金融咨询网》:开放的心态与谨慎的尝试?

  贾丕星:银行思考大数据,更多的需要考虑自身具备什么条件让客户产生的大数据自动的流向银行?银行对待大数据更多的考虑是银行有什么类型的大数据?从银行统计应用角度来说有什么价值?

  银行业现在更多的是需要掌握大数据捕获技术。因为银行不像物联网行业有绑定客户的机制。银行大量的大数据依托于外部采集和供给,在这种情况下,银行应用分析场景的成熟尚需要比较漫长的时间。所以,我个人更希望传统的银行客户把传统的技术应用到极致,发挥传统分析技术投入产出比高的优势。

  文思海辉是实施商,我们在大数据领域保持跟我们合作伙伴的紧密接触,但是我们发现每家厂商对大数据的解读其实是有差异的。比如说EMC的HAWQ技术路线适合银行吗?因为我们知道HDFS底层数据存储和关系数据的底层数据有本质的区别,但是它有它的应用场景,比如互联网和电商类。Teradata的大数据技术路线中重点突出基于MR的Aster,它可能也只是适合一定的场景。所以让我们看到一个特点是百花齐放,大家各有各的发展思路。但是银行一定要选择适合自己的。

  目前,大数据在银行还属于前期投入成本高、商业分析价值低的不成正比的情况。所以,我们希望银行在大数据领域进行尝试,而同时聚焦在传统分析技术里面的深度应用。

  《金融咨询网》:传统分析技术?那就是银行业广泛应用的数据仓库、商业智能了。

  贾丕星:是这样。对于银行来说,事实上提升传统的数据分析能力与建立大数据并不矛盾。大数据和数据仓库是同一个问题的两个方面,大数据是业务视角,在大量的各类有价值的数据的基础上建立客户全景视图,实现客户深度洞察;而数据仓库是技术视角,在数据的基础上全景实现数据全生命周期管理、元数据管理和数据监视管理。

  如果把传统的数据仓库称为小数据的话,小数据就比较简单,有比较成熟的技术应对它。但是,我从不觉得大数据是新的有震撼力的东西,但它确实给我们带来了转变。大数据与小数据,我个人理解它们两个没有所谓的替代关系,特别是银行业里面,更多的是互为补充。

  大数据时代,传统数据仓库不要因为大数据这个词扰乱了银行业的原则、规划和节奏,而是需要一步步脚踏实地的跟进大数据的技术。

数据管理:螺旋式上升的基础

  《金融咨询网》:这符合银行业稳健内敛的行业特点。但是据我们了解,无论是数据仓库,还是大数据,他们面临的共同问题却是一样的,那就是数据管理。

  贾丕星:在所有行业中,我认为银行业的数据管理是最难的。一方面,银行业的IT系统建设得最早,多年积累下来,系统非常复杂,而且随着业务发展不断打补丁,复杂程度有时难以想象;另一方面,银行业对数据的准确性要求非常高,不夸张地说,结算时差一分钱也不行。在这方面的高标准要求,是其他所有行业无法比拟的。另外,由于历史原因,很多银行的数据不仅没有统一的标准,还存在很多数据不一致、不完整的现象,这都增加了银行业数据管理和使用的难度。所以银行业的数据治理和管控是一件门槛很高的事情。

  对于数据治理和数据管控,最成熟的就是数据仓库技术。数据管理有一套成形的方法论,客观地说,这套方法论过去十几年中,思路没有调整,但是细节在不断优化。

《金融咨询网》:事实上,数据仓库在银行业已经具有相当长时间的应用历史了。在现阶段,我认为,大中型银行处于提升应用阶段,而众多中小银行,还处于观望阶段。

  贾丕星:对数据仓库要不要建,各家银行的看法和做法都不一样,因为建设数据仓库是做基本功,是苦活儿、累活儿,实施周期长、统一标准难、见效慢,往往项目实施三五年后,才能逐渐看到成效,是典型的高投入、低回报的建设项目,所以银行做这样的决策并不容易。

  但随着时间的推移,今天我们可以看到,建或不建数据仓库、有或没有数据仓库,给各家银行发展带来的影响十分明显。工商银行的数据仓库建设在行业内有口皆碑,我也参与了这个项目的整体建设,因为工商银行的数据基础打得好,所以后面就可以实现螺旋式上升的健康业务发展模式,这是所有银行都希望看到的发展模式。

  今天看,10年前开始重视数据仓库建设的银行,相比不重视的银行,发展态势都要明显健康得多。而那些忽视数据管控的银行,都后悔当年的决策,我们接触的不少银行现在又要重建数据仓库,甚至要把现有的系统推倒重来,这会是一个非常痛苦的过程,但不做又不行。

  从我们的经验看,数据仓库也好,数据治理也好,做得越晚,后期成本越高,所以对于更多的中小银行客户,我建议一定要从一开始就重视数据治理,数据仓库建得越早越好。

  在对数据重要性的认识上,以我们的经验看,除大型国有银行外,股份制银行会走得更快一些,城商行和农商行在认识上还有所欠缺。

 1 2 下一页 尾页

扫码即可手机
阅读转发此文

本文评论

相关文章