• 快捷搜索
  • 全站搜索

商业银行数据挖掘之“修、养、生、息”

2017-10-19 15:47:47作者:中国建设银行厦门开发中心 崔莹琰 贾晓惠编辑:金融咨询网
探索大数据之路并非坦途,实现大数据的业务价值需要所有的数据从业者不忘初心,需要大数据的规划者持续贯通数据的“修养生息”,并在企业的大数据应用实践之路上选择适合的战略与恰当的战术。

在“大数据”和“互联网2.0”被各行各业热炒之时,数据、信息、知识仍在以风驰电掣的速度爆发式地增长着,各行各业从观望到认同再到尝试甚至到将“以数据为中心”作为企业的转型战略开始全面深入的应用,初尝了大数据带来的“千滋百味”。做为全球最具权威的IT研究与顾问咨询公司Gartner曾提出,85%的财富500强企业于2015年前无法有效地利用大数据来获得竞争优势。可见,探索大数据之路并非坦途,实现大数据的业务价值需要所有的数据从业者不忘初心,需要大数据的规划者持续贯通数据的“修养生息”,并在企业的大数据应用实践之路上选择适合的战略与恰当的战术。

        国内商业银行早在20世纪90年代开始了以“数据仓库”、“商业智能”、“数据挖掘”为主的理论层面的探讨与研究,并在金融脱媒、利率市场化、存款保险制度推进、互联网金融飞速发展等多重因素的叠加影响下,越来越重视数据的价值。经过十余年的尝试,商业银行纷纷完成了“企业级数据仓库”的搭建,并基于整合后的数据进行数据挖掘方面的应用,如光大银行的“云图”和阳光理财·资产配置平台、广发银行的大数据零售商业智能决策平台、民生银行的“阿拉丁”平台等。在这些平台的背后,每天仍有大量的数据从业者从事着数据的采集、盘整、存储、分析与应用工作。如何在将数据转换为信息的过程中以更快的速度、花费更少的代价、取得更广泛的认同成为数据挖掘领域新的研究课题。

        而在研究这些课题的时候,人们的焦虑感和无助感时常相伴而生。当前,在互联网的应用浪潮中,某些领域的应用技术正在以极快的速度发展,如微信社交、小额支付等,让人感觉稍慢一点就有出局的危险。商业银行面对着互联网金融的挑战也感压力倍增。但在新的金融格局下,转型的方向、撬动调转方向的支点、前行的动力在哪里,是需要结合企业自身优势深度思考、全盘规划、慎重突破的。商业银行的数据挖掘领域也需要如此因时而变、变中求通。在多年实践数据挖掘的历程中,商业银行一直在尝试着更好地打通从产品到客户、从客户到资金流、从资金流到产品这三条数据供应链,但以下问题却也一直困扰着数据挖掘的实践者:数据分析师经常不能在正确的时间获取所需的数据;数据分析与挖掘过程一直在花费大量的时间做数据的清理;对于某个数据分析师、某个业务条线、某个企业来说,到底要收集多少数据?如何整合已经收集的数据?如何选择合适的数据挖掘专题和实施路径,使得挖掘成果得以更有效地应用?如何基于数据应用的视角更科学地收集数据?

        而这些问题的解决,需要商业银行在整个数据链路上,从数据的生产、加工到数据的消费环节,拥有一批包括具有终端客户营销经验的柜面一线员工、数据分析师、数据模型和数据产品设计师在内的专家持续关注数据供应链上的短板,并找到优化的方案和路径。笔者尝试从数据挖掘的“修、养、生、息”来谈谈以上问题的应对策略。

一、“修”出速度

        数据挖掘之“修”是指数据的选择与盘整。国内商业银行经过多轮的系统更迭,已经建设起完善的交易系统、产品系统、流程系统和管理分析系统。这些系统的数据大多都集成在数据仓库中,在数据仓库的建设中,基于分析挖掘层面搭建数据的框架,最终通过有限的指标来快速描述数据背后的事实,客观反映出客户对银行产品的需要,这需要数据从业者跨界地去融合业务、数据与技术,在应用中比较数据框架的优劣,在实践中迭代与优化数据的结构,并从场景化的思维看到数据的构成。

        有这样一个场景,客户A是某商业银行的代发工资客户,每个月的代发金额为1.5万元,该客户每月都在工资发放后三日内将钱通过网上银行转出至另一家商业银行,客户在其代发工资的商业银行日均存款仅有3000元。该商业银行将客户A纳入营销的重点客户,那下一步该如何做才能收到更好的营销效果呢?

        站在数据挖掘的视角来看数据的选择与盘整,针对上面的场景,可尝试对数据挖掘的常见模式和目标模式进行对比(如图1所示)。

图片1.jpg

        在图1的场景中,银行的交易系统通常会记录客户的开户网点、开户时间、代发工资标志、存款余额和每个月转账的交易明细,但对于营销来说,这样的信息并非营销人员想要的。如果银行在客户经常交易的渠道,如网上银行向该客户推荐有竞争力的理财产品或其他产品,客户有点击记录,系统有采集,记录该客户在网页的停留时间,并且对信息提供前后客户行为的变化进行分析,向营销人员提供有效的营销建议,包括客户的交易时间偏好、渠道偏好、产品偏好等,将会大大节省营销人员筛选客户的时间,提高营销的精准度。

        目前,商业银行正在探索场景化模式的合理框架,而这种支持数据挖掘的目标数据框架需要在应用实践中持续地检验与迭代优化。没有一成不变的数据框架,只有在实际的应用中不断总结,才能更清晰地选择所需的数据,更有效地清理与融合所选择的数据。

二、“养”好根基

        数据挖掘之“养”是指数据的收集与存储。到底要收集什么样的数据?收集多少数据?如何确保数据不失真?如何让数据质量稳定以及如何设计数据模型以更好地支持数据的应用?这些问题是基于企业级数据仓库来支持数据挖掘的商业银行一直在深入思考的。数据仓库在建设之初就面临着维度建模还是范式建模的选择,在建设过程中,随着数据的积累、应用的丰富与深入,还会对数据仓库进行内部调整,如分设历史数据区、基础区、公共区、应用区等,而每个数据分布区域的定位、数据组织形式、区内的数据模型设计、层之间的数据冗佘与主复本机制、制定什么样的存储策略以适应不同应用的需要都需要在数据仓库的建设中逐渐完善与优化。

        目前,商业银行的数据挖掘更多地集中在对客户的偏好分析、行为分析上,从数据组织形式上,更多需要以客户为粒度的大宽表数据,且能满足挖掘所需的数据周期要求。而大宽表的内容除了基于系统基础数据直接计算加工的数据之外,还可能需要将数据挖掘的成果(如客户分群的结果)、营销反馈或客户评价等的衍生数据包括在内。

        为适应应用的需要,国内的商业银行尝试建设和完善以客户、账户、产品等为粒度的大宽表,宽表的内容更多是基于常见的统计指标来设计的,数据挖掘的视角更加发散和多样化,其所需指标的口径也很难形成统一的标准,很难成为全行指标。这意味着每个数据挖掘专题仍有可能要基于更底层的数据来构建数据挖掘所需要的数据宽表,这给数据挖掘的数据探索和数据准备工作增加了不少难度。而每个数据挖掘在建模过程中所积累的这些变量指标,以及数据挖掘模型筛选出的强相关变量指标,大都随着数据挖掘专题的结束而消亡了。目前还没有一个很好的机制能把分散在各数据挖掘团队建模过程中积累的这些数据资产在数据仓库中进行继承和存储。这与当前数字化战略的发展要求是不相匹配的。在未来数据仓库的建设中需要纳入数据挖掘的视角,来思考如何“养”好数据的根基。

三、“生”机勃发

        数据挖掘之“生”是指数据创造价值的能力以及价值的再循环。IBM公司于2015年3月发布的大数据白皮书《分析:速度的优势》,揭示出大数据分析带来的四个转变趋势:“当前,越来越多的企业致力于利用大数据应对运营挑战;越来越多的企业致力于通过将大数据分析能力集成到业务流程中实现企业转型;越来越多的企业致力于大数据价值推动力从数量到速度转变;越来越多的企业从大数据投资中收获回报。”同样地,商业银行作为海量数据的生产商和拥有者,面对新的时代背景,其大数据投入的初衷也发生了新的要求和变化,从最初的管理突增的数据量和数据种类转变为通过数据挖掘加速原始数据向生产价值的转变。

        数据挖掘技术在商业银行的应用主要分布在客户关系管理、风险管理、信用评估、市场机会分析与预测等领域。商业银行已开始通过分析和挖掘技术从日常业务/交易产生的海量数据中提取和发现有价值的信息并应用于各相关业务领域,同时,这些有价值的信息将产生相应的营销方案或战略决策,进一步影响新一轮的营收过程,并在应用中检验信息创造价值的表现力。而这一轮营收过程所产生的数据和积累的经验将作为下一轮数据分析和挖掘的重要参考,如此循环,生生不息,完成从产品到客户、从客户到资金流、从资金流到产品这条数据供应链的循环往复。

        例如,在客户关系管理领域,商业银行通过数据挖掘技术对客户交易行为进行分析,从中寻找行为规律,进而针对不同客户定制个性化服务和产品以支持对不同层次客户的精准营销。同时,在进行精准营销的过程中,不仅可以对比以往非精准营销过程时的营销成功率等绩效指标,分析数据挖掘技术在营销价值创造时的准确性和有效性,还可以基于新一轮的营销数据修正和完善数据挖掘模型参数,以保障数据挖掘技术持续动态地价值最大化。观察发现,这个数据价值不断被创造和循环的过程,不仅有助于商业银行的核心竞争力显著提升,同时有助于其在日趋激烈的市场竞争环境中脱颖而出。

四、“息”息相关

        数据挖掘之“息”是指数据与数据在信息发现和价值创造时的相关性。当前,商业银行的组织架构、业务架构等因素都决定了其各条线、各业务、各专题数据的相对独立性。这种独立性主要体现在数据的来源环节及数据应用环节。站在企业级的视角,这种独立性需要被弱化,各商业银行数据分析专家应该将更多的注意力集中于数据的融会贯通,相互借鉴,融合积累,促进数据良性循环。各业务领域在数据挖掘过程中的知识发现应该在企业级形成共享机制,并相互借鉴分析思路、分析变量。而对某项专题,则应该更多考虑到业务的相关性、分析的多视角来融合关联的专业领域人才,共同探索与分析挖掘,打破条线或部门的屏障与壁垒。

        例如,在利率市场化的大背景下,商业银行的工作重心正在由“以规模为主”向“以效益为主”转变,如何在确保存款稳存稳增的同时,降低整体付息水平,是商业银行战略转型中亟待解决的一项工作。然而现实是,通过协商议价沉淀在银行的资金往往成本较高,而结算性、交易性、临时性、急用性的资金才是低成本存款的稳定来源。某商业银行以上述业务背景为由建立分析专题,笔者以该场景为例来论述数据在信息发现和价值创造过程中的息息相关性。首先,从该专题内容业务相关性而言,它可能涉及个人金融部、网络金融部、资金结算部等多业务条线,在进行分析挖掘时,应考虑联合相关条线专家共同致力于专题内容的剖析、分解,不能仅局限于单个条线,否则结果可能有失偏颇。其次,从数据挖掘结果的应用而言,应该站在企业级的战略视角,在全行范围内形成共享机制,避免由于信息不对称导致已形成的数据资产变成沉没资产。

        需要特别说明的是,虽然该场景是个例,但却代表了一种趋势,随着金融市场的变革和发展,银行业将面临更多的挑战,跨条线、跨领域的数据挖掘专题也会纷至沓来,在实际的数据挖掘工作中,应突破个人的分析视野,将“息息相关”视角背后需要考虑的人员、知识、数据、工程等贯穿至企业级的数据挖掘全过程,达到数据挖掘工作的企业价值最大化的目标。

(文章来源:中国金融电脑杂志) 

扫码即可手机
阅读转发此文

本文评论

相关文章

科技金融大数据
挖掘数据资源助力精细化管理

如何充分发挥数据的作用,帮助银行提升精细化管理水平,成为银行在转型发展中面临的必然问题。建设银行近年来着力深挖系统数据资