• 快捷搜索
  • 全站搜索

神经网络模型在互联网金融反欺诈的实践

2017-11-09 13:46:32作者:中国工商银行软件开发中心 陈俊清编辑:金融咨询网
本文将以智能风控模型中的神经网络模型为出发点,针对互联网金融欺诈案件特征,着重介绍神经网络模型在互联网金融反欺诈领域的研究与实践,探讨未来互联网金融的实践拓展。

近10年来,中国互联网金融处于一个高速发展的阶段,传统商业银行也纷纷融入发展洪流当中。2015年3月,工商银行在北京发布了互联网金融品牌“e-ICBC”,推出”融e购”电商平台、”融e联”即时通信平台、”融e行”直销银行平台三大平台,推进了工商银行互联网金融业务的发展速度。

  然而,在互联网金融给人们生活提供便利的同时,欺诈风险也随之增大,欺诈事件也随之增加。腾讯QQ安全情报中心发布的2016年第一季度《反电信网络诈骗大数据季度报告》中显示,今年一季度全国网络诈骗金额高达9.7亿元。欺诈手段呈现多样化,如电话诈骗、木马病毒、伪基站、钓鱼网站等。其中,钓鱼网站占据互联网安全风险事件的64%。欺诈涉案金额高、受害者多,如“e租宝”事件涉案金额达到500多亿元,造成90多万投资者的资金损失。此外,网络欺诈已形成了一套完整的黑色产业链,其规模庞大、行动迅速、协同化程度高、大数据应用加快、犯罪行为渗透互联网金融业务各个环节,每年敛财或超千亿元。

  严峻的欺诈形势给互联网金融的风险防控带来了巨大挑战。为此,互联网金融机构采取了相应的风险防控措施:①终端保护,与杀毒厂商合作,在终端及时查杀木马病毒、封杀假冒网站等;②用户认证,通过实名管理、黑名单、人脸识别、二代U盾、电子密码器等手段对客户进行身份认证;③隐私保护,进行信息分级,对信息存储、访问和传输进行安全控制;④账户保护,通过数字证书和动态口令进行账户保护;⑤交易保护,对交易行为进行监控及识别,交易风险实时控制。

  在欺诈手段多样化、网络欺诈黑色产业化、人力成本上升的背景下,现有的风险防控措施已难于满足精准化管理的需求,因此迫切需要建立基于大数据处理技术的智能风控模型,形成定量标示和定性分析的风险防控模式,实现精准的欺诈风险识别。本文将以智能风控模型中的神经网络模型为出发点,针对互联网金融欺诈案件特征,着重介绍神经网络模型在互联网金融反欺诈领域的研究与实践,探讨未来互联网金融的实践拓展。

一、互联网金融欺诈案件特征分析

  互联网金融一方面强调客户交易的便捷性,另一方面却降低了交易的安全性,给欺诈分子带来可乘之机。本文以2015年8月至12月实际发生的风险事件为例,从欺诈手段、资金流向、注册时间、欺诈金额、欺诈发生地区来分析案件特征。

  1.欺诈手段及典型案例

  对欺诈手段进行分析可知,钓鱼网站是欺诈分子采取的主要手段,占总风险事件的70.2%;木马病毒占8.2%。

  钓鱼网站典型案例:客户称其收到银行发送的短信,内容为“尊敬的用户,您的××银行账户因未核实个人身份信息,已被冻结,请登录:wap.lczno.com按提示核实认证解冻。”客户登录该欺诈网址,输入姓名、卡号、身份证号、手机号等要素之后,账户资金即被盗取。

  木马病毒典型案例:客户称其收到一条短信,内容为“××您好!这是您孩子本学期各科学习情况和我校评语t.cn/RqLomI。”客户点开短信,手机屏幕呈白屏状态,卡内资金即被盗取。

  2.资金流向

  被欺诈资金主要流向与商业银行对接的第三方商户,特别集中在一些高风险商户,例如,迅付和网银在线两家公司约占总风险事件的51.6%;此外,这些被欺诈资金往往用于购买可以快速折现的商品,如游戏充值、话费充值、账户充值等,其中游戏充值占比最大,达到43%。

  3.注册时间

  在约有25%以上的欺诈风险事件中,客户的快捷支付注册与风险事件案发日期为同一天;也就是欺诈分子盗取客户信息后,先开通快捷支付,然后在同一天进行作案。

  4.欺诈金额

  基本都在5000元以下,呈现出欺诈金额小的特征。其中,2000元以下的欺诈交易2372笔,占总风险事件的71.4%。

  5.欺诈发生地区

  客户正常交易地区与欺诈发生地区通常是不同的,欺诈发生地区主要集中在海南、广西南宁、广西玉林等,具有显著的地域性特征。

  通过上述案件特征分析可知,欺诈风险事件通常具备客户、商户、产品、渠道等多维度的风险特征,而单个维度难于识别欺诈交易。因此,需综合考虑多维度风险特征,建立基于大数据处理技术的智能风控模型,实现精准识别欺诈交易。

二、神经网络模型在反欺诈领域的技术研究

  神经网络模型是一种常用的智能风控模型,是以神经元(其结构如图1所示)为基础单元、模仿动物神经网络行为特征的数学模型,其关键要素包括学习规则和拓扑结构。其中,向后反馈(Back Propagation,BP)算法是神经网络模型的一种常用学习规则,具有很好的持久性和适时预报性。

图片6-1.jpg

  神经网络模型的拓扑结构由输入层、隐含层和输出层共同构成。输入层的每个节点分别对应预测变量,输出层的节点对应目标变量,在输入层和输出层之间是隐含层,各层之间通过激活函数和节点权值(或权重)连接在一起,形成一个学习网络拓扑结构,然后利用此结构进行反复神经网络学习,直至达到预期目标,所得的权值就是由BP算法学习得到的最优结果。

  在金融交易反欺诈领域中,神经网络模型是一种欺诈风险量化模型,它运用大数据分析和模型挖掘技术,从客户、商户、产品、渠道等维度挖掘出风险特征,对金融交易进行风险评分,预测未知欺诈概率。模型方法论的核心思想是:通过学习海量客户的历史交易数据以及相关信息(如客户、商户等信息),获取客户自身的历史交易行为模式,将当前交易行为与历史交易行为模式相比较,分析差异性,预测当前交易的风险程度;差异性越大,风险程度越高。

  神经网络模型的数据建模过程如图2所示,可分为五个步骤:数据采集、数据探索、风险特征挖掘、模型训练以及模型测试,这五个步骤之间逐层递进并可向前反复迭代。

图片6-2.jpg

  1.数据采集

  基于Hadoop开源式的大数据分布式处理技术平台,整合内外部丰富的基础数据,包括本行的客户个人数据信息、电子银行账户聚合数据信息、线下金融交易数据,以及相关的各类交易日志如线上渠道的交易与结算日志、服务交付类日志等;还包括外部数据信息,涉及人民银行、法院、公安部、检察院、工商总局、环保总局、海关总署等多个数据源,收集了刑事犯罪信息、商业犯罪信息、金融诈骗涉案账户信息、网络犯罪信息、单位违法账户信息,以及来自国际银行安全组织、国际反欺诈组织、国际银行同业的各类欺诈信息等。

  2.数据探索

  所采集的交易数据涵盖了网上银行、手机银行、电话银行、短信银行、ATM、POS、智能终端等各个渠道,这些渠道又覆盖了存折、借记卡、准贷记卡、贷记卡等介质;因此,需要对各渠道、介质的关联关系进行分析与探索,将这些数据按照时间纬度、金额纬度、交易类别、交易状况等分别进行统计,分析交易行为的主要特征。对于客户数据,应跨越不同渠道来归集客户相关的属性,如年龄、账龄、教育程度、地域等要素,建立客户画像档案,描述客户特征。对于商户数据,应根据商户信用评级信息、产品销售量、商户类别等要素,建立商户档案,划分商户风险等级。

  3.风险特征挖掘

  在对交易、客户、商户、设备、地理位置等数据进行深入分析之后,以时间、频率、金额、距离、比例等统计口径,初步构建了10 000多个风险特征,如近30分钟交易总金额、近1小时同一设备登录次数等;运用大数据处理技术,计算每个风险特征对欺诈识别的贡献能力,以及风险特征之间的相关性;然后选取出贡献能力强、相关性弱的风险特征,作为神经网络模型的预测变量。

  4.模型训练

  训练样本是由正常交易数据与欺诈交易数据组成的,其中,欺诈交易数据与正常交易数据之间比例相差非常悬殊(欺诈交易占比不到万分之一)。为了提升欺诈交易在训练样本中的占比,对正常交易数据按照一定比例抽样,而欺诈交易数据则全部选取。由于模型训练是一个多次反复的过程,并且涉及的训练样本数据量巨大,运用大数据技术处理平台,可以加快神经网络模型的训练速度。

  5.模型测试

  测试样本由没有参与模型训练的生产数据构成,对训练好后的神经网络模型进行测试,评估模型的性能表现。评价模型的性能主要有两个指标:ADR和AFPR。其中,ADR指欺诈账户的检测率,这个比率越高,说明侦测到的欺诈账户越多,从而减少了“漏网之鱼”;AFPR指模型检测出的欺诈账户中假欺诈账户(即正常账户)与欺诈账户的比率,这个比率越低,说明将正常账户误判为欺诈账户的事件就越少,从而减少干扰正常客户。通常单独观察ADR或AFPR其意义不大,需将两者统一考虑;AFPR与ADR的关系就相当于成本与收益的关系,因而,一个较好的模型是在保持AFPR不变的情况下具有更大的ADR。

  如图3所示,图中“20:1的AFPR可以达到52%的ADR”表示的业务含义为:在“每次正确抓住1个欺诈账户就会把20个正常账户误判为欺诈”的条件下,可将欺诈账户中的52%账户识别出来;最终该效果已达到了业务的要求。

图片6-3.jpg

三、神经网络模型在互联网金融交易反欺诈的应用实践

  工商银行在互联网金融反欺诈领域的探索和研究开始较早,积极打造了新一代智能化风险监控平台,除了实时接入了全渠道交易数据,还整合了客户信息、设备信息、地理位置信息、交易日志等数据;部署了超过1000个风险特征,选取其中约100个风险特征作为神经网络模型的输入(神经网络模型的计算结构如图4所示);其模型计算耗时为毫秒级别,能够实时判断每笔交易的欺诈风险,划分风险等级,并根据不同风险等级采取对应的风险控制策略,实现事中干预交易,及时挽回欺诈资金损失。

图片6-4.jpg

  神经网络模型在互联网金融交易反欺诈的应用场景如图5所示。该模型于2016年1月16日正式部署上线,截至3月15日,已准确拦截欺诈交易近百笔,涉及金额超过百万元,模型的实际准确率达26.3%,达到业界的先进水平,互联网金融风险防控水平提升到了一个新的阶段。随着后续模型持续优化,还将进一步提升模型的命中率。

图片6-5.jpg

四、神经网络模型在未来互联网金融的实践拓展

  AlphaGo围棋人机大战激发了人们对人工智能的极大关注和热情,特别是对神经网络技术的兴趣。2016年3月,AlphaGo以4:1战胜世界围棋冠军,显示出神经网络的强大学习能力,其工作原理主要采用了深度学习方法,并且该方法在图像处理、语音识别、自然语言处理等领域取得了巨大突破。在互联网金融领域中,同样可以运用深度学习方法来训练神经网路模型,进一步提升模型的性能。此外,还可构建神经网络模型在线自学习能力,实现自动调整模型的权值参数,以应对不断变化的欺诈风险。

  神经网络模型还可以拓展到互联网金融营销应用领域。业务人员需要对互联网金融客户进行精确评价和定位,以提升营销的成功率。预测客户营销的成功率与预测交易的欺诈概率在本质上是相通的。同样地,可以运用神经网络模型来挖掘出客户的生活消费习惯,预测出客户营销的成功率,为业务人员提供参考,有利于降低银行的营销成本,提高营销效益。
  
(文章来源:中国金融电脑杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章