• 快捷搜索
  • 全站搜索

智能识别担保群链路形态及其风险

2018-10-09 18:08:13作者:交通银行软件开发中心(上海) 俞书浩编辑:金融咨询网
本文利用人行征信和商业银行的既有数据,从链路形态的角度入手,先归纳了“相互担保”、“循环担保”、“金字塔”、“倒金字塔”等9种担保关系的链路形态,然后在每个“担保群”(通过“社区发现”算法发现)中自动化地智能识别出这些形态,并对每种链路形态的风险特征进行了统计,以发现风险程度高的链路形态,同时发现风险程度高的“担保群”。

互联网金融的崛起给了中小微企业方便的融资渠道,但是很多中小微企业之间存在相互担保、循环担保等复杂的担保关系情况,抱团成“担保群”,对整个银行业产生了严重的风险。正如之前有专家的文章指出,“互相担保在未来一段时间内,还将成为小微企业获取银行贷款的重要方式。因此梳理、分析、防范和化解担保圈风险,已成为稳定经济增长,维护金融稳定的重要方面。”

  而随着大数据技术的发展,很多研究都采用了大数据中的复杂社交网络技术来挖掘并分析担保群, 其中有从宏观的角度分析了全国的担保群分布,并发现担保群的地区性特征;也有深入发现核心客户,以及建立风险传播模型。

  本文利用人行征信和商业银行的既有数据,从链路形态的角度入手,先归纳了“相互担保”、“循环担保”、“金字塔”、“倒金字塔”等9种担保关系的链路形态,然后在每个“担保群”(通过“社区发现”算法发现)中自动化地智能识别出这些形态,并对每种链路形态的风险特征进行了统计,以发现风险程度高的链路形态,同时发现风险程度高的“担保群”。

  之前的研究很多分析全国的担保群,其数量往往成千上万,分析起来还需要很多人工干预。因此智能识别出风险程度高的“链路形态”以及“担保群”,能节省人工干预时间,提高效率,更快地发现并预警风险,减少未知的损失。

担保群链路形态的定义

  通过业务经验总结,归纳出了以下九种担保链路形态:

图片3-1.jpg
图1 九种链路形态

        (1)普通担保:整个担保群只有两个成员,即一对一的担保。

  (2)长链担保:整个担保群的成员组成一条连锁的长链。

  (3)金字塔形:整个担保群由一个企业为根向外担保多个企业,被担保者再担保下一级,形成一棵树。

  (4)倒金字塔形:与金字塔形相反,所有的担保关系最终都汇集到一个企业身上。

  (5)多保一:“担保群”中只要出现5个以上客户给同一客户担保的情况就算存在此形态。

  (6)一保多:“担保群”中只要出现一客户同时给5个以上客户担保的情况就算存在此形态。

  (7)相互担保:“担保群”中只要出现两个客户相互担保的情况就算存在此形态。

  (8)循环担保:“担保群”中只要出现多个客户形成环的情况就算存在此形态。

  (9)复杂混合:没有固定的形态,通过计算“担保群”的复杂度来发现复杂的情况,复杂度计算公式为:关系数/(成员数-1)。比如复杂度为3的意思是客户之间关系的数量是客户数量(减一后)的3倍。

识别担保群中的链路形态

  担保数据主要来源于人行征信数据和商业银行的授信系统中的对公客户的担保相关数据,通过对两两客户担保关系的整合,汇总了业务、担保金额和不良担保金额等字段,一共采集得到65462条担保关系,涉及78370个客户的样本数据。

  采用社交网络分析方法来分析65462条担保关系,采用社区发现算法中稳定性和效率都比较高的Louvain模块度算法发现找出“担保群”。结果中一共发现了16870个“担保群”。

  对所有16870个“担保群”使用Python和R编写程序,智能地识别出9种链路形态,每个“担保群”可以同时包含多种形态。得到的分布结果如下:

图片3-2.jpg
图2 担保群链路形态统计

  “普通担保”的担保群虽然最多,但是其每个担保群只有两个客户,所以只有20%的客户是普通的担保关系。

  统计中发现比较有意思的地方是,“倒金字塔形”的数量远远超过“金字塔形”的数量,同时“多保一”的数量也显著高于“一保多”的数量,说明客户的担保关系中,一个客户被很多人担保(或间接被担保)的情况非常常见,风险集中程度高,是值得关注的点。

  一个“倒金字塔形”担保群至少有3个客户,而“普通担保”只有2个客户,所以从客户数量上看参与“倒金字塔形”的客户数远超过“普通担保”的客户数。

  1、长链担保的担保群

  下图是典型的一个长链担保的担保群,5个客户一个担保一个连成长龙。

图片3.jpg
图3 长链担保的例子

  2、金字塔形和倒金字塔形的担保群

  下图是典型的金字塔形和倒金字塔形的担保群,金字塔的根客户以及倒金字塔的最终集中客户都红圈标示了出来。右图的形状并不是很漂亮的一级一级金字塔,而更像是一条长链,四周有分支的节点加入进来的感觉。

图片4.jpg
图4 金字塔形(左)和倒金字塔形(右)的例子

  3、多保一和一保多的担保群

   下图中核心的节点有很多对外的担保关系,是一个典型的担保公司,而值得注意的是他所担保的客户都同时还被其他的人担保,所以这些客户能同时满足多保一的形态。

图片5.jpg
图5 同时包含多保一和一保多的担保群

  4、相互担保的担保群

  下图中的担保群成员数量虽然只有5个,但担保关系已经比较错综复杂,而且其中还有一个“相互担保”,存在一定的风险隐患。

图片6.jpg
图6 相互担保的担保群

  5、循环担保的担保群

  下图中的担保群同时存在两个“循环担保“的环路!而且两个环路共用一条边两个节点。

图片7.jpg
图7 循环担保的担保群

  6、复杂混合的担保群

  根据复杂度的计算公式,关系数/(成员数-1)。本次分析中复杂度最高的“担保群”为5。如下图所示,虽然只有5个客户,但是5个客户两两之间全部都有相互担保的关系!意味着所有的10条边都是相互担保的关系,而且任意的3个以上客户之间都能组成“循环担保”的环路。浙江温州的一些中小企业间构成的担保群,很多复杂度都比较高。

图片8.jpg
图8 复杂混合的例子

链路形态的风险特征统计

  各种链路形态的“担保群”中出现不良担保关系的比例(不良关系数/总人数)如下所示:

图片9.jpg
图9 各链路形态的不良担保关系比例

  普通担保的不良比例低在预期中,长链担保的不良比例低是由于数据总量太少,没有统计意义。

  多保一、循环担保和两两互保的不良比例非常高,是总体不良比例的两倍以上。循环担保和两两互保问题严重是在预期中的,而多保一形态是之前被忽视的,值得未来在风控方面的关注。

  “担保群”的复杂度与不良比例的关系如下所示:

图片10.jpg
图10 复杂度与不良担保关系比例

  总体上看复杂度越高则不良的比例也越高,但是并不是完全线性,可能与“担保群”的成员数也有关系,因为随着成员数增加,而担保关系数没有同比增加的话,复杂度的值会下降。

 总结

  本文采用社交网络分析方法来分析人行征信数据和商业银行授信数据中的担保关系,使用Python和R编写程序,智能识别出“相互担保”、“循环担保”、“一保多”、“多保一”等9种链路形态以及其中潜在风险情况。节省人工干预时间,提高效率,更快地发现并预警风险,减少未知的损失。

  分析过程中重要的发现有如下几点:

  (1)客户风险方面:客户中80%都不是普通担保关系。同时复杂度越高的担保群,不良的比例也越高;浙江温州的一些中小企业间构成的担保群,很多复杂度都特别高。

  (2)担保群风险方面:多保一形态的问题的不良发生率比较高,甚至超过相互担保和循环担保,是风控方面需要关注的形态。

  (3)贷前授信方面:很多担保群都存在相互担保和循环担保的情况,甚至出现客户两两之间全是相互担保关系,提示当前的银行授信流程的审核标准比较宽松,应当适度提高门槛,最好能在审批前查清楚客户之前的担保关系以及其他的股权高管等等关联关系。

  (4)贷后监控方面:“倒金字塔形”的数量远远超过“金字塔形”的数量,说明担保关系中,一个客户被很多人担保(或间接被担保)的情况非常常见,所以很多的担保业务绕来绕去很可能集中到一个人的身上,像这样风险集中程度高的客户需要重点监控。同时有必要把风险集中程度高的客户,以及复杂度特别高的担保群中的客户都重点排查,并发现有没有地区性特征、区域性风险等等。

  (5)展望建议:对客户的担保关系以及其他的各种关联关系可以全部整合起来,做成熟的智能产品,自动化的发现客户抱团,链路形态,风险集中的客户等等,对授信和贷后的工作会有极大的提升。

(文章来源:金融电子化杂志)

扫码即可手机
阅读转发此文

本文评论

相关文章