风控闭环搭建方法(风控决策矩阵的开发与场景应用)
风控决策流程是信贷风控的主心脉络,这套风控框架的设计往大了说决定了后续风控的种种流程,往小了决定了后续策略调优的各种细节,关于决策流程以往的文章,相关有:
基于串行规则流的黑名单跟准入
信贷策略中的决策矩阵
...
今天,会根据风控中的决策流程,再跟大家讲解风险流程中的决策矩阵的实操内容。
我们知道金融产品大多的风控决策流程会由策略、模型两部分构成(也有只有策略或仅有模型的决策流)。
用户进件申请先后会通过策略、模型的串行节点,并根据对应模块的策略规则、模型分数的阈值,决定用户后续授信环节的通过与拒绝。但是在这种单向评估用户的风险程度对准确率均有一定影响,为了更有效地对用户风险进行评估,现探究策略与模型的并行交叉结果,综合分析用户的风险程度,于是我们引入目前较为常用的模式:策略&模型的决策矩阵分析的分析方法。
串行决策:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
并行决策:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
在具体的实操案例中,我们以模型1跟策略2进行具体的举例说明:
模型1中,根据风险评分划分的客群风险得分为:A、B、C、D、E(这些风险是由低到高排序:A—高风险、B—较高风险、C—中风险、D—较低风险、E—低风险)。根据model_score区间阈值设定如下:
编辑
添加图片注释,不超过 140 字(可选)
在策略2中,根据策略划分的风险等级也可划分为:N、L、H、D(风险由低到高,其中N—正常、L—低柔、H—高柔、D—刚性,取规则集rule_01-rule_10最高风险等级), 各规则等级根据rule区间阈值设定 如下:
编辑
添加图片注释,不超过 140 字(可选)
编辑
添加图片注释,不超过 140 字(可选)
于是根据以上模型与规则的二维交叉矩阵,就能得到规则&模型的内容,我们称之为风险决策矩阵。
编辑
添加图片注释,不超过 140 字(可选)
(相关课程中涉及的其中一种模型)
...
在风险决策矩阵中,除了以上最基础的模型外,有时候我们还将用到一些深度化的内容如风险的二级、三级矩阵,比如在授信或者定额场景中,二级矩阵更是比一级矩阵常用些。
决策矩阵的思想,也就是将两个离散化处理后的特征进行二维交叉,然后根据每个组合单元的数据表现来决定是否可以作为规则,其中数据表现与单维度分析方法一样,也是通过单元组合下样本的坏账率(badrate)与占比(percent)来分析。二维特征交叉组合的原理结构如图1所示,这里需要注意的是,在选取某个组合作为策略规则时,最好是矩阵表的边角组合,可以是单个多区间,例如示意图中的X1-bin1与X2-bin1组合、X1-bin4与X2-bin4组合等,其原因是为了保证规则的业务解释性与分布稳定性。
编辑
添加图片注释,不超过 140 字(可选)
图1 二维交叉组合原理
这里我们以特征X03(在我司贷款逾期最高天数)与X08(欺诈风险等级)为例,来介绍下二维特征交叉规则的原理逻辑。输出分布结果如图2所示。
编辑
添加图片注释,不超过 140 字(可选)
图2 二维特征交叉结果
由以上特征X03与X08的交叉结果指标(badrate与percent)分布可以看出,X03=5与X08=3交叉组合下样本群体的坏账率badrate达到55%,约为整体样本坏账率(18.65%)的3倍,而且样本占比仅有1%,满足二维特征规则开发的指标分布条件。同时,此区间对应X03与X08取值,在场景理解上也是完全满足业务逻辑的,也就是X03(在我司贷款逾期最高天数)与X08(欺诈风险等级)的取值越大风险表现越高。综上分析,根据特征X03与X08开发出的二维规则为“在我司贷款逾期最高天数(X03)>=5,且欺诈风险等级(X08)>=3,拒绝”。
对于其他特征二维组合,可以按照以上分析逻辑来实现,其中有个细节需要说明,针对连续型特征的交叉组合,在构建矩阵之前一定要对特征进行分箱离散化处理,然后根据离散区间来实现二维特征的决策矩阵。
多维特征决策树模型
多维特征的综合策略开发,决策树模型是非常有效一种实现方式,不仅原理逻辑简单,而且实现过程也较为方便。但是,在特征变量较多的情况下,采用决策树开发策略规则时,模型参数max_depth(树的深度)不要设置太大,主要原因是这样的规则虽然从区分度结果表现来看是比较好的,但在后期应用过程中很容易出现波动的情况,这是由于规则的特征复杂度引起的。因此,通过决策树模型算法开发规则时,参数max_depth最好定义在3~10范围之内。此外,模型训练拟合的特征变量,最好是经过特征工程筛选后的性能较优字段。
这里我们采用决策树回归算法来实现多维特征策略规则的开发,模型训练的拟合变量为X01~X10,具体实现过程参见第79期会员直播课程,最终输出的决策树结果通过可视化展示如图3所示。
编辑
添加图片注释,不超过 140 字(可选)
图3 多维特征决策树结果
根据决策树可视化结果,我们可以很方便的归纳出合适的策略规则,图中每个粪桶的samples代表当前区间的样本数量,value代表当前区间样本的坏账率,每个叶子单元的颜色代表了响应率的程度,颜色越深说明坏账率越高,也就是更适合作为策略。此外,需要注意的是,图中字段名称仅代表特征索引,以X9为例,X9具体是指样本数据的第10个特征(X0为第1个特征)。按照以上决策树分布结果与分析思路,可以得到相应的策略规则分别如下:
(1)当贷前申请信用风险评分(X10)<=491,拒绝;
(2)当贷前申请信用风险评分(X10)>491,且近6个月手机APP卸载次数(X05)>183,拒绝;
(3)当贷前申请信用风险评分(X10)>491,且近6个月手机APP卸载次数(X05)<=183,且近1年信贷违约账户数(X02)>5,拒绝。
综合以上内容,我们围绕实际业务场景,给大家全面介绍了风控策略的探索开发与测试评估等重要内容,欢迎各位童鞋来番茄课堂来听取第78期与79期课程,课程部分资料参考如下:
编辑
添加图片注释,不超过 140 字(可选)
编辑
添加图片注释,不超过 140 字(可选)
以上内容参考至课程:
第78期《信贷场景多维特征交叉策略的实战分析》
第79期《信贷风控策略体系效果评估与全面调优》
...
~原创文章
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com