模型预测控制基本内容(模型评估与模型监控)

接上篇:

模型评估与模型监控——混淆矩阵

模型评估与模型监控——AUC 计算示例

KS曲线及KS值

实际上,KS曲线的数据来源及本质和ROC曲线是一致的。只是ROC曲线把TPR、FPR分别做为纵轴和横轴,而KS曲线把TPR、FPR均做为纵轴,横轴由选定的不同阈值来充当。

模型预测控制基本内容(模型评估与模型监控)(1)

从KS曲线衍生出KS值,即是两条曲线之间的最大间隔距离。KS值越大表示模型 的区分能力越强。

KS计算步骤

KS统计量用于评价模型对好坏客户的区分能力。其将模型预测坏客户概率降序排列并进行分段,每一段内统计处好坏客户的累计占比,再绘制出KS曲线。KS的计算步骤如下:

  • 计算每个评分区间的好坏账户数。
  • 计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%)。
  • 计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值(累计good%-累计bad%),然后对这些绝对值取最大值即得此评分卡的KS值。
GINI基尼系数

基尼系数是另一个常用的区分度指标。GINI计算的是坏客户数在好客户数上的累计分布与随机分布曲线之间的面积,好客户数与坏客户分布之间的差异越大,GINI越高,模型的区分能力越强。

模型预测控制基本内容(模型评估与模型监控)(2)

GINI系数的计算步骤
  • 计算每个评分区间的好坏账户数。
  • 计算每个评分区间的累计好账户数占总好账户数比率(累计good%)和累计坏账户数占总坏账户数比率(累计bad%)。
  • 按照累计好账户占比和累计坏账户占比得出下图所示曲线ADC。
  • 计算出图中阴影部分面积,阴影面积占直角三角形ABC面积的百分比,即为GINI系数。
计算示例

模型预测控制基本内容(模型评估与模型监控)(3)


碎片时间,关注收藏。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页