消费金融案例分析总结
在开始分析之前,我们需要了解贷款业务的流程,即每个用户从购买到最终还款所涉及的所有环节。一般来说,网贷的流程可以概括为:
通过用户行为路径分析,我们可以得到:
适用于对产品运营中的关键环节进行分析监控,找到薄弱环节,通过用户引导或产品迭代进行优化,提升改造效果。
选择一个子集,分别统计每天申请贷款和审批贷款的新用户和老用户数量,然后计算新用户的放款率。最后,使用合并功能将新的用户结果表与旧的用户结果表拼接起来。结果如下:
接下来,我们需要知道每天老用户的数量,来计算用户的还贷率。在这里,老用户的定义是:#前一天借出,第二天继续借的新用户是老用户#。对于存量老用户,我们暂时不考虑,只看前一天借款的人第二天是否继续借款,该笔借款视为老用户借款还款,所以我们取新用户借款透视表前29天的数据+5月1的人员构成。
形成用户路径汇总表,计算每个节点的转化率。
计算转换漏斗并计算汇总数据:
结果如下:
从结果来看,从PV到UV有很大的下降。正常情况下,一个广告可能会吸引10%-30%左右的用户,但是点击量非常巨大,所以造成这个结果。
从整体来看,很明显4%的注册人数比较低,也就是说用户点击很多,但是注册人数很少。是否说明这个渠道有问题?我可以对比不同渠道的转化漏斗分析,看看是整个行业的转化率低,还是单个渠道低,还是这个渠道用户群不是我们想要的。
在消费金融公司,经常会通过日常监测发现,某个消费贷款产品的一次超额率在逐渐上升。我们需要降低一次通过率来减少产品带来的损失,同时通过率也不能太明显。
分析目标:通过数据探索和分析,制定能够有效降低一次通过率的策略。
分析思路:因为我们要分析的策略在申请时会被用来判断客户是否会逾期,所以策略分析的基本思路就是把这些有初次业绩的客户在申请时的数据还原出来(这个还原是指提取客户在申请时各个维度的数据,越多越好),然后利用这些数据找出可以区分好坏客户的变量,制定策略。
可以得出整体一次通过率为30.76%。
这里使用的是单变量分析的方法。单变量分析的主要目的是筛选出区分好坏较好的变量,以便制定策略。在小金公司的日常工作中,会有一个团队负责抓取变量,计算处理变量的数据。他们在不断获取和处理很多可能对风控有帮助的数据,并提供给我们的风控团队,我们的风控人员需要从这几千个变量中找出能够控制逾期风险的变量,而不至于错误地拒绝很多好客户。
统计结果如下:
统计结果如下:
在变量分析之后,这个时候,我们会选取比较有效的变量,这就涉及到一个衡量变量是否有效的指标,提升程度。一般来说,就是衡量拒绝最差部分客户后,整体风控的改善效果。提升程度越高,变量越能有效区分好顾客和坏顾客,错误拒绝好顾客的可能性越小。如下,通过对所有变量的提升度进行逆序排列,发现个人信用查询总数和客户信用等级提升度最高,分别达到1.93和1.71。
通过上一步的单变量分析,我们筛选出了改善程度最高的两个变量:“信用查询次数”和“信用评级”。如果拒绝这两个变量最差的客户,对整体逾期的影响将是。这种影响意味着我们假设‘信用查询总数>;3,265,438+03客户= 265,438+0全部拒绝后,其余客户逾期率较拒绝前有所下降。最后我们得到的是,信用查询量下降了3.4%,信用评级下降了7.5%。
用户在使用产品的过程中有一个用户行为过程,不同时期用户的表现可能有所不同。群体分析的主要目的是分析相似群体随时间的变化,核心是比较分析同一时期不同时间群体用户的行为差异,所以也叫同时群体分析。
那么在金融风控领域,最常用的一个场景就是账龄分析,用来监测用户逾期率的变化。如下图,M2和M3的逾期率比较高,然后调整风控策略,再进行分组分析,看策略是否有效。
结果如下:
这里生成的新字段,orderperiod是用户下单的月份,cohortgroup是根据每个用户下单的最早时期生成用户组,两者是不一样的。
接下来,按用户组和月份字段分组:
结果如下:
在orderperiod字段中,我们可以看到2019-01对应的最早消费月份是2009-01,02,03,05,但是2009-02,03,05对应的最早消费月份是相对而言的。
获取:
因此:
注意上图中每一列代表当月最早的消费组,cohortperiod代表1,2,3,4月最早消费组的情况。例如,2019-01代表1月中最早消费群体的1、2、3、4月。
总而言之:
对同一生命周期阶段的用户进行垂直分析,从而比较相似群体随时间的变化,从上图可以看出,用户留存率是随时间递减的。
同时,通过对比不同时间的同期组,可以看出留存率有高有低的表现。从上图可以看出,2065438年2月下跌,2065438年4月又上涨。
可能是在2019-03的时候用户活动导致了这样的结果,从而验证了活动改进取得了明显的效果。