贷款用户画像分析

根据实际的工程实例,学习培训应对数据信息和业务流程问题,如何去进行剖析。

下边是社群营销vip会员的工作,文中最终会得出新项目的修改建议,根据本新项目提升你的分析思维。

一.新项目数据信息详细介绍

数据信息来 ** 拍贷真正业务流程数据信息。拍拍贷是英国美国上市企业。创立于2007年6月遵循金融业实质,以统计数据为根基,用技术创新为客户带来最方便快捷可获得的借款商谈服务项目,拍拍贷服务平台借款端服务项目包含面对众多普通用户的实用性借款和别的借款。

数据信息是以2015-01-01到2017-01-30的全部个人信用标底10%s样版。从免费下载的三个文档里选择大家必须用的LCIS excel文档。

这一excel文档里的数据信息一共有37个字段名,数据信息尺寸69MB,292539条银行信贷纪录。下边是每个字符的含意:

二.业务流程指标值

假如你不可以考量它,那麼就不可以合理提高它。那麼考量的设备便是业务流程指标值了。那会不会有指标值就可以了呢?

自然并不是。指标值也是有好和坏之分。好的指标应该是关键指标值,而且应该是比例那样的指标值才更有意义。

而没有意义的指标值肯定是坏指标,例如虚荣心指标值,只关心注册量、阅读量不重视真真正正的转换率,也有后验性指标值和过度繁杂的指数都归属于坏指标值。

金融行业风险性业务流程指标值尤其重要。风险性业务流程指标值包含:贷款逾期日数DPD、贷款逾期期次、贷款逾期环节、即期指标值、延递指标值、月末清算、期终清算、延滞率、不良贷款率、转呆帐率、净损率、FPD(初次还贷贷款逾期)。

下边是自己梳理的金融行业指标值:

三、提问问题和剖析构思

网络金融领域,贷款逾期及其不良贷款问题一直是危害公司财务报告及销售业绩发展趋势的拦路虎。

此次想集中化科学研究贷款逾期占比在不同层面中较高的特点,先后来得到失信黑名单顾客的总体特点,来协助公司尽量避开该类问题。及其剖析各纬度的逾期贷款状况,及其放贷比例,给公司明确提出一些合理的参照建议。

从客户层面和业务流程层面来进行剖析。

客户层面:

1)失信黑名单客户画像,原始认证级别、年纪、性別、文凭等层面的贷款逾期占比遍布情形怎样?

2)失信黑名单用户行为分析,是不是开淘宝网店,是不是有个人征信报告、是不是进行户籍认证、是不是进行视频认证,是不是第一次借款的贷款逾期占比状况怎样?

业务流程层面:

1)不一样的年纪、性別会对还贷功能和还钱意向造成哪些危害?及其各年龄层、性別的放贷比例?

2)不良贷款率与不一样的原始评分中间有哪些关联性?及其各原始评分的放贷比例?

3)借款特性(种类、年利率、额度、限期)的差异会对还贷造成危害么?及其各借款特性的放贷比例?

根据以上信息内容,我在客户画像及其不良贷款率2个业务流程指标值考虑,依照下面策略开展剖析。

挑选下列16个层面对数据资料做好剖析:借款额度、借款限期、借款年利率、原始评分、借款种类、是不是首标、年纪、性別、手机上认证、户籍认证、视频认证、文凭认证、个人征信认证、淘宝网认证、标现阶段贷款逾期日数、待还本钱。

四、数据预处理

1.将excel文档里的信息导进mysql中

2.为了更好地便捷剖析,重新命名字段名问汉语

3.空值、重复值解决

查验发觉顾客序号在纪录日期限定情况下,有106个重复值。

实行以上句子,再度查验新表内空值和重复值均解决进行。

4.出现异常值解决

查验发觉,手机上认证,户籍认证,纪录日期存有出现异常值

将非常值做删掉解决,获得解决进行的表lcisnew,共291230列。

5.检查程序,发觉早已很完备,不用再做一致化解决

五.数据统计分析

1.客户层面

贷款逾期用户画像分析客户的基本信息,包含原始评分、年纪、性別、文凭遍布

1)原始评分贷款逾期占比遍布

应用sql得到剖析結果,随后导出来到excel中开展制作数据图表,进行数据可视化。

从上边图形中可以的得出以下结论::

原始评分为E的贷款逾期客户比例较大,次之是D、F、C,而评分最大的AAA和AA级则大部分沒有信用卡逾期的状况产生。

2)年龄层贷款逾期占比遍布

由数据分析可以看得出,每个年龄层贷款逾期占比相对性均值,都是在4%上下彷徨,可是18-22岁中间,这种刚成年人没多久的年青人贷款逾期状况更为比较严重。

3)性別贷款逾期占比遍布

从研究結果可以得到,在性別归类中,男孩和女孩贷款逾期占比区别并不是十分明显,男士为4%比女士的贷款逾期占比多一个点。

4)文凭贷款逾期占比遍布

从研究结论中可以看得出,在是不是进行文凭认证中,贷款逾期占比区别也一样并不是十分明显,自然进行文凭认证的客户贷款逾期占比比没完成的稍小一点。

贷款逾期用户画像分析客户个人行为特性,包含淘宝网认证、户籍认证、手机上认证、视频认证、个人征信认证、是不是第一次借款遍布。

1)淘宝网认证贷款逾期占比遍布

2)户籍认证贷款逾期占比遍布

3)手机上认证贷款逾期占比遍布

4)视频认证贷款逾期占比遍布

5)个人征信认证贷款逾期占比遍布

6)是不是首标贷款逾期占比遍布

将以上六个客户个人行为特性层面开展数据可视化的結果:

比照以上六个层面可以得到的理论依据是:

早已进行淘宝卖家认证的使用者的贷款逾期比例比沒有进行淘宝卖家认证的贷款逾期比例小,而是不是首标则对信用卡逾期状况大部分没危害。

此外户籍、手机上、个人征信认证取得成功的贷款逾期比例都需要比未认证取得成功的贷款逾期比例要高,这使我十分惊讶,在其中个人征信认证取得成功的贷款逾期比例比未取得成功的比例高于许多。

比例高于这么多的原因是什么呢?

接下来里尝试找寻造成这一区别的是缘故。

统计分析发觉,拍拍贷服务平台96%之多的客户全是没完成个人征信认证的。贷款逾期占比=逾期总数/数量。也就是说未取得成功认证的数量也就是分母十分大,那麼占比充足低,也就不奇怪了。

那麼针对文凭、户籍认证、个人征信认证、视频认证、手机上认证、淘宝卖家等数据产生的贷款逾期客户画像,大家还要更全方位的信息才可以进行剖析。

客户画像层面剖析汇总

1)贷款逾期客户主要是聚集在18-22岁中间,这种刚成年人没多久的年青人贷款逾期状况更为比较严重。很有可能的因素是这各群体大多数是在校生或刚踏入社会的,她们在缺少平稳收益的情形下,过多过度消费提高生活质量,造成贷款逾期的产生。

2)贷款逾期客户较多是原始评分为E的客户,次之是D、F、C,而评分最大的AAA和AA级则大部分沒有信用卡逾期的状况产生。

3)在性别差异和文凭层面,男孩和女孩贷款逾期占比区别并不是十分明显,男士为4%比女士的贷款逾期占比多一个点。进行文凭认证,专科及本科以上学历要比没完成认证的贷款逾期比例要低。

2.业务流程层面剖析

前边大家从客户画像层面做好了剖析,接下来里从业务流程层面开展剖析。

1)不良贷款率随记录趋势分析

从数据图表可以看得出,2016年我国网络金融领域,经历了各种各样重大事件,随着以后我国颁布了更严苛的管控方式,而网络金融领域的羊群效应也尽展在其中,前座公司占比绝大多数市场占有率,交易量增长速度变缓显著。从统计数据中看得出,2016年后半年,拍拍贷财产不良贷款率明显提高,一直到2017年初,做到7.38%。

2)不良贷款率与年龄层、性別中间相关分析及其按年龄层、性別的放贷比例

年龄层、性別的放贷比例

大数据可视化結果:

由图上得到:

年龄层在42-50岁的范畴内,不良贷款率最大达6.88%,35-42不良贷款率也是有6.36%的比例,而不良贷款率最大42-50岁年龄层,相匹配放贷比例则是7.16%,35-42岁年龄层范畴内,相匹配放贷比例是17%,不良贷款率超出了6%。这在操纵总体贷款逾期风险性层面,是十分不良的。因此应该分外关心,减少该年龄层不良贷款率,或是操纵该年龄层放贷总数,以期将风险性减少。

理想化的不良贷款率和放贷比例主要参数应该是成反比的。即伴随着不良贷款率持续上升,相匹配的放贷比例应当越低,那样能够保障有效的风险管控。男士不良贷款率比女生高,放贷比例尺寸男士又处在较大优势。提议服务平台可以在放贷比例上,多转给女士,以期平衡风险性。

2)不良贷款率与原始评分中间相关分析及其按原始评分的放贷比例

由图由此可见:

放贷70%比例集中化在原始评分为B和C的客户,评分最少的F,放贷量最小为0.09%,E也只是仅有0.69%。在风险控制层面拍拍贷的评分指标值和放贷比例配搭相对性科学规范。B级最优客户,做为服务平台的主力军消费群,有着不上4%的不良贷款率和近一般的借款总金额,是非常有效的挑选,与此同时AAA级客户的放贷比例极低,可以大力开发设计。与此同时总体上除去AA和AAA级客户的开发设计上看,不良贷款率和放贷比例基本上处在成反比,归属于相对比较有效的坏账损失操纵的构造,在D财号和C级客户的放贷比例上,也有有效的缩小室内空间。

3)不良贷款率与借款种类、年利率、额度、限期中间相关分析及其按其分派的放贷比例

不良贷款率与借款种类中间相关分析,及其借款种类放贷比例

不良贷款率与借款年利率中间相关分析,及其借款年利率放贷比例。年利率分类(7-10,10-13,13-16,16-19,19-22,22-24)

不良贷款率与借款额度中间相关分析,及其借款额度放贷比例。借款金额分类(<1200,1200-8000,8000-20000,20000-50000,50000-80000,,80000-120000,120000-200000,200000-300000,>=300000)

不良贷款率与借款限期中间相关分析,及其借款限期放贷比例。

对剖析结论开展大数据可视化:

由图由此可见,

借款种类中,应收款安全性标底不良贷款率最少,几乎为0。应收款安全性标,拍拍贷服务平台上借款标底的一种。客户以本身在拍拍贷站内应收帐款作贷款担保,达到"应收帐款超过借款额度"的标准。而电子商务种类的不良贷款率则60%以上,而且在放贷比例上,电子商务种类的借款占比也是28%上下。因此需要要留意大量开发设计除电子商务种类以外的借款种类,减少电子商务类借款比例,减少风险性。借款年利率在13-16这一范围内,不良贷款率做到16%,25%的放贷比例较高。总体上拍拍贷服务平台借款年利率以13-19为主力军。而年利率7-10和13-162个区段的客户不良贷款率相对性最大,还贷意向较弱。借款额度和不良贷款率关联性总体上看,伴随着借款额度增大,不良贷款率有上升的发展趋势,在其中20w-30w中间,不良贷款率最大,而超过30w以上的不良贷款率又比较不高。这当中的缘故,必须越来越多的数据信息进一步剖析得到。借款额度的不良贷款率和放贷比例总体成反比,合乎减少风险性规定。借款限期的不良贷款率和放贷比例负关联性较弱,很有可能不能有效的减少风险性,在其中80%以上的放贷奉献是大半年和一年短期借款,一般全是资金周转,迅速还贷的,这可能是由服务平台的客户归类决策,这种短期内借款的主要用处和客户特性,大家必须越来越多的信息适用。六.剖析汇总和提议

1.贷款逾期客户画像

1)贷款逾期客户主要是聚集在18-22岁中间,这种刚成年人没多久的年青人贷款逾期状况更为比较严重。这各群体大多数是在校生或刚踏入社会的,她们在缺少平稳收益的情形下,过多过度消费提高生活质量,造成贷款逾期的产生。

2)贷款逾期客户较多是原始评分为E的客户,次之是D、F、C。贷款逾期客户大量概率是男士。而且没完成文凭认证的。

有关贷款逾期客户画像,大家还要大量实际合理的信息才可以更快的叙述客户,提议服务平台依据贷款逾期客户画像,更谨慎开展业务。

2.不一样层面下,不良贷款率关联性

1)年纪在35-50岁区段范畴内,不良贷款率相对性较高,而女士客户的不良贷款率较低,还贷意愿会更强。35-50岁区段,不良贷款率较高,放贷比例较高。

提议减少该年龄层不良贷款率,或是操纵该年龄层放贷总数,以期将风险性减少。

2)评分层面,服务平台70%以上的放贷给到B和C原始评分的客户。而E、D、F三个评分较近后的客户,不良贷款率也是最大,贷款逾期产生的可能也是最大。

这跟服务平台的评分管理体系一致。提议缩小C和D的放贷量,而且大量开发设计AA,AAA级客户借款要求。

3)借款特性层面,借款种类中应收款安全性标,不良贷款率最少,而电子商务类贷款逾期的概率最大,与此同时放贷比例较高,由于不良贷款率和放贷比例成反比,提议缩小放贷量。

年利率中,7-10最少年利率,不良贷款率相对性最大,毁约产生的概率更高一些;借款额度层面,总体上额度越高,不良贷款率想对越高。

而借款限期层面,服务平台关键客户借款以大半年、一年的短期内为主导,在其中24、12、6、7的借款限期不良贷款率较高,产生毁约概率比较大。

上边新项目来源于社群营销vip会员未提升以前的內容

(https://zhuanlan.zhihu.com/p/61 ** 9855)

下边是新项目修改建议:

1.客户画像沒有搭建出去

尽管分离而言客户画像里的每一个一部分,可是沒有汇总讲出逾贷的客户画像。肖像是一个人的立体式,你将他拆分离了,就我不知道这一贷款逾期的的实际是如何,只有是见到一部分。

怎么才能立体式的輸出呢?

等同于是一个人,随后你需要做一个汇总,贷款逾期率高的人,年纪,文凭这些全是怎样的。

2剖析应当再深层次一些找到主要缘故,怎样详细分析呢?

深入分析举例说明,倘若数据统计分析結果发觉男士贷款逾期率高过女士,此刻你需要问一下自己一个为什么?

这与文凭有关系吗?与申请注册有关系?数据信息是关系的,而不是单独开的,因此你需要深层次去剖析,多问一下为什么。

但你这儿沒有详细分析,是由于犯了一个主观的不正确,天然就觉得男性逾期率更高,而不去探究他的具体原因。

每做出一个结论,就打一个问号?为什么是这样?然后去分析一下,这也是数据分析中的批判性思维。

应该每个结论都问一下为什么会这样?导致这样的结果有哪些影响因素?再去分析一下,锻炼你的分析思维,不然你的结论就会停留在表层,显得很鸡肋。

例如18-22岁的逾期率更高,这恐怕从事银行行业1年的人都会知道,你每次都只是得出这么表层的结论,那银行要你来干嘛!所以你要更深入分析这个原因,给出更好的解决方法来。

3.建议给的太浅,不具有执行性

比如18-22岁的人刚出校园,发生逾期率高,应该怎么处理?这个你应该思考一下。

用户画像出来,建议给的不好,解决的都是浅层次的问题。

更深的层次的应该是做一个逾期用户画像他的目标是什么?他要解决什么问题?

做个假设,既然用户画像都有了,为什么不建个信贷用户风险体系呢?每个点都设个分数,然后得出总分,最后来把用户分等级,例如年龄18-22,为9分,初始评级E为9分,最后把这些项目得出总分来,就是这个人的用户画像的。

比如超过70分的就不贷,或者限制贷款数量等等。每个人都给以不同的贷款等级。所以建议你做个信贷用户风险分析,你那些建议都是很浅层的,不能根本解决信贷公司的问题。

4.对数据不够敏感

比如分析中说3%-4%觉得不明显,这其实在统计上都是30%的差异了。

做项目的过程就是一个不断优化学习的过程,希望社群内部的讨论和建议可以帮助社群会员更好的完善项目。

推荐:如何用最短的时间找到初级数据分析师工作?

扫码免费用

源码支持二开

申请免费使用

在线咨询