P2p贷款数据

如何查询自己的网贷记录?

查询网贷记录时,一般只能查询有信用记录的,没有信用记录的暂时没有合适的查询渠道。

网贷查询记录进行征信的方法如下:

1.征信窗口查询:个人可携带身份证,到附近的人民银行分支机构,找到征信窗口,向工作人员提交查询申请。

2.征信中心官网查询:个人可登录中国人民银行征信中心官网,在首页点击“互联网个人征信服务平台”,然后点击“立即开始”。如果他们没有注册,他们可以单击新用户注册。注册成功后,即可登录个人账户,进行网上查询。

国内排名前十的P2P网贷平台和网贷平台有哪些?

根据神盾风控官网2021年6月发布的统计数据,全国十大p2p网贷平台排名如下:top1:宜人贷,top2:爱钱,top3:金鹿服务,top4:积木盒子,top5:拍拍贷,top6:辛凯金夫,top7:人人贷,TOP 4。这十家网贷平台都是国内非常正规优秀的网贷平台,在网贷行业占据了非常大的市场份额,对目前国内的网贷行业有着非常大的影响。

能够登上全国十大P2P网贷平台榜单,是对网贷平台非常高的肯定,因为这个榜单不仅仅是根据网贷平台的使用情况和用户数量来评判,还需要审核网贷平台的用户满意度,网贷是否都是正规业务。

如果某个网贷平台存在“714高射炮”之类的东西,或者存在违规收费等各种违法现象,那么即使用户再多,这个网贷平台也不可能在这样的榜单上。这也是很多知名网贷平台没有上市的原因,因为很多知名网贷平台可能用户不足,或者可能存在违规操作,导致用户口碑不好。

现在网贷平台数量众多,有很多非常正规专业的网贷平台供我们选择,但同时也有很多不正规的网贷公司诱导我们。在这种情况下,一定要擦亮眼睛,辨别网贷公司的好坏,选择正规的网贷平台进行业务。

美国网贷平台Prosper贷款数据分析

本文主要描述了如何用Python来评估、组织和清洗数据集。

完成这个过程后,我们将通过Tableau对“Prosper违约客户的特征是什么”这个问题进行探索、分析和可视化。

最后用随机森林算法对2009年7月以后的数据进行建模分析,对还在进行中的贷款进行违约与否的预测。

Prosper是美国第一家P2P借贷平台。这个数据集来自于优步2005年到2014在Udacity上的贷款数据。本文希望通过对已完成贷款的分析,判断什么样的客户更容易违约,并预测未完成贷款是否会违约。

原始数据集* * *包含81个变量和113937条数据。下面解释一些重要的变量,其他变量的含义可以参考变量字典。

首先加载库和数据。

然后用df.describe()和df.info()观察数据。

这次主要分析1。什么样的借款人更容易违约?2.预测未偿还贷款是否会违约。所以去掉不相关的栏目。

自2009年7月起,Prosper调整了对客户的评估方法。这次只分析2009年7月以后的贷款-01。

删除含义重复的列:

Prosper对新客户的评级和老客户不同,这次只分析新客户的数据。

首先,检查每个变量的缺失数据。

平台将贷款状态分为12类型:已取消(Cancelled)、已收费(Chargedoff)(核销,投资人有损失)、已完成(正常完成,投资人无损失)、当前(贷款偿还)、违约(坏账,投资人有损失)、FinalPaymentInProgress(投资人最终还款无损失)、过期。

本文根据交易是仍在进行还是已成交,以及投资者在已成交的交易中是否亏损,将所有数据分为以下三组:

当前(包括当前、过期),

违约(包括违约、拒付),

已完成(包括已完成,finalpaymentinprogress)。

为了便于后续的分析计算,“完成”改为1,“默认”改为0。

已完成贷款违约率defaulted _ ratio _ finished = 26.07%。

这个数据集有很多反映贷款用户信用情况的特征。其中,信用评级由Prosper根据自己的模型建立,是确定贷款利率的主要依据,而CreditScore则由官方信用评级机构提供。

从图5-1可以看出,随着ProsperRating的不断增加,违约率呈现出明显的下降趋势。

在CreditScore,低分(640-700),违约率处于比较高的位置,没有太大的变化。对于720以上的部分,随着信用评分的提高,违约率明显下降。

总体来看,借款人的信用等级越高,违约的可能性越低。

在不同收入水平中,未就业借款人的违约率最高,且随着收入的增加,违约率不断下降。

在不同的贷款状况下,违约用户的月收入明显低于非违约用户。

根据图5-4左图,违约用户和非违约用户的整体负债收入比差别不大。

根据债务收入比的四分位数,将所有数据分为数据量相近的四组。从图5-4右图可以看出,低比率(债务收入比0-0.12)和中比率(0.12-0.19)的违约率都较低。比例较高的违约率(0.19-0.29)略高于前两者。而高比例(大于0.29)用户的违约率明显上升。

根据银行卡使用率的四分位数,将数据分为'未使用'、'低透支(0,0.3 '、'中度透支(0.3,0.7 '、'高透支(0.7,1)”和'严重透支(1)。

可见透支严重的借款人违约率最高。

二是未使用的用户,这也是金融机构特别关注“白户”的原因。

InquiriesLast6Months可以反映借款人近期向金融机构申请贷款的频率,间接反映借款人近期的财务状况。

图5-6中,绿线表示不同查询时间下的贷款笔数。可以看到,大部分都在7倍以下。

在0-7次查询的范围内,默认率随着查询次数的增加而增加。

目前的违约情况可以很好地反映借款人的信用状况。

从图5-7可以看出,目前大部分借款人的逾期次数在2次以内。在0-6的范围内,违约率随着当前逾期次数的增加而增加。

为了避免某些极少数类别对违约率排名的影响,首先筛选出贷款超过30笔的类别。

从图5-8可以看出,最大的数字是1-DebtConsolidation。

违约率最高的是15-医疗/牙科(医疗)、13-户主支出(家庭支出)和3-商业(商业),均高于30%。

根据贷款金额的四分位数,将数据分为四组,数字相近。有意思的是,中等规模贷款(365,438+000,4750)的违约率最高,而高规模贷款(8,500以上)的违约率最低。

这大概是因为能申请高额贷款的用户各方面条件都很好,从而降低了违约率。

从图5-11可以看出,在0-30的范围内,随着久期的增加,违约率逐渐降低,这个范围也包含了一半左右的数据。

当久期持续增长时,违约率没有明显的变化规律。

不同地区违约率差异明显。在洛杉矶和SD等城市,违约率很高。在ut和co等城市,违约率较低。

整体来看,有房产的借款人违约率明显低于无房产的借款人。

导入相关库。

将数据中的字符串变量转换为数字。

按照测试集30%、训练集70%的比例划分数据集,使用随机森林算法建立模型。

模型测试集的预测准确率为:准确率=73.99%。

对于随机森林算法,我们可以检查该模型中每个特征的重要性。

如图6-2所示,StatedMonthlyIncome和EmploymentStatusDuration是最重要的功能。

根据该模型,预测仍在进行中的贷款是否违约。

仍在进行中的贷款违约率为Default _ Ratio _ Predict = 3.64%。

本文详细描述了Prosper loan数据从数据探索到模型建立和预测的完整过程。

研究发现,月收入和雇佣期限对是否违约影响最大。主要是因为这两个是反映借款人稳定性的重要因素。

在模型建立方面,也可以通过调整这个模型的参数来提高精度,或者尝试使用其他算法,比如logistic回归,建立新的模型进行比较。

p2p贷款数据介绍就这么多。