1.本发明涉及数据处理领域,特别是涉及一种风险分值计量方法及装置。
背景技术:2.在经济形势的不断变化的情况下,银行陆续推出多种信贷产品,在满足客户需求的同时,还能够促进银行的不断发展。客户购买银行的信贷产品,与银行产生信贷关系后,银行为了保障信贷资产质量稳定,需要对客户进行整体的风险评估与计量。银行通过客户授权收集的数据信息,计算客户的风险分值,从而可以根据风险分值及时发现并处理潜在的风险客户。
3.但是,现有技术中主要依赖于客户自行申报的数据信息进行风险分值的计算,风险分值的计算过程多为客户行为对应的信用数据的叠加,属于非常基础的方法,存在很大的人为刷分的空间,使得得到的客户的风险分值往往无法客观地、真实地反映客户的整体履约情况,容易遗漏潜在的风险客户,从而引发信贷安全问题。
技术实现要素:4.有鉴于此,本发明提供一种风险分值计量方法,通过该方法计算得到的客户风险分值可以更加客观地、真实地反映出客户的风险状况,以保护客户信贷安全。
5.本发明还提供了一种风险分值计量装置,用以保证上述方法在实际中的实现及应用。
6.一种风险分值计量方法,包括:
7.获取预设的时间段内的所有用户的第一数据集,并根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值;
8.将每个所述用户的所述预估月收入值和所述预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额;
9.获取每个所述用户对应的地方数据集,并根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;
10.基于每个所述用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;
11.将每个所述用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;
12.基于各个所述历史违约概率,运用聚类算法对各个所述第一客群进行分类,得到至少一个第二客群,并将每个所述第一客群中的各个用户归类到该第一客群对应的第二客群中;
13.确定每个所述第二客群对应的逻辑回归模型,并基于各个所述逻辑回归模型,计
算所有所述用户的初始风险分值,并根据每个所述用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
14.上述的方法,可选的,所述根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值,包括:
15.确定所述用户对应的初始客群,所述初始客群是按照预先设置的初始分类标准,划分得到的用户的集合;
16.根据所述初始客群中的各个用户的第一数据集中的月收入信息确定该初始客群对应的收入平均值,并将该收入平均值作为所述用户的第一收入值;
17.基于所述用户的第一数据集,确定所述用户的第二收入值、第三收入值、第四收入值和第五收入值;
18.根据预设的各个收入权重系数,计算所述第一收入值、所述第二收入值、所述第三收入值、所述第四收入值、所述第五收入值的加权平均值,并将所述加权平均值确定为所述用户的预估月收入值;
19.将所述用户的第一数据集中的各个还款金额相加得到所述用户的预估月支出值。
20.上述的方法,可选的,所述各个偏离系数权重包括第一系数权重、第二系数权重和第三系数权重;所述根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重,包括:
21.根据所述用户的第二数据集中的预估月收入值以及所述用户对应的各个地方数据集,计算所述用户对应的第一偏离系数,并根据预设的第一对照表,确定所述第一偏离系数对应的第一系数权重;
22.基于所述用户的第二数据集中的第一用户数据、第二用户数据、预估月收入值及预设的第二偏离系数测算因子表,计算所述用户对应的第二偏离系数,并根据预设的第二对照表,确定所述第二偏离系数对应的第二系数权重;
23.基于所述用户的第二数据集中的第三用户数据、预估月收入值以及预估月支出值,计算所述用户对应的第三偏离系数,并根据预设的第三对照表,确定所述第三偏离系数对应的第三系数权重。
24.上述的方法,可选的,所述确定每个所述第一客群对应的历史违约概率,包括:
25.统计所述第一客群中的用户个数;
26.基于所述第一客群中的各个用户的第三数据集,统计所述第一客群中满足预设的违约条件的各个用户,得到违约用户个数;
27.根据所述用户个数和违约用户个数,确定所述第一客群对应的历史违约概率。
28.上述的方法,可选的,所述基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,包括:
29.根据每个所述用户的第三数据集,确定所述用户对应的第二客群,并确定所述第二客群对应的逻辑回归模型;
30.基于所述第三数据集和预设的变量取值表,确定所述逻辑回归模型中各个变量的取值,将各个所述变量的取值代入所述逻辑回归模型,得到所述用户的违约概率;
31.运用预设的初始风险分值换算公式,将所述违约概率换算为所述用户的初始风险分值。
32.一种风险分值计量装置,包括:
33.第一计算单元,用于获取预设的时间段内的所有用户的第一数据集,并根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值;
34.第二计算单元,用于将每个所述用户的所述预估月收入值和所述预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额;
35.第一确定单元,用于获取每个所述用户对应的地方数据集,并根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;
36.第三计算单元,用于基于每个所述用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;
37.第一分类单元,用于将每个所述用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;
38.第二分类单元,用于基于各个所述历史违约概率,运用聚类算法对各个所述第一客群进行分类,得到至少一个第二客群,并将每个所述第一客群中的各个用户归类到该第一客群对应的第二客群中;
39.第四计算单元,用于确定每个所述第二客群对应的逻辑回归模型,并基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,并根据每个所述用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
40.上述的装置,可选的,所述第一计算单元,包括:
41.第一确定子单元,用于确定所述用户对应的初始客群,所述初始客群是按照预先设置的初始分类标准,划分得到的用户的集合;
42.第二确定子单元,用于根据所述初始客群中的各个用户的第一数据集中的月收入信息确定该初始客群对应的收入平均值,并将该收入平均值作为所述用户的第一收入值;
43.第三确定子单元,用于基于所述用户的第一数据集,确定所述用户的第二收入值、第三收入值、第四收入值和第五收入值;
44.第一计算子单元,用于根据预设的各个收入权重系数,计算所述第一收入值、所述第二收入值、所述第三收入值、所述第四收入值、所述第五收入值的加权平均值,并将所述加权平均值确定为所述用户的预估月收入值;
45.第二计算子单元,用于将所述用户的第一数据集中的各个还款金额相加得到所述用户的预估月支出值。
46.上述的装置,可选的,所述各个偏离系数权重包括第一系数权重、第二系数权重和第三系数权重;所述第一确定单元,包括:
47.第三计算子单元,用于根据所述用户的第二数据集中的预估月收入值以及所述用户对应的各个地方数据集,计算所述用户对应的第一偏离系数,并根据预设的第一对照表,确定所述第一偏离系数对应的第一系数权重;
48.第四计算子单元,用于基于所述用户的第二数据集中的第一用户数据、第二用户数据、预估月收入值及预设的第二偏离系数测算因子表,计算所述用户对应的第二偏离系数,并根据预设的第二对照表,确定所述第二偏离系数对应的第二系数权重;
49.第五计算子单元,用于基于所述用户的第二数据集中的第三用户数据、预估月收入值以及预估月支出值,计算所述用户对应的第三偏离系数,并根据预设的第三对照表,确定所述第三偏离系数对应的第三系数权重。
50.上述的装置,可选的,所述第一分类单元,包括:
51.第一统计子单元,用于统计所述第一客群中的用户个数;
52.第二统计子单元,用于基于所述第一客群中的各个用户的第三数据集,统计所述第一客群中满足预设的违约条件的各个用户,得到违约用户个数;
53.第四确定子单元,用于根据所述用户个数和违约用户个数,确定所述第一客群对应的历史违约概率。
54.上述的装置,可选的,所述第四计算单元,包括:
55.第五确定子单元,用于根据每个所述用户的第三数据集,确定所述用户对应的第二客群,并确定所述第二客群对应的逻辑回归模型;
56.第六确定子单元,用于基于所述第三数据集和预设的变量取值表,确定所述逻辑回归模型中各个变量的取值,将各个所述变量的取值代入所述逻辑回归模型,得到所述用户的违约概率;
57.第六计算子单元,用于运用预设的初始风险分值换算公式,将所述违约概率换算为所述用户的初始风险分值。
58.一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的风险分值计量方法。
59.一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行上述的风险分值计量方法。
60.与现有技术相比,本发明包括以下优点:
61.本发明实施例提供的风险分值计量方法,获取预设的时间段内的所有用户的第一数据集,并根据各个第一数据集,计算每个用户的预估月收入值和预估月支出值;将每个用户的预估月收入值和预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额;获取每个用户对应的地方数据集,并根据每个用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;基于每个用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;将每个用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;基于各个历史违约概率,运用聚类算法对各个第一客群进行分类,得到至少一个第二客群,并将每个第一客群中的各个用户归类到该第一客群对应的第二客群中;确定每个第二客群对应的逻辑回归模型,并基于各个逻辑回归模型,计算所有用户的初始风险分值,并根据每个用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
62.应用本发明实施例提供的方法,通过收集用户各个方面的授权数据信息,以及对多个用户组成的客群的整体进行综合计量,并结合客群的历史违约概率、用户的违约概率以及用户办理的业务对应的扣分值,最终计算得到用户的风险分值,能够实现多维度对用
户存在的风险进行评判,更加真实、客观地反映出用户的整体履约情况,从而维护用户信贷安全。
附图说明
63.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
64.图1为本发明实施例提供的一种风险分值计量方法的方法流程图;
65.图2为本发明实施例提供的一种风险分值计量方法的又一方法流程图;
66.图3为本发明实施例提供的一种风险分值计量方法的再一方法流程图;
67.图4为本发明实施例提供的一种风险分值计量装置的装置结构图;
68.图5为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
69.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
70.在本技术中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
71.本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
72.本发明实施例提供了一种风险分值计量方法,该方法可以应用在多种系统平台,其执行主体可以为计算机终端或各种移动设备的处理器,所述方法的方法流程图如图1所示,具体包括:
73.s101:获取预设的时间段内的所有用户的第一数据集,并根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值。
74.本发明实施例中,银行计算用户的风险分值需要获取用户的相关贷款信息,建立每个用户对应的《个人客户数据信息宽表》,用户对应的《个人客户数据信息宽表》、《信用卡业务汇总自由查询》以及《人行征信个人客户信息》等各个数据组成用户的第一数据集。可以从近3年与银行发生过信贷关系的个人用户基础数据中,选择一个时点如(2020年12月31日),提取用户的工作单位性质、最高学历、年龄、婚姻状况、工作年限、持有产品数量、管护
机构名称等用户的数据信息组成用户的第一数据集,并根据第一数据集中的多个数据,综合计量出用户的预估月收入值和预估月支出值。
75.具体的,如图2所示,所述根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值,包括:
76.s201:确定所述用户对应的初始客群,所述初始客群是按照预先设置的初始分类标准,划分得到的用户的集合;
77.s202:根据所述初始客群中的各个用户的第一数据集中的月收入信息确定该初始客群对应的收入平均值,并将该收入平均值作为所述用户的第一收入值;
78.可以理解的是,根据表1中工作单位性质、最高学历、年龄、婚姻状况、工作年限、持有产品情况、所在地区(最新征信中工作地址)7个字段的不同标准,以随机组合的方法,得到24000类初始客群,按照用户的第一数据集中的关于表1中各个字段的相关信息,确定用户所属的初始客群,例如,根据用户a在所述7个字段的具体值,确定用户所在的初始客群为“工作单位性质:私企、最高学历:本科、年龄:26岁-30岁、婚姻状况:未婚、工作年限:0-5年、持有产品情况:0个-3个、所在地区:二线城市”,并计算该类初始客群中的全部用户提供的月收入信息(剔除空值)的平均值,将平均值赋值于该类初始客群中的所有用户,包括所述用户,并列入所述用户的第一数据集中,记为该用户的第一收入值。
[0079][0080]
表1
[0081]
s203:基于所述用户的第一数据集,确定所述用户的第二收入值、第三收入值、第四收入值和第五收入值;
[0082]
具体的,提取用户的第一数据集中的第二收入值,第二收入值可以由该用户的第一数据集中的代发工资金额、公积金月缴存金额相加所得。若“代发工资金额”字段为空,则第二收入值记为0。提取用户的第一数据集中的第三收入值,第三收入值可以是用户的公积
金月缴存基数。若公积金月缴存基数字段为空的,第三收入值记为0。提取用户的第一数据集中的第四收入值,第四收入值可以是借款人收入证明(月收入)。若借款人收入证明字段为空的,第四收入值记为0。提取用户的第一数据集中的第五收入值,第五收入值可以是月平均收入。若月平均收入字段为空的,第五收入值记为0。
[0083]
s204:根据预设的各个收入权重系数,计算所述第一收入值、所述第二收入值、所述第三收入值、所述第四收入值、所述第五收入值的加权平均值,并将所述加权平均值确定为所述用户的预估月收入值;
[0084]
具体的,用户的预估月收入值为用户的第一收入值、第二收入值、第三收入值、第四收入值以及第五收入值的字段中非0数据的加权平均数。如表2,可以根据公式:(第一收入值*1+第二收入值*1.2+第三收入值*0.9+第四收入值*0.8第五收入值*0.5)/5,计算得到用户的预估月收入值。表中的各个权重的值可以根据实际情况而定,此处不做具体限定。
[0085][0086]
表2
[0087]
s205:将所述用户的第一数据集中的各个还款金额相加得到所述用户的预估月支出值。
[0088]
具体的,利用用户的第一数据集中的部分还款数据,确定用户的预估月支出,例如可以将第一数据集中的最近一期住房按揭贷款月还款金额、个人贷款月还款金额、信用卡分期月还款总额加总,得到用户的预估月支出值。
[0089]
应用本发明实施例提供的方法,通过划分各个用户形成多个初始客群,并计算各个初始客群的收入平均值,各个用户根据其所在初始客群的收入平均值和多个收入信息得到的各个收入值结合各个收入值的权重,算得用户的预估月收入值,并根据用户的各个支出金额确定用户的预估月支出值。根据多维数据得出用户的预估月收入值和预估月支出值,使得用户的预估月收入值和预估月支出值能更准确客观地反映出用户的收入和支出情况,有益于后续根据预估月收入值和预估月支出值对用户进行更客观的风险分值计量。
[0090]
s102:将每个所述用户的所述预估月收入值和所述预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额。
[0091]
本发明提供的实施例中,第二数据集包含用户的预估月收入值和预估月支出值以及该用户的第一数据集的各个数据,用户的第一支配金额即用户的当月可支配资金值。根据用户的预估月收入值和预估月支出值以及用户的月均aum值,计算用户的当月可支配资金值=用户的预估月收入值-用户的预估月支出值+用户的月均aum值,aum值也就是资产管理规模,是指衡量金融机构资产管理业务规模的指标,是该机构当前管理用户资产的总市
值。
[0092]
s103:获取每个所述用户对应的地方数据集,并根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重。
[0093]
本发明实施例中,用户所在地的一些因素例如房价等,以及用户本身的一些特质会影响用户的当月可支配收入,根据用户对应的地方数据集以及用户的第二数据,确定影响用户的当月可支配收入的各个偏离系数的权重。
[0094]
具体的,如图3所示,所述各个偏离系数权重包括第一系数权重、第二系数权重和第三系数权重;所述根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重,包括:
[0095]
s301:根据所述用户的第二数据集中的预估月收入值以及所述用户对应的各个地方数据集,计算所述用户对应的第一偏离系数,并根据预设的第一对照表,确定所述第一偏离系数对应的第一系数权重;
[0096]
具体的,第一偏离系数主要是为了计算购买力调节因素对用户收支水平的影响,选取地方平均房价以及城乡居民年月均收入等地方数据作为外部因素的影响指标,可以从官方途径获取地方平均房价以及城乡居民年月均收入,并获取用户的房产押品价值以及房产面积,根据公式:第一偏离系数=[(房产押品价值/房产面积/用户的预估月收入值-地方平均房价/城乡居民年月均收入)]/(房产押品价值/房产面积/用户的预估月收入值)*100%,计算得到用户对应的第一偏离系数。若在银行无房产押品的,设定第一偏离系数=0。
[0097]
参照表3,找到符合用户的第一偏离系数的第一偏离系数变化区间,从而确定用户的第一系数权重,例如根据用户的第二数据集计算得到的第一偏离系数α《-50%,则调整用户对应的第一系数权重为1.5,第一偏离系数α在其他区间时以此类推。表中的各个权重的值可以根据实际情况而定,此处不做具体限定。
[0098][0099]
表3
[0100]
s302:基于所述用户的第二数据集中的第一用户数据、第二用户数据、预估月收入值及预设的第二偏离系数测算因子表,计算所述用户对应的第二偏离系数,并根据预设的第二对照表,确定所述第二偏离系数对应的第二系数权重;
[0101]
本发明提供的实施例中,第二偏离系数主要是为了计算第一用户数据、第二用户数据、预估月收入值三者的关联性,其中,第一用户数据可以是学历程度,第二用户数据可以是工作年限。因此,第二偏离系数可以是用于衡量学历程度、工作年限以及用户预估月收入三者的匹配程度,并通过相关数据分析设置第二偏离系数的变化区间,找到用户的第二偏离系数所在的变化区间,该变化区间对应的系数权重值为所述用户的第二系数权重。
[0102]
具体的,第二偏离系数测算因子表中可设定学历程度包括研究生及以上、本科、大专、高中和其他,共分为5档,由低到高赋值1-5分;工作年限包括0-5年、5-10年、10-15年、
15-25年以及25年以上,共分为5档,由低到高赋值1-5分;收入包括5000元以下、5000元-12000元、12000元-20000元、20000元-30000元以及30000以上,共分5档,同样由低到高赋值1-5分。
[0103]
根据公式:第二偏离系数=(学历分+年限分)/(收入分*2),计算得到用户的第二偏离系数,再根据表4中第二偏离系数的4个档次,确定用户的第二系数权重,例如第二偏离系数在区间[0.2,0.375)或(2.25,5]时,调整第二权重系数为0.8,第二偏离系数在其他区间时以此类推。表中的各个权重的值可以视实际情况而定,此处不做具体限定。
[0104][0105]
表4
[0106]
s303:基于所述用户的第二数据集中的第三用户数据、预估月收入值以及预估月支出值,计算所述用户对应的第三偏离系数,并根据预设的第三对照表,确定所述第三偏离系数对应的第三系数权重。
[0107]
本发明提供的实施例中,第三偏离系数主要是为了考虑婚姻状况对个人月均收支的影响。获取用户的第三用户数据,即用户的婚姻状况,以及用户的预估月收入值以及预估月支出值,根据公式:第三偏离系数=(用户的预估月收入值-用户的预估月支出值)/用户的预估月收入值,计算得到用户的第三偏离系数,并通过相关数据分析设置第三偏离系数的变化区间,如表5所示,基于用户的婚姻状况,找到用户的第三偏离系数所在的变化区间,该变化区间对应的系数权重值为所述用户的第三系数权重,例如,当用户为已婚,且根据用户的第二数据集计算得到的第三偏离系数δ在区间(0.1,0.2],则调整所述用户对应的第三系数权重为0.9,第三偏离系数在其他区间时以此类推。
[0108]
表中的各个权重的值可以视实际情况而定,此处不做具体限定。
[0109][0110]
[0111]
表5
[0112]
应用本发明实施例提供的方法,通过3个偏离调整系数,用有限的数据调整用户的第一支配金额,即用户的当月可支配收入,考虑了押品价值、当地经济情况、负债情况等,能够更加客观的体现出用户的可支配收入状况,提高用户风险分值计算的准确度。
[0113]
s104:基于每个所述用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集。
[0114]
本发明提供的实施例中,第三数据集包含用户的第一支配金额和第二支配金额以及该用户的第二数据集的各个数据,用户的第一支配金额即用户的当月可支配资金值,第二支配金额即用户的根据各个影响因子的系数权重值调整后的当月可支配资金值。根据公式:用户的当月可支配资金(调整后)=用户当月可支配资金值
×
该用户的第一系数权重值
×
该用户的第二系数权重值
×
该用户的第三系数权重值,从而得到用户的第二支配金额。
[0115]
s105:将每个所述用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率。
[0116]
本发明提供的实施例中,每个用户的第三数据集都具有相同的多个字段,根据预设的分类标准,为每个字段划分出不同的分类标准,再根据每个字段不同分类标准的随机组合,得到多个第一客群,根据每个客群中的各个用户的第三数据集,能够计算出该客群对应的历史违约概率。具体为,如表6所示,每个用户的第三数据集都具有相同的8个字段,分别为工作单位性质、最高学历、年龄、婚姻状况、工作年限、持有产品情况、所在地区以及偏离调整后的用户当月可支配资金,将调整后的当月可支配资金值划分为19类,并结合表1中7个字段的划分标准,组合形成45.6万类用户,即得到45.6万个第一客群。
[0117]
最后根据所述用户的第三数据集的各个字段的值,找到用户对应的第一客群,例如根据用户a在所述8个字段的具体值,确定用户所在的第一客群为“工作单位性质:私企、最高学历:本科、年龄:26岁-30岁、婚姻状况:未婚、工作年限:0-5年、持有产品情况:0个-3个、所在地区:二线城市、偏离调整后的用户当月可支配资金:1-1.5万”,并确定该第一客群对应的历史违约概率。
[0118]
其中,可选的,所述确定每个所述第一客群对应的历史违约概率,包括:
[0119]
统计所述第一客群中的用户个数;
[0120]
基于所述第一客群中的各个用户的第三数据集,统计所述第一客群中满足预设的违约条件的各个用户,得到违约用户个数;
[0121]
根据所述用户个数和违约用户个数,确定所述第一客群对应的历史违约概率。
[0122]
本发明提供的实施例中,计算每类第一客群的历史违约概率,需要统计属于该第一客群的用户的总人数,以及该第一客群中违约用户的总人数,并运用公式:历史违约概率=客群违约人数/客群总人数,得到该第一客群的违约概率,其中,可以确定3年内征信或银行债项发生过逾期超30日,或征信的信用分类,或银行债项出现可疑、次级、损失的用户为满足违约条件的违约用户。
[0123]
应用本发明提供的实施例,通过统计第一客群中的违约用户以计算第一客群的历史违约概率,能够反映出各个第一客群中存在违约用户的情况,从而便于后续根据各个第一客群的历史违约概率,对各个第一客群进行聚类,将历史违约概率相对集中的第一客群
组成新的整体,减少客群数量。
[0124][0125][0126]
表6
[0127]
s106:基于各个所述历史违约概率,运用聚类算法对各个所述第一客群进行分类,得到至少一个第二客群,并将每个所述第一客群中的各个用户归类到该第一客群对应的第二客群中。
[0128]
本发明提供的实施例中,根据各个第一客群的历史违约概率,运用ap(affinitypropagation)聚类算法将s105中得到的各个第一客群(如上述的45.6万个第一客群)进行聚类,得到n(n为数值)个新的第二客群的分类,并将第一客群中的用户归类到该第一客群对应的第二客群中,从而将历史违约概率相对集中的各个第一客群组成新的整体,减少客群数量。
[0129]
s107:确定每个所述第二客群对应的逻辑回归模型,并基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,并根据每个所述用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
[0130]
本发明提供的实施例中,s106中得到的每个第二客群都具有9类数据字段,包括因变量y和自变量x1-x8,定义因变量y为用户违约状态,历史发生违约取值为1,未违约取值为0;定义自变量x1-x8为自变量,分别为:工作单位性质、最高学历、年龄、婚姻状况、工作年限、持有产品情况、所在地区(最新征信中工作地址)以及偏离调整后的用户当月可支配资金,取值表格如表7,为n个第二客群中的每一个第二客群构建logistics逻辑回归模型:
[0131]
logityi=ln(pi/1-pi)=ci+aix1+bix2+cix3
……
+hix8
[0132]
获得n个逻辑回归方程式。其中,i为用户所属的第二客群,范围为1~n,ci是常数
项,有可能某些第二客群有的,有可能某些第二客群没有;其他的ai、bi...hi,是逻辑回归模型中自变量x1到x8的方程系数,不同的第二客群具有对应的ci、ai、bi...hi,从而根据该第二客群中每个用户第三数据集中符合上述的各个字段的具体值,计算出该用户对应的违约概率yi。
[0133]
通过用户所在的第二客群对应的逻辑回归模型以及公式:用户n初始风险分值=1000-用户n违约概率pdn*1000,并根据用户第三数据集,得到该用户关于逻辑回归模型和公式中的各个变量对应的具体值,并向该逻辑回归模型和公式的各个变量代入各个具体值,计算得到用户的初始风险分值。
[0134]
本发明提供的实施例中,可选的,所述基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,包括:
[0135]
根据每个所述用户的第三数据集,确定所述用户对应的第二客群,并确定所述第二客群对应的逻辑回归模型;
[0136]
基于所述第三数据集和预设的变量取值表,确定所述逻辑回归模型中各个变量的取值,将各个所述变量的取值代入所述逻辑回归模型,得到所述用户的违约概率;
[0137]
运用预设的初始风险分值换算公式,将所述违约概率换算为所述用户的初始风险分值。
[0138]
本发明提供的实施例中,根据用户第三数据集中各个字段的具体值,找到用户对应的第一客群,并根据s106,各个第一客群在进行聚类后得到各个第一客群对应的第二客群,将用户归类到其所属第一客群所对应的第二客群,同时获取用户所在的第二客群对应的逻辑回归模型。
[0139]
例如,根据s107,若某用户属于n1第二客群则用y1方程式计算该用户违约概率pd1,根据用户的第三数据集中各个字段的具体值,结合表7,查找变量x1~x8的取值,将查找到的x1~x8得取值代入y1方程式中进行数值计算,得到用户的违约概率pd1。最后,根据公式:用户的初始风险分值=1000-用户的违约概率pdn*1000,计算得到用户的初始风险分值。
[0140]
应用本发明提供的实施例,根据逻辑回归模型计算用户的初始风险分值,综合考虑了多个因素,刻画多维度用户属性,增加评分方法准确度。
[0141]
[0142]
[0143][0144]
表7
[0145]
最后,根据用户当前办理的业务,由初始风险分值减去业务对应的扣分值,从而得到用户的当期风险分值;若用户当前同时办理多个业务,则用户的当期风险分值为用户的初始风险分值减去所有业务对应的风险分值的总和。例如用户a,根据a的特征变量x1到x8分类,其属于第二客群c的,则根据第二客群c的逻辑回归公式计算用户a的违约概率pd,然后再通过风险分值与违约概率对应的计算公式就可以作为用户a的初始风险风值。若当期用户a当前办理的业务触发了预警信号集里的某些扣分信号,那么用户a的当期风险分值=本期的初始风险分值-预警信号及触发信号扣分值的总和。
[0146]
需要说明的是,若用户在日后x1到x8对应的值发生变化,其所在的客群可能也会发生变化,则计算其违约概率pd的逻辑回归公式可能也会不同于之前,在监测时点计算出来的初始风险分值可能也会变化。
[0147]
其中,各个业务的扣分分值可以根据实际情况设定,具体如表8所示。
[0148]
例如,用户办理的业务为快贷—信用卡交易关联,系统监测到用户办理快贷前6个月,信用卡交易额逐月增加,办理快贷后连续6个月信用卡交易额下降,且与快贷办理前相比,出现明显降幅,与快贷办理前相比,降幅范围在50%-60%之间,根据表8,扣分分值为10分,以此类推。
[0149]
[0150]
[0151][0152]
表8
[0153]
需要说明的是,表8中的扣分分值是通过各单一指标逻辑回归计算用户的该行为指标出现后,对用户违约概率下降程度权重系数计算而来,扣分分值=(出现后指标权重-出现前指标权重)*1000。为最大限度揭示风险分值下降情况,不考虑各指标间的关联性。
[0154]
还需要说明的是,预警信号集里的扣分分值是用3年历史数据中的所有用户触发了某个预警信号的用户,与剩余没触发的用户做成对照组,触发预警信号即满足监测指标序号1至14中至少一个规则内容,并运用同s105至s106的客群聚类方法与违约概率估计方法,将各个用户进行聚类后得到各个触发信号的用户组成的触发信号组的各个客群和各个未触发信号的用户组成的没触发信号组的各个客群,计算触发信号组的每个客群的信号触发一年前的违约概率估计,计算剩余没触发的用户做成对照组的每个客群的信号触发一年前的违约概率估计。每个对应客群内对照组的违约概率估计之差就是这个预警信号对这一客群内用户触发预警信号后违约概率估计值的偏差,所以每个对应客群内对照组的违约概率估计之差就是预警信号触发后对于这一客群违约概率影响的偏离值,再利用分值和违约概率的对应计算公式(风险分值=1000-客群n违约概率偏离pdn*1000)将违约概率偏离换算成扣分分值。然后对客群中触发某一预警信号后的用户违约概率估计做扣分调整。扣分后得到当期用户触发预警信号后的最终风险分值,分数越低,风险越大。
[0155]
因此,每结束一个会计年度(会计法规定,会计年度自公历1月1日起至12月31日止),取前3年用户历史数据对用户初始风险分值做重新初始化。对于已无信贷余额的个人用户,预警指标扣分项保留1年,对于尚未结束信贷关系的个人用户,预警指标扣分项保留近3年。
[0156]
本发明实施例中,运用预警信号集实时调整用户风险分值,可以实现动态展示用户风险变化,预警信号集中的指标集数据来源更贴近个人用户日常用信场景。
[0157]
本发明提供的实施例中,在进行用户的风险分值计量时,通过获取到的预设时间段内的所有用户的第一数据集,计算出每个用户的预估月收入值和预估月支出值,并将计算得到的预估月收入值和预估月支出值存入用户对应的第一数据集中,得到包括第一数据集中各个数据以及用户的预估月收入值和预估月支出值的第二数据集,根据用户的第二数据集,计算用户的第一支配金额。根据用户的第二数据集及该用户对应的地方数据集,计算
得到用户的各个偏离系数权重,用户的第一支配金额及该用户的各个偏离系数权重之积为该用户的第二支配金额,用户的第一支配金额、第二支配金额以及第二数据集组成该用户对应的第三数据集,并根据预设的各个第一客群的标准,确定用户对应的第一客群,根据每个第一客群中的用户数据并确定该第一客群对应的历史违约概率;基于各个历史违约概率,运用聚类算法对各个第一客群进行分类,得到至少一个第二客群,并将每个第一客群中的各个用户归类到该第一客群对应的第二客群中;根据每个第二客群对应的逻辑回归模型,计算各个用户的初始风险分值,并根据每个用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
[0158]
应用本发明提供的实施例,通过收集用户各个方面的授权数据信息,以及对多个用户组成的客群的整体进行综合计量,并结合客群的历史违约概率、用户的违约概率以及用户办理的业务对应的扣分值,最终计算得到用户的风险分值,实现多维度对用户存在的风险进行评判,能够更加真实、客观地反映出用户的整体履约情况,从而维护用户信贷安全。
[0159]
上述各个实施例的具体实施过程及其衍生方式,均在本发明的保护范围之内。
[0160]
与图1所述的方法相对应,本发明实施例还提供了一种风险分值计量装置,用于对图1中方法的具体实现,本发明实施例提供的风险分值计量装置可以应用计算机终端或各种移动设备中,其结构示意图如图4所示,具体包括:
[0161]
第一计算单元401,用于获取预设的时间段内的所有用户的第一数据集,并根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值;
[0162]
第二计算单元402,用于将每个所述用户的所述预估月收入值和所述预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额;
[0163]
第一确定单元403,用于获取每个所述用户对应的地方数据集,并根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;
[0164]
第三计算单元404,用于基于每个所述用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;
[0165]
第一分类单元405,用于将每个所述用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;
[0166]
第二分类单元406,用于基于各个所述历史违约概率,运用聚类算法对各个所述第一客群进行分类,得到至少一个第二客群,并将每个所述第一客群中的各个用户归类到该第一客群对应的第二客群中;
[0167]
第四计算单元407,用于确定每个所述第二客群对应的逻辑回归模型,并基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,并根据每个所述用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
[0168]
本发明实施例提供的风险分值计量装置,由第一计算单元获取预设的时间段内的所有用户的第一数据集,并根据各个第一数据集,计算每个用户的预估月收入值和预估月支出值;第二计算单元将每个用户的预估月收入值和预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金
额;第一确定单元获取每个用户对应的地方数据集,并根据每个用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;第三计算单元基于每个用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;第一分类单元将每个用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;第二分类单元基于各个历史违约概率,运用聚类算法对各个第一客群进行分类,得到至少一个第二客群,并将每个第一客群中的各个用户归类到该第一客群对应的第二客群中;第四计算单元确定每个第二客群对应的逻辑回归模型,并基于各个逻辑回归模型,计算所有用户的初始风险分值,并根据每个用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
[0169]
应用本发明实施例提供的装置,通过收集用户各个方面的授权数据信息,以及对多个用户组成的客群的整体进行综合计量,并结合客群的历史违约概率、用户的违约概率以及用户办理的业务对应的扣分值,最终计算得到用户的风险分值,能够实现多维度对用户存在的风险进行评判,更加真实、客观地反映出用户的整体履约情况,从而维护用户信贷安全。
[0170]
本发明实施例提供的装置,可选的,所述第一计算单元401,包括:
[0171]
第一确定子单元,用于确定所述用户对应的初始客群,所述初始客群是按照预先设置的初始分类标准,划分得到的用户的集合;
[0172]
第二确定子单元,用于根据所述初始客群中的各个用户的第一数据集中的月收入信息确定该初始客群对应的收入平均值,并将该收入平均值作为所述用户的第一收入值;
[0173]
第三确定子单元,用于基于所述用户的第一数据集,确定所述用户的第二收入值、第三收入值、第四收入值和第五收入值;
[0174]
第一计算子单元,用于根据预设的各个收入权重系数,计算所述第一收入值、所述第二收入值、所述第三收入值、所述第四收入值、所述第五收入值的加权平均值,并将所述加权平均值确定为所述用户的预估月收入值;
[0175]
第二计算子单元,用于将所述用户的第一数据集中的各个还款金额相加得到所述用户的预估月支出值。
[0176]
本发明实施例提供的装置,可选的,所述各个偏离系数权重包括第一系数权重、第二系数权重和第三系数权重;所述第一确定单元403,包括:
[0177]
第三计算子单元,用于根据所述用户的第二数据集中的预估月收入值以及所述用户对应的各个地方数据集,计算所述用户对应的第一偏离系数,并根据预设的第一对照表,确定所述第一偏离系数对应的第一系数权重;
[0178]
第四计算子单元,用于基于所述用户的第二数据集中的第一用户数据、第二用户数据、预估月收入值及预设的第二偏离系数测算因子表,计算所述用户对应的第二偏离系数,并根据预设的第二对照表,确定所述第二偏离系数对应的第二系数权重;
[0179]
第五计算子单元,用于基于所述用户的第二数据集中的第三用户数据、预估月收入值以及预估月支出值,计算所述用户对应的第三偏离系数,并根据预设的第三对照表,确定所述第三偏离系数对应的第三系数权重。
[0180]
本发明实施例提供的装置,可选的,所述第一分类单元405,包括:
[0181]
第一统计子单元,用于统计所述第一客群中的用户个数;
[0182]
第二统计子单元,用于基于所述第一客群中的各个用户的第三数据集,统计所述第一客群中满足预设的违约条件的各个用户,得到违约用户个数;
[0183]
第四确定子单元,用于根据所述用户个数和违约用户个数,确定所述第一客群对应的历史违约概率。
[0184]
本发明实施例提供的装置,可选的,所述第四计算单元407,包括:
[0185]
第五确定子单元,用于根据每个所述用户的第三数据集,确定所述用户对应的第二客群,并确定所述第二客群对应的逻辑回归模型;
[0186]
第六确定子单元,用于基于所述第三数据集和预设的变量取值表,确定所述逻辑回归模型中各个变量的取值,将各个所述变量的取值代入所述逻辑回归模型,得到所述用户的违约概率;
[0187]
第六计算子单元,用于运用预设的初始风险分值换算公式,将所述违约概率换算为所述用户的初始风险分值。
[0188]
以上本发明实施例公开的风险分值计量装置中各个单元及子单元的具体工作过程,可参见本发明上述实施例公开的风险分值计量方法中的对应内容,这里不再进行赘述。
[0189]
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述风险分值计量方法。
[0190]
本发明实施例还提供了一种电子设备,其结构示意图如图5所示,具体包括存储器501,以及一个或者一个以上的指令502,其中一个或者一个以上指令502存储于存储器501中,且经配置以由一个或者一个以上处理器503执行所述一个或者一个以上指令502进行以下操作:
[0191]
获取预设的时间段内的所有用户的第一数据集,并根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值;
[0192]
将每个所述用户的所述预估月收入值和所述预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额;
[0193]
获取每个所述用户对应的地方数据集,并根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;
[0194]
基于每个所述用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;
[0195]
将每个所述用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;
[0196]
基于各个所述历史违约概率,运用聚类算法对各个所述第一客群进行分类,得到至少一个第二客群,并将每个所述第一客群中的各个用户归类到该第一客群对应的第二客群中;
[0197]
确定每个所述第二客群对应的逻辑回归模型,并基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,并根据每个所述用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。
[0198]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0199]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现。
[0200]
为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0201]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
技术特征:1.一种风险分值计量方法,其特征在于,包括:获取预设的时间段内的所有用户的第一数据集,并根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值;将每个所述用户的所述预估月收入值和所述预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额;获取每个所述用户对应的地方数据集,并根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;基于每个所述用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;将每个所述用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;基于各个所述历史违约概率,运用聚类算法对各个所述第一客群进行分类,得到至少一个第二客群,并将每个所述第一客群中的各个用户归类到该第一客群对应的第二客群中;确定每个所述第二客群对应的逻辑回归模型,并基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,并根据每个所述用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。2.根据权利要求1所述的方法,其特征在于,所述根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值,包括:确定所述用户对应的初始客群,所述初始客群是按照预先设置的初始分类标准,划分得到的用户的集合;根据所述初始客群中的各个用户的第一数据集中的月收入信息确定该初始客群对应的收入平均值,并将该收入平均值作为所述用户的第一收入值;基于所述用户的第一数据集,确定所述用户的第二收入值、第三收入值、第四收入值和第五收入值;根据预设的各个收入权重系数,计算所述第一收入值、所述第二收入值、所述第三收入值、所述第四收入值、所述第五收入值的加权平均值,并将所述加权平均值确定为所述用户的预估月收入值;将所述用户的第一数据集中的各个还款金额相加得到所述用户的预估月支出值。3.根据权利要求1所述的方法,其特征在于,所述各个偏离系数权重包括第一系数权重、第二系数权重和第三系数权重;所述根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重,包括:根据所述用户的第二数据集中的预估月收入值以及所述用户对应的各个地方数据集,计算所述用户对应的第一偏离系数,并根据预设的第一对照表,确定所述第一偏离系数对应的第一系数权重;基于所述用户的第二数据集中的第一用户数据、第二用户数据、预估月收入值及预设的第二偏离系数测算因子表,计算所述用户对应的第二偏离系数,并根据预设的第二对照
表,确定所述第二偏离系数对应的第二系数权重;基于所述用户的第二数据集中的第三用户数据、预估月收入值以及预估月支出值,计算所述用户对应的第三偏离系数,并根据预设的第三对照表,确定所述第三偏离系数对应的第三系数权重。4.根据权利要求1所述的方法,其特征在于,所述确定每个所述第一客群对应的历史违约概率,包括:统计所述第一客群中的用户个数;基于所述第一客群中的各个用户的第三数据集,统计所述第一客群中满足预设的违约条件的各个用户,得到违约用户个数;根据所述用户个数和违约用户个数,确定所述第一客群对应的历史违约概率。5.根据权利要求1所述的方法,其特征在于,所述基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,包括:根据每个所述用户的第三数据集,确定所述用户对应的第二客群,并确定所述第二客群对应的逻辑回归模型;基于所述第三数据集和预设的变量取值表,确定所述逻辑回归模型中各个变量的取值,将各个所述变量的取值代入所述逻辑回归模型,得到所述用户的违约概率;运用预设的初始风险分值换算公式,将所述违约概率换算为所述用户的初始风险分值。6.一种风险分值计量装置,其特征在于,包括:第一计算单元,用于获取预设的时间段内的所有用户的第一数据集,并根据各个所述第一数据集,计算每个所述用户的预估月收入值和预估月支出值;第二计算单元,用于将每个所述用户的所述预估月收入值和所述预估月支出值存储至该用户的第一数据集中,得到该用户的第二数据集,并基于该用户的第二数据集,计算该用户的第一支配金额;第一确定单元,用于获取每个所述用户对应的地方数据集,并根据每个所述用户的第二数据集及该用户对应的地方数据集,确定该用户的各个偏离系数权重;第三计算单元,用于基于每个所述用户的第一支配金额及该用户的各个偏离系数权重,计算该用户的第二支配金额,并将该用户的第一支配金额和第二支配金额存储至该用户的第二数据集中,得到该用户的第三数据集;第一分类单元,用于将每个所述用户归类到与该用户的第三数据集匹配的预设的第一客群中,并确定该第一客群对应的历史违约概率;第二分类单元,用于基于各个所述历史违约概率,运用聚类算法对各个所述第一客群进行分类,得到至少一个第二客群,并将每个所述第一客群中的各个用户归类到该第一客群对应的第二客群中;第四计算单元,用于确定每个所述第二客群对应的逻辑回归模型,并基于各个所述逻辑回归模型,计算所有所述用户的初始风险分值,并根据每个所述用户当前办理的业务对应的扣分值以及该用户的初始风险分值,计算该用户的当期风险分值。7.根据权利要求6所述的装置,其特征在于,所述第一计算单元,包括:第一确定子单元,用于确定所述用户对应的初始客群,所述初始客群是按照预先设置
的初始分类标准,划分得到的用户的集合;第二确定子单元,用于根据所述初始客群中的各个用户的第一数据集中的月收入信息确定该初始客群对应的收入平均值,并将该收入平均值作为所述用户的第一收入值;第三确定子单元,用于基于所述用户的第一数据集,确定所述用户的第二收入值、第三收入值、第四收入值和第五收入值;第一计算子单元,用于根据预设的各个收入权重系数,计算所述第一收入值、所述第二收入值、所述第三收入值、所述第四收入值、所述第五收入值的加权平均值,并将所述加权平均值确定为所述用户的预估月收入值;第二计算子单元,用于将所述用户的第一数据集中的各个还款金额相加得到所述用户的预估月支出值。8.根据权利要求6所述的装置,其特征在于,所述各个偏离系数权重包括第一系数权重、第二系数权重和第三系数权重;所述第一确定单元,包括:第三计算子单元,用于根据所述用户的第二数据集中的预估月收入值以及所述用户对应的各个地方数据集,计算所述用户对应的第一偏离系数,并根据预设的第一对照表,确定所述第一偏离系数对应的第一系数权重;第四计算子单元,用于基于所述用户的第二数据集中的第一用户数据、第二用户数据、预估月收入值及预设的第二偏离系数测算因子表,计算所述用户对应的第二偏离系数,并根据预设的第二对照表,确定所述第二偏离系数对应的第二系数权重;第五计算子单元,用于基于所述用户的第二数据集中的第三用户数据、预估月收入值以及预估月支出值,计算所述用户对应的第三偏离系数,并根据预设的第三对照表,确定所述第三偏离系数对应的第三系数权重。9.根据权利要求6所述的装置,其特征在于,所述第一分类单元,包括:第一统计子单元,用于统计所述第一客群中的用户个数;第二统计子单元,用于基于所述第一客群中的各个用户的第三数据集,统计所述第一客群中满足预设的违约条件的各个用户,得到违约用户个数;第四确定子单元,用于根据所述用户个数和违约用户个数,确定所述第一客群对应的历史违约概率。10.根据权利要求6所述的装置,其特征在于,所述第四计算单元,包括:第五确定子单元,用于根据每个所述用户的第三数据集,确定所述用户对应的第二客群,并确定所述第二客群对应的逻辑回归模型;第六确定子单元,用于基于所述第三数据集和预设的变量取值表,确定所述逻辑回归模型中各个变量的取值,将各个所述变量的取值代入所述逻辑回归模型,得到所述用户的违约概率;第六计算子单元,用于运用预设的初始风险分值换算公式,将所述违约概率换算为所述用户的初始风险分值。
技术总结本发明提供一种风险分值计量方法及装置,包括:根据用户的各个数据以及计算得到的用户的预估月收入值、预估月支出值、第一支配金额和基于各个偏离系数调整后的第二支配金额,将各个用户分别归类到预设的各个第一客群中,并确定每个第一客群的历史违约概率;运用聚类算法基于历史违约概率划分各个第一客群,得到各个第二客群,并将第一客群中的各个用户归类到该第一客群对应的第二客群中;根据第二客群对应的逻辑回归模型,计算用户的初始风险分值,根据用户当前办理的业务对应的扣分值以及用户的初始风险分值,计算用户的当期风险分值。应用该方法,可以实现从多维度对客户进行风险评判,更加客观地反映出客户的风险状况,从而保护客户信贷安全。保护客户信贷安全。保护客户信贷安全。
技术研发人员:沈忱 朱良平 陈伟杰 李文涛 叶冠乔 赵振 黄晓燕 胡海 麦文盛
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:2022.04.08
技术公布日:2022/7/5