2020国赛C思路分析:中小微企业的信贷决策
题目
在实际中,由于中小微企业规模相对较小,也缺少抵押资产,因此银行通常是依据信贷政策、企业的交易票据信息和上下游企业的影响力,向实力强、供求关系稳定的企业提供贷款,并可以对信誉高、信贷风险小的企业给予利率优惠。银行首先根据中小微企业的实力、信誉对其信贷风险做出评估,然后依据信贷风险等因素来确定是否放贷及贷款额度、利率和期限等信贷策略。
某银行对确定要放贷企业的贷款额度为10100万元;年利率为4%15%;贷款期限为1年。附件1~3分别给出了123家有信贷记录企业的相关数据、302家无信贷记录企业的相关数据和贷款利率与客户流失率关系的2019年统计数据。该银行请你们团队根据实际和附件中的数据信息,通过建立数学模型研究对中小微企业的信贷策略,主要解决下列问题:
(1) 对附件1中123家企业的信贷风险进行量化分析,给出该银行在年度信贷总额固定时对这些企业的信贷策略。
(2) 在问题1的基础上,对附件2中302家企业的信贷风险进行量化分析,并给出该银行在年度信贷总额为1亿元时对这些企业的信贷策略。
(3) 企业的生产经营和经济效益可能会受到一些突发因素影响,而且突发因素往往对不同行业、不同类别的企业会有不同的影响。综合考虑附件2中各企业的信贷风险和可能的突发因素(例如:新冠病毒疫情)对各企业的影响,给出该银行在年度信贷总额为1亿元时的信贷调整策略。
附件:
附件1 123家有信贷记录企业的相关数据
附件2 302家无信贷记录企业的相关数据
附件3 银行贷款年利率与客户流失率关系的2019年统计数据
附件中数据说明:
(1) 进项发票:企业进货(购买产品)时销售方为其开具的发票。
(2) 销项发票:企业销售产品时为购货方开具的发票。
(3) 有效发票:为正常的交易活动开具的发票。
(4) 作废发票:在为交易活动开具发票后,因故取消了该项交易,使发票作废。
(5) 负数发票:在为交易活动开具发票后,企业已入账记税,之后购方因故发生退货并退款,此时,需开具的负数发票。
(6) 信誉评级:银行内部根据企业的实际情况人工评定的,银行对信誉评级为D的企业原则上不予放贷。
(7) 客户流失率:因为贷款利率等因素银行失去潜在客户的比率。
第一问
对附件1中123家企业的信贷风险进行量化分析,给出该银行在年度信贷总额固定时对这些企业的信贷策略。
企业信息:
进项发票信息:
销项发票信息:
分析
根据附件一sheet1中的数据建立以是否违约作为目标的信贷风险评估模型。对附件1中各企业的违约概率进行定量求解,即得到各企业的信贷风险。模型的准确度需要表示出来,以展示模型好坏。
基于得到的各企业的信贷违约概率,以一年后的贷款收益最大化、客户流失率最小、客户违约风险最小为目标,考虑银行贷款额度、银行贷款利率、银行客户流失率、银行是否放贷、企业违约概率等约束,建立银行信贷策略的非线性多目标规划模型,最终通过求解模型可以确定银行的最佳信贷策略。
学会根据已知数据,挖掘新的指标出来。
数据预处理
- 对于附件 1 中 sheet1 企业信息表格进行量化分析,将“信誉评级”的 A、B、C、D 四 个等级分别量化为 100、80、60、40。将“是否违约”值量化为 0、1,其中 0 代表企 业有违约情况,1 代表没有违约情况。
- 对于附件 1、2 中的 sheet2 和 sheet3,剔除进项FP信息以及销项FP信息中的无用数据,对其中的负数FP、税额为 0 的FP以及失效FP进行删除。
第二问
在问题1的基础上,对附件2中302家企业的信贷风险进行量化分析,并给出该银行在年度信贷总额为1亿元时对这些企业的信贷策略。
分析
第一问得到的结果可以知道:企业的信誉评级与该企业是否存在违约风险有着高度的正相关关系,因此需要在信贷风险评估之前对各企业进行信誉评级。
以信誉评级为因变量,企业是否违约、企业规模、企业年利润率为自变量,基于问题一的模型对302家无信贷记录的企业的信誉等级进行评级。
然后应用问题一所建立的信贷策略模型,对302家企业进行信贷风险分析,并确定银行针对这302家企业的具体最佳信贷策略,包括银行给各企业的贷款额度、贷款利率,以及银行是否给企业放贷。
第一问做好了,第二问就是很简单,使用训练好的模型直接预测即可,再做一些文字描述分析就好了。
第三问
企业的生产经营和经济效益可能会受到一些突发因素影响,而且突发因素往往对不同行业、不同类别的企业会有不同的影响。综合考虑附件2中各企业的信贷风险和可能的突发因素(例如:新冠病毒疫情)对各企业的影响,给出该银行在年度信贷总额为1亿元时的信贷调整策略。
分析
同样是基于第一问的模型,添加了一些新的约束,可以考虑把企业进行分类 ,注意这里说的就不是已知数据了,因此可以自己去搜集相关数据然后再进行分析。比如:搜集某石油公司的信息(股票代码、股票价格的涨幅等。这里要用到基本的爬虫技术,不然搜集起来是很慢的。
对不同行业的企业数据进行分析(只需要疫情这一年或者两年的信息就好了,不用太多),可视化的查看股票价格变化等。根据它的变化,我们可以得到一个受疫情影响程度的指标:
- 严重
- 受到部分影响(一般)
- 无影响
- 好(不仅不受影响,反而还盈利)
比如:
在原来的基础上增加影响程度指标,重新训练模型,使用模型预测判断是否对其发放贷款。
将本次得到的结果与第二问的结果进行对比,会发现新冠疫情的爆发导致银行的信贷策略更加倾向于XX产业,这可能和此类产业在疫情间的快速发展有关。
方法总结
本赛题主要使用方法:
- 机器学习中的分类预测(本案例使用集成学习更好)
- 多目标规划
- 量化分析
- 基本的特征工程
案例分析到此结束,CSDN/知乎:川川菜鸟
文章来源: chuanchuan.blog.csdn.net,作者:川川菜鸟,版权归原作者所有,如需转载,请联系作者。
原文链接:chuanchuan.blog.csdn.net/article/details/126817247
- 点赞
- 收藏
- 关注作者
评论(0)