热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

风控必备的评分卡模型,TempoAI10分钟搞定

8月20日,央行发布了《2020年第二季度支付体系运行总体情况》,数据显示,截至第二季度末,信用卡逾期半年未偿信贷总额838.84亿元,占信用卡应偿信贷余额的1.17%。与一季度相比,信用卡逾期总额出

8月20日,央行发布了《2020年第二季度支付体系运行总体情况》,数据显示,截至第二季度末,信用卡逾期半年未偿信贷总额838.84亿元,占信用卡应偿信贷余额的1.17%。与一季度相比,信用卡逾期总额出现小幅下滑,这与银行在二季度采取严格的风控措施有关。为了应对信用卡带来的大规模逾期,多家银行在二季度开始加大信用卡整顿力度,而评分卡模型正是银行最常见的金融风控工具之一。

金融风控

什么是评分卡模型
评分卡模型又叫做信用评分卡模型,最早由美国信用评分巨头FICO公司于20世纪60年代推出,在信用风险评估以及金融风险控制领域中广泛使用。银行利用评分卡模型对客户的信用历史数据的多个特征进行打分,得到不同等级的信用评分,从而判断客户的优质程度,据此决定是否准予授信以及授信的额度和利率。
FICO公司评分卡

传统的信贷风控主要靠资深从业人员依靠自身的经验设置的专家规则,相较而言,评分卡模型的使用具有很明显的优点。
首先,判断快速。系统只需要按照评分卡逐项打分,最后通过相应的公式计算出总分,即可准确判断出是否为客户授信以及额度和利率;
其次,客观透明。评分卡模型的标准是统一的,无论是客户还是风险审核人员,都可以通过评分卡一眼看出评分结果和评判依据;
最后,应用范围广。由于评分卡的评分项是客观计算,其得出的分数具有广泛的参考性和适用性。例如,生活中常见的支付宝芝麻信用分,就是依据评分卡模型计算得出。
在这里插入图片描述

评分卡模型建模过程复杂且耗时
随着信贷业务规模不断扩大,客户行为的数据呈现出爆炸式的增长,金融机构对风控工作的要求也逐渐提升,评分卡模型也变得越来越复杂。金融机构需要耗费更多的精力与时间去升级和维护评分卡模型以满足风险控制的需求。
在传统的评分卡模型建模过程中,金融机构的IT算法人员需要与业务人员进行沟通,算法人员了解业务之后,通过编写代码来实现数据获取、数据预处理、变量筛选、算法实现、模型开发评估、评分转换等一系列流程,不断验证准确度,优化参数,最终生成评分卡模型。
评分卡建模流程

评分卡模型构建流程

数据认知:基于实际业务场景理解数据内容,发现数据与研究问题的关系。
数据处理:对原始数据进行处理,包括不同数据源间的数据合并、数据规整化处理、缺失值处理等环节。
特征选择:利用特征选择方法,筛选出预测能力强的有效特征,合理降低特征总维度。
特征分箱:对特征自变量进行离散化分箱处理。
WOE转换:特征分箱处理后,将变量进行WOE编码转换。
模型建立:结合样本数据建立模型及模型参数输出过程。
模型评估:利用评估指标对模型效果进行评价。
评分转换:将模型概率转换为直观评分以及生成评分卡。

10分钟搞定评分卡模型建模
TempoAI 的金融板块包含了评分卡和PSI(Population Stability Index)指标计算两大算子,在建立评分卡模型时,只需将平台封装好的相关算子拖入建模流程中,无需编写代码,就能轻松、快速完成模型的建立,解决了金融机构在评分卡模型构建中难度大、周期长的问题。

TempoAI建模流程

评分卡模型构建流程
第一步:导入数据。使用数据管理下的数据输入节点读取评分卡数据集,包括客户的基本信息、账户属性、消费行为、还款行为等。
TempoAI导入数据

数据导入页面
第二步:数据过滤。选择数据过滤节点,进行条件设置,去除掉、缺失值以及异常值数据,完成行数据的过滤和筛选。
数据过滤

数据过滤设置页面
第三步:WOE编码。选择WOE(Weight of Evidence)编码节点对数值型字段进行分箱编码处理,根据违约与正常客户的比例计算不同字段区间的WOE值,根据WOE值计算每个字段IV值,根据IV值选择比较重要的字段参与建模。
WOE编码页面

WOE编码页面
第四步:逻辑回归分类算法。选择逻辑回归分类算法,设置自变量为WOE编码后的字段进行建模。
逻辑回归分类算法

逻辑回归分类算法
第五步:评分卡。选择评分卡节点,读取WOE模型、分类模型和数据集,得到客户的评分。
评分卡节点配置界面

评分卡节点配置界面
第五步:PSI指标计算。通过计算实际数据集和期望数据集不同得分区间的样本比例,根据PSI值的大小判断模型的稳定性和变量的稳定性,从而判断该变量是否需要加入模型,以及模型是否需要更新。
PSI指标计算配置界面

PSI指标计算配置界面

至此,评分卡模型的整个建模过程就完成了。

Tempo人工智能平台

评分卡模型的算法原理虽然不是特别复杂,但在风控领域中有着不可替代的地位。随着消费金融领域的不断扩展,不仅银行,越来越多的金融机构,尤其是小额信贷企业也开始利用评分卡模型完善风控制度。
在过去,评分卡模型建模技术一直掌握在大型金融机构的少数人手里。TempoAI通过内置专门的金融分析算法,封装WOE编码以及评分卡、PSI指标计算等算法,将评分卡模型建模时间从1-2个月缩短到了数小时,有经验的IT人员10分钟即可完成整个建模过程,不仅大幅提升了建模的工作效率,而且图形化、拖拽式的建模方式对人员的技术要求大大下降,不再需要经过专业训练的数据科学家,普通的业务人员也能够独立完成评分卡模型的构建,直接进行风控决策。

TempoAI始终秉持“智能、互动、增值”的设计理念,为企业级用户提供自助式、自动化、智能化的分析模型构建服务,完整的覆盖数据接入、模型构建、流程洞察、成果部署等数据价值发现全过程,支持9大类分析场景算法、120+种分布式算法、5种独创算法、5种深度学习算法及4种以上集成学习算法,帮助500+行业头部企业实现1300+AI场景应用落地,涵盖能源、制造、金融、教育、政务、通信、零售等多个领域,解决企业AI落地难题,促进企业“全民数据科学家”的数据运营文化建设。


版权声明:本文为qq_42963448原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/qq_42963448/article/details/108680830
推荐阅读
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • SpringBoot整合SpringSecurity+JWT实现单点登录
    SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 2021最新总结网易/腾讯/CVTE/字节面经分享(附答案解析)
    本文分享作者在2021年面试网易、腾讯、CVTE和字节等大型互联网企业的经历和问题,包括稳定性设计、数据库优化、分布式锁的设计等内容。同时提供了大厂最新面试真题笔记,并附带答案解析。 ... [详细]
  • 本文总结了初学者在使用dubbo设计架构过程中遇到的问题,并提供了相应的解决方法。问题包括传输字节流限制、分布式事务、序列化、多点部署、zk端口冲突、服务失败请求3次机制以及启动时检查。通过解决这些问题,初学者能够更好地理解和应用dubbo设计架构。 ... [详细]
  • 云原生应用最佳开发实践之十二原则(12factor)
    目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]
  • 像跟踪分布式服务调用那样跟踪Go函数调用链 | Gopher Daily (2020.12.07) ʕ◔ϖ◔ʔ
    每日一谚:“Acacheisjustamemoryleakyouhaven’tmetyet.”—Mr.RogersGo技术专栏“改善Go语⾔编程质量的50个有效实践” ... [详细]
  • 本文介绍了闭包的定义和运转机制,重点解释了闭包如何能够接触外部函数的作用域中的变量。通过词法作用域的查找规则,闭包可以访问外部函数的作用域。同时还提到了闭包的作用和影响。 ... [详细]
  • ejava,刘聪dejava
    本文目录一览:1、什么是Java?2、java ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
author-avatar
钟钟来了_960
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有