CompartidoEl 23/11/22 por Comillas
Trabajo fin de grado

Explicación y predicción del Default en créditos, con la implementación de modelos de Machine Learning

tipo de documento semantico ckh_publication

Ficheros

Resumen Trabajo Fin de Grado
TFG - Lopez Blanco, Luis Ramiro.pdf
Tamaño 1108029
Formato Adobe PDF
Fecha de publicación 00/00/2022
Director/Coordinador
Coronado Vaca, María
Autor
López Blanco, Luis Ramiro

Resumen

Idioma es-ES
Resumen

Este trabajo analiza los datos de la Base de Datos de Lending Club, una plataforma de créditos localizada en Estados Unidos. A través de estos datos, este trabajo analiza las cualidades de los prestatarios que pueden llegar a provocar un Default en dichos créditos. Para ello, se lleva a cabo un análisis exploratorio de los datos, analizando todas las variables y sus diferentes valores según las observaciones que pertenecen a cada clase de la variable target. Además, usamos ciertos modelos con capacidad explicativa con la finalidad de averiguar cuales son las variables que más influyen y cuales no debemos tener tan en cuenta. Comprobamos, que de las numerosas variables que teníamos en un principio, tan solo unas 7 de ellas son verdaderamente relevantes y describen las cualidades de las personas con mayor probabilidad de generar un Default (int_rate, emp_length, dti, inq_last_6mths, Prestamo_Largo, mths_since_last_delinq y RENT).
Por otra parte, haciendo uso de distintos algoritmos de Machine Learning, intentamos generar y entrenar modelos que tengan capacidad predictiva a la hora de saber en qué créditos se podría dar un Default. Usamos modelos de Logistic Regression, KNN, Decision Tree Classifier, Random Forest Classifier, e incluso AutoML. Este último modelo usa internamente la optimización bayesiana de hiperparámetros, lo cual también explicamos dentro de este trabajo.

Idioma en-GB
Resumen

In this project, we will analyze data from the source Lending Club, a platform that gives loans and is settled in the United States. With this data, we will analyze the main and most important characteristics of borrowers that might lead to causing a Default in said loans. To do this, we will carry out an exploratory analysis of the data, considering all the variables and their different values when the observations are split according to the target variable. Additionally, we will use models that have an explicative capacity in order to see which variables are the most influential, and which are not worth it to take into account. As an outcome, we discover that, of all the variables that we had in the beginning, only 7 of them are actually relevant and describe the qualities of a person with higher probability of causing Default (int_rate, emp_length, dti, inq_last_6mths, Prestamo_Largo, mths_since_last_delinq y RENT).
The other part of the project is to generate and train models that might have a predictive capacity when it comes to classifying between Defaults and non-Defaults. For this, we will use different kinds of Machine Learning models: Logistic Regression, KNN, Decision Tree Classifier, Random Forest Classifier and AutoML. This last one model uses, internally, Bayesian optimization of hiperparametres, which is also explained in this project.

Titulación/Programa
Grado en Análisis de Negocios/Business Analytics y Grado en Derecho
Centro
Facultad de Ciencias Económicas y Empresariales

Palabras clave

Tipo de archivo application/pdf
Idioma es-ES
Tipo de acceso info:eu-repo/semantics/closedAccess
Licencia http://creativecommons.org/licenses/by-nc-nd/3.0/us/
Fecha de modificacion 08/02/2023
Fecha de disponibilidad 22/06/2021
fecha de alta 22/06/2021

Shared with: