PublicadoEl 30/11/22 por Comillas
Trabajo fin de grado

Reducción del churn a través de modelos predictivos

tipo de documento semantico ckh_publication

Ficheros

Resumen Trabajo Fin de Grado
TFG-Romero-CamachoBaselga,Carlos.pdf
Tamaño 1827474
Formato Adobe PDF
Resumen Autorización
AnexoI_I.pdf
Tamaño 83215
Formato Adobe PDF
Fecha de publicación 00/00/2019
Director/Coordinador
Caro Carretero, Raquel

Resumen

Idioma es-ES
Resumen

La variable "Churn" , es una variable descriptiva registrada por las compañías de teléfono, caracterizada por indicar la marcha o no de un determinado cliente. Este tipo de sucesos, registran un problema basado en la predicción de situaciones anómalas, que se ven representadas en forma de muestras desequilibradas, en las que la situación a predecir compone menos de un 10% total de la muestra.
Este tipo de problemas necesitan de una reorientación de los datos de tal manera que los modelos a entrenar sean capaces de predecir el suceso anómalo. Para ello será necesario equilibrar la muestra de datos con el objetivo de obtener otra muestra de clase a predecir equilibrada. En este proyecto se plantearán dos técnicas para cumplir con este objetivo, el de equilibrar el set de datos, una basada en la aplicación del oversampling combinada con la aplicación de una técnica conocida como SMOTE, y la segunda, basada en una combinación del subsampling y undersampling, por el que se obtendrá un ensamble de submuestras de clase a predecir equilibrada, donde la predicción global se realizará mediante un sistema de voto.
Como complemento, se creará un ensamble de distintos estimadores a aplicar, que en función del número de estimadores introducidos en el ensamble y de los estimadores que se traten, se obtendrá un balance entre precisión y predicción de marcha de cliente. Se entrenará dicho ensamble, en base a numerosas combinaciones de estimadores, obteniendo un resultado distinto cada combinación. Hecho que permite dar al usuario flexibilidad a la hora de decidir el balance entre precisión y predicción de marcha de cliente para cada momento, en función del set de estimadores introducidos en él ensamble.

Idioma en-GB
Resumen

The variable "Churn", is a descriptive variable registered by telephone companies, characterized by indicating the stay or not of a particular customer. This type of events, register a problem based on the prediction of anomalous situations, which are represented in the form of unbalanced samples, in which the situation to predict is less than 10% of the total sample.
This type of problem requires a reorientation of the data in such a way that the models to be trained are capable of predicting the anomalous event. To do this it will be necessary to balance the sample of data with the objective of obtaining another sample of class to predict balanced. In this project, two techniques will be proposed to meet this objective, balancing the data set, one based on the application of oversampling combined with the application of a technique known as SMOTE, and the second, based on a combination of subsampling and undersampling, by which an ensemble of subsamples of balanced predictable class will be obtained, where the overall prediction will be made by means of a voting system.
As a complement, an assembly of different estimators to be applied will be created, which, depending on the number of estimators introduced in the assembly and the estimators being treated, will obtain a balance between precision and prediction of a client's departure. This ensemble will be trained, based on numerous combinations of estimators, obtaining a different result for each combination. This fact gives the user flexibility when deciding the balance between precision and prediction of a customer leaving for each moment, depending on the set of estimators introduced in the ensemble.

Centro
Escuela Técnica Superior de Ingeniería (ICAI)

Palabras clave

Tipo de archivo application/pdf
Idioma en-GB
Tipo de acceso info:eu-repo/semantics/closedAccess
Licencia http://creativecommons.org/licenses/by-nc-nd/3.0/us/
Fecha de modificacion 25/03/2020
Fecha de disponibilidad 29/01/2019
fecha de alta 29/01/2019

Categories:

Shared with: