Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/25942
Title: Optimización del proceso de cobro en la gestión del riesgo de créditos masivos. Una comparación de técnicas de aprendizaje automático para predecir la probabilidad de pago en distintas fases de la morosidad.
Authors: Carrera Sánchez, Andrés Sebastián
Director: Benalcázar Palacios, Marco Enrique
Keywords: ORDENADOR
REDES NEURONALES ARTIFICIALES
REGRESIÓN LOGÍSTICA
RIESGO DE CRÉDITO
SCORING CREDITICIO
Issue Date: Jun-2024
Publisher: Quito : EPN, 2024.
Citation: Carrera Sánchez, A.S. (2024). Optimización del proceso de cobro en la gestión del riesgo de créditos masivos. Una comparación de técnicas de aprendizaje automático para predecir la probabilidad de pago en distintas fases de la morosidad. 74 páginas. Quito : EPN.
Abstract: In the field of credit risk, scoring models based on logistic regression have been developed to optimize the assessment of default risk. However, these models require complex feature engineering and their accuracy suffers as delinquency progresses. This study proposes the use of machine learning techniques (XGBoost and Artificial Neural Networks) to generate scores in different delinquency segments (No Arrears, 1-30 Arrears Segment, 31-90 Arrears Segment, and All Segments). The Kolmogorov-Smirnov (KS) metric is used to assess the efficiency and predictive power of the models. To ensure the accuracy and reliability of the models, a five-step methodology is employed. It starts with the formulation of the problem, followed by the selection of a data sample and definition of the target variable, then a descriptive analysis of the data is performed to facilitate cleaning. Subsequently, the models are trained and tested, and finally, the results are analyzed and the models obtained are interpreted. The results show that both XGBoost and Artificial Neural Networks outperform logistic regression in most of the arrears segments. In the No Delinquency segment, XGBoost (63.36%) and ANN (61.84%) outperform LR (56.42%). In the 1-30 days segment, XGBoost (51.38%) and ANN (50.35%) also outperform LR (47.32%). In the 31-90 days segment, ANN (38.77%) outperforms LR (36.62%), but not XGBoost (34.47%). Finally, in the all-segments model, both XGBoost (74.05%) and ANN (73.59%) outperform LR (71.01%)
Description: En el ámbito del riesgo crediticio, se han desarrollado modelos de scoring basados en regresión logística para optimizar la evaluación del riesgo de incumplimiento. Sin embargo, estos modelos requieren ingeniería de características compleja y su precisión se ve afectada a medida que avanza la morosidad. Este estudio propone el uso de técnicas de aprendizaje automático (XGBoost y Redes Neuronales Artificiales) para generar scores en diferentes segmentos de mora (Sin Mora, 1-30 días, 31-90 días y todos los segmentos). Se utiliza la métrica Kolmogorov-Smirnov (KS) para evaluar la eficiencia y el poder predictivo de los modelos. Para garantizar la precisión y fiabilidad de los modelos, se emplea una metodología de cinco pasos. Comienza con la formulación del problema, seguida de la selección de una muestra de datos y definición de la variable objetivo, luego se realiza un análisis descriptivo de los datos para facilitar la limpieza. Posteriormente, se entrenan y prueban los modelos, y finalmente, se analizan los resultados y se interpretanlos modelos obtenidos. Los resultados muestran que tanto XGBoost como las Redes Neuronales Artificiales superan a la regresión logística en la mayoría de los segmentos de mora. En el segmento Sin Mora, XGBoost (63,36%) y ANN (61,84%) superan a LR (56,42%). En el segmento 1-30 días, XGBoost (51,38%) y ANN (50,35%) también superan a LR (47,32%). En el segmento 31-90 días, ANN (38,77%) supera a LR (36,62%), pero no a XGBoost (34,47%). Finalmente, en el modelo de todos los segmentos, tanto XGBoost (74,05%) como ANN (73,59%) superan a LR (71,01%).
URI: http://bibdigital.epn.edu.ec/handle/15000/25942
Type: masterThesis
Appears in Collections:Maestría en Computación Mención en Sistemas Inteligentes

Files in This Item:
File Description SizeFormat 
CD 14844.pdf922,06 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.