Por favor, use este identificador para citar o enlazar este ítem:
http://bibdigital.epn.edu.ec/handle/15000/25702
Título: | Evaluación de modelos de machine learning aplicados al cálculo de pérdidas esperadas en entidades de microfinanzas. |
Autor: | Sangacha Ávila, Rene Alejandro |
Palabras clave: | MATEMÁTICAS MODELOS DE CRÉDITO REGRESIÓN LOGÍSTICA BOSQUE ALEATORIO AUMENTO DE GRADIENTE EXTREMO TABLAS DE RENDIMIENTO PÉRDIDA ESPERADA |
Fecha de publicación: | 27-may-2024 |
Editorial: | Quito : EPN, 2024. |
Citación: | Sangacha Ávila, R.A.(2024). Evaluación de modelos de machine learning aplicados al cálculo de pérdidas esperadas en entidades de microfinanzas. 100 páginas. Quito : EPN, 2024. |
Resumen: | The project aims to compare the effect of non-parametric machine learning models against the traditional methodology of logistic regression, to estimate the expected losses of a credit portfolio of an Ecuadorian financial institution. The trained Credit Scoring models were: Logistic Regression (RGL), Random Forest (RF), and Extreme Gradient Boosting (XGB), which estimate the probabilities of being a defaulter, considering individuals with 61 or more days past due in the performance window, based on Roll-Rate analysis results. Due to the imbalance of GOOD/BAD categories, it was necessary to rebalance the sample in order to better capture the characteristics predominant in bad payers. Considering that the project had a total of 805 variables, it was necessary to employ divergence measures to select the variables to be included in the models. The Kolmogorov-Smirnov (KS) test was used for quantitative variables, and the Value of Information (VI) test for qualitative variables, seeking diversity of information and a more accurate representation of the financial reality. The three trained models have good performance metrics, both in discrimination power and predictive stability, as evidenced in the performance tables obtained. According to the validation results, the model with the best performance metrics turned out to be the traditional methodology, followed by XGB. For the calculation of expected losses, the basic approach according to Basel II was used, meaning the loss severity was taken as 45\%. Based on the validation results, the model that reduced provisioning was XGB, indicating that an average of 3.51\% of the portfolio should be provisioned monthly. |
Descripción: | El proyecto busca comparar el efecto de los modelos de machine learning no paramétricos frente a la metodología tradicional de regresión logística, para estimar las pérdidas esperadas de una cartera de crédito de una institución financiera ecuatoriana. Los modelos de Credit Scoring entrenados fueron: Regresión Logística (RGL), Random Forest (RF) y Extreme Gradient Boosting (XGB), los cuales estiman las probabilidades de ser mal pagador, considerando como tales a las personas con 61 o más días de vencimiento en la ventana de desempeño, según los resultados del análisis de Roll-Rate. Debido al desbalance de categorías BUENO/MALO, fue necesario rebalancear la muestra con la finalidad de capturar de mejor manera las características que predominan en los malos pagadores. Considerando que para el desarrollo del proyecto se contó con un total de 805 variables, fue necesario emplear medidas de divergencia que permitan seleccionar las variables a ingresar en los modelos. Se utilizaron el test de Kolmogorov-Smirnov (KS) para variables cuantitativas y el test de Valor de Información (VI) para variables cualitativas, buscando diversidad de la información y una representación más precisa de la realidad financiera. Los tres modelos entrenados tienen buenas métricas de rendimiento, tanto en poder de discriminación como en estabilidad predictiva, lo que se evidencia en las tablas performance obtenidas. Por los resultados de validación, el modelo con las mejores métricas de rendimiento resultó ser la metodología tradicional, seguido del XGB. Para el cálculo de las pérdidas esperadas, se utilizó el enfoque básico según Basilea II, es decir, se tomó la severidad de pérdida igual al 45\%. En base a los resultados de validación, el modelo que redujo el aprovisionamiento fue XGB, indicando que se debe aprovisionar en promedio el 3.51\% de la cartera mensualmente. |
URI: | http://bibdigital.epn.edu.ec/handle/15000/25702 |
Tipo: | bachelorThesis |
Aparece en las colecciones: | TIC - Ingeniería Matemática Aplicada |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
CD 14334.pdf | 3,3 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.