Metodología para le estimación robusta de la pérdida esperada en crédito de consumo mediante datos sintéticos y algoritmos de aprendizaje automático

Barriga Barrantes, Carlos Daniel

doi:https://doi.org/10.48713/10336_47642

Ítem

Embargo

Metodología para le estimación robusta de la pérdida esperada en crédito de consumo mediante datos sintéticos y algoritmos de aprendizaje automático

https://repository.urosario.edu.co/handle/10336/47642
https://doi.org/10.48713/10336_47642

Autores

Barriga Barrantes, Carlos Daniel

Fecha

2026-02-23

Directores

Seijas Ruiz, Luis Eduardo

Editor

Universidad del Rosario

Export Format:

Buscar en:

Métricas alternativas

Resumen

El presente proyecto aborda la optimización de la gestión del riesgo de crédito en instituciones financieras, enfrentando los desafíos críticos de la privacidad de la información y el desbalance de clases inherente a los portafolios de consumo. La metodología desarrollada implementa una arquitectura de Redes Generativas Antagónicas tipo WGAN-GP (Wasserstein GAN con Penalización de Gradiente) para generar un portafolio de datos sintéticos tabulares de alta fidelidad. Este enfoque permitió replicar exitosamente la estructura estadística multivariada y las correlaciones de los datos reales sin exponer información sensible, validando su calidad mediante pruebas de bondad de ajuste y consistencia estructural. Sobre este entorno de datos sintéticos y balanceados, se evaluó el desempeño predictivo de tres modelos de clasificación: Regresión Logística Multinomial, Redes Neuronales Artificiales (MLP) y XGBoost. Los resultados demostraron la clara superioridad de los algoritmos no lineales sobre los métodos tradicionales. Específicamente, el modelo XGBoost presentó el mejor rendimiento en términos de discriminación global y sensibilidad para la detección de la clase de "Pérdida". Adicionalmente, se evidenció que la incorporación de variables de memoria temporal incrementa la capacidad discriminatoria del modelo a niveles de precisión casi perfecta. La investigación concluye con la materialización de estos hallazgos en una herramienta computacional para el cálculo de la Pérdida Esperada (PE) y la simulación de escenarios de estrés, proporcionando una solución robusta para la toma de decisiones financieras bajo un esquema de privacidad garantizada.

Abstract

This project addresses the optimization of credit risk management in financial institutions, tackling the critical challenges of data privacy and class imbalance inherent in consumer portfolios. The developed methodology implements a WGAN-GP (Wasserstein GAN with Gradient Penalty) architecture to generate a high-fidelity synthetic tabular data portfolio. This approach successfully replicated the multivariate statistical structure and correlations of real data without exposing sensitive information, validating its quality through goodness-of-fit and structural consistency tests. Using this synthetic and balanced data environment, the predictive performance of three classification models was evaluated: Multinomial Logistic Regression, Artificial Neural Networks (MLP), and XGBoost. The results demonstrated the clear superiority of non-linear algorithms over traditional methods. Specifically, the XGBoost model presented the best performance in terms of global discrimination and sensitivity for the detection of the "Lossçlass. Additionally, incorporating temporal memory variables was shown to increase the model’s discriminatory capacity to near-perfect precision levels. The research concludes by materializing these findings into a computational tool for calculating Expected Loss (EL) and simulating stress scenarios, providing a robust solution for financial decision-making under a guaranteed privacy framework.

Palabras clave

Pérdida esperada , Aprendizaje automático , Redes neuronales , Redes neuronales generativas adversarias

Keywords

Expected loss , Machine learning , Neural networks , Generative adversarial networks

Colecciones

Maestría en Matemáticas Aplicadas y Ciencias de la Computación

Mostrar el registro completo de la publicación

Metodología para le estimación robusta de la pérdida esperada en crédito de consumo mediante datos sintéticos y algoritmos de aprendizaje automático

Título de la revista

Autores

Fecha

Directores

ISSN de la revista

Título del volumen

Editor

Buscar en:

Métricas alternativas

Resumen

Abstract

Palabras clave

Keywords

Buscar en:

Enlace a la fuente

Enlaces relacionados

Set de datos

Colecciones

Políticas

Portales

Gestionado por

Enlaces directos

Nuestros programas

Servicios académicos

Protección de datos

Comprometidos
con la calidad