Ítem
Acceso Abierto

Predicting Politicians’ Misconduct: Evidence from Colombia

Título de la revista
Autores
Gallego Durán, Jorge Andrés
Prem, Mounu
Vargas Duque, Juan Fernando

Fecha
2022

Directores

ISSN de la revista
Título del volumen
Editor
Universidad del Rosario

Buscar en:

Métricas alternativas

Resumen
La corrupción tiene efectos generalizados en el desarrollo económico y el bienestar de la población. A pesar de ser crucial y necesario, combatir la corrupción no es una tarea fácil porque es un fenómeno difícil de medir y detectar. Sin embargo, los avances recientes en el campo de la inteligencia artificial pueden ayudar en esta búsqueda. En este artículo, proponemos el uso de modelos de aprendizaje automático para predecir la corrupción a nivel municipal en un país en desarrollo. Usando datos de procesos disciplinarios llevados a cabo por una agencia anticorrupción en Colombia, entrenamos cuatro modelos canónicos (Random Forests, Gradient Boosting Machine, Lasso y Neural Networks) y ensamblamos sus predicciones para predecir si un alcalde cometerá o no actos. de corrupción Nuestros modelos logran niveles aceptables de desempeño, basados ​​en métricas como la precisión y el área bajo la curva ROC, lo que demuestra que estas herramientas son útiles para predecir dónde es más probable que ocurra un mal comportamiento. Además, nuestro análisis de la importancia de las características nos muestra qué grupos de variables son más importantes para predecir la corrupción.
Abstract
Corruption has pervasive effects on economic development and the well-being of the population. Despite being crucial and necessary, fighting corruption is not an easy task because it is a difficult phenomenon to measure and detect. However, recent advances in the field of artificial intelligence may help in this quest. In this article, we propose the use of machine learning models to predict municipality-level corruption in a developing country. Using data from disciplinary prosecutions conducted by an anti-corruption agency in Colombia, we trained four canonical models (Random Forests, Gradient Boosting Machine, Lasso, and Neural Networks), and ensemble their predictions, to predict whether or not a mayor will commit acts of corruption. Our models achieve acceptable levels of performance, based on metrics such as the precision and the area under the ROC curve, demonstrating that these tools are useful in predicting where misbehavior is most likely to occur. Moreover, our feature-importance analysis shows us which groups of variables are most important upon predicting corruption.
Palabras clave
Predicción en Colombia , Corrupción en Colombia , Desarrollo económico
Keywords
Prediction in Colombia , Corruption in Colombia , Machine learning , Economic development
Buscar en: