Ítem
Acceso Abierto
Prueba de Concepto de Machine Learning para Identificar Empresas Colombianas Próximas a Exportar
Título de la revista
Autores
Sánchez Rojas, Jose Vicente
Escárraga Vargas, Marco Jeisson
Fecha
2025-07-18
Directores
Cruz Castro, Daniel Leonardo
ISSN de la revista
Título del volumen
Editor
Universidad del Rosario
Buscar en:
Métricas alternativas
Resumen
En un entorno jurídico altamente competitivo como el colombiano, donde las firmas líderes en propiedad intelectual enfrentan dificultades para captar nuevos clientes debido a la fidelidad de las empresas a sus proveedores legales, una firma legal con más de 70 años de trayectoria busca fortalecer su estrategia de crecimiento internacional mediante alianzas con firmas extranjeras. Esta estrategia se basa en identificar empresas colombianas con alto potencial de exportación para ofrecerles asesoría legal antes de que consoliden vínculos con firmas competidoras. El proyecto propone una solución analítica predictiva, basada en técnicas avanzadas de machine learning, para anticipar qué empresas, actualmente no exportadoras, iniciarán exportaciones en el siguiente año. Para ello, se construyó una base de datos integrada a partir de fuentes financieras (EMIS) y de comercio exterior (DIAN), aplicando ingeniería de características temporales y un riguroso proceso de limpieza y filtrado de datos. El modelo final se desarrolló mediante una estrategia de ensamblado (stacking) y validación cruzada estratificada, maximizando métricas como el recall y el AUC-PR en un contexto de fuerte desbalance de clases. Los resultados demostraron la viabilidad de identificar señales precursoras de exportación en datos históricos, permitiendo priorizar prospectos con alto potencial de internacionalización. Esta herramienta representa un aporte estratégico para la firma, al permitir la prospección de clientes basada en datos y no solo en intuición o relaciones preexistentes. Además, valida empíricamente una hipótesis inspirada en teorías de internacionalización empresarial y demuestra el valor de la analítica predictiva en contextos jurídicos, tradicionalmente analógicos. En conclusión, esta prueba de concepto sienta las bases para una futura implementación operativa que puede mejorar significativamente la eficiencia comercial y el posicionamiento global de la firma.
Abstract
In a highly competitive legal environment such as Colombia’s, where leading intellectual property (IP) firms face challenges in acquiring new clients due to long-standing loyalty to incumbent legal providers, a law firm with over 70 years of experience seeks to strengthen its international growth strategy through alliances with foreign firms. This strategy is based on identifying Colombian companies with high export potential in order to approach them with legal advisory services before they form partnerships with competing firms. This project proposes a predictive analytical solution based on advanced machine learning techniques to anticipate which companies, currently non-exporters, are likely to begin exporting in the following year. To achieve this, a consolidated database was built using financial information (EMIS) and international trade data (DIAN), applying temporal feature engineering and a rigorous data cleaning and filtering process. The final model was developed using a stacked ensemble learning strategy and stratified cross-validation, maximizing metrics such as recall and AUC-PR in the context of a highly imbalanced classification problem. Results demonstrated the feasibility of detecting pre-export behavioral patterns in historical data, enabling the firm to prioritize high-potential prospects for internationalization. This tool represents a strategic advantage, allowing the firm to shift from intuition-based client acquisition to a data-driven prospecting approach. Furthermore, it empirically validates a hypothesis grounded in internationalization theory and showcases the value of predictive analytics in traditionally analog legal sectors. In conclusion, this proof of concept lays the groundwork for future operational implementation that could significantly improve the firm’s commercial efficiency and global positioning.
Palabras clave
Machine Learning , Exportación , Propiedad Intelectual , Modelo Predictivo , Captación de Clientes , Analítica de Negocios , Internacionalización Empresarial
Keywords
Machine Learning , Exportation , Intellectual Property , Predictive Model , Client Acquisition , Business Analytics , Business internationalization




