Maestría en Matemáticas Aplicadas y Ciencias de la Computación
URI permanente para esta colección
Examinar
Envíos recientes
- ÍtemAcceso AbiertoArquitectura de protección de privacidad de datos para modelos de lenguaje de gran tamaño (LLM) usando chatgpt(2025-04-03) Bonilla Beltrán, Sofia Luisa Carolina; Ocampo Candela, Danna Natalia; Wightman Rojas, Pedro Mario; Díaz López, Daniel OrlandoEl presente trabajo surge de la necesidad de fortalecer la privacidad en los modelos de lenguaje de gran tamaño (LLMs) como ChatGPT, Google Gemini y XLNet, los cuales presentan vulnerabilidades que pueden comprometer datos sensibles. A pesar de los avances en inteligencia artificial, la seguridad y privacidad de la información en estos modelos aún presentan desafíos, especialmente en la protección contra filtraciones de datos y accesos no autorizados. Esta investigación tiene como objetivo diseñar e implementar una arquitectura de protección de privacidad que mitigue riesgos tanto en la entrada como en la salida de los LLMs. Para ello, se abordan mecanismos para identificar y ofuscar datos sensibles en distintos tipos de información, incluyendo texto e imágenes, garantizando así la confidencialidad del usuario en todas las etapas de la comunicación con el modelo. El proyecto se estructura en tres etapas. La primera etapa consiste en un análisis ofensivo,demostrando las vulnerabilidades existentes en los modelos de lenguaje y cómo pueden ser explotadas para extraer información privada. En la segunda fase, se desarrolla una arquitectura de seguridad que emplea técnicas avanzadas de anonimización, protegiendo los datos sensibles antes de ser procesados por el modelo y controlando la información generada en sus respuestas. Finalmente, la tercera etapa evalúa el desempeño de la arquitectura mediante pruebas experimentales, asegurando que la implementación no afecte la precisión ni la utilidad del modelo, pero sí refuerce la protección de los datos. Los resultados de este proyecto permiten establecer nuevas estrategias de seguridad en LLMs, contribuyendo al desarrollo de modelos más confiables y con mejores garantías de privacidad para los usuarios.
- ÍtemDesconocidoDeterminación de eventos adversos prevenibles en la gestión del riesgo asistencial de una institución hospitalaria(2025-02-17) Soba Loaiza, José David; Roldan Jimenéz, Diego GerardoEste proyecto busca automatizar la clasificación de eventos adversos como prevenibles o no prevenibles en una institución hospitalaria colombiana mediante técnicas de procesamiento de lenguaje natural y aprendizaje automático. Se analizaron 418 reportes que incluyen variables categóricas y descripciones textuales, estas últimas representadas mediante enfoques estáticos y dinámicos. Los clasificadores evaluados incluyeron modelos lineales y basados en árboles de decisión, aplicados tanto a las variables categóricas como a las representaciones textuales. Los resultados obtenidos abordan de manera efectiva la necesidad de automatizar la clasificación de estos eventos adversos en la búsqueda de mejorar su evaluación y monitoreo, alineándose con las mejores prácticas en seguridad del paciente.
- ÍtemAcceso AbiertoInteligencia artificial en el monitoreo de la contración pública en salud(2024-12-12) Salazar Mejía, Andrés Sebastián; Gallego Durán, Jorge AndrésEl sector salud en Colombia enfrenta grandes desafíos relacionados con la adecuada gestión de los recursos en los procesos de contratación, necesarios para el funcionamiento del sistema. La contratación pública es el aspecto más susceptible al despilfarro en Colombia, relacionado con altas ineficiencias, que son más frecuentes y pueden comprometer mayores recursos. A esto se suma un aumento de la participación del Estado y la cantidad de contratos públicos debido a posibles reformas. Este trabajo propone una metodología basada en aprendizaje de máquinas para predicción temprana de ineficiencias en los contratos del sector salud, usando como medida el número de adiciones en valor (sobrecostos) reportadas en la plataforma de contratación del Estado. Además, introduce a la literatura de contratación pública el uso de modelos de regresión y la incorporación de ensambles de modelos de detección de anomalías. Entre los principales hallazgos destacan los métodos basados en árboles como los de mejor desempeño, especialmente Random Forest, con un RMSE de prueba menor a 0,7. El estudio también identifica el tamaño del contrato, en valor y duración, las condiciones de entrega y el presupuesto de las entidades como características valiosas para la formulación de políticas públicas; y muestra que la incorporación de medidas de detección de anomalías mejora la comprensión de las ineficiencias. Adicionalmente, se encuentra la medida de ineficiencias propuesta superior a la usada en la literatura para la priorización de la investigación de contratos por parte de las entidades de control, con un 𝑀𝐴𝑃1000 de 1. Esta metodología permitirá mejorar el cuidado de los recursos del sistema de salud colombiano por medio de una eficaz intervención por parte de las entidades de control.
- ÍtemAcceso AbiertoSistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza(2024-05-25) Lizarazo Malambo, William; Morales Pinto, Yiby Karolina; Matemáticas Aplicadas y Computación - MACCLa Ley 906 de 2004 otorga a los fiscales la facultad para interceptar comunicaciones, bajo el cumplimiento de los requisitos legales. Esta herramienta, clave en investigaciones penales, enfrenta desafíos crecientes debido a la adopción de las tecnologías de comunicación encriptada y el alto volumen de datos. En este contexto, surge la necesidad de implementar nuevas metodologías de an´alisis de datos que incrementen la eficiencia del sistema de interceptación de comunicaciones. El reconocimiento e identificación de voz es una de estas metodologías, permitiendo a través de la generación de una huella digital, identificar y rastrear a la persona a la que pertenece dicha huella dentro de un conjunto de datos. Esta t´ecnica resulta particularmente útil en el contexto judicial, ya que facilita la asociación de casos y mejora la eficiencia del sistema al identificar si una misma persona está siendo o ha sido monitoreada en diferentes salas posibilitando la construcción de casos m´as sólidos. La base t´ecnica de este método incluye el an´alisis de frecuencias de sonido y el uso de espectrogramas, que actúan como huellas digitales en la identificación de voces. Para el análisis de estos datos se emplean dos modelos de redes neuronales convolucionales, modelos que son ampliamente usados para el an´alisis de este tipo de datos no estructurados. Las métricas de desempeño calculadas para cada uno de los modelos y experimentos diseñados muestran resultados satisfactorios para la solución del problema de identificación del hablante, sin embargo, uno de los modelos planteados domina todas las métricas aplicadas, siendo este el candidato para su implementación.
- ÍtemAcceso AbiertoModelación de precios por medio del juego de las minorías(2024-07-15) López López, Edwin Jair; Gaitán Rubio, Sergio; Andrade Lotero, Édgar JoséEl movimiento geométrico browniano es un modelo tradicionalmente usado para describir el comportamiento del precio de un activo. A pesar de su popularidad, el modelo tiene limitaciones; por ejemplo, la modelación de burbujas financieras. Por ello, el presente proyecto explora la modelación del comportamiento del precio de un activo por medio de modelos basados en agentes, todo esto con el fin de proponer metodologías alternativas que permitan capturar las características de los precios durante una burbuja financiera. Así las cosas, en el proyecto se implementaron dos modelos de precios (basados en variaciones del minority game), para luego contrastar sus características frente al modelo tradicional y contra datos reales de burbujas financieras. Los resultados demuestran que la modelación por medio de agentes permite simular circunstancias de mercado que se asemejan más a las de una burbuja financiera que el modelo browniano.