Ítem
Acceso Abierto

Sistema de reconocimiento de voz: una aplicacion para aumentar la eficiencia del sistema esperanza
Título de la revista
Autores
Lizarazo Malambo, William
Archivos
Fecha
2024-05-25
Directores
Morales Pinto, Yiby Karolina
ISSN de la revista
Título del volumen
Editor
Universidad del Rosario
Buscar en:
Métricas alternativas
Resumen
La Ley 906 de 2004 otorga a los fiscales la facultad para interceptar comunicaciones, bajo el cumplimiento de los requisitos legales. Esta herramienta, clave en investigaciones penales, enfrenta desafíos crecientes debido a la adopción de las tecnologías de comunicación encriptada y el alto volumen de datos. En este contexto, surge la necesidad de implementar nuevas metodologías de an´alisis de datos que incrementen la eficiencia del sistema de interceptación de comunicaciones. El reconocimiento e identificación de voz es una de estas metodologías, permitiendo a través de la generación de una huella digital, identificar y rastrear a la persona a la que pertenece dicha huella dentro de un conjunto de datos. Esta t´ecnica resulta particularmente útil en el contexto judicial, ya que facilita la asociación de casos y mejora la eficiencia del sistema al identificar si una misma persona está siendo o ha sido monitoreada en diferentes salas posibilitando la construcción de casos m´as sólidos. La base t´ecnica de este método incluye el an´alisis de frecuencias de sonido y el uso de espectrogramas, que actúan como huellas digitales en la identificación de voces. Para el análisis de estos datos se emplean dos modelos de redes neuronales convolucionales, modelos que son ampliamente usados para el an´alisis de este tipo de datos no estructurados. Las métricas de desempeño calculadas para cada uno de los modelos y experimentos diseñados muestran resultados satisfactorios para la solución del problema de identificación del hablante, sin embargo, uno de los modelos planteados domina todas las métricas aplicadas, siendo este el candidato para su implementación.
Abstract
Law 906 of 2004 grants prosecutors the power to intercept communications, subject to compliance with legal requirements. This tool, key in criminal investigations, faces growing challenges due to the adoption of encrypted communication technologies and the high volume of data. In this context, the need arises to implement new data analysis methodologies that increase the efficiency of the communications interception system. Voice recognition and identification is one of these methodologies, allowing, through the generation of a digital fingerprint, to identify and track the person to whom said fingerprint belongs within a set of data. This technique is particularly useful in the judicial context, since it facilitates the association of cases and improves the efficiency of the system by identifying whether the same person is being or has been monitored in different rooms, enabling the construction of more solid cases. The technical basis of this method includes the analysis of sound frequencies and the use of spectrograms, which act as fingerprints in the identification of voices. To analyze this data, two convolutional neural network models are used, models that are widely used for the analysis of this type of unstructured data. The performance metrics calculated for each of the designed models and experiments show satisfactory results for solving the speaker identification problem, however, one of the proposed models dominates all the applied metrics, making this the candidate for implementation.
Palabras clave
Espectogramas , Convolucional , Red neuronal , Interceptación de comunicaciones , Huella de voz
Keywords
Spectrograms, convolutional, neural network, communications interception, voice print