Empowering Cyber Intelligence with Natural Language Processing

Díaz López, Daniel Orlando; Zapata Rozo, Andrés; Campo Archbold, Alejandra

doi:https://doi.org/10.48713/10336_45218

Ítem

Acceso Abierto

Empowering Cyber Intelligence with Natural Language Processing

Mostrar el registro sencillo de la publicación

dc.creator	Díaz López, Daniel Orlando
dc.creator	Zapata Rozo, Andrés
dc.creator	Campo Archbold, Alejandra
dc.date.accessioned	2025-04-11T22:50:10Z
dc.date.available	2025-04-11T22:50:10Z
dc.date.created	2023-04-23
dc.description	En esta presentación se muestra como el Procesamiento de Lenguaje Natural (NLP), que es una rama de la inteligencia artificial, puede ser aplicable para mejorar un ejercicio de ciberinteligencia sobre grandes volúmenes de datos. Primero se muestra la forma como se puede convertir texto no estructurado en un formato procesable por un modelo NLP, como por ejemplo el texto proveniente de tweets o post dentro la deep web, foros de hacking o redes sociales en general. También se muestra ejemplos de modelos NLP que son capaces de identificar intenciones, sentimientos, entidades, tópicos, entre otros a partir de un texto de entrada. Este tipo de modelos son los mismos utilizados en soluciones de análisis de texto como ChatGPT o Bing Chat. Segundo, se muestra cómo los modelos de NLP pueden usarse dentro de un ciclo de ciberinteligencia que contiene una identificación de un escenario, unos recolectores, modelos de análisis de datos y generación de información accionable. De esta forma se demuestra que NLP puede ayudar de manera directa a mejorar la detección de escenarios de interés para la seguridad nacional como aquellos asociados a la radicalización de individuos, la instigación a la violencia, la promoción de la desestabilización de un estado, la distribución de contenido ciberterrorista, entre otros. El foco de está parte de la presentación esta centrado en un fenómeno conocido como Manipulación Social Hostil (HSM) que consiste en la persuasión de la población por parte de un actor de amenaza, con el fin de incitarlo a generar violencia contra un objetivo. Adicionalmente, se muestran los resultados de toxicidad detectados con estos modelos en el marco de las últimas elecciones al congreso de los Estados Unidos, realizadas el pasado 8 de noviembre del 2022. Fruto de estos resultados, se podrán investigar el fenómeno de terrorismo interno proveniente de grupos radicales dentro de los Estados Unidos. Esta parte de la presentación es derivada de una investigación realizada en conjunto entre los speaker y personal del Center for Cybersecurity de la Universidad de Nueva York. Finalmente, en esta presentación se muestran los resultados de la aplicación de un ciclo de ciberinteligencia sobre un escenario en el que se presume hubo Manipulación Social Hostil en un país latinoamericano. En este ejercicio se recorrerá el ciclo de ciencia de datos fundamentado en la recolección, preprocesamiento, modelamiento y despliegue de una solución de analítica de datos.
dc.description.abstract	This presentation demonstrates how Natural Language Processing (NLP), a branch of artificial intelligence, can be applied to enhance cyber intelligence exercises involving large volumes of data. First, it will show how unstructured text can be converted into a format that can be processed by an NLP model, such as text from tweets or posts on the deep web, hacking forums, or social media in general. It also shows examples of NLP models capable of identifying intents, sentiments, entities, topics, and other topics from input text. These types of models are the same ones used in text analysis solutions such as ChatGPT or Bing Chat. Second, it shows how NLP models can be used within a cyber intelligence cycle that includes scenario identification, data collectors, data analysis models, and the generation of actionable insights. This demonstrates that NLP can directly help improve the detection of scenarios of interest to national security, such as those associated with the radicalization of individuals, instigation of violence, promotion of state destabilization, and distribution of cyberterrorist content. The focus of this part of the presentation is on a phenomenon known as Hostile Social Manipulation (HSM), which consists of a threat actor's persuasion of the population to incite violence against a target. Additionally, the toxicity results detected with these models are presented in the context of the recent US congressional elections, held on November 8, 2022. These results will allow for investigation into the phenomenon of domestic terrorism originating from radical groups within the United States. This part of the presentation is derived from research conducted jointly by the speakers and staff from the Center for Cybersecurity at New York University. Finally, this presentation shows the results of applying a cyber intelligence cycle to a scenario where Hostile Social Manipulation is suspected in a Latin American country. This exercise will explore the data science cycle based on the collection, preprocessing, modeling, and deployment of a data analytics solution.
dc.format.extent	43 pp
dc.format.mimetype	application/pdf
dc.identifier.doi	https://doi.org/10.48713/10336_45218
dc.identifier.uri	https://repository.urosario.edu.co/handle/10336/45218
dc.language.iso	eng
dc.publisher	Universidad del Rosario
dc.publisher.department	Escuela de Ingeniería, Ciencia y Tecnología
dc.publisher.program	Matemáticas Aplicadas y Ciencias de la Computación - MACC
dc.relation.related	https://doi.org/10.1016/j.inffus.2024.102459
dc.relation.youtube	https://www.youtube.com/embed/j_9vIXBPCp4?si=YgNf6O0gfsTclLIu
dc.rights	Attribution-ShareAlike 4.0 International	*
dc.rights.accesRights	info:eu-repo/semantics/openAccess
dc.rights.acceso	Abierto (Texto Completo)
dc.rights.uri	http://creativecommons.org/licenses/by-sa/4.0/	*
dc.source.instname	instname:Universidad del Rosario
dc.source.reponame	reponame:Repositorio Institucional EdocUR
dc.subject	Inteligencia artificial
dc.subject	Inteligencia de amenazas
dc.subject	Procesamiento de lenguaje natural
dc.subject	Ciber inteligencia
dc.subject.keyword	Artificial intelligence
dc.subject.keyword	Threat intelligence
dc.subject.keyword	Natural language processing
dc.subject.keyword	Cyber intelligence
dc.title	Empowering Cyber Intelligence with Natural Language Processing
dc.title.TranslatedTitle	Potenciando la Ciberinteligencia con el Procesamiento del Lenguaje Natural
dc.type	conferenceObject
dc.type.hasVersion	info:eu-repo/semantics/acceptedVersion
dc.type.spa	Presentación
local.department.report	Escuela de Ciencias e Ingeniería

Archivos

Bloque original

Mostrando1 - 1 de 1

Nombre:: Empowering_Cyber_Intelligence_with_Natural_Language_Processing_Bsides-2023.pdf
Tamaño:: 4.7 MB
Formato:: Adobe Portable Document Format
Descripción:

Descargar