Ítem
Acceso Abierto
Empowering Cyber Intelligence with Natural Language Processing
| dc.creator | Díaz López, Daniel Orlando | |
| dc.creator | Zapata Rozo, Andrés | |
| dc.creator | Campo Archbold, Alejandra | |
| dc.date.accessioned | 2025-04-11T22:50:10Z | |
| dc.date.available | 2025-04-11T22:50:10Z | |
| dc.date.created | 2023-04-23 | |
| dc.description | En esta presentación se muestra como el Procesamiento de Lenguaje Natural (NLP), que es una rama de la inteligencia artificial, puede ser aplicable para mejorar un ejercicio de ciberinteligencia sobre grandes volúmenes de datos. Primero se muestra la forma como se puede convertir texto no estructurado en un formato procesable por un modelo NLP, como por ejemplo el texto proveniente de tweets o post dentro la deep web, foros de hacking o redes sociales en general. También se muestra ejemplos de modelos NLP que son capaces de identificar intenciones, sentimientos, entidades, tópicos, entre otros a partir de un texto de entrada. Este tipo de modelos son los mismos utilizados en soluciones de análisis de texto como ChatGPT o Bing Chat. Segundo, se muestra cómo los modelos de NLP pueden usarse dentro de un ciclo de ciberinteligencia que contiene una identificación de un escenario, unos recolectores, modelos de análisis de datos y generación de información accionable. De esta forma se demuestra que NLP puede ayudar de manera directa a mejorar la detección de escenarios de interés para la seguridad nacional como aquellos asociados a la radicalización de individuos, la instigación a la violencia, la promoción de la desestabilización de un estado, la distribución de contenido ciberterrorista, entre otros. El foco de está parte de la presentación esta centrado en un fenómeno conocido como Manipulación Social Hostil (HSM) que consiste en la persuasión de la población por parte de un actor de amenaza, con el fin de incitarlo a generar violencia contra un objetivo. Adicionalmente, se muestran los resultados de toxicidad detectados con estos modelos en el marco de las últimas elecciones al congreso de los Estados Unidos, realizadas el pasado 8 de noviembre del 2022. Fruto de estos resultados, se podrán investigar el fenómeno de terrorismo interno proveniente de grupos radicales dentro de los Estados Unidos. Esta parte de la presentación es derivada de una investigación realizada en conjunto entre los speaker y personal del Center for Cybersecurity de la Universidad de Nueva York. Finalmente, en esta presentación se muestran los resultados de la aplicación de un ciclo de ciberinteligencia sobre un escenario en el que se presume hubo Manipulación Social Hostil en un país latinoamericano. En este ejercicio se recorrerá el ciclo de ciencia de datos fundamentado en la recolección, preprocesamiento, modelamiento y despliegue de una solución de analítica de datos. | |
| dc.description.abstract | This presentation demonstrates how Natural Language Processing (NLP), a branch of artificial intelligence, can be applied to enhance cyber intelligence exercises involving large volumes of data. First, it will show how unstructured text can be converted into a format that can be processed by an NLP model, such as text from tweets or posts on the deep web, hacking forums, or social media in general. It also shows examples of NLP models capable of identifying intents, sentiments, entities, topics, and other topics from input text. These types of models are the same ones used in text analysis solutions such as ChatGPT or Bing Chat. Second, it shows how NLP models can be used within a cyber intelligence cycle that includes scenario identification, data collectors, data analysis models, and the generation of actionable insights. This demonstrates that NLP can directly help improve the detection of scenarios of interest to national security, such as those associated with the radicalization of individuals, instigation of violence, promotion of state destabilization, and distribution of cyberterrorist content. The focus of this part of the presentation is on a phenomenon known as Hostile Social Manipulation (HSM), which consists of a threat actor's persuasion of the population to incite violence against a target. Additionally, the toxicity results detected with these models are presented in the context of the recent US congressional elections, held on November 8, 2022. These results will allow for investigation into the phenomenon of domestic terrorism originating from radical groups within the United States. This part of the presentation is derived from research conducted jointly by the speakers and staff from the Center for Cybersecurity at New York University. Finally, this presentation shows the results of applying a cyber intelligence cycle to a scenario where Hostile Social Manipulation is suspected in a Latin American country. This exercise will explore the data science cycle based on the collection, preprocessing, modeling, and deployment of a data analytics solution. | |
| dc.format.extent | 43 pp | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.doi | https://doi.org/10.48713/10336_45218 | |
| dc.identifier.uri | https://repository.urosario.edu.co/handle/10336/45218 | |
| dc.language.iso | eng | |
| dc.publisher | Universidad del Rosario | |
| dc.publisher.department | Escuela de Ingeniería, Ciencia y Tecnología | |
| dc.publisher.program | Matemáticas Aplicadas y Ciencias de la Computación - MACC | |
| dc.relation.related | https://doi.org/10.1016/j.inffus.2024.102459 | |
| dc.relation.youtube | https://www.youtube.com/embed/j_9vIXBPCp4?si=YgNf6O0gfsTclLIu | |
| dc.rights | Attribution-ShareAlike 4.0 International | * |
| dc.rights.accesRights | info:eu-repo/semantics/openAccess | |
| dc.rights.acceso | Abierto (Texto Completo) | |
| dc.rights.uri | http://creativecommons.org/licenses/by-sa/4.0/ | * |
| dc.source.instname | instname:Universidad del Rosario | |
| dc.source.reponame | reponame:Repositorio Institucional EdocUR | |
| dc.subject | Inteligencia artificial | |
| dc.subject | Inteligencia de amenazas | |
| dc.subject | Procesamiento de lenguaje natural | |
| dc.subject | Ciber inteligencia | |
| dc.subject.keyword | Artificial intelligence | |
| dc.subject.keyword | Threat intelligence | |
| dc.subject.keyword | Natural language processing | |
| dc.subject.keyword | Cyber intelligence | |
| dc.title | Empowering Cyber Intelligence with Natural Language Processing | |
| dc.title.TranslatedTitle | Potenciando la Ciberinteligencia con el Procesamiento del Lenguaje Natural | |
| dc.type | conferenceObject | |
| dc.type.hasVersion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.spa | Presentación | |
| local.department.report | Escuela de Ciencias e Ingeniería |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Empowering_Cyber_Intelligence_with_Natural_Language_Processing_Bsides-2023.pdf
- Tamaño:
- 4.7 MB
- Formato:
- Adobe Portable Document Format
- Descripción:



