Ítem
Acceso Abierto

Empowering Cyber Intelligence with Natural Language Processing

dc.creatorDíaz López, Daniel Orlando
dc.creatorZapata Rozo, Andrés
dc.creatorCampo Archbold, Alejandra
dc.date.accessioned2025-04-11T22:50:10Z
dc.date.available2025-04-11T22:50:10Z
dc.date.created2023-04-23
dc.descriptionEn esta presentación se muestra como el Procesamiento de Lenguaje Natural (NLP), que es una rama de la inteligencia artificial, puede ser aplicable para mejorar un ejercicio de ciberinteligencia sobre grandes volúmenes de datos. Primero se muestra la forma como se puede convertir texto no estructurado en un formato procesable por un modelo NLP, como por ejemplo el texto proveniente de tweets o post dentro la deep web, foros de hacking o redes sociales en general. También se muestra ejemplos de modelos NLP que son capaces de identificar intenciones, sentimientos, entidades, tópicos, entre otros a partir de un texto de entrada. Este tipo de modelos son los mismos utilizados en soluciones de análisis de texto como ChatGPT o Bing Chat. Segundo, se muestra cómo los modelos de NLP pueden usarse dentro de un ciclo de ciberinteligencia que contiene una identificación de un escenario, unos recolectores, modelos de análisis de datos y generación de información accionable. De esta forma se demuestra que NLP puede ayudar de manera directa a mejorar la detección de escenarios de interés para la seguridad nacional como aquellos asociados a la radicalización de individuos, la instigación a la violencia, la promoción de la desestabilización de un estado, la distribución de contenido ciberterrorista, entre otros. El foco de está parte de la presentación esta centrado en un fenómeno conocido como Manipulación Social Hostil (HSM) que consiste en la persuasión de la población por parte de un actor de amenaza, con el fin de incitarlo a generar violencia contra un objetivo. Adicionalmente, se muestran los resultados de toxicidad detectados con estos modelos en el marco de las últimas elecciones al congreso de los Estados Unidos, realizadas el pasado 8 de noviembre del 2022. Fruto de estos resultados, se podrán investigar el fenómeno de terrorismo interno proveniente de grupos radicales dentro de los Estados Unidos. Esta parte de la presentación es derivada de una investigación realizada en conjunto entre los speaker y personal del Center for Cybersecurity de la Universidad de Nueva York. Finalmente, en esta presentación se muestran los resultados de la aplicación de un ciclo de ciberinteligencia sobre un escenario en el que se presume hubo Manipulación Social Hostil en un país latinoamericano. En este ejercicio se recorrerá el ciclo de ciencia de datos fundamentado en la recolección, preprocesamiento, modelamiento y despliegue de una solución de analítica de datos.
dc.description.abstractThis presentation demonstrates how Natural Language Processing (NLP), a branch of artificial intelligence, can be applied to enhance cyber intelligence exercises involving large volumes of data. First, it will show how unstructured text can be converted into a format that can be processed by an NLP model, such as text from tweets or posts on the deep web, hacking forums, or social media in general. It also shows examples of NLP models capable of identifying intents, sentiments, entities, topics, and other topics from input text. These types of models are the same ones used in text analysis solutions such as ChatGPT or Bing Chat. Second, it shows how NLP models can be used within a cyber intelligence cycle that includes scenario identification, data collectors, data analysis models, and the generation of actionable insights. This demonstrates that NLP can directly help improve the detection of scenarios of interest to national security, such as those associated with the radicalization of individuals, instigation of violence, promotion of state destabilization, and distribution of cyberterrorist content. The focus of this part of the presentation is on a phenomenon known as Hostile Social Manipulation (HSM), which consists of a threat actor's persuasion of the population to incite violence against a target. Additionally, the toxicity results detected with these models are presented in the context of the recent US congressional elections, held on November 8, 2022. These results will allow for investigation into the phenomenon of domestic terrorism originating from radical groups within the United States. This part of the presentation is derived from research conducted jointly by the speakers and staff from the Center for Cybersecurity at New York University. Finally, this presentation shows the results of applying a cyber intelligence cycle to a scenario where Hostile Social Manipulation is suspected in a Latin American country. This exercise will explore the data science cycle based on the collection, preprocessing, modeling, and deployment of a data analytics solution.
dc.format.extent43 pp
dc.format.mimetypeapplication/pdf
dc.identifier.doihttps://doi.org/10.48713/10336_45218
dc.identifier.urihttps://repository.urosario.edu.co/handle/10336/45218
dc.language.isoeng
dc.publisherUniversidad del Rosario
dc.publisher.departmentEscuela de Ingeniería, Ciencia y Tecnología
dc.publisher.programMatemáticas Aplicadas y Ciencias de la Computación - MACC
dc.relation.relatedhttps://doi.org/10.1016/j.inffus.2024.102459
dc.relation.youtubehttps://www.youtube.com/embed/j_9vIXBPCp4?si=YgNf6O0gfsTclLIu
dc.rightsAttribution-ShareAlike 4.0 International*
dc.rights.accesRightsinfo:eu-repo/semantics/openAccess
dc.rights.accesoAbierto (Texto Completo)
dc.rights.urihttp://creativecommons.org/licenses/by-sa/4.0/*
dc.source.instnameinstname:Universidad del Rosario
dc.source.reponamereponame:Repositorio Institucional EdocUR
dc.subjectInteligencia artificial
dc.subjectInteligencia de amenazas
dc.subjectProcesamiento de lenguaje natural
dc.subjectCiber inteligencia
dc.subject.keywordArtificial intelligence
dc.subject.keywordThreat intelligence
dc.subject.keywordNatural language processing
dc.subject.keywordCyber intelligence
dc.titleEmpowering Cyber Intelligence with Natural Language Processing
dc.title.TranslatedTitlePotenciando la Ciberinteligencia con el Procesamiento del Lenguaje Natural
dc.typeconferenceObject
dc.type.hasVersioninfo:eu-repo/semantics/acceptedVersion
dc.type.spaPresentación
local.department.reportEscuela de Ciencias e Ingeniería
Archivos
Bloque original
Mostrando1 - 1 de 1
Cargando...
Miniatura
Nombre:
Empowering_Cyber_Intelligence_with_Natural_Language_Processing_Bsides-2023.pdf
Tamaño:
4.7 MB
Formato:
Adobe Portable Document Format
Descripción: