Ítem
Solo Metadatos

From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques

dc.creatorSánchez-Holgado, Patriciaspa
dc.creatorMartín-Merino Acera, Manuelspa
dc.creatorBlanco Herrero, Davidspa
dc.date.accessioned2020-09-09T15:33:52Z
dc.date.available2020-09-09T15:33:52Z
dc.date.created2020-01-17spa
dc.descriptionLos cambios producidos en los últimos años en cuanto a modelos de comunicación social han llevado a todos los sectores a adaptarse a los nuevos medios para alcanzar a su público. La comunicación de la ciencia no es una excepción. La manera en que se distribuyen contenidos sobre ciencia está cambiando debido a la presencia creciente de tecnologías, y la red social Twitter se ha convertido en un importante aliado debido a su gran volumen de usuarios. En el presente trabajo, se utilizan técnicas de aprendizaje automático para desarrollar un clasificador -que funciona en tiempo real- de sentimiento relacionados con mensajes publicados en Twitter. Para ello, se descargaron 200 000 tweets destinados a construir un corpus de entrenamiento limpio y procesado de 10 000 textos etiquetados, la mitad positivos y la mitad negativos, sobre ciencia en español. El corpus permite entrenar el modelo de aprendizaje automático y construir un prototipo OpScience, capaz de determinar el sentimiento de mensajes publicados en Twitter en tiempo real. Los resultados relacionados con la exactitud del clasificador corresponden al 72 %. Estos resultados pueden ayudar a darle mayor valor a temas de la comunicación científica en un espacio de debate social y predecir intereses o tendencias futuras, como se pudo comprobar en una prueba en enero de 2019.spa
dc.description.abstractThe changes produced in recent years in social communication models have meant that all sectors have had to adapt to new media to reach their audiences. The communication of science is no exception. The distribution of contents about science is adapting to an increasing presence of technologies, and the social network Twitter has become a necessary ally due to its large volume of users. In this paper, machine learning techniques are used to develop a sentiment classifier of messages posted in real-time on Twitter. To this end, 200 000 tweets were downloaded to build a training corpus of 10 000 clean and processed labeled texts, half positive and half negative, about science in Spanish. This corpus allows the training of the machine learning model and builds a prototype, OpScience, able to determine the sentiment of messages posted on Twitter in real-time. The accuracy results obtained by the classifier is around 72 %. This can help to assess issues of scientific communication in a space of social debate and predict future interests or trends, as observed during the test in January 2019.spa
dc.format.mimetypeapplication/pdf
dc.identifier.doihttps://doi.org/10.12804/revistas.urosario.edu.co/disertaciones/a.7691
dc.identifier.issn1856-9536
dc.identifier.urihttps://repository.urosario.edu.co/handle/10336/29119
dc.language.isospa
dc.publisherUniversidad del Rosariospa
dc.publisherUniversidad de Los Andesspa
dc.publisherUniversidad Complutense de Madridspa
dc.relation.citationEndPage58
dc.relation.citationIssueNo. 1
dc.relation.citationStartPage35
dc.relation.citationTitleAnuario Electrónico de Estudios en Comunicación Social Disertaciones
dc.relation.citationVolumeVol. 13
dc.relation.ispartofAnuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; Vol. 13 Núm. 1 (2020); 35-58spa
dc.relation.ispartofAnuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; v. 13 n. 1 (2020); 35-58spa
dc.relation.ispartofAnuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; Vol. 13 No. 1 (2020); 35-58spa
dc.relation.urihttps://revistas.urosario.edu.co/index.php/disertaciones/article/view/7691spa
dc.rights.accesRightsinfo:eu-repo/semantics/openAccess
dc.rights.accesoAbierto (Texto Completo)spa
dc.sourceAnuario Electrónico de Estudios en Comunicación Social 'Disertacionesspa
dc.source.instnameinstname:Universidad del Rosario
dc.source.reponamereponame:Repositorio Institucional EdocUR
dc.subjectAnálisis de sentimientospa
dc.subjectaprendizaje automático supervisadospa
dc.subjectTwitterspa
dc.subjectcomunicación científicaspa
dc.subjectSentiment analysisspa
dc.subjectTwitterspa
dc.subjectsupervised machine learningspa
dc.subjectscientific communicationspa
dc.subjectAnálise de Sentimentospa
dc.subjectaprendizagem automática supervisadaspa
dc.subjectTwitterspa
dc.subject.keywordcomunicação científicapor
dc.titleFrom Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniquesspa
dc.title.TranslatedTitleDo data-driven ao data-feeling: análise de sentimento no tempo real de mensagens em espanhol sobre divulgação científica usando técnicas de aprendizagem automáticapor
dc.title.alternativeDel data-driven al data-feeling: análisis de sentimiento en tiempo real de mensajes en español sobre divulgación científica usando técnicas de aprendizaje automáticospa
dc.typearticleeng
dc.type.hasVersioninfo:eu-repo/semantics/publishedVersion
dc.type.spaArtículospa
Archivos