Científicos pueden predecir resultados electorales con análisis de opiniones en Twitter

Investigadores de la Universidad de Granada (UGR), pertenecientes al departamento de Ciencias de la Computación e Inteligencia Artificial, han modelado un sistema basado en técnicas de inteligencia artificial que permite predecir los resultados de unas elecciones mediante el análisis de opiniones en Twitter.

En este trabajo los científicos de la UGR proponen un sistema de Big Data descriptivo capaz de lidiar con una masiva cantidad de información no estructurada (un gran ‘data lake’) proveniente de Twitter, logrando establecer un sistema de previsión política durante las elecciones americanas de 2016, en las que ganó Donald Trump frente a Hillary Clinton.

La política está hoy en día en boca de todos. Muestra de ello es la cantidad de hilos de conversación sobre estos temas que día a día se vierten en todas las redes sociales. Una de las redes sociales más utilizadas para estos menesteres es la red social Twitter, donde encontramos opiniones de los partidos, los dirigentes, los militantes o simplemente de las personas interesadas en la política. Ser capaz de procesar adecuadamente estos datos y convertirlos en conocimiento es una ardua tarea que beneficia a multitud de campos, desde el académico, el empresarial o el ámbito periodístico.

La investigación de la UGR es fruto de esta motivación de poder «resumir» una gran cantidad de datos en información clara y concisa, que aporte valor a una posible pregunta de investigación.

El sistema ha sido desarrollado por José Ángel Díaz García, María Dolores Ruiz y María José Martín-Bautista, del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada, y probado en un problema real de comparación entre dos políticos y sus políticas: Donald Trump y Hillary Clinton, enfrentados en las elecciones generales de EEUU de noviembre de 2016.

SENTIMIENTOS Y EMOCIONES

El método ideado en la UGR ofrece de una manera fácilmente interpretable y explicable una serie de relaciones entre conceptos y discusiones en la red social sobre ambos políticos, así como los sentimientos y emociones asociados a los mismos. «En el núcleo de nuestro sistema, encontramos técnicas no supervisadas de Inteligencia Artificial, es decir, técnicas que no necesitan bases de datos previamente etiquetadas para poder ser entrenadas y utilizadas», apuntan los autores.

Destacan entre ellas las reglas de asociación, que mediante el uso de lexicons y diccionarios permiten el análisis de sentimientos. «Estás técnicas tienen hoy en día un gran valor debido a que aportan soluciones interpretables y fácilmente entendibles, lo que conlleva una fácil trazabilidad de los datos y proporciona resultados fácilmente explicables que podrían ser utilizados por personas sin conocimientos técnicos, democratizando así el acceso a la Inteligencia Artificial», apuntan los autores.

Este nuevo enfoque descriptivo difiere de los tradicionales modelos de ‘Machine Learning’, orientados al análisis de predictivo de sentimientos, en los cuales se necesitan de grandes bases de datos pre-etiquetadas (algo muy escaso en redes sociales, debido a la volatilidad de los temas), y normalmente ofrecen soluciones poco interpretables basadas en ajustes matemáticos muy complejos.

El análisis de los resultados obtenidos apoya la capacidad del sistema diseñado en la UGR de obtener reglas de asociación y patrones con gran valor descriptivo en el caso de uso de las elecciones americanas. Así, se pueden establecer paralelismos entre estos patrones con eventos de la vida real.

Algunos de estos paralelismos descubiertos por el sistema pueden ser los que relacionan de manera muy fuerte las palabras prohibición, servicio y transgénero con Donald Trump, lo cual muestra que el actual presidente americano estaba alineado con la prohibición del servicio de estas personas en el sector, algo que ya estaba siendo considerado en 2016 y que fue confirmado en 2017.

En cuanto a los sentimientos, el sistema revela cómo la sociedad americana tenía un mayor nivel de enfado con Hillary Clinton frente a Trump, el cual encabeza la emoción «trust», es decir, los tuits sobre Trump eran emitidos por personas con una alta confianza en el actual presidente de los EEUU.

Si tenemos en cuenta que los datos fueron procesados durante la campaña electoral, podría por tanto incluso trazarse un paralelismo en los posteriores resultados que dieron la victoria a Donald Trump, según los expertos.