En ITELLIGENT, como ya indicábamos en un post anterior, intentamos resolver el problema que surge a la hora de detectar temáticas o topics en un gran conjunto de tweets a través de algoritmos matemáticos basados en Topic Model.
Para resolver dicho problema decidimos elegir un Topic Model basado en modelo bayesiano de última generación (STM). La estructura de este Topic Model nos permite introducir en el modelo información extra referida a los tweets, (elementos contenidos en el texto, datos del autor, etc…), además de los elementos (menciones, hashtag, etc) y palabras contenida en éstos, lo cual nos ha ayudado a detectar los topics de una manera más clara a los que se detectaban a través de otros Topic Models.
Uno de los proyectos más actuales a los que hemos aplicado nuestro algoritmo basado en el STM ha sido a un conjunto de tweets recogidos a raíz de una monitorización de las cuentas de los 4 políticos más relevantes del panorama español -Albert Rivera, Mariano Rajoy, Pablo Iglesias y Pedro Sánchez-, durante los últimos días de esta semana. Se han obtenido cuatro temas principales de conversación alrededor de estos políticos. Dichos temas se muestran a continuación:
0 comentarios