Tag: analítica empresarial

ae

La Analítica Empresarial (AE) comprende los métodos y las técnicas que se utilizan para recopilar, analizar e investigar el conjunto de datos de una organización, lo cual genera conocimiento que se transforma en oportunidades de negocio y mejora la estrategia empresarial. AE permite una mejora en la toma de decisiones ya que éstas se basan en la obtención de datos reales y tiempo real y permite conseguir objetivos empresariales a partir del análisis de estos datos

Algunos factores como el aumento en la obtención de datos big data, los diversos cabales para relacionarse con los clientes-usuarios-consumidores y el crecimiento de la demanda para obtener mejores servicios;  hacen que los responsables de comunicación y marketing deban ser innovadores y efectivo en la toma de decisiones ya que la AE puede ser muy útil para dar apoyo a la estrategia de marketing de la empresa.

¿Qué podemos hacer con la Analítica Empresarial?

La AE permite:

  • Detectar tendencias
  • Realizar diagnósticos a partir de modelos predictivos
  • Utilizar estos modelos para optimizar los procesos de negocios
  • Enriquecer los datos internos de la empresa para diferenciarse de la competencia.

Clasificación de la Analitica Empresarial:

  1. Analítica Descriptiva. Utiliza los datos para explicar el pasado. Consiste en preparar y analizar datos históricos para identificar patrones y tendencias. Técnicas como modelos de regresión, el modelado de datos y visualización suelen ser usados en la Analítica Descriptiva.
  2. Analítica Predictiva. Utiliza los datos para determinar que puede pasar en elfuturo. La Analítica Predictiva permite determinar la probabilidad asociada a eventos futuros a partir del análisis de la información disponible (presente y pasada), además permite descubrir relaciones entre los datos que normalmente no es detectada con un análisis menos sofisticado. Técnicas como la minería de datos (data mining) y los modelos predictivos son utilizados.
  3. Analítica Prescriptiva. Utiliza los datos para prescribir aquellas accionesque incrementen nuestras posibilidades de obtener los mejores resultados. La Analítica Prescriptiva determina nuevos forma de operar que permitan alcanzar nuestros objetivos de negocio. Técnicas como la optimización o la simulación son utilizadas, aunque normalmente se requiere la creación de un modelo predictivo previo.

Business Analytics vs Business Intelligence

Internet ha generado un fenómeno completamente nuevo, en el que el mercado realiza sus propios análisis comparando ofertas, intercambiando experiencias y, en esencia, tomando el control de las marcas. Es por ello que los responsables de marketing deban tener en cuenta: ¿qué es la Inteligencia Empresarial?

Otro concepto relacionado con la AE es la Inteligencia Empresarial (IE) centrada en el uso de los datos de una empresa para facilitar también la toma de decisiones y anticipar acciones empresariales.

La diferencia con la AE es que la IE es un concepto más amplio, no solo se centra en el análisis de datos sino que éste es un área dentro de la IE. Es decir, la IE se trata de un conjunto de estrategias, aplicaciones, datos, tecnología y arquitectura técnica entre las que se encuentra la AE; y todo ello, enfocado a la creación de nuevo conocimiento a través de los datos existentes de la empresa.

El próximo día 12 de Noviembre a partir de las 10:00 am, nuestro Director Técnico de Itelligent, Jaime Martel, tendrá la oportunidad de participar en el IV Congreso Nacional de Conocimiento Abierto Bioinspirado e Inteligencia Colectiva, que se celebrará en el BBVA Innovation Center de Madrid.

Dicha jornada tendrá la finalidad de poner en conocimiento de las empresas las posibilidades de mejora de su competitividad mediante el desarrollo de herramientas que potencien su operatividad comercial y organizativa. Especialmente la capacidad de acelerador tecnológico del BIG DATA OPTIMIZER de Knowdle Foundation & Research Institute.

4ºcongreso-BigData-Itelligent

Jaime Martel, tratará el tema “Estado del arte de los robots semánticos”, durante la Mesa Redonda “Well are all Media Players: Big Data of Media Computing Challenges”, que tendrá lugar de 11:30 – 12:30 am. Según el Director Tecnico de Itelligent: “Una parte importante del potencial a realizar por el Big Data y la Analítica Empresarial proviene de la puesta en valor de los contenidos generados por los usuarios y otras informaciones textuales en lenguaje natural”.

Si estáis interesados en este evento se emitirá en Streaming a través del perfil de BBVA Innovation Center en YouTube

Cuando analizamos un conjunto de textos, en concreto tweets, nos surge un problema a la hora de detectar temáticas (o topics) existentes en ellos, ya que si tratamos con un número de tweets extremadamente numeroso esto será inabarcable para una o varias personas.topic

Una solución a este problema puede consistir en el uso de los denominados Topic Models. Estos se definen como modelos jerárquicos bayesianos que se aplican a una serie datos discretos, tales como un conjunto de textos, en nuestro caso tweets, y en el que se consideran a los elementos del conjunto como mezclas de un número determinado de topics, que aparecen con cierta probabilidad o frecuencia en cada elemento del conjunto.

En 2003 David Blei, Andrew Ng y Michael Jordan publicaron un artículo llamado “Latent Dirichlet Allocation (LDA)”, en el cual se describía un novedoso y revolucionario Topic Model. El LDA es un modelo jerárquico bayesiano de tres niveles, en el que se considera para los topics una distribución multinomial, cuyo parámetro n-dimensional, (siendo n el número de topics existentes), sigue, a su vez, una distribución de Dirichlet.

Uno de los proyectos a los que hemos aplicado este modelo es uno formado por 30000 tweets y basado en la escucha de una serie de bloggers influyentes del mundo de la moda entre los meses de Septiembre y Octubre de 2014, del que pretendíamos conocer sus tendencias predominantes.

Uno de los topics más importantes que hemos encontrado con un volumen del 7,2% del total, es uno relacionado con la dieta. En el siguiente gráfico, podemos comprobar como conforme empieza a terminar el verano, el físico deja de tomar importancia en las personas y de ahí la bajada de frecuencia en este topic. Observamos como pasa de un 0.1% a un 0.05%, casi la mitad de  la cifra anterior.

grafica1

Otro ejemplo es el obtenido en cuanto a la moda de Otoño, teniendo un volumen de datos con respecto al total del 7,7%.

grafica2

Esta gráfica, en cambio, es más estable pero aún así, podemos observar un pico coincidiendo con la Nueva York Fashion Week y Madrid Fashion Week entre la primera y segunda semana de Septiembre pasando de una frecuencia de aproximadamente 0.6% a cerca de un 0.8%.

Por último, como consecuencia también de las tendencias de las modelos en las pasarelas, es curioso ver como se trata el tema del peinado en las modelos, y como esto afecta al público. A continuación podremos observar, aunque con un volumen menor que en las anteriores, el 6.7% del total, como en la gráfica se ejerce un pico de frecuencia de esta temática, pasando de menos de un 0.06% a más de un 0.1%.

grafica 3

Al aplicar LDA a este y a otros proyectos relacionados con tweets hemos encontrado cierta desambigüedad en el conjunto final de textos que pertenecen a un topic (o topics) en concreto, es decir, cierta mezcla de temáticas, causada a raíz de la escasez de palabras contenidas en los tweets y que limitan este modelo para este conjunto concreto de textos.

Para evitar esta desambigüedad actualmente estamos realizando nuevas pruebas con otros Topics Models actuales, en concreto el Structural Topic Model (STM), que permite incluir metadata, (o grupo de características de los tweets, como puede ser autor, localización, etc), en el modelo, lo cual evita en gran parte el anterior problema, permitiendo una detección de topics más eficaz.

En este post incluimos algunos ejemplos de proyectos relacionados con la minería web en los que ITelligent ha participado. Estos proyectos pueden dar una estupenda idea de cómo se puede emplear la minería web que explicábamos en un post anterior.

Inteligencia Comercial para el sector Fotovoltaico y Termosolar

Este proyecto consistió en la obtención de inteligencia comercial para el sector fotovoltaico y termo-solar, el resultado fue un sistema que permite a sus usuarios obtener una ventaja competitiva gracias a que el sistema les permite monitorizar todos los proyectos de energía solar que se publican en España y disponer para cada uno de ellos de una información lista para ser aprovechada comercialmente.

ITelligent_Inteligencia_Comercial_Fotovoltaico_Termosolar

Para este proyecto se desarrolló un “pipeline” muy complejo que a continuación se describe:

  • Diariamente se extraen unos 4000 documentos de unas 70 webs de diversas administraciones públicas españolas.
  • Los 4000 documentos son clasificados automáticamente para detectar aquellos cuya temática sea sobre energía fotovoltaica y/o termo-solar (ej. solicitud de licencias de proyectos, declaraciones de impacto ambiental, concursos, …).
  • Cada uno de los documentos detectados en el paso anterior, son sometidos a un sistema automático de extracción de información para obtener determinada información relevante (ej. nombre del promotor del proyecto, ubicación del proyecto, potencia del proyecto, …).
  • La información obtenida en el paso anterior es enriquecida de forma automática con información adicional procedente de otras páginas web (ej. información catastral, geolocalización en mapa, etc.).
  • Por último los datos son agregados en un mashup que permite el filtrado y el acceso a toda la información de una forma muy amigable.

Sistema de Minería de Opinión para el sector Automovilístico

En este proyecto el cliente requería la monitorización de diversas páginas web de automóviles con contenidos subjetivos (comentarios) y la extracción de inteligencia de estos comentarios. El resultado es un sistema que permite determinar de cada automóvil del que se habla, de que elemento del mismo se habla (ej. seguridad, conducción, habitáculo) y si se habla positivamente o negativamente.

ITelligent_mineria_opinon_automovilistico

Inicialmente el cliente indicó las características que quería estudiar de los automóviles (ej. precio, habitáculo, servicio, seguridad, …) y las páginas web que deseaba monitorizar. Una vez definido lo anterior se desarrolló, en colaboración con los profesores de la Universidad de Sevilla doctores José Antonio Troyano y Fermín Cruz, el sistema que a continuación se describe:

  • Diariamente se extraen los datos de las distintas webs (comentarios y otros).
  • Los datos son procesados por un sistema de minería de opinión de última generación, que permite detectar de qué característica del coche se habla en un comentario y si se habla positivamente o negativamente.
  • El resultado del paso anterior es formateado según las especificaciones del cliente y enviado al mismo.

Inteligencia Competitiva para Ayudas y Subvenciones

En este proyecto el cliente necesitaba obtener todas las ayudas que diariamente se publican en España (sobre 30.000 ayudas al año), clasificarlas y obtener una ficha de cada una de las convocatorias, automatizando lo más posible con vistas a minimizar el esfuerzo manual. El cliente permite ofrecer a sus usuarios una información muy completa de todas las ayudas y subvenciones casi en tiempo real.

ITelligent_mineria_opinion_Ayudas y subvenconesl

Inicialmente el cliente definió como deberían ser clasificadas cada una de las ayudas localizadas, esta clasificación jerárquica permite posteriormente filtrar y crear alertas. Además para cada una de las convocatorias de ayudas se crea una plantilla con diversos campos (ej. plazo, objeto de la convocatoria, …), que permite disponer de una información homogenizada.

Para este proyecto se desarrolló un “pipeline” muy complejo que a continuación se describe:

  • Diariamente se extraen un número muy elevado de documentos de unas 80 webs de diversas administraciones públicas españolas.
  • Los documentos son clasificados automáticamente en función de las categorías definidas por el cliente (ej. I+D+i, urbanismo, juventud, …).
  • Cada uno de los documentos detectados como convocatorias son procesados para extraer determinada información con vistas a crear una ficha de cada convocatoria (ej. plazo de la convocatoria, objeto de la convocatoria,…).
  • La información es diariamente puesta a disposición del cliente junto a unas herramientas que permiten supervisar los resultados. Al mismo tiempo esta supervisión es utilizada como feedback para la mejora de los modelos de extracción y clasificación.