Tag: Casos prácticos

0

Esta entrada al Blog se centra en un caso real en el que se utilizan:  técnicas de DataScience, datos obtenidos de diversas fuentes y nuestra plataforma de geomarketing. Este caso ha consistido en la clasificación de secciones censales atendiendo a diversos criterios, tanto perfiles de usuarios como datos internos del cliente.

En España hay unas 36.000 secciones censales, cada una de ellas delimita una zona geográfica relativamente pequeña, para hacernos una idea, en la siguiente imagen se muestran secciones censales del centro de Madrid. La clasificación de secciones censales consiste en detectar patrones similares (ej. basado en datos de consumo, demografía o cualquier otros datos que sea de interés a nivel de sección censal) entre secciones censales y caracterizar secciones censales similares bajo una misma denominación, estas clasificaciones pueden ser de un nivel o de varios (taxonomías).

Al clasificar las secciones censales según una necesidad concreta, las decisiones de marketing se simplifican mucho ya que es mucho más manejable trabajar con un conjunto pequeño de tipos de secciones censales (normalmente entre 10 y 50 tipos) que con 36.000.

ITELLIGENT_Geomarketing_zonas por cada target_Madrid.

Ejemplo de secciones censales. Ciudad de Madrid

Necesidad del Cliente

El cliente quería mejorar su estrategia comercial adaptándola a distintas tipologías de clientes, además al ser una empresa con una importante fuerza de venta requería definir esta estrategia según cada zona geográfica, idealmente a nivel intermunicipal. El cliente disponía de escasos datos de sus clientes, básicamente datos de facturación y dirección y deseaba que el número de tipologías de clientes definidos no fuese mayor de 10 pues requería establecer una estrategia comercial para cada tipología, además era muy importante la identificación de las zonas geográficas de las distintas tipologías.

Solución aportada por ITELLIGENT

Se le propuso al cliente realizar una segmentación geográfica a nivel de sección censal que incorporase la información de facturación de sus clientes y una gran diversidad de información demográfica disponible a dicho nivel. El resultado sería una clasificación de las 36.000 secciones censales en un máximo de 10 categorías, cada una de dichas categorías representaría a tipologías de población homogéneas y reconocibles, por lo que el cliente podría establecer para cada una de ella una estrategia comercial diferenciada y que pudiese ser trasladada, por identificación de las secciones censales a las delegaciones que le correspondiera implementarlas.

La solución se desarrolló en varios pasos que se describen a continuación:

FASE 1 A partir de los datos internos, se determino para cada sección censal la facturación promedio de los usuarios con domicilios en dicha sección censal, para ello fue necesario geolocalizarlos e identificar la sección censal a la que pertenecían.

FASE 2 Se seleccionaron las variables demográficas a incluir en el estudio, aquí además de contar con la experiencia del cliente, se realizaron análisis (ej. estudios de correlación) con vistas a incorporar sólo aquellas variables que fuesen realmente significativas.

FASE 3 Se creó el modelo de clasificación de las secciones censales, para ello se evaluaron distintos números de categorías (entre 5 y 10) para determinar el numero óptimo. Se seleccionaron un total de 10 categorías.

FASE 3_zonas por cada target_ITELLIGENT

Fase 4. Clasificación del Target

FASE 4 Se etiquetaron las categorías a partir de los valores de las variables de las secciones censales pertenecientes a cada categoría. Así a título de ejemplo en la imagen Fase 4. se muestran dos categorías y los valores de las variables de las mismas. Según la zona de densidad de población baja -zona rural-, con personas mayores, de escaso nivel educativo,  con una facturación baja, …) se etiqueta esta categoría como «Jubilados en zonas rústicas con vivienda en propiedad y consumo bajo». Además, se evalúa el interés comercial de cada una de las categorías.

FASE 5 Evaluación de los resultados. Para evaluar los resultados se tomo una muestra de secciones censales y junto al cliente se comprobó que fuesen coherentes con la clasificación que se les daba.

FASE 5_GEOMARKETING_zonas por cada target_ITELLIGENT

Clasificación de zonas por cada target detectado.

Resultado del proyecto

El resultado final del sistema de clasificación es el que se muestra en la imagen de arriba. Debido a la confidencialidad del proyecto la clasificación del target no incorporar los datos internos del cliente, por lo que los resultados varían un poco respecto a los datos finales.  Por otro lado,  el cliente mediante acceso a la plataforma de geomarketing de ITelligent –netGeomarketing– tiene acceso a los resultados de la clasificación además de muchas otras funcionalidades.

0

El Geomarketing permite integrar información geográfica (mapas) con una multitud de variables (ej. demográficas, consumo, competencia,…) para conseguir tomar decisiones de marketing más inteligentes. La llegada del Big Data y el Data Science hacen que el Geomarketing haya dejado de ser una opción para las empresas, para convertirse en una necesidad si quieren seguir siendo competitivas.

En este post vamos a mostrar un caso real en el que además de utilizar la plataforma de geomarketing de ITelligent, se realiza una análisis masivo para evaluar las 36.000 secciones censales que existen en España, con vistas a determinar las zonas de mayor potencial para el establecimiento de la actividad comercial del cliente.

Necesidad del Cliente:

El cliente tenía previsto abrir 64 nuevos establecimientos a nivel nacional en los próximos dos años, por el tipo de negocio, el cliente estimaba que el 90% del éxito del establecimiento estaba ligado a su ubicación por lo que para él era esencial localizar aquellas ubicaciones con mayor potencial, a partir de la demografía, competencia, etc. Para ello el departamento de expansión requería diseñar una estrategia a nivel nacional que le permitiese definir zonas prioritarias de actuación (comunidades y provincias) y una vez definida esta estrategia disponer de una herramienta que le permitiese evaluar a nivel de municipio las mejores opciones de ubicación del establecimiento. Además el cliente estaba muy interesado en complementar los análisis con oferta de locales disponibles en las secciones censales de interés, de forma que pudiese incluir esta información en su toma de decisiones.

Solución aportada por ITELLIGENT

Como el cliente contaba con varios establecimientos en producción, se le propuso generar unos perfiles de clientes a partir del análisis de sus datos internos e identificar y crear una base de datos de empresas competidoras. A partir de los perfiles y de la competencia, evaluar todas las secciones censales de España para poder establecer su estrategia a nivel nacional. Por último se incorporaría un modelo a la plataforma netGeomarketing para que el cliente pudiese evaluar los distintos municipios que requiriese, además de incorporar a la plataforma información sobre la oferta de locales a nivel de sección censal.

La solución se desarrollo en varios pasos que se describen a continuación:

FASE 1 A partir de los datos internos del cliente (domicilio de sus clientes, fecha de nacimiento y sexo) para cada establecimiento, se realizo un análisis encaminado a obtener el área de captura del establecimiento (área alrededor del establecimiento en la que se encuentran la mayor parte de los clientes) y definir unos perfiles de los clientes.

FASE 2 A partir de recursos identificados por el cliente se creó una base de datos de establecimientos de la competencia geolocalizados. Los establecimientos fueron clasificados por el cliente en 5 categorías y se realizo un análisis de la influencia de cada categoría de establecimientos de la competencia sobre los establecimientos propios.

FASE 2_geomarketing ubicaciones interés_ITELLIGENT

Fase 3. Estudio sobre la competencia, ¿cómo nos afecta?

FASE 3 Se creó el modelo a partir del área de captura y de los perfiles obtenidos en el Paso-1 y del efecto de la competencia obtenido en el Paso-2. Dicho modelo permite dada una sección censal, valorar la bondad de ubicar el establecimiento en dicha sección censal a partir de los datos demográficos del área de captura, de los perfiles objetivos y de la competencia.

FASE 4 Se realizó una evaluación a nivel de toda España a partir del modelo del Paso-3. Una vez realizada la evaluación se realizo un análisis y se genero un informe para el cliente, dónde se le informaba de las zonas más prometedoras a tres niveles: comunidad autónoma, provincia y municipio.

FASE 5 Se incorporó el modelo generado en el Paso-3 a la plataforma netGeomarketing así como la base de datos de competencia de forma que el cliente pudiese realizar estudios concretos a nivel de municipios.

FASE 5_geomarketing_geomarketing ubicaciones interés_ITELLIGENT

Fase 5. El modelo se aplica a la plataforma NETGEOMARKETING de ITELLIGENT

FASE 6 Se incorporó información sobre la oferta de locales comerciales de las características de interés (metros cuadrados mínimos y máximos) para el cliente a nivel de sección censal (número de establecimientos y precio promedio). El cliente puede filtrar por los criterios establecidos para (ej. sólo mostrar secciones censales con oferta de suelo), y realizar un estudio para un local concreto a partir de sus ubicación.

Resultados

El cliente pasó de basar su esfuerzo de expansión en intuiciones más o menos acertadas, a basarse en datos y analíticas, por lo que se han mejorado considerablemente los procesos de decisión. Por otro lado el disponer de la plataforma netGeomarketing ha permitido al departamento de expansión ser mucho más productivo, pudiendo hacer un análisis detallado de un municipio y centrarse en las secciones censales de mayor potencial.

En este post incluimos algunos ejemplos de proyectos relacionados con la minería web en los que ITelligent ha participado. Estos proyectos pueden dar una estupenda idea de cómo se puede emplear la minería web que explicábamos en un post anterior.

Inteligencia Comercial para el sector Fotovoltaico y Termosolar

Este proyecto consistió en la obtención de inteligencia comercial para el sector fotovoltaico y termo-solar, el resultado fue un sistema que permite a sus usuarios obtener una ventaja competitiva gracias a que el sistema les permite monitorizar todos los proyectos de energía solar que se publican en España y disponer para cada uno de ellos de una información lista para ser aprovechada comercialmente.

ITelligent_Inteligencia_Comercial_Fotovoltaico_Termosolar

Para este proyecto se desarrolló un «pipeline» muy complejo que a continuación se describe:

  • Diariamente se extraen unos 4000 documentos de unas 70 webs de diversas administraciones públicas españolas.
  • Los 4000 documentos son clasificados automáticamente para detectar aquellos cuya temática sea sobre energía fotovoltaica y/o termo-solar (ej. solicitud de licencias de proyectos, declaraciones de impacto ambiental, concursos, …).
  • Cada uno de los documentos detectados en el paso anterior, son sometidos a un sistema automático de extracción de información para obtener determinada información relevante (ej. nombre del promotor del proyecto, ubicación del proyecto, potencia del proyecto, …).
  • La información obtenida en el paso anterior es enriquecida de forma automática con información adicional procedente de otras páginas web (ej. información catastral, geolocalización en mapa, etc.).
  • Por último los datos son agregados en un mashup que permite el filtrado y el acceso a toda la información de una forma muy amigable.

Sistema de Minería de Opinión para el sector Automovilístico

En este proyecto el cliente requería la monitorización de diversas páginas web de automóviles con contenidos subjetivos (comentarios) y la extracción de inteligencia de estos comentarios. El resultado es un sistema que permite determinar de cada automóvil del que se habla, de que elemento del mismo se habla (ej. seguridad, conducción, habitáculo) y si se habla positivamente o negativamente.

ITelligent_mineria_opinon_automovilistico

Inicialmente el cliente indicó las características que quería estudiar de los automóviles (ej. precio, habitáculo, servicio, seguridad, …) y las páginas web que deseaba monitorizar. Una vez definido lo anterior se desarrolló, en colaboración con los profesores de la Universidad de Sevilla doctores José Antonio Troyano y Fermín Cruz, el sistema que a continuación se describe:

  • Diariamente se extraen los datos de las distintas webs (comentarios y otros).
  • Los datos son procesados por un sistema de minería de opinión de última generación, que permite detectar de qué característica del coche se habla en un comentario y si se habla positivamente o negativamente.
  • El resultado del paso anterior es formateado según las especificaciones del cliente y enviado al mismo.

Inteligencia Competitiva para Ayudas y Subvenciones

En este proyecto el cliente necesitaba obtener todas las ayudas que diariamente se publican en España (sobre 30.000 ayudas al año), clasificarlas y obtener una ficha de cada una de las convocatorias, automatizando lo más posible con vistas a minimizar el esfuerzo manual. El cliente permite ofrecer a sus usuarios una información muy completa de todas las ayudas y subvenciones casi en tiempo real.

ITelligent_mineria_opinion_Ayudas y subvenconesl

Inicialmente el cliente definió como deberían ser clasificadas cada una de las ayudas localizadas, esta clasificación jerárquica permite posteriormente filtrar y crear alertas. Además para cada una de las convocatorias de ayudas se crea una plantilla con diversos campos (ej. plazo, objeto de la convocatoria, …), que permite disponer de una información homogenizada.

Para este proyecto se desarrolló un «pipeline» muy complejo que a continuación se describe:

  • Diariamente se extraen un número muy elevado de documentos de unas 80 webs de diversas administraciones públicas españolas.
  • Los documentos son clasificados automáticamente en función de las categorías definidas por el cliente (ej. I+D+i, urbanismo, juventud, …).
  • Cada uno de los documentos detectados como convocatorias son procesados para extraer determinada información con vistas a crear una ficha de cada convocatoria (ej. plazo de la convocatoria, objeto de la convocatoria,…).
  • La información es diariamente puesta a disposición del cliente junto a unas herramientas que permiten supervisar los resultados. Al mismo tiempo esta supervisión es utilizada como feedback para la mejora de los modelos de extracción y clasificación.