Esta entrada al Blog se centra en un caso real en el que se utilizan: técnicas de DataScience, datos obtenidos de diversas fuentes y nuestra plataforma de geomarketing. Este caso ha consistido en la clasificación de secciones censales atendiendo a diversos criterios, tanto perfiles de usuarios como datos internos del cliente.
En España hay unas 36.000 secciones censales, cada una de ellas delimita una zona geográfica relativamente pequeña, para hacernos una idea, en la siguiente imagen se muestran secciones censales del centro de Madrid. La clasificación de secciones censales consiste en detectar patrones similares (ej. basado en datos de consumo, demografía o cualquier otros datos que sea de interés a nivel de sección censal) entre secciones censales y caracterizar secciones censales similares bajo una misma denominación, estas clasificaciones pueden ser de un nivel o de varios (taxonomías).
Al clasificar las secciones censales según una necesidad concreta, las decisiones de marketing se simplifican mucho ya que es mucho más manejable trabajar con un conjunto pequeño de tipos de secciones censales (normalmente entre 10 y 50 tipos) que con 36.000.
Necesidad del Cliente
El cliente quería mejorar su estrategia comercial adaptándola a distintas tipologías de clientes, además al ser una empresa con una importante fuerza de venta requería definir esta estrategia según cada zona geográfica, idealmente a nivel intermunicipal. El cliente disponía de escasos datos de sus clientes, básicamente datos de facturación y dirección y deseaba que el número de tipologías de clientes definidos no fuese mayor de 10 pues requería establecer una estrategia comercial para cada tipología, además era muy importante la identificación de las zonas geográficas de las distintas tipologías.
Solución aportada por ITELLIGENT
Se le propuso al cliente realizar una segmentación geográfica a nivel de sección censal que incorporase la información de facturación de sus clientes y una gran diversidad de información demográfica disponible a dicho nivel. El resultado sería una clasificación de las 36.000 secciones censales en un máximo de 10 categorías, cada una de dichas categorías representaría a tipologías de población homogéneas y reconocibles, por lo que el cliente podría establecer para cada una de ella una estrategia comercial diferenciada y que pudiese ser trasladada, por identificación de las secciones censales a las delegaciones que le correspondiera implementarlas.
La solución se desarrolló en varios pasos que se describen a continuación:
FASE 1 A partir de los datos internos, se determino para cada sección censal la facturación promedio de los usuarios con domicilios en dicha sección censal, para ello fue necesario geolocalizarlos e identificar la sección censal a la que pertenecían.
FASE 2 Se seleccionaron las variables demográficas a incluir en el estudio, aquí además de contar con la experiencia del cliente, se realizaron análisis (ej. estudios de correlación) con vistas a incorporar sólo aquellas variables que fuesen realmente significativas.
FASE 3 Se creó el modelo de clasificación de las secciones censales, para ello se evaluaron distintos números de categorías (entre 5 y 10) para determinar el numero óptimo. Se seleccionaron un total de 10 categorías.
FASE 4 Se etiquetaron las categorías a partir de los valores de las variables de las secciones censales pertenecientes a cada categoría. Así a título de ejemplo en la imagen Fase 4. se muestran dos categorías y los valores de las variables de las mismas. Según la zona de densidad de población baja -zona rural-, con personas mayores, de escaso nivel educativo, con una facturación baja, …) se etiqueta esta categoría como «Jubilados en zonas rústicas con vivienda en propiedad y consumo bajo». Además, se evalúa el interés comercial de cada una de las categorías.
FASE 5 Evaluación de los resultados. Para evaluar los resultados se tomo una muestra de secciones censales y junto al cliente se comprobó que fuesen coherentes con la clasificación que se les daba.
Resultado del proyecto
El resultado final del sistema de clasificación es el que se muestra en la imagen de arriba. Debido a la confidencialidad del proyecto la clasificación del target no incorporar los datos internos del cliente, por lo que los resultados varían un poco respecto a los datos finales. Por otro lado, el cliente mediante acceso a la plataforma de geomarketing de ITelligent –netGeomarketing– tiene acceso a los resultados de la clasificación además de muchas otras funcionalidades.
El Geomarketing permite integrar información geográfica (mapas) con una multitud de variables (ej. demográficas, consumo, competencia,…) para conseguir tomar decisiones de marketing más inteligentes. La llegada del Big Data y el Data Science hacen que el Geomarketing haya dejado de ser una opción para las empresas, para convertirse en una necesidad si quieren seguir siendo competitivas.
En este post vamos a mostrar un caso real en el que además de utilizar la plataforma de geomarketing de ITelligent, se realiza una análisis masivo para evaluar las 36.000 secciones censales que existen en España, con vistas a determinar las zonas de mayor potencial para el establecimiento de la actividad comercial del cliente.
Necesidad del Cliente:
El cliente tenía previsto abrir 64 nuevos establecimientos a nivel nacional en los próximos dos años, por el tipo de negocio, el cliente estimaba que el 90% del éxito del establecimiento estaba ligado a su ubicación por lo que para él era esencial localizar aquellas ubicaciones con mayor potencial, a partir de la demografía, competencia, etc. Para ello el departamento de expansión requería diseñar una estrategia a nivel nacional que le permitiese definir zonas prioritarias de actuación (comunidades y provincias) y una vez definida esta estrategia disponer de una herramienta que le permitiese evaluar a nivel de municipio las mejores opciones de ubicación del establecimiento. Además el cliente estaba muy interesado en complementar los análisis con oferta de locales disponibles en las secciones censales de interés, de forma que pudiese incluir esta información en su toma de decisiones.
Solución aportada por ITELLIGENT
Como el cliente contaba con varios establecimientos en producción, se le propuso generar unos perfiles de clientes a partir del análisis de sus datos internos e identificar y crear una base de datos de empresas competidoras. A partir de los perfiles y de la competencia, evaluar todas las secciones censales de España para poder establecer su estrategia a nivel nacional. Por último se incorporaría un modelo a la plataforma netGeomarketing para que el cliente pudiese evaluar los distintos municipios que requiriese, además de incorporar a la plataforma información sobre la oferta de locales a nivel de sección censal.
La solución se desarrollo en varios pasos que se describen a continuación:
FASE 1 A partir de los datos internos del cliente (domicilio de sus clientes, fecha de nacimiento y sexo) para cada establecimiento, se realizo un análisis encaminado a obtener el área de captura del establecimiento (área alrededor del establecimiento en la que se encuentran la mayor parte de los clientes) y definir unos perfiles de los clientes.
FASE 2 A partir de recursos identificados por el cliente se creó una base de datos de establecimientos de la competencia geolocalizados. Los establecimientos fueron clasificados por el cliente en 5 categorías y se realizo un análisis de la influencia de cada categoría de establecimientos de la competencia sobre los establecimientos propios.
FASE 3 Se creó el modelo a partir del área de captura y de los perfiles obtenidos en el Paso-1 y del efecto de la competencia obtenido en el Paso-2. Dicho modelo permite dada una sección censal, valorar la bondad de ubicar el establecimiento en dicha sección censal a partir de los datos demográficos del área de captura, de los perfiles objetivos y de la competencia.
FASE 4 Se realizó una evaluación a nivel de toda España a partir del modelo del Paso-3. Una vez realizada la evaluación se realizo un análisis y se genero un informe para el cliente, dónde se le informaba de las zonas más prometedoras a tres niveles: comunidad autónoma, provincia y municipio.
FASE 5 Se incorporó el modelo generado en el Paso-3 a la plataforma netGeomarketing así como la base de datos de competencia de forma que el cliente pudiese realizar estudios concretos a nivel de municipios.
Fase 5. El modelo se aplica a la plataforma NETGEOMARKETING de ITELLIGENT
FASE 6 Se incorporó información sobre la oferta de locales comerciales de las características de interés (metros cuadrados mínimos y máximos) para el cliente a nivel de sección censal (número de establecimientos y precio promedio). El cliente puede filtrar por los criterios establecidos para (ej. sólo mostrar secciones censales con oferta de suelo), y realizar un estudio para un local concreto a partir de sus ubicación.
Resultados
El cliente pasó de basar su esfuerzo de expansión en intuiciones más o menos acertadas, a basarse en datos y analíticas, por lo que se han mejorado considerablemente los procesos de decisión. Por otro lado el disponer de la plataforma netGeomarketing ha permitido al departamento de expansión ser mucho más productivo, pudiendo hacer un análisis detallado de un municipio y centrarse en las secciones censales de mayor potencial.
En este post incluimos algunos ejemplos de proyectos relacionados con la minería web en los que ITelligent ha participado. Estos proyectos pueden dar una estupenda idea de cómo se puede emplear la minería web que explicábamos en un post anterior.
Inteligencia Comercial para el sector Fotovoltaico y Termosolar
Este proyecto consistió en la obtención de inteligencia comercial para el sector fotovoltaico y termo-solar, el resultado fue un sistema que permite a sus usuarios obtener una ventaja competitiva gracias a que el sistema les permite monitorizar todos los proyectos de energía solar que se publican en España y disponer para cada uno de ellos de una información lista para ser aprovechada comercialmente.
Para este proyecto se desarrolló un «pipeline» muy complejo que a continuación se describe:
Sistema de Minería de Opinión para el sector Automovilístico
En este proyecto el cliente requería la monitorización de diversas páginas web de automóviles con contenidos subjetivos (comentarios) y la extracción de inteligencia de estos comentarios. El resultado es un sistema que permite determinar de cada automóvil del que se habla, de que elemento del mismo se habla (ej. seguridad, conducción, habitáculo) y si se habla positivamente o negativamente.
Inicialmente el cliente indicó las características que quería estudiar de los automóviles (ej. precio, habitáculo, servicio, seguridad, …) y las páginas web que deseaba monitorizar. Una vez definido lo anterior se desarrolló, en colaboración con los profesores de la Universidad de Sevilla doctores José Antonio Troyano y Fermín Cruz, el sistema que a continuación se describe:
Inteligencia Competitiva para Ayudas y Subvenciones
En este proyecto el cliente necesitaba obtener todas las ayudas que diariamente se publican en España (sobre 30.000 ayudas al año), clasificarlas y obtener una ficha de cada una de las convocatorias, automatizando lo más posible con vistas a minimizar el esfuerzo manual. El cliente permite ofrecer a sus usuarios una información muy completa de todas las ayudas y subvenciones casi en tiempo real.
Inicialmente el cliente definió como deberían ser clasificadas cada una de las ayudas localizadas, esta clasificación jerárquica permite posteriormente filtrar y crear alertas. Además para cada una de las convocatorias de ayudas se crea una plantilla con diversos campos (ej. plazo, objeto de la convocatoria, …), que permite disponer de una información homogenizada.
Para este proyecto se desarrolló un «pipeline» muy complejo que a continuación se describe: