Tag: web content mining

0

La minería web tiene como objeto descubrir información útil o el conocimiento (KNOWLEDGE) procedente de la estructura de hipervínculo web, contenido de la página y datos de usuario. Aunque la minería web utiliza muchas técnicas de minería de datos, no es meramente una aplicación de técnicas de minería de datos tradicionales, debido a la heterogeneidad y la naturaleza semi-estructurada o no estructurada de los datos de la web.

Muchas de las nuevas tareas de minería y algoritmos actuales  fueron  inventados en la pasada década.  Basados en los principales tipos de información utilizados en el proceso de minería. Las tareas de minería web se pueden clasificar en tres tipos: estructura web de minería o web structure mining, extracción de contenido web o web content mining y la minería de uso web o web usage mining.

Web Usage Mining o Minería de Uso Web

En este post, nos centramos en la minería de uso web o web usage mining, para dar respuesta a qué es y en qué consiste este proceso. En primer lugar, debemos tener en cuenta que la Web Usage Mining tiene como objeto de estudio al usuario que navega en una página, a diferencia de web content mining y web strutcture mining que están enfocadas al estudio de la estructura y contenido de la website en sí misma. Este tipo de minería -web usage mining- tiene como objetivo: captar, modelar y analizar  los patrones de comportamiento y los perfiles de los usuarios que interactúan con una web site.  Estos patrones aportan datos de gran interés ya que se pueden utilizar para tener una mejor comprensión del comportamiento de grupos de usuarios con necesidades o intereses comunes dentro de una Web.

De esta forma, gracias a esta información dada con este tipo de minería web, se pueden tomar decisiones en el entorno de la Web, tales como:

  • Mejorar la organización y estructura del sitio web
  • Crear experiencias personalizadas para los usuarios
  • Facilitar la navegación al usuario
  • Generar sugerencias dinámicas de productos o servicios (a través de un sistemas de recomendaciones)

webdatamining_itelligent

Web Usage Mining  se refiere a la detección y análisis automático de patrones en clickstreams, transacciones de usuario y otros datos asociados, recopilados o generados como resultado de las interacciones del usuario con los recursos web sobre uno o más sitios web.

Por tanto, el análisis de estos datos -información recopilada en torno a las conductas en la web de los usuarios-, puede ayudar al sector e-commerce (comercio electrónico) e inteligencia empresarial para:

  • Determinar el valor de la lifetime del cliente
  • Diseñar estrategias de cross-marketing para productos y servicios
  • Valorar la eficacia de las campañas promocionales
  • Optimizar la funcionalidad de las aplicaciones web-based
  • Ofrecer contenido más personalizado a los visitantes web
  • Y por último, encontrar la estructura lógica más eficaz para su espacio web

Fuentes y tipos de datos en web usage mining

Ya tenemos una breve idea de qué consiste la minería web usage pero,  si nos adentramos en términos técnicos, ¿qué fuentes y  tipos de datos podemos obtener de esta minería web?

La principal fuente de datos usados en la web usage mining son los ficheros de logs de los servidores, access log, application logs, etc. Otras fuentes de datos adicionales, también esenciales para la preparación de datos y descubrir patrones, son: los archivos del sitio y meta-datos, bases de datos  plantilla de aplicaciones y dominios inteligentes.

Los datos obtenidos a través de diversas fuentes se pueden clasificar en cuatro grupos principales.

  • USAGE DATA Es la principal fuente de datos de minería de uso web. Los datos recopilados de forma automática por la web y servidores representa el comportamiento de navegación de los visitantes. El  nivel más básico de la extracción de los datos la visita de una página (pageview) ya que se obtiene la información básica del visitante (user client) como puede ser la lectura de un artículo, la vista de un página de un producto o agregar un producto al carrito de la compra. A nivel de usuario, el nivel más básico de extracción de comportamiento es la sesión (session). Una sesión es una secuencia de páginas vistas por un único usuario durante una única visita.
  • CONTENT DATA Los datos de contenido en un sitio son la colección de objetos y las relaciones que se transmite al usuario. En su mayor parte, estos datos se componen de combinaciones de materiales de texto e imágenes.
  • STRUCTURE DATA La estructura de los datos representa el diseño de cómo se aprecia (view) la organización del contenido dentro de la web. En esta estructura de los datos también incluye la estructura del contenido dentro de una página.
  • USER DATA Las bases de datos para el sitio pueden incluir información adicional sobre el perfil de usuario. Estos datos pueden incluir información demográfica sobre los usuarios registrados , valoraciones de los usuarios sobre diversos objetos tales como productos o películas, compras anteriores o historias de estancia de los usuarios , así como otras representaciones explícitas o implícitas sobre los intereses del usuario.

Otras publicaciones en nuestro blog que pueden interesarte sobre Minería Web:

  • Minería web: de contenidos, de estructuras y de usos: donde se define qué es la minería web y se describen sus tres variantes: web content mining o minería del contenido de la web, web structure mining o mineria de la estructura de la web, y web usage mining o minería de uso web (registro de navegación de la web)
  • Aplicaciones prácticas de Minería Web: donde se incluyen algunos proyectos relacionados con la Minería Web en los que ITELLIGENT ha participado. Se tratan de ejemplo práctico en el sector automovilístico, Fotovolcaico y Termosolar, y Ayudas y Subvenciones.

Bibligrafía recomendada:

LIU, BING (2007): WEB DATA MINING Exploring Hyperlinks, contents and usage data. Berlín: Ed. Springer Science & Business Media.