La minería web tiene como objeto descubrir información útil o el conocimiento (KNOWLEDGE) procedente de la estructura de hipervínculo web, contenido de la página y datos de usuario. Aunque la minería web utiliza muchas técnicas de minería de datos, no es meramente una aplicación de técnicas de minería de datos tradicionales, debido a la heterogeneidad y la naturaleza semi-estructurada o no estructurada de los datos de la web.
Muchas de las nuevas tareas de minería y algoritmos actuales fueron inventados en la pasada década. Basados en los principales tipos de información utilizados en el proceso de minería. Las tareas de minería web se pueden clasificar en tres tipos: estructura web de minería o web structure mining, extracción de contenido web o web content mining y la minería de uso web o web usage mining.
Web Usage Mining o Minería de Uso Web
En este post, nos centramos en la minería de uso web o web usage mining, para dar respuesta a qué es y en qué consiste este proceso. En primer lugar, debemos tener en cuenta que la Web Usage Mining tiene como objeto de estudio al usuario que navega en una página, a diferencia de web content mining y web strutcture mining que están enfocadas al estudio de la estructura y contenido de la website en sí misma. Este tipo de minería -web usage mining- tiene como objetivo: captar, modelar y analizar los patrones de comportamiento y los perfiles de los usuarios que interactúan con una web site. Estos patrones aportan datos de gran interés ya que se pueden utilizar para tener una mejor comprensión del comportamiento de grupos de usuarios con necesidades o intereses comunes dentro de una Web.
De esta forma, gracias a esta información dada con este tipo de minería web, se pueden tomar decisiones en el entorno de la Web, tales como:
Web Usage Mining se refiere a la detección y análisis automático de patrones en clickstreams, transacciones de usuario y otros datos asociados, recopilados o generados como resultado de las interacciones del usuario con los recursos web sobre uno o más sitios web.
Por tanto, el análisis de estos datos -información recopilada en torno a las conductas en la web de los usuarios-, puede ayudar al sector e-commerce (comercio electrónico) e inteligencia empresarial para:
Fuentes y tipos de datos en web usage mining
Ya tenemos una breve idea de qué consiste la minería web usage pero, si nos adentramos en términos técnicos, ¿qué fuentes y tipos de datos podemos obtener de esta minería web?
La principal fuente de datos usados en la web usage mining son los ficheros de logs de los servidores, access log, application logs, etc. Otras fuentes de datos adicionales, también esenciales para la preparación de datos y descubrir patrones, son: los archivos del sitio y meta-datos, bases de datos plantilla de aplicaciones y dominios inteligentes.
Los datos obtenidos a través de diversas fuentes se pueden clasificar en cuatro grupos principales.
Otras publicaciones en nuestro blog que pueden interesarte sobre Minería Web:
Bibligrafía recomendada:
LIU, BING (2007): WEB DATA MINING Exploring Hyperlinks, contents and usage data. Berlín: Ed. Springer Science & Business Media.
Knowledge Discovery in Database
Data Mining (minería de datos) es también conocida como Knowledge Discovery in database (KDD). Es comúnmente definida como el proceso para descubrir patrones útiles o conocimientos a partir de fuentes de datos tales como Bases de Datos, textos, imágenes, la web, etc. Los patrones deben ser válidos, potencialmente útiles y entendibles. La minería de datos es un campo multidisciplinar que incluye: aprendizaje automático, estadísticas, sistemas de base de datos, inteligencia artificial, Information Retrieval, visualización de la información, … El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Existen muchas técnica dentro de data mining. Existen muchas tareas de data mining. Algunos de los más comunes consisten en el aprendizaje supervisado, aprendizaje no supervisado, minería de asociación de reglas y minería de secuencia (1).
En resumen, la minería de datos es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
10 VENTAJAS DEL USO DE MINERÍA DE DATOS
Sin embargo, también existen pequeños inconvenientes en el uso de técnicas de minería de datos, tales como:
¿Quieres saber más sobre Data Mining o Minería Web?
Te recomendamos que eches un vistazo a estas dos publicaciones en nuestro blog:
O también, puedes leer este libro, como parte de la bibliografía consultada para este post: (1) LIU, BING (2007): WEB DATA MINING Exploring Hyperlinks, contents and usage data. Berlín: Ed. Springer Science & Business Media.
El próximo día 12 de Noviembre a partir de las 10:00 am, nuestro Director Técnico de Itelligent, Jaime Martel, tendrá la oportunidad de participar en el IV Congreso Nacional de Conocimiento Abierto Bioinspirado e Inteligencia Colectiva, que se celebrará en el BBVA Innovation Center de Madrid.
Dicha jornada tendrá la finalidad de poner en conocimiento de las empresas las posibilidades de mejora de su competitividad mediante el desarrollo de herramientas que potencien su operatividad comercial y organizativa. Especialmente la capacidad de acelerador tecnológico del BIG DATA OPTIMIZER de Knowdle Foundation & Research Institute.
Jaime Martel, tratará el tema “Estado del arte de los robots semánticos”, durante la Mesa Redonda “Well are all Media Players: Big Data of Media Computing Challenges”, que tendrá lugar de 11:30 – 12:30 am. Según el Director Tecnico de Itelligent: “Una parte importante del potencial a realizar por el Big Data y la Analítica Empresarial proviene de la puesta en valor de los contenidos generados por los usuarios y otras informaciones textuales en lenguaje natural”.
Si estáis interesados en este evento se emitirá en Streaming a través del perfil de BBVA Innovation Center en YouTube