El proceso de Product Matching consiste en relacionar para distintas fuentes aquellos productos que son el mismo. Esto, que puede parecer una tarea trivial, no es así debido a que para un mismo producto, en cada web, lo pueden nombrar de diferente forma. Por ejemplo, tomando datos de tres webs de viajes distintas, podemos ver como en cada una de ellas, al hotel Gran Bahía Duque y al Hotel Gran Meliá Palacio Isora en Tenerife, son nombradas por cada web de forma distinta.
WEB 1 | WEB 2 | WEB 3 |
Gran Hotel Bah\u00eda Del Duque Resort | Gran Bahia Del Duque Resort | HOTEL GRAN BAHIA DEL DUQUE RESORT 5* LUJO(Costa Adeje) |
Gran Melia Palacio De Isora | Gran Meliá Palacio de Isora Resort & SPA | HOTEL GRAN MELIA PALACIO DE ISORA 5* LUJO(Guia De Isora) |
¿Cómo solucionar esta problemática?
Existen dos enfoques para solventar el problema que conlleva el Product Matching:
- Técnica de similitud de textos: medir la similitud entre los textos de título y descripción de los productos para detectar aquellas ofertas que representan al mismo producto.
- Técnicas de aprendizaje automático para generar modelos que realicen el matching entre productos.
¿Cómo funciona un sistema de Product Matching?
Se basa en un proceso con las siguientes etapas:
- Preprocesado, se establece la normalización de los datos.
- Filtrado, se generan los bloques de Matching.
- Clasificación, se determina el producto con el que enlaza.
¿Quieres conocer más sobre Product Matching?
Te recomendamos las siguientes publicaciones:
Köpcke, H., Thor, A., Thomas, S., Rahm, E. Tailoring entity resolution for matching product offers.(2012) ACM International Conference Proceeding Series.
Köpcke, H., Thor, A., Rahm, E. Evaluation of entity resolution approaches on real-world match problems. (2010) Proceedings of the VLDB Endowment, 3 (1).
Thor, A. Toward an adaptive string similarity measure for matching product offers. (2010) INFORMATIK 2010 – Service Science – Neue Perspektiven fur die Informatik, Beitrage der 40. Jahrestagung der Gesellschaft fur Informatik e.V. (GI)
Kannan, A., Givoni, I.E., Agrawal, R., Fuxman, A. Matching unstructured product offers to structured product specifications. (2011) Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.
Kannan, A., Talukdar, P.P., Rasiwasia, N., Ke, Q. Improving product classification using images. (2011) Proceedings – IEEE International Conference on Data Mining, ICDM, art. no. 6137235.
0 comentarios