Introducción al Procesamiento del Lenguaje Natural: de Turing a Bert, pasando por Watson

Post sobre:

Escrito por:

Martel, Jaime

03/02/2021

Década de los 50

Se considera 1950 como el año del nacimiento del PLN, cuando Alan Turing publica un artículo denominado “Machine and Intelligence”. Poniendo de relieve que una forma de medir la inteligencia seria a través de la capacidad de una máquina de responder preguntas de forma que un operador humano no distinguiera sus respuestas de las de un humano (Test de Turing).

Un énfasis inicial en la década de los 50s fue la traducción automática, en particular entre inglés y ruso, con objetivos militares. Una época de fuerte optimismo en las posibilidades del PLN.

En esa época uno de los sistemas desarrollados, al traducir un versículo del testamento (Mateos, 26:41) que dice: ‘the spirit is willing, but the flesh is weak’ (el espíritu es voluntarioso, pero la carne es débil) lo tradujo por ‘the vodka is agreeable, but the meat is spoiled’ (el vodka es agradable pero la carne esta podrida), estos tipos de errores fueron los que hicieron

[Tweet «Introducción al #PLN: De Turing a Bert, pasando por Watson #IA «]

Década de los 60 y 70

A principio de los 60s los sistemas desarrollados de Traducción Automática son evaluados con resultados muy limitados lo que paralizó su desarrollo futuro y en general supuso un baño de realidad para el sector del PLN.

Durante esta década Noam Chomsky (lingüista estadounidense) introduce la teoría formal del lenguaje y la sintaxis generativa. Esto dio un nuevo impulso al PLN, con la creación de nuevas aproximaciones basadas principalmente en reglas cuyo objetivo era generar lenguaje o parsear textos.

Desgraciadamente estos sistemas basados en reglas, se vieron pronto superados por la complejidad del lenguaje natural, así los sistemas requerían más y más reglas llegando a convertirse en inmanejables.

Se comenta que en esa época Fred Jelinek de IBM que trabajaba en los sistemas de PLN decía: “cada vez que un lingüista abandona el equipo el sistema mejora”, en referencia a las limitaciones de los modelos basados en reglas lingüísticas frente a los modelos basados en probabilidad y aprendizaje automático.

Década de los 80 y 90

Las limitaciones de los sistemas basados en reglas hacen que en esta década comiencen a tener cada vez más protagonismo los sistemas basados en probabilidad y aprendizaje automático (machine learning). Estos sistemas van reduciendo su dependencia de modelos lingüísticos y se basan cada vez más en datos (ej. conjuntos de textos denominados “corpus”).

Durante los 90s la aparición de internet, introduce la disponibilidad de un gran número de textos (html, pdfs,…) y audios, además de la necesidad de nuevas herramientas que sean capaces de poner en valor estos grandes repositorios de datos. Durante esta década se desarrollan los sistemas de búsqueda (ej. AltaVista y Yahoo) y a finales de los 90s aparece Google que supone un cambio de paradigma en los sistemas de búsqueda.

yahoo

Década de los 2000

Las técnicas de Aprendizaje Automático (Machine Learning) van tomando cada vez más protagonismo. El éxito de empresas como Google, hacen que la Inteligencia Artificial y el PLN comiencen a popularizarse.

Durante la década del 2000s IBM desarrolla Watson, que en el 2011 derrota al juego del Jeopardy a dos expertos en dicho juego. Watson es un sistema diseñado para una tarea de PLN denominada Q&A (preguntas y respuestas), adaptado a las particularidades de Jeopardy y con capacidad de interactuar por voz con el presentador.

Década de los 2010

Las nuevas técnicas de Deep Learning (redes neuronales profundas) que a principios de la década están revolucionando el procesamiento de imágenes llegan al PLN. Apareciendo en el 2012 Word2Vec una técnica de “Word embedding” que permite representar las palabras de un texto como vectores, con unas propiedades muy interesantes. Word2vec representó la introducción de un nuevo paradigma en el PLN, que comienza a abordar con éxito tareas hasta entonces consideradas extremadamente complicadas.

En el 2018 Google presenta BERT, que es un modelo de Word embedding, que presenta mejoras sobre Word2vec, entre otras, su capacidad de representar mediante diferentes vectores palabras polisémicas.

Otras entradas de esta categoría

Espacios de datos: qué son y por qué son necesarios

Open Data

¿Por qué son necesarios los espacios de datos? Hoy en día, hay sectores donde es requisito...

Caso de uso ChatGPT: cómo contestar preguntas sobre un repositorio documental propio.

Big Data e Inteligencia Artificial

Nuestra plataforma netITELLIGENT dispone de un potente buscador sobre aquellos repositorios...

iPredice, un ejemplo de aplicación de Inteligencia Artificial para el mantenimiento predictivo de infraestructuras energéticas

Digitalización Ciclo del Agua

ITELLIGENT, en consorcio con Grupo Energético de Puerto Real, Wattabit y Universidad de Cádiz,...

« Entradas más antiguas

¿Quieres aportar nueva información o hacernos un comentario?

1 Comentario

José Joaquín Jiménez Ruiz el 28 de noviembre de 2023 a las 18:38

¿Qué resultados da hoy en día un programa como CHAT GPT 4, en el test de Turing, para ver la capacidad de una máquina de responder preguntas de forma que un operador humano no distinguiera sus respuestas de las de un humano ?.
Responder

ITELLIGENT

Introducción al Procesamiento del Lenguaje Natural: de Turing a Bert, pasando por Watson

Otras entradas de esta categoría

Espacios de datos: qué son y por qué son necesarios

Caso de uso ChatGPT: cómo contestar preguntas sobre un repositorio documental propio.

iPredice, un ejemplo de aplicación de Inteligencia Artificial para el mantenimiento predictivo de infraestructuras energéticas

¿Quieres aportar nueva información o hacernos un comentario?

1 Comentario

Enviar un comentario Cancelar la respuesta

Síguenos

Contacto

TELÉFONO	(+34) 910 783 660
EMAIL	info@itelligent.es
OFICINA CENTRAL	Parque Tecnológico CEEI Calle Manantial, 13, 11500 El Puerto de Santa María Cádiz – ESPAÑA