El Plan de Impulso de las Tecnologías del Lenguaje (PTL) se ejecuta en el marco de la Agenda Digital para España y tiene como objetivo impulsar el sector del procesamiento del lenguaje natural (PLN), la traducción automática y los sistemas conversacionales en lengua española y lenguas cooficiales. Con un alcance de cinco años, este PTL tiene como premisa coordinar todas las actuaciones de la Administración General del Estado junto a las Comunidades Autónomas para fomentar las tecnologías del lenguaje.
Asimismo, existen algunos objetivos específicos que se engloban en este Plan:
El PTL pretende que el impulso a las tecnologías del lenguaje se realice de forma coordinada: buscar sinergias y evitar duplicidad de esfuerzos, conforme a las recomendaciones de la Comisión para la Reforma de las Administraciones Públicas (CORA).
Este PTL se estructura en cuatro ejes principales:
Puedes descargarlo aquí.
ITELLIGENT, pionera en España en Procesamiento del Lenguaje Natural
Con más de diez años de experiencia, ITELLIGENT ha sido pionera en aplicaciones de técnicas de Procesamiento de Lenguaje Natural para diversos clientes y proyectos, tanto nacionales como internacionales. Asimismo, nos hemos especializado en el desarrollo de tecnologías encaminadas a la estructuración de Big Data y el desarrollo de soluciones que permitan a las organizaciones una ventaja competitiva gracias a la «inteligencia» que el análisis de estos grandes volúmenes de datos les aporta.
¿Quieres saber más sobre nuestros proyectos?
La clasificación automática de documentos consiste en utilizar técnicas de Inteligencia Artificial sobre un conjunto de elementos para ordenarlos por clases o categorías. Sin embargo, también se pueden utilizar estas técnicas para asignar un documento a una determinada clase o categoría.
Par llevar a cabo la clasificación automática de documentos primero hay que realizar una extracción de features (características) destinadas a ser informativos y no redundantes. Esto facilitará los pasos posteriores de machine learning en la clasificación automática de documentos. La extracción de características (features) se trata de un proceso de reducción y codificación, donde un conjunto inicial de variables sin procesar (ej. texto en un documento) se reduce a características más manejables para su procesamiento (ej. números) y que se describa con precisión el conjunto de datos original.
Existen diversas técnicas de extracción de features:
Técnica clásicas
Nuevas técnicas basadas en Deep Learning:
Tras la extracción de features y en base a la información previa que se posea de los documentos a clasificar o categorizar, se podrán realizar diversas técnicas para la clasificación automática de documentos:
Cuáles son las técnicas de clasificación automática de documentos más usadas
Según el tipo de clasificación, existen: