Nuestro Blog

La Redes Neuronales Generativas Adversarias conocidas a nivel mundial como GAN -del inglés, Generative Adversarial Networks- se tratan de modelos de deep learning para generar y/o manipular imágenes, fotos, videos y edición de audios. Gracias a la maravillosa mente de Ian Goodfellow, quién junto a otros siete compañeros de la Universidad de Montreal en 2014, escribieron el primer paper sobre Generative Adversal Networks, hoy en día conocemos estas redes neuronales basadas en deep lerning.

Las GANs funcionan con dos redes neuronales: una “generadora” y otra “discriminadora”. Ambas compiten en un constante juego de suma cero donde lo que una red gana, la otra pierde. En otras palabras,  la ganancia o pérdida de una de las redes se compensa con la ganancia o pérdida de la opuesta. Desarrollamos un poco más esta idea.

La red neuronal «generadora» produce muestras de aquello que queremos crear (ej. imágenes, textos, sonidos…) con el objetivo de engañar a la red «discriminadora» para que crea que son reales. A su vez, el objetivo de la red «discriminadora» es detectar las falsificaciones analizando el material producido por la red «generadora» y determinando si se ajusta a lo que está buscando.  Es decir, identifica si cada instancia de datos que revisa pertenece o no al conjunto de datos de entrenamiento. En palabras de Ian Goodfellow, «es un proceso donde cada una de las redes va mejorando y aprende de su oponente».

Las GAN han logrado grandes avances y ahora pueden producir imágenes falsas muy convincentes de animales, paisajes, rostros humanos, etc. hasta tal punto que han surgido apps que permiten, a cualquier persona con un smartphone, experimentar con esta tecnología. Un ejemplo de esto son las apps que generan imágenes «deep fakes».

Generación de imágenes «deep fakes»

Deep Fake es un concepto relativamente nuevo y que está compuesto por los términos: deep learning y fake. Esto es «aprendizaje profundo», una de las ramas de la Inteligencia Artificial, y la palabra, «falso». Este concepto es bastante acertado ya que la tecnología que genera estos rostros hiperrealistas (o casi hiperrealistas) que no se corresponden con una persona real ya que falsifica (fake) su voz y sus gestos, son modelos de deep learning basados en Redes Neuronales Generativas Adversarias (GAN).

Actualmente existen apps centradas en el «Deep fake» que permiten jugar con imágenes y/o audiovisuales de tal forma que cualquier persona, con tan solo descargarla, pueda tener a su disposición esta manipulación de imágenes. Uno de los primeros ejemplos más famosos de «deep fake» es un vídeo de con imágenes que «falseaba» ser Obama:

Otro ejemplo más reciente ocurrió el verano pasado (2019), con el auge de #FaceAppChallenge: una app que permitía simular qué aspecto podría tener una persona en el futuro en la vejez. Esta app se hizo viral pese a muchas advertencias en diferentes medios off/online sobre el posible «peligro» existente en la privacidad del usuario al aceptar las condiciones en la descarga de la aplicación. Sin embargo, pese a ello, hemos podido ver como se ha hecho de nuevo viral este verano. En esta ocasión, con simulaciones de cómo sería un persona cambiando de sexo, es decir, ver cómo se vería una mujer si fuese hombre o un hombre si fuese mujer.

.

google journalist studio periodismo de datos

Desde proyectos de investigación a largo plazo que exponen irregularidades hasta análisis de noticias de última hora sobre decisiones judiciales importantes, el periodismo de datos a menudo se basa en colecciones gigantes de documentos, imágenes y grabaciones de audio. Los periodistas se enfrentan con una decisión difícil: hacerlo solos y que tome semanas, reclutar a un equipo de colegas o intentar escribir un programa para extraer los datos.

¿Cómo sería si pusiéramos lo mejor de la tecnología de la búsqueda, inteligencia artificial y machine learning de Google en manos de los periodistas? Este es el resultado: Journalist Studio, un conjunto de herramientas que utiliza tecnología para ayudar a los periodistas a hacer su trabajo de manera más eficiente, segura y creativa, y un nuevo producto para periodistas de la región de Latinoamérica.

Journalist Studio se compone de 13 herramientas enfocadas al análisis  de datos y su visualización para hacer más fácil la labor de investigación a periodistas de datos. Entre estas herramientas, destacamos las siguientes:

  • Programa de Protección Avanzada. Este programa protege a los usuarios que tienen alta visibilidad e información sensible y que estén en riesgo de recibir ataques intencionados online. Se añaden protecciones nuevas automáticamente para hacer frente a la amplia gama de amenazas que hay hoy en día. Más  información.
  • The Common Knowdledge Project. Para explorar, visualizas y compartir datos sobre temas importantes en unacomunidad local, creando gráficos propios a partir de miles de millones de puntos de datos públicos. Más información.
  • Data Commons. Es un repositorio de open data que combina datos públicos utilizando entidades comunes mapeadas. Incluye herramientas para explorar y analizar fácilmente datos en diferentes conjuntos de datos sin necesidad de limpiar o unir datos. Más información.
  • Pinpoint. Subir y analizar una gran cantidad de documentos con el poder de la Búsqueda de Google, la Inteligencia Artificial y el aprendizaje automático. Más adelante nos centramos en este herramienta.
  • Fact check Explorer. Buscar resultados de verificación de hechos en la web sobre un tema o una persona. Más información.
  • Flourish. Herramienta para la visualización de los datos utilizando plantillas personalizadas. Más información.

En el listado anterior hemos citado Pinpoint. Una plataforma para ayudar a los reporteros a revisar rápidamente entre cientos de miles de documentos, identificando y organizando automáticamente a las personas, organizaciones y ubicaciones mencionadas con mayor frecuencia. En lugar de pedir a los usuarios que presionen repetidamente «Ctrl+F», la herramienta ayuda a los periodistas a utilizar la Búsqueda de Google y el gráfico de conocimiento, el reconocimiento óptico de caracteres y las tecnologías de voz a texto para buscar en archivos PDF escaneados, imágenes, notas escritas a mano, correos electrónicos y archivos de audio.

pintpoint_journalist studio_periodismo de datos
Pinpoint ya ha demostrado ser útil para proyectos de investigación como el informe de USA TODAY sobre 40.600 muertes relacionadas con COVID-19 vinculadas a hogares de ancianos y la mirada de Reveal sobre el “desastre de las pruebas” de COVID-19 en los centros de detención de ICE, así como un artículo del Washington Post sobre la crisis de los opioides. La velocidad de esta herramienta también ayudó a los reporteros con proyectos a corto plazo como el análisis de Rappler, con sede en Filipinas, de los informes de la CIA de la década de 1970, y situaciones de noticias de última hora, como la verificación rápida de hechos de Verificado MX, con sede en México, de las actualizaciones diarias del gobierno sobre la pandemia.
Pinpoint está disponible ahora y los periodistas ya pueden registrarse para solicitar acceso. La herramienta permite cargar y analizar documentos en siete idiomas: inglés, francés, alemán, italiano, polaco, portugués y español. Para impulsar la colaboración, también Google se ha asociado con The Center for Public Integrity, Document Cloud, el programa Big Local News de la Universidad de Stanford y The Washington Post para crear colecciones públicas compartidas, disponibles para todos los usuarios. El próximo jueves 23 de octubre Google a las 18.00 am (España) realizará desde Youtube un streaming para que los periodistas interesados puedan participar de un entrenamiento sobre Pinpoint:

Ingenieros de ITELLIGENT serán parte de los docentes junto a otros profesionales del sector en varios cursos que lanza «Andalucía Es Digital» junto a la «Escuela de Organización Industrial» sobre IA y Machine Learning.

Andalucía Es Digital es una iniciativa de la Junta de Andalucía (J.A.) destinada a la promoción de la sociedad digital y la economía 4.0. Esta iniciativa es impulsada por la Dirección General de Economía Digital e Innovación de la Consejería de Economía, Conocimiento, Empresas y Universidad de la J.A. En este ultimo trimestre del año, Andalucía Es Digital ofrece cursos de formación sobre Inteligencia Artificial y Machine Learning para desarrolladores y directivos de empresas. Los participantes en estos cursos, cuya inscripción ha sido gratuita, obtendrán un certificado de calidad emitido por la Escuela de Organización Industrial (EOI) tras su finalización en el mes de diciembre.

inteligencia artificial andalucia es digital eoi itelligent

Programa de Inteligencia Artificial para personal directivo.

Dirigido a personal directivo y mandos intermedios de empresas andaluzas del sector de las Tecnologías de la Información y la Comunicación (TIC) interesados en adquirir un conocimiento general de las diferentes áreas que componen la Inteligencia Artificial.

En este curso se pretende mostrar una visión práctica de los tres campos de más aplicación que están utilizándose en el mundo corporativo: visión Artificial (VA), Aprendizaje Automático (Machine Learning) y Procesamiento del Lenguaje Natural (PLN). En cuanto a éste último, Jaime Martel CTO de ITELLIGENT, impartirá una de las sesiones  en la que mostrará casos prácticos de aplicación del PLN en diversos sectores:

  • La clasificación documental.
  • Preguntas y respuestas turísticas a partir de datos colaborativos.
  • Extracción de keywords y resúmenes de artículos científicos.
  • Detección de hot topics en noticias.
  • Extracción de información de resoluciones administrativas y CVs.
  • Alexa en la interpretación consumo eléctrico (NLG).

machine learning andalucia es digital eoi itelligent

Machine Learning para desarrolladores

Dirigido a personas autónomas y profesionales de empresas del sector TIC andaluz cuya actividad principal es el desarrollo de software. Para el correcto desarrollo del curso si es necesario disponer de algunos conocimientos previos en programación y conocimientos básicos de matemáticas y, especialmente, álgebra.

En este curso se pretende dar a conocer las herramientas más utilizadas en la construcción de aplicaciones de Inteligencia Artificial: R, Python y las plataformas de desarrollo que simplifican el modelado y evaluación de las soluciones.

En este curso, nuestro compañero del departamento de Ingeniería I+D+i de ITELLIGENT, Mario Rivas, impartirá una sesión en streaming sobre «Python en la práctica» en dos módulos:

  • Desarrollo de un recomendador de moda desde información textual a información visual mediante Convolutional Neural Network.
  • Desarrollo de un sistema de búsqueda de recursos turísticos basada en Deep Learning (embeddings) utilizando textos informales (comentarios).

¿Te han parecido interesantes estos cursos? Aunque ya están las plazas ocupadas ¡no desesperes! Andalucía Es Digital posee un amplio abanico de cursos en su buscador que puedes descubrir aquí.

También, puedes seguir Andalucía Es Digital tanto en Twitter como en LinkedIn para estar al día de todas sus iniciativas para la promoción de la sociedad digital  y Economía 4.0 en Andalucía.

catalogo cursos andalucia es digital