Tag: Inteligencia Artificial

google journalist studio periodismo de datos

Desde proyectos de investigación a largo plazo que exponen irregularidades hasta análisis de noticias de última hora sobre decisiones judiciales importantes, el periodismo de datos a menudo se basa en colecciones gigantes de documentos, imágenes y grabaciones de audio. Los periodistas se enfrentan con una decisión difícil: hacerlo solos y que tome semanas, reclutar a un equipo de colegas o intentar escribir un programa para extraer los datos.

¿Cómo sería si pusiéramos lo mejor de la tecnología de la búsqueda, inteligencia artificial y machine learning de Google en manos de los periodistas? Este es el resultado: Journalist Studio, un conjunto de herramientas que utiliza tecnología para ayudar a los periodistas a hacer su trabajo de manera más eficiente, segura y creativa, y un nuevo producto para periodistas de la región de Latinoamérica.

Journalist Studio se compone de 13 herramientas enfocadas al análisis  de datos y su visualización para hacer más fácil la labor de investigación a periodistas de datos. Entre estas herramientas, destacamos las siguientes:

  • Programa de Protección Avanzada. Este programa protege a los usuarios que tienen alta visibilidad e información sensible y que estén en riesgo de recibir ataques intencionados online. Se añaden protecciones nuevas automáticamente para hacer frente a la amplia gama de amenazas que hay hoy en día. Más  información.
  • The Common Knowdledge Project. Para explorar, visualizas y compartir datos sobre temas importantes en unacomunidad local, creando gráficos propios a partir de miles de millones de puntos de datos públicos. Más información.
  • Data Commons. Es un repositorio de open data que combina datos públicos utilizando entidades comunes mapeadas. Incluye herramientas para explorar y analizar fácilmente datos en diferentes conjuntos de datos sin necesidad de limpiar o unir datos. Más información.
  • Pinpoint. Subir y analizar una gran cantidad de documentos con el poder de la Búsqueda de Google, la Inteligencia Artificial y el aprendizaje automático. Más adelante nos centramos en este herramienta.
  • Fact check Explorer. Buscar resultados de verificación de hechos en la web sobre un tema o una persona. Más información.
  • Flourish. Herramienta para la visualización de los datos utilizando plantillas personalizadas. Más información.

En el listado anterior hemos citado Pinpoint. Una plataforma para ayudar a los reporteros a revisar rápidamente entre cientos de miles de documentos, identificando y organizando automáticamente a las personas, organizaciones y ubicaciones mencionadas con mayor frecuencia. En lugar de pedir a los usuarios que presionen repetidamente «Ctrl+F», la herramienta ayuda a los periodistas a utilizar la Búsqueda de Google y el gráfico de conocimiento, el reconocimiento óptico de caracteres y las tecnologías de voz a texto para buscar en archivos PDF escaneados, imágenes, notas escritas a mano, correos electrónicos y archivos de audio.

pintpoint_journalist studio_periodismo de datos
Pinpoint ya ha demostrado ser útil para proyectos de investigación como el informe de USA TODAY sobre 40.600 muertes relacionadas con COVID-19 vinculadas a hogares de ancianos y la mirada de Reveal sobre el “desastre de las pruebas” de COVID-19 en los centros de detención de ICE, así como un artículo del Washington Post sobre la crisis de los opioides. La velocidad de esta herramienta también ayudó a los reporteros con proyectos a corto plazo como el análisis de Rappler, con sede en Filipinas, de los informes de la CIA de la década de 1970, y situaciones de noticias de última hora, como la verificación rápida de hechos de Verificado MX, con sede en México, de las actualizaciones diarias del gobierno sobre la pandemia.
Pinpoint está disponible ahora y los periodistas ya pueden registrarse para solicitar acceso. La herramienta permite cargar y analizar documentos en siete idiomas: inglés, francés, alemán, italiano, polaco, portugués y español. Para impulsar la colaboración, también Google se ha asociado con The Center for Public Integrity, Document Cloud, el programa Big Local News de la Universidad de Stanford y The Washington Post para crear colecciones públicas compartidas, disponibles para todos los usuarios. El próximo jueves 23 de octubre Google a las 18.00 am (España) realizará desde Youtube un streaming para que los periodistas interesados puedan participar de un entrenamiento sobre Pinpoint:

Ingenieros de ITELLIGENT serán parte de los docentes junto a otros profesionales del sector en varios cursos que lanza «Andalucía Es Digital» junto a la «Escuela de Organización Industrial» sobre IA y Machine Learning.

Andalucía Es Digital es una iniciativa de la Junta de Andalucía (J.A.) destinada a la promoción de la sociedad digital y la economía 4.0. Esta iniciativa es impulsada por la Dirección General de Economía Digital e Innovación de la Consejería de Economía, Conocimiento, Empresas y Universidad de la J.A. En este ultimo trimestre del año, Andalucía Es Digital ofrece cursos de formación sobre Inteligencia Artificial y Machine Learning para desarrolladores y directivos de empresas. Los participantes en estos cursos, cuya inscripción ha sido gratuita, obtendrán un certificado de calidad emitido por la Escuela de Organización Industrial (EOI) tras su finalización en el mes de diciembre.

inteligencia artificial andalucia es digital eoi itelligent

Programa de Inteligencia Artificial para personal directivo.

Dirigido a personal directivo y mandos intermedios de empresas andaluzas del sector de las Tecnologías de la Información y la Comunicación (TIC) interesados en adquirir un conocimiento general de las diferentes áreas que componen la Inteligencia Artificial.

En este curso se pretende mostrar una visión práctica de los tres campos de más aplicación que están utilizándose en el mundo corporativo: visión Artificial (VA), Aprendizaje Automático (Machine Learning) y Procesamiento del Lenguaje Natural (PLN). En cuanto a éste último, Jaime Martel CTO de ITELLIGENT, impartirá una de las sesiones  en la que mostrará casos prácticos de aplicación del PLN en diversos sectores:

  • La clasificación documental.
  • Preguntas y respuestas turísticas a partir de datos colaborativos.
  • Extracción de keywords y resúmenes de artículos científicos.
  • Detección de hot topics en noticias.
  • Extracción de información de resoluciones administrativas y CVs.
  • Alexa en la interpretación consumo eléctrico (NLG).

machine learning andalucia es digital eoi itelligent

Machine Learning para desarrolladores

Dirigido a personas autónomas y profesionales de empresas del sector TIC andaluz cuya actividad principal es el desarrollo de software. Para el correcto desarrollo del curso si es necesario disponer de algunos conocimientos previos en programación y conocimientos básicos de matemáticas y, especialmente, álgebra.

En este curso se pretende dar a conocer las herramientas más utilizadas en la construcción de aplicaciones de Inteligencia Artificial: R, Python y las plataformas de desarrollo que simplifican el modelado y evaluación de las soluciones.

En este curso, nuestro compañero del departamento de Ingeniería I+D+i de ITELLIGENT, Mario Rivas, impartirá una sesión en streaming sobre «Python en la práctica» en dos módulos:

  • Desarrollo de un recomendador de moda desde información textual a información visual mediante Convolutional Neural Network.
  • Desarrollo de un sistema de búsqueda de recursos turísticos basada en Deep Learning (embeddings) utilizando textos informales (comentarios).

¿Te han parecido interesantes estos cursos? Aunque ya están las plazas ocupadas ¡no desesperes! Andalucía Es Digital posee un amplio abanico de cursos en su buscador que puedes descubrir aquí.

También, puedes seguir Andalucía Es Digital tanto en Twitter como en LinkedIn para estar al día de todas sus iniciativas para la promoción de la sociedad digital  y Economía 4.0 en Andalucía.

catalogo cursos andalucia es digital

PyTorch es un framework de Machine Learning de código abierto creado para ser flexible y modular para la investigación, con la estabilidad y el soporte necesarios para el despliegue de producción. PyTorch proporciona un paquete de Python para funciones de alto nivel como el cálculo de tensor (como NumPy) con una fuerte aceleración de GPU y TorchScript para una transición fácil entre el modo «eager» y el modo gráfico. Con la última versión de PyTorch, el framework proporciona ejecución basada en gráficos, capacitación distribuida, implementación móvil y cuantización. La sencillez de su interfaz, y su capacidad para ejecutarse en GPUs (lo que acelera el entrenamiento de los modelos), lo convierten en la opción más asequible para crear redes neuronales artificiales.

Originalmente desarrollado por Facebook AI Research, PyTorch ha sido a su vez una pieza fundamental en el desarrollo de relevantes aplicaciones de Inteligencia Artificial, como el Autopilot de Tesla y el Pyro de Uber. Gracias a su facilidad de uso, PyTorch se ha convertido en uno de los frameworks de Deep Learning más populares del mundo, al que sólo hacen sombra Tensorflow y Keras, ambos respaldados por el patrocinio de Google. En este artículo (en inglés), puedes descubrir las diferencias entre PyTorch y TensorFlow.

¿Por qué PyTorch es el framework de Deep Learning del futuro?

A continuación, te exponemos las diez razones por las que PyTorch es uno de los framework de aprendizaje profucndo más populares a nivel mundial:

1. Python es uno de los lenguajes de programación más populares utilizados por los científicos de datos, para construir modelos de Machine Learning. PyTorch está diseñado para integrarse perfectamente con Python y sus bibliotecas populares como NumPy.

2. Fácil de aprender. PyTorch es más fácil de aprender que otros frameworks de Deep Learning. Esto se debe a que su sintaxis y aplicación son similares a muchos lenguajes de programación convencionales como Python.La documentación de PyTorch también es muy organizada y útil para principiantes. Más adelante os mostraremos recursos para aprender PyTorch.

3. Mayor productividad del desarrollador. PyTorch es muy simple de usar, lo que también significa que la curva de aprendizaje para los desarrolladores es relativamente corta. PyTorch tiene una interfaz Python simple y proporciona una API simple pero potente. PyTorch también se puede implementar fácilmente en Windows y Linux.

4. Debugging (depuración) fácil. Como PyTorch está profundamente integrado con Python, muchas herramientas de depuración de Python también se pueden usar en el código PyTorch. Específicamente, las herramientas pdb e ipdb de Python se pueden usar para este tipo de depuración en PyTorch.

5. Data Parallelism. PyTorch tiene una característica muy útil conocida como paralelismo de datos. Con esta función, PyTorch puede distribuir el trabajo computacional entre múltiples núcleos de CPU o GPU

6. Support de gráfico dinámico. PyTorch admite gráficos computacionales dinámicos, lo que significa que el comportamiento de la red se puede cambiar mediante programación en tiempo de ejecución. Esto facilita una optimización de modelo más eficiente y le da a PyTorch una gran ventaja sobre otros frameworks de aprendizaje automático, que tratan las redes neuronales como objetos estáticos. Con este enfoque dinámico, podemos ver todos y cada uno de los cálculos y saber exactamente lo que está sucediendo. Cuando el flujo de datos y las operaciones correspondientes se definen en tiempo de ejecución, la construcción del gráfico computacional ocurre dinámicamente. Esto se hace con la ayuda de la clase de autogrado implícitamente.

7. PyTorch también proporciona un nuevo front-end híbrido. Esto significa que tenemos dos modos de operación, a saber, el modo «eager» y el modo gráfico. Generalmente utilizamos el modo «eager» para la investigación y el desarrollo, ya que este modo proporciona flexibilidad y facilidad de uso. Y generalmente utilizamos el modo gráfico para la producción, ya que esto proporciona una mejor velocidad, optimización y funcionalidad en un entorno de tiempo de ejecución C ++.

8. Bibliotecas útiles. Una gran comunidad de desarrolladores ha creado muchas herramientas y bibliotecas para extender PyTorch. La comunidad también está apoyando el desarrollo en visión por computadora, aprendizaje de refuerzo y mucho más.

9. PyTorch tiene soporte nativo de ONNX y puede exportar modelos en el formato estándar de intercambio de red neuronal abierta. Esto permitirá que los modelos basados ​​en PyTorch accedan directamente a las plataformas y tiempos de ejecución compatibles con ONNX.

10. PyTorch también es bien recibido por las principales plataformas en la nube, lo que permite a los desarrolladores e ingenieros realizar trabajos de capacitación a gran escala en GPU con PyTorch. El soporte en la nube de PyTorch también proporciona la capacidad de ejecutar modelos en un entorno de producción.

learning pytorch

Recursos para aprender PyTorch

Gracias a Internet, podemos acceder a un gran numero de recursos gratuitos para aprender PyTorch. La propia web de PyTorch ofrece una serie de herramientas -en inglés- como son:

  • La guía de referencia de la API: https://pytorch.org/docs/stable/index.html
  • Videotutoriales de 60 minutos: https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html
  • Tutoriales: https://pytorch.org/tutorials/
  • Recetas de ejemplos de códigos: https://pytorch.org/tutorials/recipes/recipes_index.html
  • Manual: Deep Learning with PyTorch

Sin embargo si necesitas mejor videotutoriales en español, existe el canal de YouTube Not CSV el cual posee una interesante introducción a PyTorch dividida en dos vídeos de una hora cada uno.

Por otro lado, existen otros recursos formativos muy útiles fuera de la web de PyTorch como: