Tag: Extraer información de pdf

google journalist studio periodismo de datos

Desde proyectos de investigación a largo plazo que exponen irregularidades hasta análisis de noticias de última hora sobre decisiones judiciales importantes, el periodismo de datos a menudo se basa en colecciones gigantes de documentos, imágenes y grabaciones de audio. Los periodistas se enfrentan con una decisión difícil: hacerlo solos y que tome semanas, reclutar a un equipo de colegas o intentar escribir un programa para extraer los datos.

¿Cómo sería si pusiéramos lo mejor de la tecnología de la búsqueda, inteligencia artificial y machine learning de Google en manos de los periodistas? Este es el resultado: Journalist Studio, un conjunto de herramientas que utiliza tecnología para ayudar a los periodistas a hacer su trabajo de manera más eficiente, segura y creativa, y un nuevo producto para periodistas de la región de Latinoamérica.

Journalist Studio se compone de 13 herramientas enfocadas al análisis  de datos y su visualización para hacer más fácil la labor de investigación a periodistas de datos. Entre estas herramientas, destacamos las siguientes:

  • Programa de Protección Avanzada. Este programa protege a los usuarios que tienen alta visibilidad e información sensible y que estén en riesgo de recibir ataques intencionados online. Se añaden protecciones nuevas automáticamente para hacer frente a la amplia gama de amenazas que hay hoy en día. Más  información.
  • The Common Knowdledge Project. Para explorar, visualizas y compartir datos sobre temas importantes en unacomunidad local, creando gráficos propios a partir de miles de millones de puntos de datos públicos. Más información.
  • Data Commons. Es un repositorio de open data que combina datos públicos utilizando entidades comunes mapeadas. Incluye herramientas para explorar y analizar fácilmente datos en diferentes conjuntos de datos sin necesidad de limpiar o unir datos. Más información.
  • Pinpoint. Subir y analizar una gran cantidad de documentos con el poder de la Búsqueda de Google, la Inteligencia Artificial y el aprendizaje automático. Más adelante nos centramos en este herramienta.
  • Fact check Explorer. Buscar resultados de verificación de hechos en la web sobre un tema o una persona. Más información.
  • Flourish. Herramienta para la visualización de los datos utilizando plantillas personalizadas. Más información.

En el listado anterior hemos citado Pinpoint. Una plataforma para ayudar a los reporteros a revisar rápidamente entre cientos de miles de documentos, identificando y organizando automáticamente a las personas, organizaciones y ubicaciones mencionadas con mayor frecuencia. En lugar de pedir a los usuarios que presionen repetidamente «Ctrl+F», la herramienta ayuda a los periodistas a utilizar la Búsqueda de Google y el gráfico de conocimiento, el reconocimiento óptico de caracteres y las tecnologías de voz a texto para buscar en archivos PDF escaneados, imágenes, notas escritas a mano, correos electrónicos y archivos de audio.

pintpoint_journalist studio_periodismo de datos
Pinpoint ya ha demostrado ser útil para proyectos de investigación como el informe de USA TODAY sobre 40.600 muertes relacionadas con COVID-19 vinculadas a hogares de ancianos y la mirada de Reveal sobre el “desastre de las pruebas” de COVID-19 en los centros de detención de ICE, así como un artículo del Washington Post sobre la crisis de los opioides. La velocidad de esta herramienta también ayudó a los reporteros con proyectos a corto plazo como el análisis de Rappler, con sede en Filipinas, de los informes de la CIA de la década de 1970, y situaciones de noticias de última hora, como la verificación rápida de hechos de Verificado MX, con sede en México, de las actualizaciones diarias del gobierno sobre la pandemia.
Pinpoint está disponible ahora y los periodistas ya pueden registrarse para solicitar acceso. La herramienta permite cargar y analizar documentos en siete idiomas: inglés, francés, alemán, italiano, polaco, portugués y español. Para impulsar la colaboración, también Google se ha asociado con The Center for Public Integrity, Document Cloud, el programa Big Local News de la Universidad de Stanford y The Washington Post para crear colecciones públicas compartidas, disponibles para todos los usuarios. El próximo jueves 23 de octubre Google a las 18.00 am (España) realizará desde Youtube un streaming para que los periodistas interesados puedan participar de un entrenamiento sobre Pinpoint: