¿Cómo podemos gestionar mejor el consumo y el uso de los recursos naturales de nuestro planeta y proteger el medio ambiente? Para responder a esta y otras preguntas, se requiere una continua monitorización del estado y salud de la Tierra. El programa Copernicus creado por la UE nos ayuda a ello. Copernicus observa nuestro medioambiente, recopila-almacena datos y analiza y elabora productos para la toma de decisiones. El programa proporciona datos de manera operacional y servicios de información, de forma gratuita, sobre numerosas áreas de aplicación, gracias a una gran variedad de tecnologías que van, desde satélites en el espacio a sistemas de medición en tierra, mar y aire.
¿Qué es Copernicus?
Copernicus es un programa de observación y monitorización de la Tierra de la Unión Europea. El objetivo de este programa es analizar nuestro planeta y su medio ambiente para proteger sus recursos naturales y sus seres que habitan en él. Proporciona un enorme conjunto de datos abiertos (open data), gratuitos y de alto valor. A partir de infraestructuras de observación por satélites y sistema de medición por tierra, mar y aire, se generan servicios de información accesible para los ciudadanos, la administración pública, la comunidad científica, emprendedores y empresas. Esta recopilación de información y generación de conocimiento sobre nuestro planeta tiene el fin de mejorar la calidad de vida de la sociedad mundial.
La Comisión Europea coordina y gestiona el programa, en cuya ejecución colaboran los Estados miembros, la Agencia Espacial Europea (ESA), la Organización Europea para la Explotación de Satélites Meteorológicos (Eumetsat), el Centro Europeo de Previsiones Meteorológicas a Medio Plazo (ECMWF), las agencias de la UE y la empresa Mercator Océan.
En definitiva, Copernicus monitoriza nuestro planeta y sus muchos ecosistemas, garantizando al mismo tiempo que sus ciudadanos estén preparados y protegidos frente a posibles crisis, desastres naturales y catástrofes provocadas por el hombre.
¿Cómo funciona Copernicus?
Los servicios de información de Copernicus se nutren de:
En algunas ocasiones, estos dispositivos de medición en órbita trabajan individualmente y, en otras, combinados con sensores instalados en la tierra, mar o aire.
Luego, Copernicus almacena la información y ayuda a obtener abundante información fiable y actualizada sobre el estado de nuestro planeta. Estos datos se emplean para confeccionar diversos productos como pueden ser estadísticas o mapa topográficos. Los datos se analizan con el fin de generar indicadores útiles que informen sobre las tendencias del pasado, presente y futuro para investigadores y usuarios finales.
Copernicus no solo contribuye a la excelencia científica y técnica europea, sino que también integra un marco de servicios públicos para el acceso libre e integro de los datos recogidos. Cualquiera, ya sea científico, responsable político, emprendedor o ciudadano de a pie, puede emplear estos datos.
¿Qué relación hay entre entre Copernicus y los Objetivos de Desarrollo Sostenible?
El programa Copernicus se divide en seis ejes principales para la obtención de información completa, abierta y gratuita sobre:
Estos ejes poseen una estrecha relación con los Objetivos de Desarrollo Sostenible (ODS) de las Naciones Unidas. El programa Copernicus es la gran contribución europea en observación y monitorización de la Tierra para la Agenda 2030. Con los datos que se obtienen del programa, podemos analizar y generar indicadores de medida acerca del planeta, contribuir al desarrollo sostenible y a la acción por el clima, facilitando así la toma de decisiones respecto a ambas. Algunos de los Objetivos de Desarrollo Sostenible que se cubren de forma directa o indirecta con los ejes principales del programa Copernicus son:
Puedes visitar la web www.copernicus.eu para acceder a datos y servicios de Copernicus
En los últimos años, Google ha apostado por múltiples iniciativas basadas en open data, desde Google Dataset Search para la localización de datos abiertos publicados en repositorios de las administraciones públicas hasta sus propios sistemas de open data con conjuntos de datos estandarizados y legibles por máquinas para ser utilizados por sistemas de Machine Learning. Todas estas iniciativa desarrolladas por Google se enmarcan dentro de un portfolio de proyectos de investigación e innovación llamado Google Research, donde no solo ha apostado por la publicación de datasets, si no que el propio Google actúa también como reutilizador de datos públicos. A continuación, os exponemos algunos ejemplos de las soluciones de Google basadas en open data.
GOOGLE DATA SEARCH: Buscador de Datos
Como antes mencionábamos, Google ha puesto a disposición de los usuarios decenas de conjuntos de datos estandarizados y legibles por máquinas para ser utilizados por sistemas de Machine Learning. Sin embargo, la apertura de datos no es suficiente si éstos no son fáciles de encontrar. Por este motivo, Google ofrece Google Dataset Search, un motor de búsqueda especializado en encontrar conjuntos de datos abiertos almacenados en cientos de repositorios asociados a instituciones públicas de todo el mundo, haciendo que sean accesibles y útiles de forma universal. El servicio está dirigido a periodistas, investigadores, estudiantes o cualquier ciudadano interesado en encontrar ciertos datos. Asimismo, Google Dataset Search complementa a Google Scholar, buscador de investigaciones, estudios e informes académicos.
Existe, además, un servicio adicional de datos abiertos enfocado al periodismo de datos: Journalist Studio. Una plataforma compuesta de 13 herramientas enfocadas al análisis de datos para facilitar la labor de investigación a periodistas de datos. En un post anterior ahondamos en este servicio, puedes consultarlo aquí.
GOOGLE EARTH: Sistema de Información Geográfica (SIG)
Google Earth es un Sistema de Información Geográfica (SIG) que muestra el globo terráqueo de forma virtual con imágenes por satélite y en relieve en 3D. Este SIG fue creado bajo el nombre de EarthViewer 3D por la compañía Keyhole, financiada por la CIA (EE.UU) y comprada en 2004 por Google -de ahí su actual nombre- absorbiendo la aplicación. Google Earth está compuesto por una superposición de imágenes obtenidas por fotografías aéreas, imágenes de satélites, información geográfica procedentes de modelos de datos SIG de todo el mundo y modelos creados por ordenador.
Google Earth soporta datos geoespaciales tridimensionales mediante los archivos Keyhole Markup Language (.kml). Este formato de archivo sirve para mostrar datos geográficos en un navegador terrestre, como Google Maps y Google Earth. Asimismo, los archivos .kml se pueden crear para identificar ubicaciones, agregar superposiciones de imágenes y exponer datos enriquecidos de nuevas formas. KML se trata de un estándar internacional mantenido por OGC.
Actualmente, en la nueva actualización en 2021, Google Earth ofrece la posibilidad de ver la Tierra en una dimensión totalmente nueva bajo la función Timelapse. A partir de 24 millones de fotos satélites tomadas en los últimos 37 años, Google ofrece ver cómo ha pasado el tiempo por lugares de todo el mundo y presenciar casi cuatro décadas de cambios planetarios.
GOOGLE TRANSLATE: Sistema de Traducción Automática (NMT)
En 2016, Google anunciaba la actualización de Google Translate con el sistema de Traducción Automática Neural (NMT por sus siglas en inglés, neural machine translation), basada en el algoritmo Phrase-Based Machine Translation. Desde entonces y con los avances en Inteligencia Artificial, Google ha mejorado sus capacidades en reconocimiento de voz y reconocimiento de imágenes. Sin embargo, mejorar la traducción automática sigue siendo un objetivo desafiante ya que el sistema no se iguala al nivel de calidad que se obtiene con una traducción realizada por un ser humano experto en el campo de la traducción, sobre todo, en el caso de los idiomas más minoritarios, por lo que siguen realizando ajustes y avances.
Google no hace públicos los datos exactos que utiliza para el entrenamiento del sistema. Sin embargo, en su informe «Sistema de traducción automática neuronal de Google: superando la brecha entre la traducción humana y la automática» sí destacan que han realizado pruebas de referencia con dos corpus disponibles públicamente: WMT’14 English-to-French y WMT´14 English-German.
OTRAS INICIATIVAS DE GOOGLE RESEARCH
Google ha desarrollado otras iniciativas como la predicción del tiempo y el pronóstico de precipitación basados en modelos de computationally intensive physics (como HRRR de National Oceanic and Atmospheric Administration) para producir pronósticos a corto plazo de hasta ocho horas, con una mayor resolución temporal y espacial. Esto es, no solo conocer la predicción meteorológica en tu ciudad (ej. en Madrid) sino en un área en concreto (ej. en el Parque de El Retiro) gracias a estos modelos de Machine Learning.
Otro ejemplo, a raíz de la Covid19, ha sido la puesta en marcha la reutilización de datos centrados en la movilidad, como son los informes de movilidad local. Estos informes sirven para descubrir cómo han cambiado los desplazamientos de una comunidad debido a la pandemia actual -éstos pueden descargarse tanto en formato .pdf como .csv para su reutilización-. Asimismo, en un post anterior, mostrábamos una actualización de Google Maps (2020) en la que implementaban una nueva capa en sus mapas para conocer la incidencia de la Covid19 en un destino en concreto. Esta capa mostraba la media de casos de coronavirus de los últimos 7 días por cada 100.000 personas así como una etiqueta donde se indica si la tendencia de nuevos casos es al alza o a la baja.
En ITELLIGENT hemos desarrollado una web con datos estadísticos y mapas interactivos en tiempo real sobre el COVID-19 en España. Gracias a los datos recopilados a través del Instituto de Salud Carlos III y su hibridación con datos del Instituto Nacional de Estadística, los usuarios pueden obtener todo tipo de información y datos de la enfermedad del Coronavirus en toda España.
El objetivo es ofrecer una plataforma de open data, todos ellos aglutinados en una única web, sobre la evolución de la pandemia y actualizados diariamente.
Esta página se encuentra disponible en http://covid.itelligent.es/ y posee información y recursos para comprender el brote de la pandemia en España y su evolución actual. En ella podemos encontrar mapas interactivos, de forma que pinchando en las imágenes puedes visualizar en detalle los datos y estadísticas actualizadas. Asimismo, gracias a este estudio se puede calcular la incidencia del Covid19 por cada 100 mil habitantes.
Además, esta información publicada en la web, se pueden descargar tanto en PDF como en Excel y están disponibles en la plataforma netOpenData de ITELLIGENT, de tal forma que sus usuarios pueden consultar los datos vía API. En las próximas semanas, se irán implementando nuevos datos e información acerca del Coronavirus como, por ejemplo, la publicada por las Comunidades Autónomas u otras fuentes de datos.