¿Por qué son necesarios los espacios de datos?
Hoy en día, hay sectores donde es requisito indispensable la compartición de datos entre los distintos actores de un mismo sector. Un ejemplo prototípico de esto, son las aduanas. En las fronteras, si se comparten datos entre los países limítrofes, no sólo se puede reducir el esfuerzo, evitando un doble chequeo, sino que además se puede conseguir un funcionamiento óptimo si se comparten datos. Por ejemplo, poder detectar de forma temprana un posible problema veterinario si el país de entrada conoce con antelación la carga que trae un camión gracias a la información facilitada por el país de salida
Sin embargo, esto también puede suponer introducir nuevas complejidades que deben ser resueltas. Algunas de ellas son:
- Interoperabilidad. En el momento en el que se comparten datos hay que definir algún tipo de estándares para que ambos sistemas o ambas partes entiendan las características de los datos compartidos. Por ejemplo, en el caso de las aduanas, es común utilizar algunos de los estándares definidos por la OMA (Organización Mundial de Aduanas), que entre otros, estandariza los códigos de los productos o materias primas.
- Uso de los datos. Al compartir los datos, dejamos de tener el control sobre los mismos. Esto puede ser un problema si no se exponen explícitamente las condiciones de uso de dichos datos. Por ejemplo, en el caso de las aduanas, pueden existir datos que el país de salida podría compartir con el país de entrada para una finalidad concreta, pero puede que tenga miedo de que el país de entrada los utilices con otros objetivos.
- Seguridad. Al compartir los datos de forma digital estamos introduciendo nuevos riesgos ya que abrimos los sistemas a terceros. Por ejemplo, en un sistema aduanero de un país que solo era utilizado de forma interna, exponer determinados datos a terceros, puede suponer un riesgo de seguridad.
- Protección de datos. Al compartir datos sensibles (por ejemplo. datos personales), es necesario garantizar que, la persona que recibe esos datos, mantenga los niveles de privacidad exigidos para el uso que se les vaya a dar. En algunos casos, esto conlleva utilizar técnicas de anonimización antes de compartir los datos.
¿Qué son los espacios de datos o data spaces?
Los espacios de datos vienen a resolver las problemáticas que se producen a la hora de compartir datos entre diferentes actores. Un espacio de datos es una forma de compartir datos entre distintos actores garantizando los derechos de cada uno de los participantes. La idea básica es pasar de un control de acceso de los datos a un control de uso de los datos.
Como ejemplo, uno de los pilares básicos de la Estrategia Europea de Datos es la creación de Espacios de Datos comunes e interoperables en toda la UE en sectores estratégicos. El objetivo es superar las barreras (legales, técnicas, …) que actualmente existen para el intercambio de datos, lo que sin duda permitirá la puesta en marcha de proyectos innovadores sobre estos datos y la generación de nuevas empresas y servicios. Para ello, es necesario poner en marcha las infraestructuras de datos y los marcos de gobernanza para facilitar la puesta en común y el intercambio de datos.
ELEMENTOS TECNOLOGICOS CLAVES EN LOS ESPACIOS DE DATOS
Desde una perspectiva técnica, un espacio de datos puede entenderse como una colección de componentes técnicos que facilitan un flujo de datos/información dinámico, seguro y continuo entre partes y dominios. Estos componentes se pueden implementar de muchas maneras diferentes y se pueden implementar en diferentes marcos de tiempo de ejecución (por ejemplo, Kubernetes). Según Open DEI, se pueden clasificar de la siguiente manera:
INTEROPERABILIDAD DE DATOS
Los bloques de construcción tecnológica que pertenecen a esta categoría son:
- Modelos y formatos de datos: este componente básico establece un formato común para las especificaciones del modelo de datos y la representación de datos en las cargas útiles de intercambio de datos. Combinado con el componente básico de las API de intercambio de datos, esto garantiza la interoperabilidad total entre los participantes.
- API de intercambio de datos: este componente básico facilita el intercambio y el intercambio de datos (es decir, la provisión de datos y el consumo/uso de datos) entre los participantes del espacio de datos. Un ejemplo de un bloque de construcción de interoperabilidad de datos que proporciona una API de intercambio de datos común es el «Context Broker» (Broker de contexto) del Connecting Europe Facility (CEF), recomendado por la Comisión Europea para compartir datos en el momento adecuado entre varias organizaciones.
- Procedencia y trazabilidad de los datos: este bloque de construcción proporciona los medios para rastrear y rastrear en el proceso de provisión de datos y consumo/uso de datos. Por lo tanto, proporciona la base para una serie de funciones importantes, desde la identificación del linaje de los datos hasta el registro de transacciones a prueba de auditorías. También permite la implementación de una amplia gama de casos de uso de seguimiento a nivel de aplicación, como el seguimiento de productos o flujos de materiales en una cadena de suministro.
SOBERANIA Y CONFIANZA DE DATOS
Los bloques de construcción tecnológica que facilitan la confianza y la soberanía de los datos son:
- Gestión de identidades (IM): el componente básico de IM permite la identificación, autenticación y autorización de las partes interesadas que operan en un espacio de datos. Garantiza que las organizaciones, las personas, las máquinas y otros actores reciban identidades reconocidas, y que esas identidades puedan autenticarse y verificarse, incluido el aprovisionamiento de información adicional1, para que los mecanismos de autorización los utilicen para habilitar el control de acceso y uso. El bloque de construcción de IM se puede implementar sobre la base de plataformas de IM fácilmente disponibles que cubren partes de la funcionalidad requerida. Ejemplos de soluciones de código abierto son la infraestructura KeyCloak, la plataforma de mensajería instantánea Apache Syncope, la plataforma de mensajería instantánea de código abierto del Shibboleth Consortium o el marco FIWARE IM. La integración del componente IM con el componente eID del Connecting Europe Facility (CEF), que respalda la identificación electrónica de usuarios en toda Europa, sería particularmente importante. La creación de identidades federadas y de confianza en espacios de datos puede estar respaldada por normativas europeas como EIDAS.
- Intercambio confiable: este bloque de construcción facilita el intercambio de datos confiable entre los participantes, asegurando a los participantes en una transacción de intercambio de datos que los otros participantes son realmente quienes dicen ser y que cumplen con las reglas/acuerdos definidos. Esto se puede lograr mediante medidas organizativas (por ejemplo, certificación o credenciales verificadas) o medidas técnicas (por ejemplo, atestación remota).
- Control/políticas de acceso y uso: este componente garantiza el cumplimiento de las políticas de acceso y uso de datos definidas como parte de los términos y condiciones establecidos cuando los recursos o servicios de datos se publican (consulte el componente básico «Mercado de publicaciones y servicios» a continuación) o se negocian entre proveedores y consumidores. Un proveedor de datos normalmente implementa mecanismos de control de acceso a datos para evitar el uso indebido de recursos, mientras que los mecanismos de control de uso de datos normalmente se implementan en el lado del consumidor de datos para evitar el uso indebido de datos. En cadenas de valor de datos complejas, los prosumidores combinan ambos mecanismos. El control de acceso y el control de uso se basan en la identificación y la autenticación.
CREACIÓN DE VALOR DE DATOS
Los bloques de construcción tecnológica que facilitan la creación de valor de los datos son:
- Metadatos y protocolo de descubrimiento: este componente básico incorpora mecanismos de publicación y descubrimiento para recursos y servicios de datos, haciendo uso de descripciones comunes de recursos, servicios y participantes. Dichas descripciones pueden ser tanto independientes del dominio como específicas del dominio. Deben estar habilitados por tecnologías de web semántica e incluir principios de datos vinculados.
- Contabilidad del uso de datos: este bloque de creación proporciona la base para contabilizar el acceso y/o el uso de datos por parte de diferentes usuarios. Esto, a su vez, respalda importantes funciones de compensación, pago y facturación (incluidas las transacciones de intercambio de datos sin la participación de los mercados de datos).
- Servicios de publicación y mercado: Para respaldar la oferta de recursos y servicios de datos bajo términos y condiciones definidos, se deben establecer mercados. Este componente básico admite la publicación de estas ofertas, la gestión de procesos vinculados a la creación y el seguimiento de contratos inteligentes (que describen claramente los derechos y obligaciones para el uso de datos y servicios) y el acceso a datos y servicios.
En función de las necesidades técnicas, se pueden ejecutar los procesos de backend correspondientes para calificación, compensación y facturación. Por lo tanto, el bloque de construcción facilita la ampliación dinámica de los espacios de datos con más partes interesadas, recursos de datos y servicios de análisis/procesamiento de datos (como servicios de análisis de big data, servicios de machine learning o servicios basados en modelos de procesamiento estadístico para diferentes funciones comerciales). Debe comprender capacidades para publicar recursos de datos siguiendo los estándares DCAT (Data Catalogue Vocabulary) ampliamente aceptados, y para recopilar datos de plataformas de publicación de datos abiertos existentes.
0 comentarios