Webinar europeo sobre novedades en los espacios de datos del futuro

Fecha de la noticia: 19-05-2023

Webinar data spaces

Los datos abiertos suponen el nivel más alto de intercambio de datos, ya que están disponibles de manera gratuita y son accesibles para todos. Procesados de manera adecuada y garantizando un pleno respeto a la protección de datos personales, pueden ayudar a los ciudadanos, empresas y sector público a tomar mejores decisiones.

Los datos abiertos, junto con el resto de datos, juegan un papel clave la creación de espacios de datos, tal y como refiere la Estrategia Europea de Datos. Como recoge el documento, la puesta en marcha de espacios de datos comunes e interoperables en sectores estratégicos se constituye con el objetivo de “superar los obstáculos técnicos y jurídicos a la puesta en común de datos entre organizaciones, combinando las herramientas e infraestructuras necesarias y abordando cuestiones de confianza”, por ejemplo, mediante normas comunes desarrolladas para el espacio”.

Teniendo en cuenta su relevancia, la Academia del Portal de Datos Europeo ha organizado una serie de seminarios web sobre espacios de datos. El primero de ellos se celebró el pasado 12 de mayo en formato online y se puede ver aquí. En él, se mencionaron las novedades y progresos que se están llevando a cabo respecto a los data spaces, avances que en España se vienen realizando desde la Oficina del Dato.

Resumimos a continuación los principales aspectos abordados en este primer seminario, en el que participaron Daniele Rizzi, Principal administrator and policy officer y Johan Bodenkamp, Policy and project officer en la Dirección General de Redes de Comunicación, Contenido y Tecnologías de la Comisión Europea, con la moderación de Giulia Carsaniga, Research and Policy Lead Consultant en Capgemini.

Los espacios de datos y la estrategia digital de la UE

En la primera parte del seminario, que se celebró de manera online, se destacó cómo la transformación digital es una de las grandes prioridades de la Unión Europea. De hecho, Europa cuenta con una estrategia específica para avanzar en este aspecto, es decir, lograr ‘Una Europa adaptada a la era digital’, y es una de las seis prioridades 2019-24 de la Comisión Europea.

La estrategia digital de la Unión Europea tiene como objetivo hacer que la trasformación digital beneficie a las personas y las empresas, contexto en el que se enmarca la Estrategia Europea de Datos de febrero de 2020, que recoge una serie de medidas para el impulso de un mercado europeo del dato, a semejanza del Mercado Común Europeo, germen de la actual UE.

La creación de este mercado europeo del dato requiere del establecimiento de una serie de acciones y estándares con un enfoque basado en los datos, la tecnología y la infraestructura. A ello, contribuye además el esfuerzo colectivo, en el que se encuadran programas públicos como DIGITAL Europe o privados como Gaia-X.

Un año después de la aprobación de la Estrategia Europea del Dato, el Consejo Europeo reconocía, en marzo de 2021, “la necesidad de acelerar la creación de espacio de datos comunes y asegurar el acceso e interoperabilidad de los datos” e invitaba a la Comisión a “presentar el progreso realizado y las medidas restantes necesarias para establecer los espacios de datos sectoriales anunciados en la Estrategia Europea de Datos de febrero de 2020”. Posteriormente, en febrero de 2022 la Comisión Europea publicó un documento de trabajo sobre el mercado europeo del dato.

Tras contextualizar en el marco europeo el desarrollo del concepto de espacios de datos, los ponentes del webinar pasaron a explicar aquellas piezas fundamentales que formarán parte de los espacios de datos, algunas de ellas ya están operativas y otras se encuentran en desarrollo. En el seminario se dio una visión general de cómo se espera que sea el espacio de datos europeo, y se destacaron las siguientes partes:

En primer lugar, se habló sobre los datasets de alto valor del sector público. En enero de este año la Comisión Europea publicó el listado de conjuntos de datos de alto valor entendido como aquellos que aportan valor añadido e importantes beneficios para la sociedad. Existe una amplia variedad de datos de alto valor englobados en diferentes áreas (salud, agricultura, movilidad, energía, etc.) que las partes interesadas ponen a disposición con diferentes grados de apertura. Tal y como se explicó en el webinar, la idea es comenzar a crear espacios de datos de alto valor comunes en áreas más homogéneas, aunque el objetivo final es que en ese mercado europeo se compartan datos entre todas ellas, ya que la mayoría de las aplicaciones requerirán datos de diferentes ámbitos.

Para apoyar la creación de esos espacios de datos, la primera iniciativa que se ha puesto en marcha en Europa es la creación del Data Spaces Support Centre. Este centro explora las necesidades de las iniciativas de los espacios de datos, define requisitos comunes, establece las mejores prácticas para acelerar la formación de espacios de datos soberanos como un elemento crucial de la transformación digital en todas las áreas y se encarga de garantizar su interoperabilidad mediante el cumplimiento de unos estándares comunes.

Para que todo esto se pueda desarrollar, es necesario contar con una infraestructura técnica para los espacios de datos, que se encarga de facilitar servicios cloud y edge-cloud, soluciones de middleware inteligente (Simpl), mercado digital, computación de alto rendimiento, plataforma de inteligencia artificial bajo demanda e instalaciones de prueba y experimentación de IA.

Diferencias y similitudes entre los espacios de datos y los datalakes

Tras repasar la visión general de los espacios de datos en Europa, en el seminario se abordaron sus principales características. De esta forma, se presentó un espacio de datos como una infraestructura de TI segura y respetuosa con la privacidad para agrupar, acceder, procesar, usar y compartir datos. Además, se definió como un mecanismo de gobernanza de datos que comprende un conjunto de reglas de naturaleza administrativa y contractual que determinan los derechos de acceso, procesamiento, uso y compartición de datos de manera confiable, transparente y en cumplimiento de la legislación vigente.

Una de las características que se destacaron en el webinar sobre este tipo de infraestructura es que en ella los titulares de los datos tienen el control sobre quién puede acceder a qué datos, con qué propósito y bajo qué condiciones pueden ser utilizados, Además, hay una gran cantidad de datos disponibles de forma voluntaria que pueden ser reutilizados de forma gratuita o a cambio de una remuneración, dependiendo de la decisión de los titulares de los datos.

Finalmente, se subrayó el hecho de que los espacios de datos cuentan con la participación de un número abierto de organizaciones/individuos, respetando las normas de competencia y garantizando un acceso no discriminatorio para todos los participantes.

Otro de los conceptos que se abordó en el seminario fue el de datalake, para compararlo con el de un espacio de datos. Así, se definieron los lagos de datos como repositorios que permiten almacenar datos estructurados y no estructurados a cualquier escala. En un datalake, según explicaron en el seminario, es posible almacenar datos tal y como están, sin necesidad de estructurarlos previamente y ejecutar diferentes tipos de análisis, desde paneles de control y visualizaciones hasta realizar procesamiento de big data, análisis en tiempo real y aprendizaje automático para tomar decisiones más acertadas. El acceso al datalake implica la posibilidad de acceder a todos los datos contenidos que se albergan en él, no necesariamente de manera ordenada.

Por otra parte, un espacio de datos, en palabras de los ponentes, se puede definir como un ecosistema de datos federado basado en políticas y reglas compartidas. Los usuarios de dichos espacios de datos tienen la capacidad de acceder a los datos de manera segura, transparente, confiable, fácil y unificada. En un espacio de datos los titulares de los datos tienen el control sobre el acceso y uso de sus datos. Desde una perspectiva técnica, se puede ver un espacio de datos como un concepto de integración de datos que no requiere esquemas de bases de datos comunes ni integración física de datos, sino que se basa en almacenes de datos distribuidos e integrados según sea necesario.

Haciendo un símil con la acción de conseguir peces, en el datalake el usuario tiene que pescarlos por sí mismo, y un espacio de datos sería como ir a un mercado de peces.

Próximos pasos: Marco de gobernanza y actores europeos

Una vez presentada la diferencia entre dataspaces y datalakes, en el webinar se abordó el cambio de paradigma de intercambio de datos que está sucediendo en la actualidad. Hasta ahora, se empleaba un intercambio bilateral de datos basado en acuerdos contractuales, sin embargo, va tomando fuerza un nuevo modelo de infraestructuras de intercambio de datos con alojamiento centralizado de datos y/o mercados de datos que permiten reducir los costes de transacción cuando los datos no se mantienen en un repositorio central.

El siguiente paso en la evolución de los espacios de datos sería, según los ponentes, la creación de enlaces entre los participantes, en un modelo en el que los datos se federasen y se almacenasen de manera distribuida con herramientas que permitan la búsqueda, el acceso y el análisis en múltiples industrias, empresas y entidades.

Para que este proceso ocurra, tal y como los ponentes explicaron, es necesario el apoyo y trabajo coordinado de diferentes actores. Por un lado, sería fundamental establecer unas normas comunes que faciliten el intercambio de datos y acercar a los diferentes actores implicados a una política común de datos en la UE. Igualmente es indispensable ofrecer soluciones técnicas y apoyo financiero.

En esta línea, en el webinar se destacó un importante hito: la puesta en marcha del European Data Innovation Board (EDIB) que apoyará a la Comisión en la publicación de directrices para facilitar el desarrollo de los espacios comunes europeos de datos y la identificación de las normas y los requisitos de interoperabilidad necesarios para el intercambio de datos.

Como se indicó anteriormente, la puesta en marcha del espacio de datos precisa de arquitectura técnica, por lo que en el webinar se destacaron dos soluciones técnicas gratuitas:

  • Los Building Blocks: Soluciones digitales abiertas y reutilizables basadas en estándares que permiten funcionalidades básicas, como la autenticación confiable y el intercambio seguro de datos.
  • Simpl: El middleware inteligente que permitirá federaciones basadas en la nube y nube en el borde. Apoyará las principales iniciativas de datos financiadas por la Comisión Europea, como los espacios de datos europeos comunes.

El papel clave del Data Spaces Support Centre

Al final del seminario se presentó con más detalle la iniciativa Data Spaces Support Centre (DSCC). Este centro, creado en octubre de 2022, da apoyo a las diferentes iniciativas en la creación de espacios de datos y está previsto que finalice su actividad en marzo de 2026. Está formado por doce socios y cuenta además con dieciséis socios colaboradores, entre los que se encuentran importantes asociaciones y empresas con experiencia en el ámbito del intercambio de datos.

El DSCC tiene como misión principal la creación de una red de socios y una comunidad, a la que proporciona las herramientas para la creación de los espacios de datos. Se centra de manera especial en la interoperabilidad y pretende generar sinergias a nivel europeo para el desarrollo de espacios de datos.

En el webinar se hizo un repaso de las colaboraciones y las iniciativas en las que participa el Data spaces support centre y se destacó que en su web está disponible el kit de inicio, un punto de partida para la construcción de los espacios de datos.

En la recta final del seminario, para dar una visión general de los espacios de datos, se detallaron cuáles son los actores relevantes del espacio común de datos europeo:

  • Data Spaces Support Centre (DSSC): Encargado de coordinar las acciones relevantes en los espacios de datos.
  • Data Space Coordination and Support Actions (CSAs): Se centra en los espacios de datos sectoriales.
  • European Data Innovation Board: A partir de septiembre de 2023, se ocupará de fijar las directrices para lograr la interoperabilidad en los espacios de datos.

Si quieres saber más sobre el concepto de los espacios de datos y su relevancia en la actualidad, puedes ver el seminario completo en el siguiente vídeo:

Los materiales formativos están disponibles en https://data.europa.eu/en/academy: