El pasado 13 de marzo se celebró una jornada del Grupo de Trabajo de Movilidad del Hub Gaia-X España, donde se abordaron los principales retos del sector en lo referente a proyectos sobre la compartición y explotación de datos. La sesión, que se desarrolló en la Escuela Técnica Superior de Ingenieros de Caminos, Canales y Puertos de la Universidad Politécnica de Madrid, permitió a los asistentes conocer de primera mano los principales retos del sector, así como algunos de los proyectos de datos punteros de la industria de la movilidad. El evento fue también un punto de encuentro en el que se compartieron ideas y reflexiones entre los actores clave del sector.
La jornada comenzó con la presentación del Ministerio de Transportes, Movilidad y Agenda Urbana, intervención que destacó la gran importancia del Punto de Acceso Nacional de Transporte Multimodal, un proyecto de ámbito europeo, que permite concentrar toda la información de la oferta de transporte de viajeros del país en un único punto nacional, con el objetivo de proporcionar los cimientos para impulsar el desarrollo de los servicios de movilidad del futuro.
A continuación, la Oficina del Dato de la Secretaría de Estado de Inteligencia Artificial (SEDIA) aportó la visión del modelo de desarrollo de Espacios de Datos y los principios de diseño de dichos espacios alineados con los valores europeos. Se destacó la importancia de las redes de negocio en base a ecosistemas de datos, el carácter intersectorial de la industria de la Movilidad y el importante papel de los datos abiertos en los espacios de datos del sector.
Seguidamente, se presentaron casos de uso por parte de Vicomtech, Amadeus, i2CAT y el Ayuntamiento de Alcobendas, que permitieron conocer de primera mano algunos ejemplos de uso de tecnología para proyectos de compartición de datos (tanto de espacios de datos como de data lakes, o lagos de datos).
Finalmente, se presentó un estudio inicial de la Fundación i2CAT, FACTUAL Consulting y EIT Urban Mobility sobre los componentes básicos de los futuros espacios de datos de movilidad en España. El estudio, que puede descargarse aquí en español, aborda el potencial de los espacios de datos de movilidad para el mercado español. Aunque se centra en España, recoge un enfoque sobre la investigación tanto nacional como internacional , enmarcado en el contexto europeo para establer estándares, el desarrollo de los componentes técnicos que habilitan los espacios de datos, los primeros proyectos faro y el abordaje de desafíos comunes para cumplir hitos en materia de movilidad sostenible en Europa.
Las presentaciones utilizadas en la sesión están disponibles en este enlace.
La ‘Estrategia europea de datos’ de la Comisión Europea establece que es clave la creación de un mercado único de datos compartidos. En dicha estrategia, la Comisión se ha marcado como uno de sus principales objetivos el impulso de una economía del dato acorde a los valores europeos de autodeterminación en la compartición de datos (soberanía), confidencialidad, transparencia, seguridad y competencia justa.
Los espacios de datos comunes a nivel europeo son un recurso fundamental en la estrategia de datos porque actúan como habilitadores del impulso de la economía del dato. De hecho, poner en común los datos europeos de sectores clave, fomentar la circulación de los datos y crear espacios de datos colectivos e interoperables son acciones que contribuyen al beneficio de la sociedad.
Aunque los entornos de compartición de datos existen desde hace tiempo, se plantea la creación de espacios de datos que garanticen los valores y principios de la UE. Desarrollar iniciativas legislativas que los habiliten no solo es un reto tecnológico, sino también de coordinación entre los participantes, de gobernanza, de adopción de estándares y de interoperabilidad.
Para abordar un desafío de tal magnitud, la Comisión tiene previsto invertir cerca de 8.000 millones de euros hasta 2027 en el despliegue de la transformación digital europea. Como parte del proyecto se incluye el fomento de infraestructuras, herramientas, arquitecturas y mecanismos para compartir datos. Para que triunfe esta estrategia es necesario que, desde el cumplimiento de los valores europeos, se plantee un paradigma de espacio de datos que tenga calado en la industria. Este paradigma de espacio de datos actuará como un estándar tecnológico de facto y permitirá que avance la concienciación social sobre las posibilidades del dato, algo que posibilitará el retorno económico de las inversiones requeridas para crearlo.
Con el fin de hacer realidad el paradigma de espacios de datos, desde la convergencia de las actuales iniciativas, la Comisión Europea ha apostado por el desarrollo del proyecto Simpl.
¿En qué consiste exactamente Simpl?
Simpl es un proyecto financiado por el programa Digital Europe de la Comisión Europea, dotado con 150 millones de euros y con un plazo de ejecución de tres años. Su objetivo es poner a disposición de la sociedad un software (middleware) para la construcción de ecosistemas de datos y servicios de infraestructuras en la nube que soporten los valores europeos de soberanía el dato, privacidad y mercado justo.
El proyecto Simpl consiste en la entrega de 3 productos:
- Simpl-Open: Middleware propiamente dicho. Se trata de una solución de software para crear ecosistemas de servicios de datos (compartición de datos y aplicaciones) y servicios de infraestructura en la nube (IaaS, PaaS, SaaS, etc). Este software debe incluir agentes que habiliten la conexión al espacio de datos, servicios operacionales y servicios de intermediación (catálogo, vocabulario, registro de actividad, etc). El resultado deberá entregarse bajo licencia de fuentes abiertas y se intentará construir una comunidad open source que garantice su evolución.
- Simpl-Labs: Infraestructura para crear entornos de trabajo de pruebas (test bed) para que los usuarios interesados pueden probar la última versión del software en la modalidad de autoservicio. Este entorno está pensado principalmente para promotores de espacios de datos que quieran hacer las oportunas pruebas técnicas antes de un despliegue.
- Simpl-Live: Despliegues de Simpl-open en entornos de producción que se corresponderán a espacios sectoriales contemplados en el programa Digital Europe. En concreto, se plantea el despliegue de espacios de datos gestionados por la propia Comisión Europea (Salud, Procurement, Lenguaje).
El proyecto tiene una orientación práctica y busca obtener resultados a la mayor brevedad. Por lo que se pretende que, además de suministrar el software, el contratista preste un servicio de laboratorio para que los usuarios puedan realizar pruebas. La empresa que desarrolle Simpl también deberá adaptar el software para el despliegue de espacios de datos comunes europeos previstos en el programa Digital Europe.
La asociación Gaia-X está considerada como la más próxima en sus objetivos al proyecto Simpl, así que el resultado del proyecto deberá esforzarse en la reutilización de los componentes que Gaia-X ponga a su disposición.
Por su parte, el centro Data Space Support Center, en el que participan las principales iniciativas europeas de creación de marcos tecnológicos y estándares para la construcción de espacios de datos, deberá definir los requisitos del middleware mediante especificaciones, modelos arquitectónicos y selección de estándares.
Los trabajos preparatorios de Simpl finalizaron en mayo de 2022, fijando el alcance y los requerimientos técnicos del proyecto que han sido objeto de detalle en el proceso contractual actualmente abierto. La licitación se puso en marcha el pasado 24 de febrero de 2023. Toda la información está disponible en TED eTendering, incluida la manera de formular preguntas sobre el proceso de licitación. El plazo para la presentación de solicitudes finaliza el 24 de abril de 2023 a las 17: 00 (hora de Bruselas).
Simpl espera disponer de una plataforma viable mínima publicada a principios de 2024. Paralelamente, y lo antes posible, el entorno abierto de pruebas (Simpl-Labs) se pondrá a disposición de las partes interesadas en experimentar. A continuación, se procederá a integrar progresivamente diferentes casos de uso, ayudándolos a ajustar Simpl a las necesidades específicas, considerando prioritarios los casos financiados de otro modo en el marco del programa de trabajo Europa DIGITAL.
Como conclusión, cabe remarcar que Simpl es la apuesta de la Comisión Europea para el despliegue e interoperabilidad de las diferentes iniciativas de espacios de datos sectoriales, garantizándose su concordancia con las especificaciones y requisitos emanados del Data Space Support Center y, por tanto, con el proceso de convergencia de las diferentes iniciativas europeas de construcción de espacios de datos (Gaia-X, IDSA, Fiware, BDVA).
Gaia-X representa un innovador paradigma con el que vincular más estrechamente los datos con la infraestructura tecnológica que hay por debajo, de forma que se garantice la transparencia, el origen y el funcionamiento de estos recursos. Este modelo nos permite desplegar una Economía del Dato soberana y transparente, que respete los derechos fundamentales europeos, y que en España tomará forma en torno a los espacios de datos sectoriales (C12.I1 y C14.I2 del Plan de Recuperación, Transformación y Resiliencia). Estos se alinearán con el marco regulatorio europeo, así como con una gobernanza e instrumentos pensados para asegurar la interoperabilidad, y sobre la que articular el buscado mercado único de datos.
En este sentido, los nodos de interoperabilidad de Gaia-X, o Gaia-X Digital Clearing House (GXDCH), tienen por objeto ofrecer servicios de validación automática de las reglas de interoperabilidad a promotores y participantes de espacios de datos. La creación de este tipo de nodos fue anunciada en la Gaia-X Summit 2022, el pasado mes de noviembre en París. La arquitectura Gaia-X, promovida por la asociación Gaia-X European Association for Data & Cloud AISBL, se ha consolidado como una prometedora alternativa tecnológica para la creación de ecosistemas abiertos y transparentes de conjuntos y servicios de datos.
Estos ecosistemas, por naturaleza federados, servirán para el desarrollo a escala de la citada Economía del Dato. Pero para ello, deben cumplirse una serie de reglas mínimas que aseguren la interoperabilidad entre participantes. La conformidad con dichas reglas es precisamente la función de la GXDCH, sirviendo como "ancla" para desplegar servicios de mercado certificados. Por tanto, la creación en España de un nodo de estas características supone un elemento crucial para el despliegue de los espacios federados de datos a nivel nacional, lo que estimulará el desarrollo y la innovación en torno al dato bajo un entorno de respeto a la soberanía del dato, la privacidad, transparencia y la justa competencia.
La GXDCH se define como un nodo en el que se prestan servicios operacionales de un ecosistema que cumpla con las reglas de interoperabilidad de Gaia-X. Como “servicios operacionales” se deben entender aquellos servicios que son necesarios para el funcionamiento de un espacio de datos, pero que no son en sí mismos servicios de compartición de datos, ni de aplicaciones de explotación de datos, ni de infraestructuras en la nube. Gaia-X define seis servicios operacionales, de los cuales al menos dos deben formar parte de los nodos obligatorios que alberguen las GXDCHs:
Servicios obligatorios
- Gaia-X Registry: Definida como una base de datos inmutable, no repudiable y distribuida con capacidad de ejecutar código. Típicamente sería una infraestructura blockchain que soporta un servicio de identidad descentralizada (‘Self Sovereign Identity’) en la que se almacenan, entre otras, la lista de autoridades emisoras de credenciales (Trust Anchors) u otros datos necesarios para el funcionamiento de la gestión de identidad en Gaia-X.
- Servicio de conformidad de Gaia-X o Gaia-X Compliance Service pertenece a los denominados Gaia-X Federation Services y su función es verificar el cumplimiento de las reglas mínimas de interoperabilidad definidas por la asociación Gaia-X (por ejemplo, el Trust Framework)
Servicios opcionales
- Servicio de edición de Self-Descriptions (SDs) o Wizard: Las SDs son credenciales verificables según el estándar definido por el W3C mediante las cuales se describen a sí mismos tanto los participantes de un ecosistema Gaia-X como los productos puestos a disposición por los proveedores. El servicio de conformidad antes mencionado consiste en validar que las SDs cumplen con las normas de interoperabilidad. El Wizard es un servicio de conveniencia para la creación de Self-Descriptions según esquemas predefinidos.
- Catálogo: Servicio de almacenamiento de la oferta de servicios disponible en el ecosistema para su consulta.
- e-Wallet: Para la gestión de credenciales verificables (SDs) por parte de los participantes en un sistema basado en identidades distribuidas.
- Servicio de Notaría: Servicio de emisión de credenciales verificables firmadas por autoridades de acreditación (Trust Anchors).
En qué consiste el servicio de conformidad de Gaia-X (p.e. Compliance Service)
El servicio de conformidad de Gaia-X pertenece a los denominados Gaia-X Federation Services, y su función es verificar el cumplimiento de las reglas mínimas de interoperabilidad definidas por la asociación Gaia-X. Gaia-X denomina a estas reglas mínimas de interoperabilidad (Trust Framework). Se debe tener en cuenta que el establecimiento del Trust Framework es una de las contribuciones diferenciadoras del marco tecnológico de Gaia-X frente a otras soluciones de mercado. Pero el objetivo no se limita a establecer normas de interoperabilidad, sino que pretende crear un servicio que sea operable y, en la medida de lo posible, automatizado, que valide el cumplimiento del Trust Framework. Este servicio es el Gaia-X Compliance Service.
El elemento clave de estas reglas son las denominadas “Self-Descriptions” (SDs). Las SDs son credenciales verificables según la norma definida por el W3C mediante las cuales se describen a sí mismos tanto los participantes de un espacio de datos como los productos puestos a disposición por los proveedores. El servicio Gaia-X Compliance valida el cumplimiento del Trust Framework mediante un chequeo de las SDs desde los siguientes puntos de vista:
- Formato y sintaxis de las SDs
- Validación de los esquemas de las SDs (vocabulario y ontología)
- Validación de la criptografía de las firmas de los emisores de las SDs
- Consistencia de los atributos
- Veracidad del valor de los atributos.
Una vez validadas las Self-Descriptions, el operador del servicio de conformidad emite una credencial verificable que da fe del cumplimiento de las normas de interoperabilidad, aportando confianza a los participantes del ecosistema. La Gaia-X AISBL proporciona el código necesario para implementar el Compliance Service y autoriza la prestación del servicio a entidades de confianza, pero no opera directamente el servicio por lo que requiere la existencia de socios que se encarguen de esta labor.
El Hub español de Gaia-X (Gaia-X Hub Spain), asociación sin ánimo de lucro cuyo objetivo es acelerar la capacidad europea en materia de compartición de datos y soberanía digital, busca que los diferentes sectores de la economía construyan una comunidad en torno al dato para, así, poder promover un entorno propicio para la creación de espacios de datos sectoriales. Enmarcado en la estrategia España Digital 2026 y con el Plan de Recuperación, Transformación y Resiliencia como hoja de ruta para la transformación digital de España, el objetivo del hub es potenciar el desarrollo de soluciones innovadoras basadas en datos e inteligencia artificial, a la par que contribuye a impulsar la competitividad de las empresas de nuestro país.
El hub se organiza a lo largo de diferentes grupos de trabajo, existiendo uno específico dedicado a analizar los restos y oportunidades de los espacios de datos de compartición y explotación de datos en el sector turístico. El turismo es uno de los sectores productivos clave en la economía española, llegando a alcanzar un volumen del 12,2% del PIB nacional.
El turismo, dado su ecosistema de participantes públicos y privados, de diferentes dimensiones y grado de madurez tecnológico, constituye un entorno óptimo donde contrastar las bondades de estos ecosistemas federados de datos. Gracias a ellos se facilita la extracción de valor de fuentes de datos no tradicionales, con una elevada escalabilidad, y garantizando en todo caso unas condiciones robustas de seguridad, privacidad y, por en ende, de soberanía del dato.
Así, y con la finalidad de producir la primera radiografía de dicho espacio de datos en España, desde la Oficina del dato, en colaboración con el Hub español de Gaia-X se ha elaborado el informe ‘Radiografía del Espacio de Datos de Turismo en España’, un documento que busca resumir y resaltar en qué momento se encuentra actualmente el diseño de dicho espacio de datos, las diferentes oportunidades para el sector y cuáles son los principales retos que deben superarse para conseguir el despliegue del mismo, ofreciendo una hoja de ruta para su construcción y despliegue.
¿Por qué es necesario un espacio de datos de turismo?
Si algo quedó claro tras el estallido de la pandemia por COVID-19 es que el turismo es una actividad interdependiente de otras industrias por lo que, al pausarse esta, sectores como la movilidad, la logística, la salud, la agricultura, la automoción o la alimentación, entre otros, se vieron también afectados.
Situaciones como la anterior, evidencian las posibilidades que ofrece la compartición de datos entre sectores, ya que éstos pueden ayudar a mejorar la toma de decisiones. Sin embargo, conseguirlo en el ámbito turístico no es una tarea sencilla dado que desplegar un espacio de datos para este sector requiere del esfuerzo coordinado entre las distintas partes de la sociedad implicadas.
Por ello, el objetivo y el reto es crear "espacios" inteligentes capaces de aportar un contexto de seguridad y confianza que favorezca el intercambio y la combinación de datos. De este modo y a partir de la generación del valor añadido que aportan los datos, sería posible resolver algunos de los problemas existentes actualmente en el sector para crear nuevas estrategias enfocadas a conocer mejor al turista y, por ende, a mejorar su experiencia a la hora de viajar.
La generación de estos espacios de compartición y explotación de datos supondrá grandes ventajas para el sector, ya que se facilitará la creación de ofertas, productos y servicios más personalizados que proporcionen una experiencia mejorada y adaptada a las necesidades de los clientes, mejorando así la capacidad de atraer turistas. Además de impulsar un mayor conocimiento del sector y una toma de decisiones informada tanto por parte de organizaciones públicas como privadas, que pueden detectar más fácilmente nuevas oportunidades de negocio.
Retos de seguridad y gobernanza de datos para aprovechar las oportunidades del mercado turístico digital
Uno de los principales escollos a la hora de desarrollar un espacio de datos sectorial es la falta de confianza en el intercambio de datos, la ausencia de modelos de datos compartidos o la insuficiencia de normas de interoperabilidad para un intercambio de datos eficiente entre las diferentes plataformas existentes y los actores de la cadena de valor.
Yendo a los retos más específicos, el sector turístico se encuentra, además, con la necesidad de combinar los espacios de datos B2B (compartición entre empresas y organizaciones privadas) con los C2B y G2B (compartición de usuarios a empresas y sector público a empresas). Si a esto le sumamos que lo ideal es aterrizar los conjuntos de datos del sector turístico a nivel nacional, regional y local, el reto se torna aún mayor.
De forma paralela, para diseñar un espacio de datos del sector, también debe tenerse en cuenta que existen diferencias respecto a la calidad de los datos de los actores anteriormente mencionados. Al no existir una serie de estándares concretos, encontramos diferencias en el nivel de granularidad y calidad de los datos, la semántica, así como disparidad entre formatos y licencias, lo que deja un escenario de datos inconexo.
A su vez, es fundamental conocer de primera mano cuáles son las demandas que tienen los distintos actores de la industria, algo que solo se consigue escuchando y tomando notas sobre las necesidades presentes en los distintos niveles de la industria. Por ello, conviene recordar que el turismo es una actividad social cuyo foco no debe posicionarse solamente en el destino, ya que el éxito de un espacio de datos turístico residirá también en la capacidad para conocer mejor al cliente y, por ende, poder ofrecerle servicios adecuados a sus demandas que mejoren su experiencia e incentiven sus ganas de continuar viajando.
De este modo, y tal y como recoge el informe elaborado por la Oficina del Dato, en colaboración con el hub español de Gaia-X, resulta interesante reorientar el foco y desplazarlo del destino hacia el turista, en línea con el descubrimiento y generación de casos de uso de SEGITTUR. Y es que, aunque es cierto que la focalización en el destino ha servido para desarrollar plataformas digitales que han impulsado la competitividad, la eficiencia y la estrategia turística, plantear una estrategia que preste la misma atención al turista permitiría ampliar y mejorar los catálogos de datos disponibles.
Medir los factores que condicionan la experiencia de los turistas durante la visita a nuestro país permite optimizar su satisfacción en todo el circuito del viaje, a la par que contribuir a crear campañas de marketing cada vez más personalizadas, tomando como el análisis de los intereses de los diferentes segmentos de mercado.
Situación actual de la construcción del espacio de datos del Turismo español y próximos pasos
La falta de madurez del mercado en la creación de espacios de datos como solución, hace necesario un enfoque de experimentación, tanto para la consolidación de los componentes tecnológicos, como para la validación de las diferentes facetas (infraestructura soft) presentes en los espacios de datos.
Actualmente, el Grupo de Trabajo de Turismo del Hub español de Gaia-X trabaja en la definición de los elementos clave del espacio de datos de turismo, a partir de casos de uso alineados con los retos del sector. El objetivo es dar respuesta a algunas preguntas clave, utilizando el conocimiento existente en materia de espacios de datos:
- ¿Cuáles son las características clave del entorno turístico y qué problemas de negocio pueden abordarse?
- ¿Qué modelos orientados a datos se pueden trabajar en los diferentes casos de uso?
- ¿Qué requisitos existen y qué modelo de gobernanza es necesario? ¿Qué tipologías de participantes deben considerarse?
- ¿Qué componentes de negocio, legales, operativos, funcionales, tecnológicos son necesarios?
- ¿Qué arquitectura tecnológica de referencia puede utilizarse?
- ¿Qué procesos de desarrollo, integración, test y despliegue de la tecnología pueden emplearse?
El impulso de la llamada economía del dato es una de las grandes prioridades en las que se encuentra trabajando actualmente la Unión Europea, en general, y España, en particular. Disponer de un mercado único digital de intercambio de datos es una de las claves para lograr este impulso entre los Estados miembro, y para ello, entran en juego los espacios de datos.
Data Spaces Business Alliance (DSBA)
Un espacio de datos es un ecosistema capaz de materializar la compartición voluntaria de datos entre sus participantes, respetando su soberanía sobre los mismos, esto es, siendo capaces de fijar las condiciones de su acceso y uso. La DSBA, fundada en 2021, está compuesta por los principales actores en la definición de estándares, modelos y marcos tecnológicos para la construcción y operación de espacios de datos. En concreto, la alianza está compuesta por la Big Data Value Association (BDVA), la Fundación FIWARE y las asociaciones Gaia-X European Association for Data and Cloud AISBL y la International Data Spaces Association (IDSA). El propósito de la alianza es acordar un marco tecnológico común que evite la fragmentación tecnológica de la actividad, así como la armonización en el mensaje y las actividades de difusión.
Technical Convergence Discussion Document
Respecto a la parte tecnológica, la DSBA publicó en septiembre de 2022 una primera aproximación a la deseada convergencia tecnológica.
El documento analiza técnicamente los puntos de anclaje para crear espacios de datos confiables, catálogos federados y mercados compartidos y la capacidad de definir políticas de uso de los datos (en base al uso de un lenguaje común). Esta capacidad para compartir respetando la soberanía del dueño de los datos es lo que hace de estos espacios algo novedoso y verdaderamente disruptor, pues por primera vez ofrece elementos técnicos con que controlar los riesgos asociados a la compartición de información.
Para conseguir la convergencia técnica, la asociación acordó el desarrollo de un marco mínimo viable (MVF, minimal viable framework) basado en tres pilares:
- Interoperabilidad en el intercambio de datos mediante la utilización del protocolo/API estándar de intercambio de datos NGSI-LD y los modelos de datos "Smart Data Models" ampliados para la adopción del modelo de información definido por la arquitectura IDS.
- Soberanía y confianza en el intercambio de datos mediante la adopción de un modelo descentralizado (Self-Sovereign Identity) como el propuesto por Gaia-X (con su Trust Framework) que emplearía la DLT (Distributed Ledger Technologies) impulsada por la Comisión Europea (EBSI). El resultado será un entorno de confianza compatible con la normativa eIDAS 2.0 de la UE.
- Servicios de creación de valor (intermediación) consistentes en un catálogo de datos descentralizado y servicios de comercialización basados en estándares del TM Forum.
La alianza considera que este MVF sería un buen punto de partida sobre el que trabajar para alcanzar la deseada convergencia tecnológica, contando y reutilizando piezas de las actuales soluciones aportadas por los distintos suministradores.
Ejemplo de mercado público de datos
El documento plantea el ejemplo de un proveedor de servicios de datos que ofrece su servicio en un mercado público de datos (Data Marketplace), de modo que los consumidores puedan acceder fácilmente a esta oferta. Además, los proveedores pueden también delegar el acceso a sus usuarios para modificar atributos del servicio que contratan.
Es un ejemplo que puede verse en detalle en el documento, éste resulta interesante porque entran en juego diferentes sistemas de autenticación, políticas de seguridad y acceso y, en definitiva, diferentes sistemas que deben interoperar entre sí.
Adicionalmente, se expone un ejemplo de integración entre el Data Marketplace y un catálogo de datos mediante el enfoque seguido por el proyecto europeo Horizonte 2020 'Digital Open Marketplace Ecosystem' (DOME). De esta manera, se crean las ofertas en el catálogo compartido y pueden ser consultadas posteriormente siguiendo las políticas de acceso definidas.
El documento explica, paso por paso y desde una perspectiva puramente técnica, las acciones a abordar por cada uno de los roles identificados, con el propósito de orientar potenciales escenarios que pudieran producirse en la realidad.
El futuro de la DSBA
La DSBA considera que el mencionado MVF es sólo el primer paso para la convergencia de las diferentes arquitecturas y tecnologías existentes en la construcción de espacios de datos. Los siguientes pasos de la alianza tendrán en cuenta los roles asignados a cada uno de los participantes. Más concretamente:
- IDSA: Desarrolla arquitecturas y estándares de espacios de datos. En particular, un modelo para conectores que garantiza la compartición soberana de datos de forma escalable.
- Gaia-X: Desarrolla y despliega una arquitectura, un modelo de gobernanza acorde a especificaciones de negocio para espacios de datos sectoriales, así como un set de herramientas (Gaia-X Federation Services toolkit) con que instanciar la interoperabilidad, componibilidad y transparencia de los servicios de infraestructura y datos en nube.
- FIWARE: Con un stack tecnológico que viene del mundo de los Gemelos Digitales, la comunidad desarrolla componentes software que permiten llevar a la práctica la construcción de espacios de datos.
Así mismo, la DSBA se marca como objetivos prioritarios:
- La compatibilidad de la arquitectura de IDS con un mecanismo de gestión de identidad basado en identificadores descentralizados.
- La integración de un catálogo federado como el propuesto con el bróker de metadatos propuesto en la arquitectura IDS.
- La definición de un vocabulario común.
- Avanzar conjuntamente con la labor del Data Space Support Center (un programa financiado por la Comisión Europea, y donde estas asociaciones desarrollan un papel protagonista), así como con los esfuerzos de normalización en base al proyecto ‘Smart Middleware Platform’ (SIMPL) de la CE.
Contenido elaborado por Juan Mañes, experto en Data Governance.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El pasado 20 de octubre, Madrid acogió una nueva edición del Data Management Summit Spain, una cumbre internacional que este año también tuvo lugar en Italia (7 de julio) y Latam (20 de septiembre). La cita reunió a CiOs, CTOs, CDOs, Directores de Sistemas, Responsables de Inteligencia de Negocio y Científicos de Datos encargados de implementar tecnologías emergentes con el fin de resolver nuevos retos tecnológicos y alinearse con nuevas oportunidades de negocio.
Este evento fue precedido de un prólogo celebrado la tarde anterior, en colaboración con DAMA España y la Oficina del Dato. Se trataba de una sesión dirigida exclusivamente a representantes de los distintos niveles de la administración pública y centrado en los datos abiertos y el intercambio de información entre administraciones. Durante la jornada se debatió el papel transformador del dato y cómo su uso intensivo y puesta en valor son fundamentales para lograr la transformación digital de las administraciones públicas.
Tal y como se refirió en la sesión, el dato tiene un papel esencial en el desarrollo de tecnologías disruptivas como la Inteligencia Artificial, y supone un factor diferencial a la hora de poner en marcha una revolución industrial y tecnológica que permita consolidar una economía digital más justa, inclusiva y en línea con los ODS y la Agenda 2030. Una auténtica economía del dato con la vocación de nutrir con todas las garantías el desarrollo de dos procesos clave y estratégicos para la reconstrucción de nuestro país: la transformación digital y la transición ecológica.
Los espacios de datos y los datos abiertos, claves para conseguir una administración orientada al dato
La apertura institucional corrió a cargo de Carlos Alonso, director de la División Oficina del Dato. Su intervención se centró en resaltar cómo la consecución de una administración orientada al dato, parte inseparable de su proceso de transformación digital, pasa por el desarrollo de los espacios de datos del sector público, los cuales habilitan la compartición de datos con soberanía y su explotación a gran escala. El dato es un bien público, a conservar y tratar en aras de una aplicación de servicios y políticas públicas de calidad. El objetivo es conseguir una administración orientada al dato, centrada en la ciudadanía, abierta, transparente, inclusiva participativa e igualitaria, asegurando un uso ético, seguro y responsable de los datos.
En este proceso de concepción de los espacios de datos del sector público y privado son fundamentales los datos abiertos, como resaltó Carlos Alonso durante su intervención: “Los espacios de datos son grandes consumidores y generadores de datos abiertos, debiéndose asegurar su disponibilidad. Esto es, se precisa fijar unos determinados acuerdos de nivel de servicio que aseguren el acceso”.
Compartición de experiencias entre administraciones
Tras esta apertura institucional, la jornada ha abordado la oportunidad que suponen la creación de espacios de compartición y explotación de datos en las administraciones públicas, y ha permitido difundir diferentes proyectos en torno al dato por parte de representantes de los diferentes niveles administrativos, incluyendo también Comunidades Autónomas y entidades locales.
Andreu Francisco, Director General del Consorcio local Localret, formado por las administraciones locales de Cataluña para el desarrollo de los servicios y redes de telecomunicaciones y la aplicación de las TIC, presentó un metamodelo digital, cuyo fin es estructurar la arquitectura tecnológica y de servicios necesarios en una ciudad digital. Se trata de una solución integral, que puede ser implementada en distintos territorios y personalizada en función de las singularidades de cada ciudad, facilitando que los habitantes de los 877 municipios catalanes puedan desarrollarse a nivel profesional y personal.
César Priol, Director General de Digitalización y Atención Ciudadana, de Bizkaiko Foru Aldundia (País Vasco) compartió su experiencia en la creación de la Oficina de Datos, resaltando la importancia de organizarse tanto a nivel organizativo como normativo y legal para tener la capacidad de transformar con los datos no solo la organización, sino también el territorio.
Magda Lorente, Jefa de la Sección de Asistencia en Sistemas de Información Local, y Sara Aguilar, Jefa del Servicio del Boletín Oficial de la Provincia de Barcelona y otras Publicaciones Oficiales de la Diputación de Barcelona, hablaron de buenas prácticas en la gestión de datos. Magda Lorente resaltó la importancia de que las diputaciones se orienten al dato para así poder asumir su papel relevante en el impulso del gobierno del dato municipal. Según un estudio realizado por la Diputación de Barcelona, que verá la luz a finales de noviembre, el 85% de los municipios podrían quedarse al margen de la inteligencia artificial y de la administración inteligente debido a que sus capacidades técnicas no permiten materializar la orientación al dato que se precisa.
Sara Aguilar, por su parte, presentó un ejemplo de cómo las administraciones están consolidando el camino en la toma de decisiones en base al dato de calidad: el CIDO, un buscador de información y documentación oficial. Esta herramienta nació en el año 2000 con el fin de acercar la información de las administraciones a la ciudadanía de forma amigable. Desde él se puede acceder, por ejemplo, a más de 2.600 procesos selectivos con convocatoria abierta y a 1.600 subvenciones abiertas, gracias a los datos abiertos ofrecidos por los distintos municipios de Cataluña. CIDO se basan en un modelo de lector de etiquetas y en el uso de algoritmos de inteligencia artificial, que clasifican la información recogida de los municipios. Disponen de más de 2 millones de anuncios, datos abiertos estructurados y documentados que sirven a través de una API que se puede integrar en cualquier plataforma.
Mesas redondas y dinámicas de grupo para promover el debate
Durante el desarrollo de la jornada los asistentes pudieron participar en diferentes dinámicas de intercambio de experiencias. La primera dinámica estuvo centrada en los datos abiertos y la segunda en la interoperabilidad.
Además, se celebraron dos mesas redondas que han permitido abordar la materia desde diferentes prismas de opinión:
- La primera mesa redonda, moderada por Carlos Alonso, se centró en los retos y barreras para el intercambio de datos en el sector públicos. En ella se proyectaron a mayor escala las actuales metodologías, especificaciones y prácticas relacionadas con el tratamiento de la información, para conseguir un intercambio de datos fluido y continuo entre administraciones, sectores industriales y ciudadanos. La mesa conto con la participación de: Carlos Alonso, Jose Antonio Eusamio (Secretaría General de Administración Digital), César Priol (Diputación de Vizcaya), Miguel Angel Martinez Vidal (INE) y Magda Lorente.
- La segunda mesa redonda se centró en cómo acelerar la adopción de Open Linked Data en el dominio de la administración pública, moderada en este caso por Oscar Alonso (IBM Consulting & DAMA España). En ella participaron Sara Aguilar (Diputación de Barcelona), Oscar Alonso (DAMA España e IBM), Sonia Castro (datos.gob.es), Juan José Alonso (Orange) y Olga Quiros (ASEDIE) La conversación giró en torno a las iniciativas de la UE, como la Ley de gobernanza de datos, que están actuando como punto de inflexión en las políticas de datos. Dicha ley busca establecer mecanismos sólidos para facilitar la reutilización de ciertas categorías de datos protegidos del sector público, aumentar la confianza en los servicios de intermediación de datos y promover el altruismo de datos en toda la UE. Con ello se pone de manifiesto como desde UE está trabajando para reforzar diversos mecanismos de intercambio de datos con el objetivo de fomentar su disponibilidad y que puedan utilizarse para impulsar aplicaciones y soluciones avanzadas en inteligencia artificial, medicina personalizada, movilidad ecológica, fabricación inteligente y muchos otros ámbitos. Durante el debate también se resaltó la importancia que tiene la ética del dato.
Materiales disponibles sobre la jornada
Si te perdiste la sesión, el video de la misma está disponible en Youtube. También se ha hecho pública la grabación de la cumbre del día 20, una jornada que contó con un enfoque más empresarial, con ponencias de expertos y dinámicas de grupo centradas en la gobernanza de datos, su calidad, los datos maestros y la arquitectura de datos, entre otros temas. También está disponibles las fotos del evento.
Además, en la página web de la cumbre se han ido publicando entrevistas a algunos de los ponentes, que permiten profundizar un poco más en los proyectos que llevan a cabo.
El pasado 25 de octubre se celebró el taller de trabajo “Casos de uso del espacio de datos del Turismo español”, con el objetivo de arrancar el diseño y despliegue del primer dataspace del turismo interoperable a nivel europeo, construido bajo el sello de Gaia-X.
Esta actividad, organizada por la Oficina del Dato en colaboración con la Secretaría de Estado de Turismo, a través de SEGITTUR, se encuadra dentro del modelo de colaboración público privado para la constitución de los espacios de datos sectoriales impulsada por la Secretaria de Estado de Digitalización e Inteligencia Artificial del Ministerio de Asuntos Económicos y Transformación Digital. La cita supone la continuación al proceso de dinamización de los espacios de datos nacionales que se inició con la jornada abierta “Impulso gubernamental a una reindustrialización data-driven - Espacio de datos del Turismo español”, y se enmarca dentro de las acciones llevadas a cabo por el Gobierno de España para crear el entorno legal, político, tecnológico y de financiación propicio al despliegue de la economía del dato, tal y como se detalla en la estrategia España Digital 2026. Esta actuación está alineada con la escena europea.
¿Por qué un espacio de datos de turismo?
Los datos son un elemento vital del desarrollo y sostenibilidad del sector turístico. Permitiendo su adecuada puesta en valor se refuerza la ya significativa contribución del sector a la economía nacional. El lugar donde materializar este valor latente son los espacios de datos.
De acuerdo con su acepción europea, los espacios de datos son ecosistemas donde diversos actores comparten datos de manera voluntaria y segura. De esta forma se materializa la compartición de datos entre los partícipes respetando los principios de auto determinación en la compartición de datos (soberanía), privacidad, transparencia, seguridad y competencia justa.
El turismo, dado su ecosistema de participantes públicos y privados, de diferentes dimensiones y grado de madurez tecnológico, constituye un entorno óptimo donde contrastar las bondades de estos ecosistemas federados de datos. Gracias a ellos se facilita la extracción de valor de fuentes de datos no tradicionales, con una elevada escalabilidad, y garantizando en todo caso unas condiciones robustas de seguridad, privacidad y en ende de soberanía del dato.
La alta disponibilidad de datos sobre turismo supone grandes ventajas para el sector, ya que facilita la creación de ofertas, productos y servicios más personalizados que proporcionen una experiencia mejorada y adaptada a las necesidades de los clientes, mejorando así la capacidad de atraer turistas. Además de impulsar un mayor conocimiento del sector y una toma de decisiones informada tanto por parte de organizaciones públicas como privadas, que pueden detectar más fácilmente nuevas oportunidades de negocio.
Un taller eminentemente práctico
Durante el desarrollo del taller, los más de cien participantes, tanto del sector turístico como tecnológico, abordaron la caracterización en detalle de diferentes casos de uso de compartición de datos susceptibles de satisfacer necesidades de negocio concretas del sector turístico. Los participantes se organizaron a lo largo de diferentes mesas de trabajo considerando la madurez de los casos de uso planteados, buscando fomentar la variedad de perfiles y la agrupación de intereses. Las diferentes dinámicas de trabajo que se llevaron a cabo, se realizaron de acuerdo con la metodología de descubrimiento y diseño de casos de uso elaborada por la Oficina del dato, permitiendo validar su contenido y su escalabilidad al resto de espacios de datos sectoriales por constituir.
Durante las conclusiones finales de la jornada, la Oficina del Dato hizo énfasis en el papel central de los espacios de datos como lugar donde crear nuevas oportunidades de negocio dentro del sector turístico. También se resaltó que las sinergias derivadas de la compartición de datos van más allá de la suma de los datos individuales, y las inversiones, debidamente apoyadas por la colaboración pública-privada, deben verse más allá del corto plazo necesitando ser respaldadas por la Dirección. El problema a resolver es un problema de negocio y la solución no es exclusivamente tecnológica, deben buscarse soluciones simples con facilidad de adopción y uso, de despliegue robusto, ágil y sencillo que no generen barreras de entrada a pequeños participantes. Aprovechando el momento tecnológico, económico, político y social, es posible desarrollar un sector turístico orientado al dato, sostenible, generador de valor social e inclusivo.
En este enlace puedes ver la presentación del taller, donde se recogen, entre otros, aspectos metodológicos para la creación de espacios de datos, como las características a cumplir o los elementos a considerar. A continuación también puedes acceder a varias infografías:
- Los espacios de datos de turismo y el modelo Gaia-X
- Ficha del caso de uso para la compartición de datos
- Identificación y propuesta de casos de uso en turismo
- Elementos que intervienen en el proceso de compartición de datos
Muchas organizaciones y administraciones han encontrado en los datos abiertos un pilar transformacional sobre el que ejercer la estrategia hacia la cultura del dato. Tener acceso a datos de forma estructurada es la base de nuevos modelos de negocio, así como de nuevas iniciativas dirigidas al ciudadano en los diferentes ámbitos de actuación.
Sin embargo, obtener todo el potencial de los datos abiertos, requiere de una plataforma capaz de poner a disposición de terceros estos datos asegurando su calidad, entendimiento, privacidad y seguridad.
En este contexto, el libro “Designing Data Spaces”, incluye un capítulo, firmado por Fabian Kirstein and Vincent Bohlen, donde se propone el uso de la arquitectura IDS-RAM propuesta por la International Data Spaces (IDS) para el desarrollo de ecosistemas de datos abiertos. En él se aborda una prueba de concepto sobre la viabilidad de la arquitectura de IDS para disponer espacios de datos públicos con el objetivo de lograr una base sólida que permita construir y mantener ecosistemas de datos abiertos interoperables, capaces de hacer frente a los retos existentes.
A continuación, se resumen las opiniones recogidas en el capítulo.
Ecosistemas de datos abiertos
Los espacios de datos son ecosistemas donde diversos actores comparten datos de manera voluntaria y segura, siguiendo mecanismos comunes de gobernanza, organizativos, normativos y técnicos.
Con el objetivo de impulsar la economía digital global, mediante un sistema seguro y soberano de intercambio de datos en el que todos los participantes puedan obtener el máximo valor de sus datos, en 2016 surge IDSA (International Data Spaces Association), una coalición de más de 130 empresas internaciones con representación en más de 20 países en todo el mundo.
Entre otras iniciativas, promueve un modelo de referencia arquitectónico denominado IDS-RAM, que pretende facilitar el intercambio de datos para optimizar su valor, pero sin perder su control. Ofrece varios enfoques cuya aplicabilidad puede entenderse tanto en el contexto de datos privados como de datos abiertos, ya que se basa en repositorios de metadatos para compartir información. Es decir, los datos permanecen bajo el control de sus propietarios y son los metadatos estandarizados los que se gestionan de forma centralizada para su compartición.
La creación de los espacios de datos conlleva una serie de riesgos a los que hacer frente, tanto desde el punto de vista del consumidor como del proveedor. Los proveedores de datos ponen el foco en el cumplimiento legal, mediante aspectos como la propiedad de los datos. Aunque existen normas comunes para aspectos como la descripción de metadatos - La World Wide Web Consortium no es ajena al problema y por ello propuso hace ya varios años su Data Catalog Vocabulary (DCAT), un estándar para describir catálogos de datos - lo cierto es que la interoperabilidad, en ocasiones, está lejos de su mayor potencial. Esto se debe a que a veces existen metadatos incompletos, la calidad es escasa, los datos están obsoletos, existen dificultades para acceder a datos e interoperar, etc.
La aplicabilidad de IDS-RAM en entornos de datos abiertos
IDS ofrece un enfoque basado en garantizar la soberanía de los datos a los proveedores, facilitando el intercambio de datos y dando respuesta a las preocupaciones tanto de consumidores como de proveedores.
Los conceptos y tecnologías subyacentes a los datos abiertos y al IDS-RAM son muy similares. Ambas iniciativas se basan en repositorios de metadatos para compartir información sobre la disponibilidad y accesibilidad de los datos. Estos repositorios almacenan metadatos, sin necesidad de transferir los datos reales. Por lo tanto, ambos conceptos siguen los principios de descentralización y transferencia de metadatos desde y hacia los puntos centrales de acceso a la información. Los datos reales permanecen bajo el control de la infraestructura del editor de datos hasta que un usuario los solicita. Además, el modelo de información de IDS se basa en los principios de Linked Data y DCAT. Esto hace que sea un sistema fácilmente compatible con los portales de datos abiertos, impulsando la interoperabilidad entre espacios de datos y portales de datos abiertos.
La arquitectura que propone IDS se basa principalmente en dos artefactos, un conector a las fuentes de datos (Open Data Connector) y un almacén de metadatos (Open Data Broker), tal como muestra la siguiente imagen extraída del libro “Designing Data Spaces”:
- Open Data Connector: adopta el rol de proveedor de datos abiertos. Cada entidad publicadora, aplica una instancia del conector para anunciar la disponibilidad y conceder accesos a los datos. Al tratarse de datos abiertos, y por tanto públicos, no es necesario aplicar políticas de uso o restricciones tan estrictas como cuando hablamos de otros conectores de datos privados basados en esta arquitectura, lo que permite una configuración y manejo a priori más sencillo.
- Open Data Broker: el repositorio centralizado de metadatos cumple una función similar a la de un portal de datos abiertos. A partir de estos metadatos, la interfaz de portal ofrece funcionalidades para localizar y descargar los datos desde los conectores.
Esta gestión permite agrupar por diferentes ámbitos de aplicación, es decir, se pueden crear repositorios de metadatos centralizadosde sectores como salud o turismo, así como a nivel municipal, regional, nacional o internacional.
En un ecosistema de datos como el que se propone por IDS, el conector informa sobre los datos disponibles o actualizados, y en el repositorio de metadatos estos se actualizan en consecuencia. Para ello se utilizan mecanismos de comunicación basados en el modelo de información de IDS (IDS information model) y el protocolo IDS (IDS Communication Protocol o IDSCP) que anuncian posibles modificaciones en la disponibilidad de los datos. De esta manera, se garantiza la disponibilidad de los datos actualizados.
En los portales de datos abiertos que recogen un gran número de fuentes de datos, la accesibilidad y la usabilidad general dependen de los metadatos suministrados por los proveedores de datos originales. Las normas como DCAT proporcionan una base común, pero IDS ofrece especificaciones más estrictas en el proceso de comunicación.
Aunque es una propuesta interesante, en el contexto de datos abiertos, este enfoque aún no ha sido implantada en ningún espacio. No obstante, ya se han realizado pruebas de concepto, como puede verse en el Public Data Space, un escaparate disponible desde diciembre de 2020 que reproduce cómo funciona la solución. En él, los conectores exponen la oferta de datos abiertos de diferentes portales de datos de Alemania y se registran en un almacén de metadatos.
La siguiente imagen muestra el flujo de trabajo de un modelo basado en IDS-RAM versus un enfoque más tradicional:
Conclusiones
Los portales de datos abiertos suministran acceso a datos abiertos procedentes de diversos proveedores. La usabilidad general de estos portales, está supeditada en cierto modo al descubrimiento de los datos, que a su vez depende de la calidad de sus metadatos.
Para contrarrestar los problemas de datos no disponibles o enlaces muertos que en ocasiones se producen en entornos de datos abiertos, los portales recogen periódicamente los catálogos de datos del publicador y realizan comprobaciones de disponibilidad. En el ecosistema de datos abiertos basado en IDS-RAM, el conector informa al bróker sobre los conjuntos de datos disponibles o actualizados. El enfoque "pull" de la responsabilidad en los entornos habituales de datos abiertos se invierte en un enfoque "push" en el ecosistema de IDS. Este enfoque focaliza en la responsabilidad del publicador de mantener la oferta de datos y además presenta nuevas posibilidades para controlar su difusión. Utilizando IDS-RAM, el publicador elige a qué broker de metadatos se inscribe, lo que le otorga una mayor soberanía sobre sus datos.
Para los consumidores de datos, este enfoque puede suponer mejoras en cuanto a la posibilidad de encontrar los datos en el momento oportuno y reduce la fragmentación. Además, si los datos abiertos pueden adquirirse, manejarse y procesarse con las mismas herramientas y aplicaciones que ya se aplican en la industria, las posibilidades de integración y reutilización se multiplican.
Contenido elaborado por Juan Mañes, experto en Data Governance.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Para que un espacio de datos funcione correctamente, es necesario contar con actores suficientes para cubrir un conjunto de roles y una serie de componentes tecnológicos. Estos elementos permiten fijar un marco común de gobernanza para compartir los datos de manera segura, garantizando la soberanía de los participantes sobre sus propios datos. Este concepto, la soberanía de los datos, se puede definir como la capacidad del dueño de los datos para establecer las políticas de uso y acceso de los datos que va a intercambiar, y es el elemento nuclear de un espacios de datos.
En este sentido, el informe “Principios de diseño para los espacios de datos” (abril 2021), financiado por la Unión Europea, ofrece los fundamentos que deben seguir los espacios de datos para actuar de acuerdo con los valores de la UE: descentralización, apertura, transparencia, soberanía e interoperabilidad. El informe fue elaborado por expertos de 25 compañías diferentes, por lo que da una visión consensuada con la industria.
A continuación se resumen algunas de las principales aportaciones del documento, tomando como referencia el artículo “Elementos de un espacio de datos” publicado en la revista Boletic, de la Asociación profesional de Cuerpos Superiores de Sistemas y Tecnologías de la Información. En dicho artículo, los elementos de un espacio de datos se dividen en dos categorías:
- Roles y ámbitos de actuación
- Componentes fundamentales
Roles
En un espacio de datos podemos encontrar diversos participantes, cada uno de ellos enfocados en un ámbito de actuación. Es lo que se conoce como roles:
-
Proveedores y consumidores de datos
Son los participantes que proporcionan e interactúan con los datos. Dentro de esta categoría encontramos varios roles:
- Productor de los datos: Genera los datos.
- Dueño de los datos: Es el titular de los derechos de acceso y utilización de los datos.
- Proveedor de datos: Capta los datos y los ofrece a través del catálogo del espacio de datos.
- Consumidor de datos: Accede a los datos del catálogo.
- Proveedor de aplicaciones: Proporciona aplicaciones que permiten trabajar con los datos ofreciendo valor añadido (por ejemplo, modelos de machine learning, visualizaciones, procesos de limpieza, etc.).
-
Intermediarios
En este caso hablamos de terceros que ofrecen los servicios necesarios para la publicación, búsqueda de recursos y registro de transacciones. Algunos ejemplos de servicios que ofrecen los intermediarios son:
- Vocabularios y ontologías, que permiten organizar, categorizar o etiquetar sistemáticamente la información, mejorando la interoperabilidad.
- Tiendas de aplicaciones, donde figuran las herramientas ofrecidas por los proveedores de aplicaciones, garantizándose que han pasado un proceso de control de calidad.
- Servicios de bróker de metadatos para la publicación de un catálogo de ofertas de recursos (datos y aplicaciones) con la máxima información posible.
- Servicios de orquestación, que permiten automatizar diversas actividades.
- Registros de transacciones (clearing house), que permiten mantener el control de las operaciones realizadas.
-
Proveedores tecnológicos
Proporcionan componentes para que el espacio de datos opere correctamente, convirtiéndose en un entorno seguro y de confianza. Ejemplos de estos componentes son el conector -un elemento fundamental que veremos a continuación-, los sistemas de gestión de usuarios o los sistemas de supervisión.
No entrarían en esta categoría los servicios de intermediación ni las aplicaciones.
-
Operadores del espacio de datos
Centrados en la gestión del espacio, realizan tareas como la tramitación de peticiones o incidencias, control de cambios, mantenimiento software, etc. Entre otras cuestiones, certifican a los participantes, ejercen la gobernanza del espacio de datos y definen el roadmap de funcionalidades.
Todos estos roles no son exclusivos, y un mismo usuario puede adoptar varios de ellos.
Componentes de un espacio de datos
Existen diferentes aproximaciones sobre los componentes que debe tener un espacio de datos. Se puede acudir a Gaia-X y/o tomar como referencia el modelo de arquitectura IDS-RAM (Reference Architecture model), caracterizado por presentar una arquitectura abierta, confiable y federada para un intercambio de datos intersectorial.
En todo caso, para que la actividad se desarrolle de una manera segura y controlada, son necesarios, al menos, los siguientes bloques:
-
Componentes para el acceso al espacio de datos: conector
Uno de los principales elementos de los espacios de datos es el conector, mediante el cual los participantes acceden al espacio de datos y a los propios datos. Es el encargado de tratar los datos según las políticas de uso definidas por el dueño de los derechos de acceso y utilización, garantizando su soberanía. Para evitar su manipulación maliciosa, los conectores pueden ir firmados mediante un certificado suministrado por la gobernanza del espacio de datos, de forma que se garantice su integridad y el cumplimiento de los derechos de uso establecidos por el dueño de los datos.
-
Componentes para la intermediación
Permiten los servicios de intermediación antes mencionados, el bróker de metadatos, la tienda de aplicaciones, etc. De todos ellos, el más fundamental es el catálogo de recursos. Además de un listado con la oferta disponible, también es la herramienta que permite localizar al proveedor del recurso, las características del mismo y sus condiciones de uso.
-
Componentes para la gestión de identidad y el intercambio seguro de datos
Estos componentes permiten garantizar la identidad de los participantes y la seguridad de las transacciones. Por ello se suele exigir a los participantes la presentación de credenciales (por ejemplo, vía certificados X.509)
-
Componentes para la gestión del espacio de datos
Se trata de herramientas que permiten que el espacio de datos opere con normalidad, facilitando las operaciones diarias, la gestión de los participantes (alta, baja, revocación, suspensión), la supervisión de la actividad, etc.
¿Cómo interactúan todos estos elementos?
Todos estos roles y componentes interactúan entre sí. Primero, el proveedor de datos registra su oferta de datos en el catálogo, incluyendo metadatos relevantes, como las políticas de uso. El consumidor de datos busca en el catálogo los conjuntos de datos y aplicaciones de su interés. Una vez localizados, contacta con el proveedor, comunicándole cuáles son los recursos que quiere adquirir. En este proceso, puede producirse una negociación adicional de las condiciones. Una vez alcanzado el acuerdo, el consumidor puede descargar los datos.
La operación debe ser registrada tanto por el proveedor como por el consumidor.
Todos estos elementos (roles, componentes y procesos) permiten que el intercambio de datos se realice de manera segura y controlada, en un entorno gestionado de confianza. Con todo ello se busca que las empresas y organismos europeos puedan intercambiar informacion generando un mercado europeo de datos que de lugar a nuevos productos y servicios de valor, impulsando la economía europea.
Contenido elaborado por el equipo de datos.gob.es.
La Data Spaces Business Alliance (DSBA) nació en septiembre de 2021, fruto de la colaboración de cuatro grandes organizaciones con mucho que aportar a la economía del dato: la Big Data Value Association (BDVA), FIWARE, Gaia-X y la International Data Spaces Association (IDSA). Su objetivo: impulsar la adopción de espacios de datos en toda Europa aprovechando sinergias.
¿Cómo funciona la DSBA?
La DSBA reúne a diversos agentes para hacer realidad un futuro impulsado por los datos, donde las organizaciones públicas y privadas puedan compartirlos y así liberar todo su valor, garantizando la soberanía, interoperabilidad, seguridad y fiabilidad. Para alcanzar este objetivo, la DSBA ofrece apoyo a las organizaciones, así como herramientas, recursos y conocimientos especializados. Por ejemplo, se trabaja en el desarrollo de un framework común de bloques tecnológicos agnósticos reutilizables en diferentes dominios, con que asegurar la interoperabilidad de los diferentes espacios de datos.
Las cuatro organizaciones fundadoras, BDVA, FIWARE, Gaia-X e IDSA, cuentan con una serie de redes internacionales de "Hubs" nacionales o regionales, con más de 90 iniciativas distribuidas en 34 países. Estas iniciativas, pese a ser muy heterogéneas en foco, forma jurídica, nivel de madurez, etc., cuentan con puntos en común y con un gran potencial para colaborar, complementarse y crear impacto. Además, al operar a nivel local, regional y/o nacional, estas iniciativas proporcionan información periódica a las asociaciones europeas sobre las diferentes políticas, culturas y ecosistemas empresariales regionales dentro la UE.
Además, la postulación de la DSBA ha resultado ganadora a la convocatoria de la Comisión Europea para la creación de un Centro de Soporte, que promoverá y coordinará acciones relativas a los espacios de datos sectoriales. Este centro pondrá a disposición tecnologías, procesos, estándares y herramientas con que apoyar el despliegue de los espacios de datos comunes, permitiendo así la reutilización de datos entre sectores.
Los hubs de la DSBA
Cuando se habla de los hubs de la DSBA se hace referencia a la red global que combina las iniciativas ya existentes de BDVA, FIWARE, Gaia-X e IDSA, como recoge la siguiente figura.
Las principales características de cada uno de estos grupos son:
BDVA i-Spaces
Los i-Spaces de BDVA son incubadoras de datos y centros de innovación intersectoriales e interorganizativos, cuyo fin es acelerar la innovación basada en datos y la inteligencia artificial en los sectores público y privado. Ofrecen entornos seguros de experimentación, que reúnen todos los aspectos técnicos y no técnicos necesarios para que las organizaciones, especialmente las PYMEs, puedan probar, pilotar y explotar rápidamente sus servicios, productos y aplicaciones.
Los i-Spaces ofrecen acceso a fuentes de datos, herramientas para gestionarlos y tecnologías de inteligencia artificial, entre otros. Alojan datos cerrados y abiertos de fuentes empresariales y públicas, como recursos lingüísticos, datos geoespaciales, datos sanitarios, estadísticas económicas, datos de transporte, datos meteorológicos, etc. Los i-spaces cuentan con su propia infraestructura Big Data con potencia de procesamiento ad hoc, almacenamiento en línea y aceleradores de última generación, todas dentro de las fronteras europeas.
Para convertirse en un i-Space las organizaciones deben pasar por un proceso de evaluación, utilizando para ello un sistema de 5 categorías, que se clasifican de acuerdo a los niveles de oro, plata y bronce. Estos hubs deben renovar sus etiquetas cada dos años, y estas certificaciones les permiten unirse a una federación pan-europea para fomentar la innovación de datos transfronterizos, a través del proyecto EUHubs4Data.
FIWARE iHubs
FIWARE es una comunidad de software abierto promovida por la industria TIC, que -con el apoyo de la Comisión Europea- proporciona herramientas y conforma un ecosistema de innovación para que emprendedores creen nuevas aplicaciones y servicios Smart. Los iHubs de FIWARE son centros de innovación enfocados a la creación de comunidades y entornos de colaboración que impulsen el avance de las empresas digitales en esta área. Estos centros proporcionan a empresas privadas, administraciones públicas, instituciones académicas y desarrolladores, acceso a conocimiento y una red mundial de proveedores e integradores de esta tecnología, que además ha sido avalada por organismos de normalización internacionales.
Existen 5 tipos de iHubs:
- iHub School: Entorno enfocado en el aprendizaje de FIWARE, desde una perspectiva empresarial y técnica, aprovechando casos de uso prácticos.
- iHub Lab: Laboratorio donde ejecutar pruebas y pilotos, así como obtener certificaciones FIWARE.
- iHub Business Mentor: Espacio para aprender a construir un modelo de negocio viable a medida.
- iHub Community Creator: Punto físico de encuentro para la comunidad local donde reunir a todas las partes interesadas, que actúa como puerta de entrada al ecosistema local y global de FIWARE.
Gaia-X Hubs
Los Gaia-X Hubs son los puntos de contacto nacionales sobre la iniciativa Gaia-X. Hay que destacar que no son parte como tal de la Gaia-X AISBL (la asociación europea sin ánimo de lucro), sino que actúan como grupos de reflexión independientes, que cooperan con la asociación en el despliegue de proyectos, tareas de comunicación, y generación de requerimientos de negocios para la definición de la arquitectura de la iniciativa (ya que los hubs tienen cercanía con los proyectos industriales de cada país).
A través de ellos se desarrollan espacios de datos específicos en base a las necesidades nacionales, así como la identificación de oportunidades de financiación para implementar los servicios y tecnología de Gaia-X. También se busca que interactúen con otras regiones para construir espacios de datos transnacionales, facilitando el intercambio de información y que los casos de uso nacionales escalen internacionalmente. Para ello, la AISBL proporciona acceso a una plataforma de colaboración, así como apoyo a los respectivos hubs en la distribución y comunicación de los casos de uso.
IDSA Hubs
Los IDSA Hubs permiten intercambiar conocimiento en torno a la arquitectura de referencia (conocida como el IDS-RAM) a nivel país. Reuniendo a las organizaciones de investigación, de promoción de la innovación, sin ánimo de lucro, y a las empresas que utilizan los conceptos y normas de IDS en la región, buscan impulsar su adopción, y -por ende- fomentar una economía del dato soberana con mayor capilaridad.
Estos centros son impulsados en cada país por una universidad, una organización de investigación, o una entidad sin ánimo de lucro, que trabajan junto a IDSA para crear conciencia sobre la soberanía en torno a los datos, transferir conocimientos, reclutar nuevos miembros y difundir casos de uso en base al IDS-RAM. Para ello, desarrollan actividades que van desde sesiones formativas hasta reuniones con responsables de las diferentes administraciones públicas. También fomentan y coordinan proyectos de investigación y desarrollo con organizaciones y empresas internacionales, así como con gobiernos y otras entidades de carácter público.
Conclusión
Como decíamos al principio, existe un gran potencial de sinergias entre estos grupos, que deben explorarse, debatirse y articularse en acciones y proyectos concretos. Nos encontramos ante una prometedora oportunidad de aunar esfuerzos y seguir avanzando en el desarrollo y expansión de los espacios de datos, para generar un impacto notable en la Economía del Dato.
Para estimular el debate inicial, desde la Data Spaces Business Alliance han elaborado el documento “Data Spaces Business Alliance Hubs: potential for synergies and impact”, donde se profundiza en la coyuntura desarrollada anteriormente.