¿Cuáles son los principales elementos de un espacio de datos?

Fecha de la noticia: 20-10-2022

Portada del informe “Principios de diseño para los espacios de datos”

Para que un espacio de datos funcione correctamente, es necesario contar con actores suficientes para cubrir un conjunto de roles y una serie de componentes tecnológicos. Estos elementos permiten fijar un marco común de gobernanza para compartir los datos de manera segura, garantizando la soberanía de los participantes sobre sus propios datos. Este concepto, la soberanía de los datos, se puede definir como la capacidad del dueño de los datos para establecer las políticas de uso y acceso de los datos que va a intercambiar, y es el elemento nuclear de un espacios de datos.

En este sentido, el informe  “Principios de diseño para los espacios de datos” (abril 2021), financiado por la Unión Europea, ofrece los fundamentos que deben seguir los espacios de datos para actuar de acuerdo con los valores de la UE: descentralización, apertura, transparencia, soberanía e interoperabilidad. El informe fue elaborado por expertos de 25 compañías diferentes, por lo que da una visión consensuada con la industria.

A continuación se resumen algunas de las principales aportaciones del documento, tomando como referencia el artículo “Elementos de un espacio de datos” publicado en la revista Boletic, de la Asociación profesional de Cuerpos Superiores de Sistemas y Tecnologías de la Información. En dicho artículo, los elementos de un espacio de datos se dividen en dos categorías:

  • Roles y ámbitos de actuación
  • Componentes fundamentales

Roles

En un espacio de datos podemos encontrar diversos participantes, cada uno de ellos enfocados en un ámbito de actuación. Es lo que se conoce como roles:

Visual que muestra los roles involucrados en un espacio de datos, definidos a continuación.

  1. Proveedores y consumidores de datos

Son los participantes que proporcionan e interactúan con los datos. Dentro de esta categoría encontramos varios roles:

  • Productor de los datos: Genera los datos.
  • Dueño de los datos: Es el titular de los derechos de acceso y utilización de los datos.
  • Proveedor de datos: Capta los datos y los ofrece a través del catálogo del espacio de datos.
  • Consumidor de datos: Accede a los datos del catálogo.
  • Proveedor de aplicaciones: Proporciona aplicaciones que permiten trabajar con los datos ofreciendo valor añadido (por ejemplo, modelos de machine learning, visualizaciones, procesos de limpieza, etc.).
  1. Intermediarios

En este caso hablamos de terceros que ofrecen los servicios necesarios para la publicación, búsqueda de recursos y registro de transacciones. Algunos ejemplos de servicios que ofrecen los intermediarios son:

  • Vocabularios y ontologías, que permiten organizar, categorizar o etiquetar sistemáticamente la información, mejorando la interoperabilidad.
  • Tiendas de aplicaciones, donde figuran las herramientas ofrecidas por los proveedores de aplicaciones, garantizándose que han pasado un proceso de control de calidad.
  • Servicios de bróker de metadatos para la publicación de un catálogo de ofertas de recursos (datos y aplicaciones) con la máxima información posible.
  • Servicios de orquestación, que permiten automatizar diversas actividades.
  • Registros de transacciones (clearing house), que permiten mantener el control de las operaciones realizadas.
  1. Proveedores tecnológicos

Proporcionan componentes para que el espacio de datos opere correctamente, convirtiéndose en un entorno seguro y de confianza. Ejemplos de estos componentes son el conector -un elemento fundamental que veremos a continuación-, los sistemas de gestión de usuarios o los sistemas de supervisión.

No entrarían en esta categoría los servicios de intermediación ni las aplicaciones.

  1. Operadores del espacio de datos

Centrados en la gestión del espacio, realizan tareas como la tramitación de peticiones o incidencias, control de cambios, mantenimiento software, etc. Entre otras cuestiones, certifican a los participantes, ejercen la gobernanza del espacio de datos y definen el roadmap de funcionalidades.

Todos estos roles no son exclusivos, y un mismo usuario puede adoptar varios de ellos.

Componentes de un espacio de datos

Existen diferentes aproximaciones sobre los componentes que debe tener un espacio de datos. Se puede acudir a Gaia-X y/o tomar como referencia el modelo de arquitectura IDS-RAM (Reference Architecture model), caracterizado por presentar una arquitectura abierta, confiable y federada para un intercambio de datos intersectorial.

En todo caso, para que la actividad se desarrolle de una manera segura y controlada, son necesarios, al menos, los siguientes bloques:

  1. Componentes para el acceso al espacio de datos: conector

Uno de los principales elementos de los espacios de datos es el conector, mediante el cual los participantes acceden al espacio de datos y a los propios datos. Es el encargado de tratar los datos según las políticas de uso definidas por el dueño de los derechos de acceso y utilización, garantizando su soberanía. Para evitar su manipulación maliciosa, los conectores pueden ir firmados mediante un certificado suministrado por la gobernanza del espacio de datos, de forma que se garantice su integridad y  el cumplimiento de los derechos de uso establecidos por el dueño de los datos.

  1. Componentes para la intermediación

Permiten los servicios de intermediación antes mencionados, el bróker de metadatos, la tienda de aplicaciones, etc. De todos ellos, el más fundamental es el catálogo de recursos. Además de un listado con la oferta disponible, también es la herramienta que permite localizar al proveedor del recurso, las características del mismo y sus condiciones de uso.

  1. Componentes para la gestión de identidad y el intercambio seguro de datos

Estos componentes permiten garantizar la identidad de los participantes y la seguridad de las transacciones. Por ello se suele exigir a los participantes la presentación de credenciales (por ejemplo, vía certificados X.509)

  1. Componentes para la gestión del espacio de datos

Se trata de herramientas que permiten que el espacio de datos opere con normalidad, facilitando las operaciones diarias, la gestión de los participantes (alta, baja, revocación, suspensión), la supervisión de la actividad, etc.

¿Cómo interactúan todos estos elementos?

Todos estos roles y componentes interactúan entre sí. Primero, el proveedor de datos registra su oferta de datos en el catálogo, incluyendo metadatos relevantes, como las políticas de uso. El consumidor de datos busca en el catálogo los conjuntos de datos y aplicaciones de su interés. Una vez localizados, contacta con el proveedor, comunicándole cuáles son los recursos que quiere adquirir. En este proceso, puede producirse una negociación adicional de las condiciones. Una vez alcanzado el acuerdo, el consumidor puede descargar los datos.

La operación debe ser registrada tanto por el proveedor como por el consumidor.

Gráfica que muestra el escenario de intercambio de datos en un espacio de datos, descrito anteriormente..

Todos estos elementos (roles, componentes y procesos) permiten que el intercambio de datos se realice de manera segura y controlada, en un entorno gestionado de confianza. Con todo ello se busca que las empresas y organismos europeos puedan intercambiar informacion generando un mercado europeo de datos que de lugar a nuevos productos y servicios de valor, impulsando la economía europea.


Contenido elaborado por el equipo de datos.gob.es.