Blog

El dato se ha convertido en el gran poder transformador de la sociedad. Más allá de la visión más mercantilista, su capacidad para generar conocimiento, impulsar la innovación y empoderar a los individuos y las comunidades es innegable. De hecho, constituye un recurso con el que abordar, desde una perspectiva innovadora, los grandes desafíos ambientales, sociales y de salud, permitiendo la colaboración entre actores, impulsando la innovación y mejorando la necesaria rendición de cuentas.

Siguiendo directrices europeas como la Estrategia Europea de los Datos, el reto actual es fomentar la circulación de los datos en beneficio de todos, poniendo en común los datos en sectores clave con la creación de espacios de datos comunes e interoperables. Un espacio de datos es un ecosistema donde se materializa la compartición voluntaria de los datos de sus participantes dentro de un entorno de soberanía, confianza y seguridad, establecido mediante mecanismos integrados de gobernanza, organizativos, normativos y técnicos. Los espacios de datos son pieza clave para el desarrollo de la economía del dato, al habilitar su acceso, intercambio y reutilización legítima, posicionando al dato como recurso no rival, cuya utilidad crece a medida que su uso se generaliza, en un claro ejemplo de efecto red.

¿En qué consisten las Acciones de Apoyo Coordinado (CSA)?

Con el fin de impulsar el desarrollo de los espacios de datos, el Programa Digital Europeo (DIGITAL) de la Comisión Europea financia una serie de Acciones de Apoyo Coordinado (CSA por sus siglas en inglés) para impulsar su desarrollo. La mayoría de estas acciones cuentan con una financiación de alrededor de un millón de euros por proyecto y una duración aproximada de un año, con fecha prevista de finalización en el cuarto trimestre de 2023. Sus resultados deben contribuir a los objetivos del programa DIGITAL, que tiene como finalidad reducir la brecha entre la investigación y el despliegue de las tecnologías digitales, y facilitar la transferencia al mercado de los resultados de la investigación, en beneficio de los ciudadanos y las empresas europeas, especialmente las pequeñas y medianas.

Cada acción concreta se centra en un determinado sector de la actividad económica buscando, a partir de un mapeo del panorama de datos de cada sector en cuestión, ponerse en contacto con las partes interesadas pertinentes, conectándolas, buscando desarrollar de forma colaborativa una hoja de ruta estratégica compartida. Esta hoja de ruta compartida tiene como objetivo final acabar construyendo en fases posteriores los correspondientes espacios de datos sectoriales. Durante el proceso se definen objetivos claros y resultados clave para inspirar, apoyar y motivar a todas las partes interesadas a contribuir y utilizar datos sectoriales de alta calidad como base para la innovación y la generación de valor.

Para llevar a cabo esta hoja de ruta, se ha elaborado un inventario exhaustivo de las plataformas existentes que ya comparten datos relevantes. Asimismo, cada proyecto CSA se ha enfocado, mediante diferentes grupos de trabajo y talleres con las partes interesadas, en desarrollar recomendaciones sobre modelos de gobernanza de los espacios de datos y modelos de negocio digitales para su sector. El objetivo es identificar los factores clave de éxito y esbozar cómo un espacio de datos puede crear valor y beneficios no solo para el sector en cuestión sino también para otros sectores con los que esté interrelacionado. Además, en los diferentes proyectos se realizan planes para abordar los desafíos técnicos y organizativos que impulsen el uso de estándares de interoperabilidad en estrecha colaboración con el Centro de Apoyo a los Espacios de Datos (DSSC) en el afán de alinearse con el Marco Tecnológico Europeo de Espacios de Datos.

¿Dónde puedo encontrar información actualizada sobre las CSA?

Se puede encontrar Información concreta sobre el estado de situación de las diferentes acciones de coordinación y soporte en sus sitios web a través de los siguientes enlaces:

DATES (Turismo)
Tourism Data Space (Turismo)
DS4SKills (Habilidades)

PrepDSpace4Mobility (Movilidad)

AgriDataSpace (Agroalimentario)

Great (Medioambiental)

DataSp4ce (Industrial)

DS4SSCC (Ciudades Inteligentes)



El resultado de estas acciones de soporte coordinado proporcionará la información y las bases para la correcta ejecución de los proyectos de desarrollo e implementación (“deployments”) de los espacios comunes europeos de datos, que se apoyarán en diferentes programas europeos. Así, se catalizará la creación de un mercado único de datos, basado en datos confiables y de calidad, que permitirá la digitalización de las cadenas de valor de las industrias. Además, su efectivo desarrollo, apoyará los objetivos de la Unión Europea de lograr una transición ecológica y una transformación digital, y de reforzar su resiliencia y su autonomía estratégica.

calendar icon
Noticia

Bajo la Presidencia española del Consejo de la Unión Europea, el Gobierno de España ha liderado la cumbre Gaia-X Summit 2023 que se ha celebrado en Alicante durante los días 9 y 10 de noviembre. El evento tenía como objetivo repasar los últimos avances de Gaia-X en la promoción de la soberanía de datos en Europa. Tal y como presentamos en datos.gob.es, Gaia-X es una iniciativa europea del sector privado para la creación de una infraestructura de datos que sea federada, abierta, interoperable y reversible, y que sirve por tanto fomenta la soberanía digital y la disponibilidad de los datos.

La cumbre ha servido también ha servido como espacio para el intercambio de ideas entre las voces líderes de la comunidad europea de espacios de datos, y ha culminado con la presentación de un comunicado para impulsar la autonomía estratégica en la nube, los datos y la inteligencia artificial, elemento considerado crítico para la competitividad de la UE. El documento, fomentado por la Secretaría de Estado de Digitalización e Inteligencia Artificial, constituye un llamamiento conjunto para una respuesta “más coherente y coordinada” en el desarrollo de programas y proyectos, tanto europeos como a nivel de estados miembro, relacionados con los datos y las tecnologías del sector.

Para ello, el comunicado aboga por la interoperabilidad respaldada por una infraestructura sólida de servicios en la nube y por el desarrollo de una inteligencia artificial basada en datos de alta calidad, con una gobernanza sólida que cumpla con los marcos normativos europeos. En concreto, se resaltan las posibilidades que ofrecen las redes neuronales profundas (Deep Neural Networks), cuyo éxito recae en tres factores principales: algoritmos, capacidad de cálculo y acceso a grandes cantidades de datos. En este sentido, el documento resalta la necesidad de apostar por este último factor, impulsando un paradigma de red neuronal basado en datos de alta calidad, bien parametrizados y en infraestructuras compartidas, que no sólo ahorren un tiempo valioso a los investigadores, sino que también eviten la degradación medioambiental, dado que limita las necesidades de cómputo de estos sistemas al trabajar más allá del paradigma de fuerza bruta.

Por este motivo, otro de los aspectos abordados por el documento es la dinamización del acceso a fuentes de datos de diferentes dominios complementarios. Eso permitiría una economía de datos “flexible, dinámica y altamente escalable” que sirva para optimizar procesos, innovar y/o crear nuevos modelos de negocio.

El llamamiento se muestra optimista con la iniciativas y programas europeos existentes, empezando por el propio proyecto de Gaia-X. También se resaltan otros proyectos como son el IPCEI-CISproyecto Simpl europeo. Asimismo, subraya la necesidad de “una coordinación más amplia y efectiva para impulsar proyectos industriales, avanzar en la estandarización de etiquetas de nube y datos confiables, lo que sirve para garantizar unos niveles altos de ciberseguridad, protección de datos, transparencia algorítmica y portabilidad”.

El comunicado destaca la importancia de lograr un mercado único de datos que incluya procesos de intercambios de datos bajo un marco común de gobernanza. Así, valora el novedoso conjunto de legislación digital y de datos, como la ley de datos (Data Act), entre cuyos objetivos se encuentra el impulso de la disponibilidad de datos en el conjunto de la Unión. El comunicado está abierto a la adhesión de nuevos miembros que busquen avanzar en el fomento de una economía del dato flexible, dinámica y altamente escalable.

calendar icon
Documentación

En la era de los datos, nos enfrentamos al desafío de la escasez de datos de valor para la construcción de nuevos productos y servicios digitales. Aunque vivimos en una época en la que los datos están por todas partes, a menudo nos encontramos con dificultades para acceder a datos de calidad que nos permitan comprender procesos o sistemas desde una perspectiva basada en datos. La falta de disponibilidad, la fragmentación, la seguridad y la privacidad son solo algunas de las razones que dificultan el acceso a datos reales.

Sin embargo, los datos sintéticos han surgido como una solución prometedora a este problema. Los datos sintéticos son información fabricada artificialmente que imita las características y distribuciones de los datos reales, sin contener información personal o sensible. Estos datos se generan mediante algoritmos y técnicas que preservan la estructura y las propiedades estadísticas de los datos originales.

Los datos sintéticos son útiles en diversas situaciones donde la disponibilidad de datos reales es limitada o se requiere proteger la privacidad de las personas involucradas. Tienen aplicaciones en la investigación científica, pruebas de software y sistemas, y entrenamiento de modelos de inteligencia artificial. Permiten a los investigadores explorar nuevos enfoques sin acceder a datos sensibles, a los desarrolladores probar aplicaciones sin exponer datos reales y a los expertos en IA entrenar modelos sin la necesidad de recopilar todos los datos del mundo real que en ocasiones son, simplemente, imposibles de capturar en tiempos y costes asumibles.

Existen diferentes métodos para generar datos sintéticos, como el remuestreo, el modelado probabilístico y generativo, y los métodos de perturbación y enmascaramiento. Cada método tiene sus ventajas y desafíos, pero en general, los datos sintéticos ofrecen una alternativa segura y confiable para el análisis, la experimentación y el entrenamiento de modelos de inteligencia artificial.

Es importante destacar que el uso de datos sintéticos ofrece una solución viable para superar las limitaciones de acceso a datos reales y abordar preocupaciones de privacidad y seguridad. Los datos sintéticos permiten realizar pruebas, entrenar algoritmos y desarrollar aplicaciones sin exponer información confidencial. Sin embargo, es fundamental garantizar la calidad y la fidelidad de los datos sintéticos mediante evaluaciones rigurosas y comparaciones con los datos reales.

En este informe, abordamos de forma introductoria la disciplina de los datos sintéticos, ilustrando algunos casos de uso de valor para los diferentes tipos de datos sintéticos que se pueden generar. Los vehículos autónomos, la secuenciación de ADN o los controles de calidad en las cadenas de producción son solo algunos de los casos que detallamos en este informe. Además, hemos destacado el uso del software open-source SDV (Synthetic Data Vault), desarrollado en el entorno académico del MIT, que utiliza algoritmos de aprendizaje automático para crear datos sintéticos tabulares que imitan las propiedades y distribuciones de los datos reales. Desarrollamos un ejemplo práctico, en un entorno de Google Colab para generar datos sintéticos sobre clientes ficticios alojados en un hotel ficticio. Hemos seguido un flujo de trabajo que involucra la preparación de datos reales y metadatos, el entrenamiento del sintetizador y la generación de datos sintéticos basados en los patrones aprendidos. Además, hemos aplicado técnicas de anonimización para proteger los datos sensibles y hemos evaluado la calidad de los datos sintéticos generados.

En resumen, los datos sintéticos son una herramienta poderosa en la era de los datos, ya que nos permiten superar la escasez y la falta de disponibilidad de datos de valor. Con su capacidad para imitar los datos reales sin comprometer la privacidad, los datos sintéticos tienen el potencial de transformar la forma en que desarrollamos proyectos de inteligencia artificial y análisis. A medida que avanzamos en esta nueva era, es probable que los datos sintéticos desempeñen un papel cada vez más importante en la generación de nuevos productos y servicios digitales.

Si quieres saber más sobre el contenido de este informe, puedes ver la entrevista a su autor.

 

En esta infografía se resume el concepto y sus principales aplicaciones:

Puedes descargarla en PDF aquí

 

 

A continuación, puedes descargar el informe completo, el resumen ejecutivo y una presentación-resumen.

calendar icon
Blog

Vivimos en un entorno en constante evolución en el que los datos crecen de manera exponencial y son, además, un componente fundamental de la economía digital. En este contexto, es necesario desbloquear su potencial para maximizar su valor mediante la creación de oportunidades para su reutilización. Sin embargo, es importante tener en cuenta que ese incremento en velocidad, escala y variedad de los datos supone que asegurar su calidad sea más complicado.

En este escenario surge la necesidad de establecer procesos comunes aplicables a los activos de datos de toda organización a lo largo de su ciclo de vida. Todo tipo de instituciones deben disponer de datos bien gobernados, gestionados y con niveles adecuados de calidad, siendo necesaria una metodología de evaluación común que pueda ayudar a una mejora continua de dichos procesos y permita evaluar la madurez de una organización de forma estandarizada.

La Oficina del Dato ha patrocinado, promovido y participado en la generación de las especificaciones UNE, unos recursos normativos que permiten implantar procesos comunes en la gestión del dato y que además proporcionan un marco de referencia para establecer una cultura de datos organizacional.

Por una parte, encontramos las especificaciones UNE 0077:2023 Gobierno del datoUNE 0078:2023 Gestión del dato y UNE 0079:2023 Gestión de la calidad del dato, que están concebidas para ser aplicadas de forma conjunta, habilitando un marco de referencia sólido que fomente la adopción de prácticas sostenibles y efectivas alrededor del dato.

Además, es necesaria una metodología de evaluación común que permita una mejora continua de los procesos de gobierno, gestión y gestión de la calidad del dato, así como la medición de la madurez de las organizaciones de forma estandarizada. Para el desarrollo de un marco homogéneo de evaluación del tratamiento que una organización hace de los datos se ha desarrollado la especificación UNE 0080.

Con el objetivo de ofrecer un proceso basado en estándares internacionales que ayude a las organizaciones a utilizar un modelo de calidad y a definir características y métricas de calidad adecuadas, se ha generado la especificación UNE 0081 Evaluación de la calidad del dato que complementa la UNE 0079 Gestión de la calidad del dato.

La siguiente infografía resumen cuáles son las claves de las Especificaciones UNE sobre el dato y las principales ventajas de su aplicación (haz clic en la imagen para acceder a la infografía).

Descarga la infografía

También está disponible un vídeo explicativo sobre las Especificaciones UNE sobre datos

calendar icon
Noticia

El pasado 11 de septiembre se celebró un webinar en el que se llevó a cabo un repaso sobre Gaia-X, desde sus fundamentos, encarnados por su arquitectura y modelo de confianza denominado Trust Framework, pasando por los Servicios de Federación con los que se trata de facilitar y agilizar el acceso a la infraestructura, hasta el catálogo de servicios que unos usuarios (proveedores) podrán poner a disposición de otros (consumidores).  

El webinar dirigido por la gerente del Hub español de Gaia-X, estuvo protagonizado por dos de los expertos de la Oficina del Dato, que a través de sus ponencias guiaron a la audiencia hacia un mayor conocimiento de los que es la iniciativa Gaia-X. Al final de la sesión. se contó con una dinámica de preguntas y respuestas en la que se pudo profundizar en detalle. Se puede acceder a la grabación de este seminario desde la página oficial del Hub: [Forjando el Futuro de los Espacios de Datos Federados en Europa | Gaia-X (gaiax.es)

 

Gaia-X como pieza clave para forjar los Espacios de Datos europeos 

Gaia-X surge como un innovador paradigma con el que facilitar la integración de los recursos informáticos. En base a modelos tecnológicos de la Web 3.0, se habilita la identificación y trazabilidad de diferentes recursos de datos, desde conjuntos de datos, algoritmos, diferentes modelos semánticos o de otra índole conceptual, a incluso infraestructura tecnológica subyacente (recursos de nube). Esto sirve para visibilizar el origen y el funcionamiento de estas entidades, lo que permite facilitar la transparencia y el cumplimiento de normativas y los valores europeos. 

Más concretamente, Gaia-X proporciona diferentes servicios encargados de verificar automáticamente el cumplimiento de unas reglas mínimas de interoperabilidad, lo que permite después definir reglas más abstractas con un foco de negocio, o incluso como base para definir e instanciar la Nube Confiable y los espacios soberanos de datos. Estos servicios se operacionalizarán mediante diferentes nodos de interoperabilidad de Gaia-X, o Gaia-X Digital Clearing Houses. 

Con Gaia-X como herramienta podremos publicar, encontrar y explotar un catálogo de servicios que cubrirá diferentes servicios según los requerimientos del usuario. Por ejemplo, para infraestructura cloud estos pueden ser características como la residencia en territorio europeo o el cumplimiento de normativas UE (como el eIDAS o el RGPD, o las normas de intermediación de datos presentes en el Reglamento de Gobernanza de Datos), y también crear servicios combinables, agregando piezas de diferentes proveedores (algo complejo en estos momentos). También se encontrarán conjuntos de datos específicos con los que entrenar modelos de Inteligencia Artificial, y sobre los cuales su propietario tendrá control gracias a la trazabilidad habilitada, hasta la ejecución de algoritmos y apps sobre datos propios del consumidor, de forma que se preserve en todo momento la privacidad de los mismos. 

Como vemos, esta novedosa capacidad de trazabilidad, basada en tecnologías punteras, sirve como acicate del Compliance, y por ello es una pieza fundamental en el despliegue de los espacios de datos interoperables a nivel europeo y el mercado único digital. 

 

 

calendar icon
Blog

Motivación

Hoy en día, en un entorno en constante cambio y en el que la generación de datos está creciendo de forma exponencial, es necesario establecer procesos comunes a lo largo del ciclo de vida de los activos de datos de toda organización. Disponer de datos bien gobernados, gestionados y con niveles adecuados de calidad se convierte en una necesidad para todo tipo de instituciones, siendo necesaria una metodología de evaluación común que pueda ayudar a una mejora continua de dichos procesos y permita evaluar la madurez de una organización de forma estandarizada.

El desarrollo de un marco homogéneo de evaluación de la madurez para una organización, con relación al tratamiento que hace de los datos, brinda la oportunidad de analizar detalladamente los procedimientos internos que realiza, identificando debilidades asociadas a esos procedimientos y permitiendo establecer planes de acción para su optimización y mejora. Al fortalecer estos procesos internos se garantiza una mayor confiabilidad y calidad de los datos, lo que también redunda en una mayor y más fácil participación en los nuevos mercados de datos, habilitando estos la comercialización y compartición de datos con soberanía, confianza y seguridad. Este innovador paradigma favorece la colaboración entre organizaciones, aprovechando sus sinergias, y generando además un desarrollo de entornos empresariales más eficientes y de mayor innovación.

El mencionado proceso de evaluación se podrá llevar a cabo de forma estandarizada gracias al desarrollo y publicación de la nueva especificación UNE 0080, y debe considerarse como un proceso de mejora continua. A lo largo de ese camino, entidades reconocidas e independientes podrán emitir certificaciones que validen que una organización cumple con ciertos estándares y requisitos establecidos, de tal forma que una organización pueda demostrar su compromiso y excelencia con los estándares, lo cual servirá para lograr un buen posicionamiento en el competitivo mercado de la economía del dato.

Especificaciones UNE – Guía de Evaluación del Gobierno, Gestión y Gestión de la Calidad del Dato

La Oficina del Dato ha patrocinado, promovido y participado en la generación de la especificación nacional UNE 0080:2023, con la que dar respuesta a la necesidad de contar con una guía de evaluación de procesos basada en estándares internacionales, con la que organizaciones tanto públicas como privadas, puedan evaluar de forma sistemática el estado actual o grado de consecución de sus procesos de trabajo en materia de gobierno, gestión y gestión de calidad del dato en base a la definición dada para esos procesos en las especificaciones UNE de Gobierno del dato UNE 0077:2023Gestión del dato UNE 0078:2023, y Gestión de la calidad del dato UNE 0079:2023. Esta nueva especificación se encuentra dirigida a los responsables de implantar y supervisar los procesos de gobierno, gestión y calidad del dato en sus respectivas organizaciones, de tal forma que aseguren su buen funcionamiento o, en caso de que sea necesario, sean capaz de mejorarlos, así como a los consultores y auditores que necesiten llevar a cabo una evaluación de dichos procesos.

El modelo de evaluación de los procesos desarrollado en la guía está basado en la familia de normas internacionales ISO/IEC 33000, mientras que el modelo de madurez de la organización asociado a esa evaluación de los procesos está basado en el Modelo Alarcos de Madurez de Datos (MAMD) según las normas ISO 8000.

En la siguiente figura se pueden ver los 22 procesos definidos en las especificaciones UNE (0077, 0078 y 0079) distribuidos por los diferentes niveles de madurez organizacional con los que están relacionados. Es importante matizar que en esta figura no se muestran los niveles de capacidad de cada proceso, los cuales se desarrollan a continuación.

Niveles de madurez de una organización y procesos requeridos por nivel

Figura 1: Niveles de madurez de una organización y procesos requeridos por nivel

Modelo de Evaluación de procesos

El modelo de evaluación de procesos establece que cada uno de los 22 procesos definidos en las diferentes especificaciones (5 de Gobierno, 13 de gestión y 4 de gestión de la calidad) tienen distintos niveles de capacidad o grados de mejora, siendo el nivel 0 el más básico (no implementado) y el nivel 5 el más avanzado (innovado).

Niveles de capacidad de un proceso

Figura 2: Niveles de capacidad de un proceso

Cada nivel de capacidad de un proceso lleva asociados unos atributos de proceso (o requisitos) que es necesario cumplir para alcanzar dicho nivel de capacidad, siendo necesario no sólo cumplir los atributos de proceso del nivel a alcanzar, sino también los relativos a niveles inferiores. Los atributos de proceso por nivel de capacidad son los siguientes:

Atributos de proceso por nivel de capacidad

Figura 3: Atributos de proceso por nivel de capacidad

En la guía de evaluación se detallan exactamente qué requisitos son necesarios satisfacer para dar por cumplido cada atributo de proceso, así como sus métricas de evaluación para concluir si un atributo de proceso está No implementado (N), Parcialmente implementado (P), Ampliamente implementado (A) o Totalmente implementado (T). Por tanto, si por ejemplo queremos afirmar que un determinado proceso de nuestra organización está a un nivel de capacidad “Nivel 2 - Proceso Gestionado”, los atributos del proceso relativos al nivel 1 deben de estar Totalmente implementados (T) y los relativos al nivel 2 al menos Ampliamente implementados (A) o Totalmente implementados (T).

Modelo de Evaluación de madurez de la organización

La guía propone que para determinar el nivel de madurez de la organización en conjunto, será necesario no sólo que ésta realice los procesos propios de cada nivel, tal y como se muestra en la figura anterior, sino que estos también alcancen el nivel de capacidad acorde al nivel de madurez contra el que se evalúa.

Pongamos un ejemplo: si una organización quiere evaluar y acreditar que cumple con el nivel 2 de madurez organizacional “Gestionado”, necesita realizar al menos todos los procesos relativos al nivel de madurez 1 (2 procesos) y al nivel 2 (7 procesos), y que estos además estén desarrollados a un nivel de capacidad mínimo de grado 2 (proceso gestionado) mediante la certificación de sus respectivos atributos de proceso (‘totalmente implementado’ los atributos de procesos del nivel de capacidad 1 y ‘ampliamente implementados’ o ‘totalmente implementados’ los atributos de procesos relativos al nivel 2). Así, tal y como se muestra en la Figura 4 resumen de la evaluación de madurez organizacional, puede observarse como todos los procesos relativos al nivel gestionado han sido evaluados en cuanto a su capacidad como implementados al menos ampliamente.

Ejemplo de cumplimiento de un nivel 2 en madurez organizacional.

Figura 4: Ejemplo de cumplimiento de un nivel 2 en madurez organizacional.

En resumen, gracias al desarrollo de esta especificación o guía, las organizaciones van a disponer de una herramienta estandarizada para ser capaces de autoevaluar sus procesos en torno al gobierno del dato, gestión del dato, y gestión de la calidad del dato. Además, resulta también posible que puedan ser evaluadas por entidades externas certificadoras en última instancia, que acrediten no sólo la madurez organizacional, sino también una calidad del dato mínima, para escenarios en que éste vaya a ser compartido con otros participantes del ecosistema. 

El contenido de esta guía, así como del resto de especificaciones UNE mencionadas, puede visualizarse de forma libre y gratuita desde el portal de AENOR a través del enlace que figura a continuación accediendo al apartado de compra y marcando “lectura” en el desplegable en el que aparece preseleccionado “pdf”El acceso a esta familia de especificaciones UNE del dato está patrocinado por la Secretaría de Estado de Digitalización e Inteligencia Artificial, Dirección General del Dato. Aunque la visualización requiere registro previo, se aplica un descuento del 100% sobre el total del precio que se aplica en el momento de finalizar la compra. Tras finalizar la compra se podrá acceder a la norma o normas seleccionadas desde el área de cliente en el apartado mis productos.

En el siguiente vídeo se presenta un resumen de las mencionadas guías. 

calendar icon
Blog

La Oficina del Dato elabora dos guías de ayuda para la concepción eficaz de espacios de datos

El concepto de espacio de datos, entendido como un ecosistema de compartición voluntaria de datos en un entorno de confianza, seguridad y soberanía, se va a desplegar con todo su potencial a lo largo de los próximos años, como apuesta clave de la Unión Europea para impulsar la economía del dato y preservar su soberanía digital. Dichos espacios se construyen alrededor de casos de uso concretos de compartición y explotación de datos donde satisfacer necesidades de negocio concretas, un proceso para el que no resulta sencillo descubrir dichas necesidades, ni su óptimo diseño, al estar presentes diversas consideraciones y áreas de conocimiento.

Para rebajar las barreras de entrada ligadas a su concepción, la Oficina del Dato, dependiente de la Secretaría de Estado de Digitalización e Inteligencia Artificial, ejerciendo su función de dinamizar el gobierno, gestión, compartición y el uso de datos, ha publicado sendas guías que facilitarán la puesta en marcha de casos de uso de compartición de datos: la Guía de evaluación de viabilidad de casos de uso y la Guía de diseño de casos de uso.

Ambos documentos tienen como objetivo ayudar a los potenciales creadores de espacios de datos a superar los desafíos propios de la puesta en marcha de un caso de uso de compartición de datos. En este sentido, las guías orientan paso a paso y en las sucesivas etapas del proceso, proporcionando plantillas con preguntas concretas a las diferentes situaciones que se irán presentando en su diseño. El uso de estas guías debe entenderse de forma iterativa, permitiendo un proceso de refinamiento; así, una vez establecida la viabilidad de un determinado escenario, se abordará su diseño detallado, en un proceso en el que la propia dinámica puede llevar a provocar un replanteamiento de la etapa original de viabilidad. De igual forma, las preguntas presentes en cada paso pueden provocar matizaciones en los pasos anteriores, permitiendo en todo momento una progresiva mejora.

Las guías tienen como origen el contenido de los trabajos realizados desde la iniciativa Data Sharing Coalition. Trabajos en los que, compartiendo experiencia y conocimiento, las organizaciones abordaron el desafío que supuso iniciar el camino de crear en la práctica casos de uso de compartición y explotación de datos. Tomando como base esta referencia, las guías que aquí presentamos han ido evolucionando y han sido particularizadas para el contexto español, siendo enriquecidas igualmente con las aportaciones de los participantes a los eventos de dinamización de espacios de datos organizados por la Oficina del Dato.

Guía de evaluación de viabilidad de casos de uso

La Guía de evaluación de viabilidad de casos de uso permite generar, describir y evaluar ideas de casos de uso escalables de compartición de datos. Con el objetivo final de tomar una decisión acerca de la viabilidad del escenario propuesto, la guía plantea una metodología estructurada a lo largo de cinco pasos: generación del caso de uso, definición de su alcance, evaluación del potencial, estudio de la complejidad de la interacción y toma de decisión final de viabilidad.

Guía de diseño de casos de uso

Una vez abordada la viabilidad del escenario planteado, y si ésta se estimase afirmativa, la Guía de diseño de casos de uso ofrece el soporte necesario para su puesta en marcha. En este punto, se incide tanto en su escalabilidad como en la reutilización de los datos más allá del ámbito inicial. A la hora de diseñar de forma óptima un caso de uso de intercambio y explotación de datos, creemos que las cuestiones de implementación técnica representan tan sólo uno de los factores a tomar en cuenta, resaltando también la criticidad de consideraciones tales como su gobernanza, el modelo de negocio, la experiencia de usuario y los diversos aspectos regulatorios sobre los que se articula y opera.

La Guía, a lo largo de diferentes etapas, aborda la definición detallada del caso de uso, fijando el objetivo y alcance, identificando las funcionalidades que permiten habilitar la compartición de datos, y detallando qué habilitadores permiten el desarrollo de dichas funcionalidades. Gracias al enfoque práctico de la guía, en ella se incluyen útiles plantillas de preguntas-clave que permiten descubrir fácilmente los diversos aspectos a considerar, abordando temas como los principios rectores del caso de uso, el modelo de iteración, los componentes funcionales, las reglas y regulaciones, los contratos, la privacidad, la gestión de la información y los riesgos, las herramientas de apoyo, o incluso los acuerdos de nivel de servicio o la planificación del proyecto.

Los documentos base de ambas guías, las plantillas de preguntas en formato de hoja de cálculo para facilitar su cumplimentación, así como un ejemplo relativo a la viabilidad del proyecto “Caminos de pasión” facilitado por la Fundación Santa María la Real, se encuentran disponibles a través de los siguientes enlaces.

calendar icon
Noticia

El pasado 13 de marzo se celebró una jornada del Grupo de Trabajo de Movilidad del Hub Gaia-X España, donde se abordaron los principales retos del sector en lo referente a proyectos sobre la compartición y explotación de datos. La sesión, que se desarrolló en la Escuela Técnica Superior de Ingenieros de Caminos, Canales y Puertos de la Universidad Politécnica de Madrid, permitió a los asistentes conocer de primera mano los principales retos del sector, así como algunos de los proyectos de datos punteros de la industria de la movilidad. El evento fue también un punto de encuentro en el que se compartieron ideas y reflexiones entre los actores clave del sector.

La jornada comenzó con la presentación del Ministerio de Transportes, Movilidad y Agenda Urbana, intervención que  destacó la gran importancia del Punto de Acceso Nacional de Transporte Multimodal, un proyecto de ámbito europeo, que permite concentrar toda la información de la oferta de transporte de viajeros del país en un único punto nacional, con el objetivo de proporcionar los cimientos para impulsar el desarrollo de los servicios de movilidad del futuro.

A continuación, la Oficina del Dato de la Secretaría de Estado de Inteligencia Artificial (SEDIA) aportó la visión del modelo de desarrollo de Espacios de Datos y los principios de diseño de dichos espacios alineados con los valores europeos. Se destacó la importancia de las redes de negocio en base a ecosistemas de datos, el carácter intersectorial de la industria de la Movilidad y el importante papel de los datos abiertos en los espacios de datos del sector.

Seguidamente, se presentaron casos de uso por parte de Vicomtech, Amadeus, i2CAT y el Ayuntamiento de Alcobendas, que permitieron conocer de primera mano algunos ejemplos de uso de tecnología para proyectos de compartición de datos (tanto de espacios de datos como de data lakes, o lagos de datos).

Finalmente, se presentó un estudio inicial de la Fundación i2CAT, FACTUAL Consulting y EIT Urban Mobility sobre los componentes básicos de los futuros espacios de datos de movilidad en España. El estudio, que puede descargarse aquí en español, aborda el potencial de los espacios de datos de movilidad para el mercado español. Aunque se centra en España, recoge un enfoque sobre la investigación tanto nacional como internacional , enmarcado en el contexto europeo para establer estándares, el desarrollo de los componentes técnicos que habilitan los espacios de datos, los primeros proyectos faro y el abordaje de desafíos comunes para cumplir hitos en materia de movilidad sostenible en Europa.

Las presentaciones utilizadas en la sesión están disponibles en este enlace.

 

calendar icon
Noticia

Gaia-X representa un innovador paradigma con el que vincular más estrechamente los datos con la infraestructura tecnológica que hay por debajo, de forma que se garantice la transparencia, el origen y el funcionamiento de estos recursos. Este modelo nos permite desplegar una Economía del Dato soberana y transparente, que respete los derechos fundamentales europeos, y que en España tomará forma en torno a los espacios de datos sectoriales (C12.I1 y C14.I2 del Plan de Recuperación, Transformación y Resiliencia). Estos se alinearán con el marco regulatorio europeo, así como con una gobernanza e instrumentos pensados para asegurar la interoperabilidad, y sobre la que articular el buscado mercado único de datos.

En este sentido, los nodos de interoperabilidad de Gaia-X, o Gaia-X Digital Clearing House (GXDCH), tienen por objeto ofrecer servicios de validación automática de las reglas de interoperabilidad a promotores y participantes de espacios de datos. La creación de este tipo de nodos fue anunciada en la Gaia-X Summit 2022, el pasado mes de noviembre en París. La arquitectura Gaia-X, promovida por la asociación Gaia-X European Association for Data & Cloud AISBL, se ha consolidado como una prometedora alternativa tecnológica para la creación de ecosistemas abiertos y transparentes de conjuntos y servicios de datos.

Estos ecosistemas, por naturaleza federados, servirán para el desarrollo a escala de la citada Economía del Dato. Pero para ello, deben cumplirse una serie de reglas mínimas que aseguren la interoperabilidad entre participantes. La conformidad con dichas reglas es precisamente la función de la GXDCH, sirviendo como "ancla" para desplegar servicios de mercado certificados. Por tanto, la creación en España de un nodo de estas características supone un elemento crucial para el despliegue de los espacios federados de datos a nivel nacional, lo que estimulará el desarrollo y la innovación en torno al dato bajo un entorno de respeto a la soberanía del dato, la privacidad, transparencia y la justa competencia.

La GXDCH se define como un nodo en el que se prestan servicios operacionales de un ecosistema que cumpla con las reglas de interoperabilidad de Gaia-X. Como “servicios operacionales” se deben entender aquellos servicios que son necesarios para el funcionamiento de un espacio de datos, pero que no son en sí mismos servicios de compartición de datos, ni de aplicaciones de explotación de datos, ni de infraestructuras en la nube. Gaia-X define seis servicios operacionales, de los cuales al menos dos deben formar parte de los nodos obligatorios que alberguen las GXDCHs:

Servicios obligatorios

  • Gaia-X Registry: Definida como una base de datos inmutable, no repudiable y distribuida con capacidad de ejecutar código. Típicamente sería una infraestructura blockchain que soporta un servicio de identidad descentralizada (‘Self Sovereign Identity’) en la que se almacenan, entre otras, la lista de autoridades emisoras de credenciales (Trust Anchors) u otros datos necesarios para el funcionamiento de la gestión de identidad en Gaia-X.
  • Servicio de conformidad de Gaia-X o Gaia-X Compliance Service pertenece a los denominados Gaia-X Federation Services y su función es verificar el cumplimiento de las reglas mínimas de interoperabilidad definidas por la asociación Gaia-X (por ejemplo, el Trust Framework)

Servicios opcionales

  • Servicio de edición de Self-Descriptions (SDs) o Wizard: Las SDs son credenciales verificables según el estándar definido por el W3C mediante las cuales se describen a sí mismos tanto los participantes de un ecosistema Gaia-X como los productos puestos a disposición por los proveedores. El servicio de conformidad antes mencionado consiste en validar que las SDs cumplen con las normas de interoperabilidad. El Wizard es un servicio de conveniencia para la creación de Self-Descriptions según esquemas predefinidos.
  • Catálogo: Servicio de almacenamiento de la oferta de servicios disponible en el ecosistema para su consulta.
  • e-Wallet: Para la gestión de credenciales verificables (SDs) por parte de los participantes en un sistema basado en identidades distribuidas.
  • Servicio de Notaría: Servicio de emisión de credenciales verificables firmadas por autoridades de acreditación (Trust Anchors).

En qué consiste el servicio de conformidad de Gaia-X (p.e. Compliance Service)

El servicio de conformidad de Gaia-X pertenece a los denominados Gaia-X Federation Services, y su función es verificar el cumplimiento de las reglas mínimas de interoperabilidad definidas por la asociación Gaia-X. Gaia-X denomina a estas reglas mínimas de interoperabilidad (Trust Framework). Se debe tener en cuenta que el establecimiento del Trust Framework es una de las contribuciones diferenciadoras del marco tecnológico de Gaia-X frente a otras soluciones de mercado. Pero el objetivo no se limita a establecer normas de interoperabilidad, sino que pretende crear un servicio que sea operable y, en la medida de lo posible, automatizado, que valide el cumplimiento del Trust Framework. Este servicio es el Gaia-X Compliance Service.

El elemento clave de estas reglas son las denominadas “Self-Descriptions” (SDs). Las SDs son credenciales verificables según la norma definida por el W3C mediante las cuales se describen a sí mismos tanto los participantes de un espacio de datos como los productos puestos a disposición por los proveedores. El servicio Gaia-X Compliance valida el cumplimiento del Trust Framework mediante un chequeo de las SDs desde los siguientes puntos de vista:

  • Formato y sintaxis de las SDs
  • Validación de los esquemas de las SDs (vocabulario y ontología)
  • Validación de la criptografía de las firmas de los emisores de las SDs
  • Consistencia de los atributos
  • Veracidad del valor de los atributos.

Una vez validadas las Self-Descriptions, el operador del servicio de conformidad emite una credencial verificable que da fe del cumplimiento de las normas de interoperabilidad, aportando confianza a los participantes del ecosistema. La Gaia-X AISBL proporciona el código necesario para implementar el Compliance Service y autoriza la prestación del servicio a entidades de confianza, pero no opera directamente el servicio por lo que requiere la existencia de socios que se encarguen de esta labor.

calendar icon
Blog

El Hub español de Gaia-X (Gaia-X Hub Spain), asociación sin ánimo de lucro cuyo objetivo es acelerar la capacidad europea en materia de compartición de datos y soberanía digital, busca que los diferentes sectores de la economía construyan una comunidad en torno al dato para, así, poder promover un entorno propicio para la creación de espacios de datos sectoriales. Enmarcado en la estrategia España Digital 2026 y con el Plan de Recuperación, Transformación y Resiliencia como hoja de ruta para la transformación digital de España, el objetivo del hub es potenciar el desarrollo de soluciones innovadoras basadas en datos e inteligencia artificial, a la par que contribuye a impulsar la competitividad de las empresas de nuestro país.

El hub se organiza a lo largo de diferentes grupos de trabajo, existiendo uno específico dedicado a analizar los restos y oportunidades de los espacios de datos de compartición y explotación de datos en el sector turístico. El turismo es uno de los sectores productivos clave en la economía española, llegando a alcanzar un volumen del 12,2% del PIB nacional.

El turismo, dado su ecosistema de participantes públicos y privados, de diferentes dimensiones y grado de madurez tecnológico, constituye un entorno óptimo donde contrastar las bondades de estos ecosistemas federados de datos. Gracias a ellos se facilita la extracción de valor de fuentes de datos no tradicionales, con una elevada escalabilidad, y garantizando en todo caso unas condiciones robustas de seguridad, privacidad y, por en ende, de soberanía del dato.

Así, y con la finalidad de producir la primera radiografía de dicho espacio de datos en España, desde la Oficina del dato, en colaboración con el Hub español de Gaia-X  se ha elaborado el informe ‘Radiografía del Espacio de Datos de Turismo en España’, un documento que busca resumir y resaltar en qué momento se encuentra actualmente el diseño de dicho espacio de datos, las diferentes oportunidades para el sector y cuáles son los principales retos que deben superarse para conseguir el despliegue del mismo, ofreciendo una hoja de ruta para su construcción y despliegue.

¿Por qué es necesario un espacio de datos de turismo?

Si algo quedó claro tras el estallido de la pandemia por COVID-19 es que el turismo es una actividad interdependiente de otras industrias por lo que, al pausarse esta, sectores como la movilidad, la logística, la salud, la agricultura, la automoción o la alimentación, entre otros, se vieron también afectados.

Situaciones como la anterior, evidencian las posibilidades que ofrece la compartición de datos entre sectores, ya que éstos pueden ayudar a mejorar la toma de decisiones. Sin embargo, conseguirlo en el ámbito turístico no es una tarea sencilla dado que desplegar un espacio de datos para este sector requiere del esfuerzo coordinado entre las distintas partes de la sociedad implicadas.

Por ello, el objetivo y el reto es crear "espacios" inteligentes capaces de aportar un contexto de seguridad y confianza que favorezca el intercambio y la combinación de datos. De este modo y a partir de la generación del valor añadido que aportan los datos, sería posible resolver algunos de los problemas existentes actualmente en el sector para crear nuevas estrategias enfocadas a conocer mejor al turista y, por ende, a mejorar su experiencia a la hora de viajar.

La generación de estos espacios de compartición y explotación de datos supondrá grandes ventajas para el sector, ya que se facilitará la creación de ofertas, productos y servicios más personalizados que proporcionen una experiencia mejorada y adaptada a las necesidades de los clientes, mejorando así la capacidad de atraer turistas. Además de impulsar un mayor conocimiento del sector y una toma de decisiones informada tanto por parte de organizaciones públicas como privadas, que pueden detectar más fácilmente nuevas oportunidades de negocio.

Retos de seguridad y gobernanza de datos para aprovechar las oportunidades del mercado turístico digital

Uno de los principales escollos a la hora de desarrollar un espacio de datos sectorial es la falta de confianza en el intercambio de datos, la ausencia de modelos de datos compartidos o la insuficiencia de normas de interoperabilidad para un intercambio de datos eficiente entre las diferentes plataformas existentes y los actores de la cadena de valor.

Yendo a los retos más específicos, el sector turístico se encuentra, además, con la necesidad de combinar los espacios de datos B2B (compartición entre empresas y organizaciones privadas) con los C2B y G2B (compartición de usuarios a empresas y sector público a empresas). Si a esto le sumamos que lo ideal es aterrizar los conjuntos de datos del sector turístico a nivel nacional, regional y local, el reto se torna aún mayor.

De forma paralela, para diseñar un espacio de datos del sector, también debe tenerse en cuenta que existen diferencias respecto a la calidad de los datos de los actores anteriormente mencionados. Al no existir una serie de estándares concretos, encontramos diferencias en el nivel de granularidad y calidad de los datos, la semántica, así como disparidad entre formatos y licencias, lo que deja un escenario de datos inconexo.

A su vez, es fundamental conocer de primera mano cuáles son las demandas que tienen los distintos actores de la industria, algo que solo se consigue escuchando y tomando notas sobre las necesidades presentes en los distintos niveles de la industria. Por ello, conviene recordar que el turismo es una actividad social cuyo foco no debe posicionarse solamente en el destino, ya que el éxito de un espacio de datos turístico residirá también en la capacidad para conocer mejor al cliente y, por ende, poder ofrecerle servicios adecuados a sus demandas que mejoren su experiencia e incentiven sus ganas de continuar viajando. 

De este modo, y tal y como recoge el informe elaborado por la Oficina del Dato, en colaboración con el hub español de Gaia-X, resulta interesante reorientar el foco y desplazarlo del destino hacia el turista, en línea con el descubrimiento y generación de casos de uso de SEGITTUR. Y es que, aunque es cierto que la focalización en el destino ha servido para desarrollar plataformas digitales que han impulsado la competitividad, la eficiencia y la estrategia turística, plantear una estrategia que preste la misma atención al turista permitiría ampliar y mejorar los catálogos de datos disponibles.

Medir los factores que condicionan la experiencia de los turistas durante la visita a nuestro país permite optimizar su satisfacción en todo el circuito del viaje, a la par que contribuir a crear campañas de marketing cada vez más personalizadas, tomando como el análisis de los intereses de los diferentes segmentos de mercado.

Situación actual de la construcción del espacio de datos del Turismo español y próximos pasos

La falta de madurez del mercado en la creación de espacios de datos como solución, hace necesario un enfoque de experimentación, tanto para la consolidación de los componentes tecnológicos, como para la validación de las diferentes facetas (infraestructura soft) presentes en los espacios de datos.

Actualmente, el Grupo de Trabajo de Turismo del Hub español de Gaia-X trabaja en la definición de los elementos clave del espacio de datos de turismo, a partir de casos de uso alineados con los retos del sector. El objetivo es dar respuesta a algunas preguntas clave, utilizando el conocimiento existente en materia de espacios de datos:

  • ¿Cuáles son las características clave del entorno turístico y qué problemas de negocio pueden abordarse?
  • ¿Qué modelos orientados a datos se pueden trabajar en los diferentes casos de uso?
  • ¿Qué requisitos existen y qué modelo de gobernanza es necesario? ¿Qué tipologías de participantes deben considerarse?
  • ¿Qué componentes de negocio, legales, operativos, funcionales, tecnológicos son necesarios?
  • ¿Qué arquitectura tecnológica de referencia puede utilizarse?
  • ¿Qué procesos de desarrollo, integración, test y despliegue de la tecnología pueden emplearse?
calendar icon