La Secretaría de Estado de Digitalización e Inteligencia Artificial, en colaboración con SEGITTUR y como parte de la feria internacional FITUR, organizó el pasado 19 de diciembre el primer taller del Hub español de Gaia-X, centrado en avanzar la creación del espacio de datos de la industria del Turismo.
Los datos son una palanca de transformación digital del mundo, así como un elemento habilitador para la innovación y el desarrollo de nuevas tecnologías y servicios. Sin embargo, los datos por sí solos no generan ningún valor, y es clave ponerlos en contexto para obtener beneficios tangibles. Para ello, generalmente se hace necesario compartir y relacionar distintos conjuntos de datos, a menudo de distintas disciplinas o dominios.
En este contexto de necesidad de compartición es donde surge el concepto de los espacios de datos. Estos son estructuras (tecnológicas y de gobernanza) que proporcionan confianza y seguridad en torno a la compartición voluntaria de datos entre sus participantes. Son ecosistemas donde se articulan y gestionan las voluntades, funciones y procesos necesarios para compartir datos, a través de mecanismos de consenso, bajo un contexto de soberanía y control, y en base a una arquitectura de sistemas federada.
Este primer taller colaborativo se ha centrado en el uso de los datos en la industria del Turismo, uno de los sectores clave para España. Su objetivo es conformar una visión para este espacio de datos. Para ello, se analizaron los retos y oportunidades en materia de gobernanza del espacio, las tecnologías y arquitecturas disponibles para facilitar la compartición de datos, así como casos de uso tractores para el sector. El taller tuvo forma híbrida (presencial + online) y contó con la participación de diferentes representantes de la política, de oficinas técnicas gubernamentales, de empresas a lo largo de toda la cadena de valor del Turismo, universidades e institutos tecnológicos, así como integradores del mundo TI. Se contó además con ponentes de cada una de estas clases de organizaciones, queriendo así reflejar que la construcción y operación de los espacios de datos necesita de la involucración de un ecosistema variado y multidisciplinar.
El Hub español de Gaia-X
El Gobierno de España está trabajando en promover el entorno propicio para la creación de espacios de datos sectoriales, a través de las distintas iniciativas en materia de datos que se detallan en la Agenda España Digital 2025, y aprovechando la excepcional oportunidad que ofrecen los fondos NextGenEU. Bajo este marco, se ha impulsado la creación del Hub español de Gaia-X, que busca que sectores de todos los tamaños creen comunidad en torno al dato. El objetivo es que sirva para desarrollar e implantar nuevas soluciones innovadoras basadas en datos e Inteligencia Artificial, e impulsen la competitividad de las empresas. Estos espacios son además tractores para generar beneficios a lo largo de toda la cadena transformativa del dato, y se presta especial atención a que en la misma estén también representadas PYMEs y microPYMEs.
Gaia-X es una iniciativa europea del sector privado cuyo objetivo es la creación de una infraestructura de datos abierta, federada e interoperable, constituida sobre los valores de la disponibilidad y el control de los datos, y para el fomento de la Economía del Dato. Su principal objetivo es apoyar la respuesta europea en materia de compartición de datos a lo largo de distintos sectores y geografías de la Unión, y en base a un modelo federado que garantice la confianza y la soberanía digital. La iniciativa logra la capilaridad en el territorio de los diferentes estados miembro a través de 15 hubs nacionales de Gaia-X, incluido el de España.
Desarrollo de la jornada de trabajo
Durante la jornada de trabajo, se señaló que España será el primer país en liderar un espacio de datos en la industria del Turismo, que desarrollará estándares y maneras para compartir datos en la práctica, aportando de esa manera su capacitación y experiencia al resto de Europa. Esto supondrá a su vez una gran oportunidad dentro del proceso de transformación digital que ya vive la economía española.
La puesta en marcha de este proyecto conlleva una serie de retos relativos a la generación de confianza, la reducción de costes en la interoperabilidad, el establecimiento de semánticas y estándares, la creación de modelos de negocio generadores de valor, así como el logro de un modelo de gobernanza práctico que garantice la soberanía y control de los partícipes sobre sus datos y lo qué se hace con ellos. Éstas, consideraciones comunes a la creación de todo espacio de datos, se agudizan en este caso por la alta fragmentación y atomización del sector, así como su incompleta digitalización. La solución pasa por la implantación de una cadena de valor digitalizada de extremo a extremo, que englobe a todos los intervinientes en un modelo de compartición de datos que permita una visión holística, dando respuesta a las cuestiones relativas a la gestión de la privacidad, el mantenimiento de las ventajas competitivas, y la fijación de modelos de recompensa.
Para ello, durante la sesión de trabajo se evidenció la necesidad de avanzar en un enfoque de casos de uso: desde una necesidad de negocio concreta se abordan requerimientos y necesidades, fijándose así las condiciones básicas que garanticen su viabilidad y sostenibilidad. De esta manera, se dota además de escalabilidad al espacio de datos, que permite desplegarlo de manera ágil e incremental, contando con un producto inicial y que puede ampliarse fácilmente en sucesivas etapas con más funcionalidades y roles, según vayan incorporándose al espacio de datos nuevos participantes y casos de uso.
Estos casos de uso son la base para fijar los requisitos de la arquitectura del ecosistema de compartición de datos, incluyendo los estándares semánticos, modelos y vocabularios de datos concretos, la fijación de los roles y funciones de los participantes, así como los requisitos de los diferentes componentes software necesarios. La infraestructura de datos y de los sistemas es abierta y federada, goza de la escalabilidad y flexibilidad que ofrece el modelo de referencia de IDS (International Data Spaces), y cumple con los criterios de Gaia-X. De esa manera, tanto el espacio de datos del Turismo, como los futuros espacios sectoriales que se vayan generando, no sólo cumplen su función habilitadora para la Economía del Dato, sino que además lo hacen en base a los principios europeos básicos de soberanía digital, transparencia y transversalidad e igualdad.
La Comisión Europea estima que la economía del dato -aquella cuyo modelo de negocio se basa en la explotación de datos para generar productos y servicios- alcanzará un valor de 550.000 millones de euros en la UE27 en 2025. Esta cifra significa que pasará de ocupar el 2,8% del PIB a suponer el 4%. Solo en nuestro país, se apunta que generará más de 50.000 millones de euros y 750.000 puestos de trabajo.
En el mismo informe, la Comisión también indica que, para alcanzar un escenario de crecimiento alto, es necesario que disminuya la concentración de los datos en manos de unos pocos y se apueste por políticas de compartición de datos que fomenten la innovación y el avance de la sociedad. Por ello, entre otras acciones, la Comisión lanzó el Support Centre for Data Sharing (SCDS), enfocado en investigar e informar sobre las prácticas de compartir datos y aquellos elementos que influyen en su éxito.
La compartición de datos impulsa la colaboración entre los investigadores, desarrolladores y creadores de productos y servicios, lo que puede dar lugar a nuevos e importantes descubrimientos, además de repercutir en la reputación positiva de las compañías que ceden datos. Las empresas empiezan a ser conscientes de esta situación, lo que está llevando a que cada vez veamos más ejemplos de iniciativas privadas de intercambio y compartición de datos. Esto afecta a organizaciones de todo tipo, incluyendo grandes empresas que atesoaran, gestionan o tienen acceso a grandes volúmenes de datos. Veamos algunos ejemplos de compartición:
HealthData 29
La Fundación 29, junto a Microsoft, ha puesto en marcha Health29, una plataforma para compartir conjuntos de datos abiertos para fines de investigación. En el proyecto también han participado Garrigues y la Cátedra de Privacidad y Transformación Digital de la Universidad de Valencia.
Las organizaciones que lo deseen se pueden registrar como publicadores y empezar a compartir datos anonimizados, garantizando la privacidad y seguridad. Actualmente hay 3 organizaciones publicadoras. Todas ellas comparten datos relacionados con la COVID-19:
- HM Hospitales comparte datos clínicos relacionados con el tratamiento del COVID-19, incluyendo diagnósticos, tratamientos, ingresos, pasos por UCI, pruebas diagnósticas por imagen, resultados de laboratorio, alta o deceso, entre otros.
- LaLiga provee datos relativos a pruebas PCR y de antígenos realizadas a los jugadores y al personal de los clubes de LaLiga Santander y LaLiga SmartBank.
- Sanitas, como parte de su proyecto Data4good, proporciona a los investigadores datos demográficos e información clínica (medicamentos, constantes vitales, información de laboratorios y diagnóstico) de los pacientes con COVID-19 que han sido ingresados en sus centros médicos.
Estos datos pueden utilizarse para comprender mejor el comportamiento de esta enfermedad y su tratamiento, pero también para realizar modelos predictivos de la evolución de la enfermedad o modelos epidemiológicos. Los investigadores que quieran acceder a estos datos necesitan rellenar una solicitud, que el publicador deberá aprobar.
En el contexto del proyecto también se ha creado una guía con el marco técnico y legal para crear un repositorio público de datos procedentes de los sistemas de salud.
Cabe destacar que Microsoft engloba esta acción en su iniciativa de impulso de la compartición de datos, Open Data Campaign, como nos explicó Belén Gancedo, Directora de Educación en Microsoft Ibérica, en esta entrevista.
Data for Good
Data for Good es el nombre que lleva la iniciativa de compartición de datos de Meta, la compañía de Mark Zuckerberg, antes llamada Facebook, igual que la red social -la cual sí mantiene el nombre-. Facebook cuenta con tres mil millones de usuarios. Data for Good pretende utilizar información anonimizada sobre esta comunidad para “ayudar a las organizaciones a prestar mejores servicios”.
En la web se ofrecen diversos datos y herramientas, incluyendo mapas. También cuenta con una sección de impacto con ejemplos de uso de los datos. Mientras algunos productos requieren la firma de un acuerdo de intercambio de datos, otros son públicos y open source, como por ejemplo:
- High Resolution Settlement Layer: se trata de un mapa de densidad poblacional que utiliza datos censales, imágenes satelitales y algoritmos de machine learning para detectar estructuras. Ha sido utilizado, por ejemplo, para analizar el acceso a centros de salud en España.
- Movement Range Maps: consiste en un mapa con datos de movilidad actualizados diariamente (aquí hay un artículo sobre la metodología). Han sido utilizados por gobiernos y agencias alrededor del mundo para medir los efectos de las restricciones en movilidad durante la pandemia de COVID-19 o el nivel de actividad económica.
- Social Connectedness Index: mapa que mide los niveles de amistad en Facebook entre países y regiones en el mundo. Este índice ayuda a predecir patrones económicos, de migración o salud, entre otros. Ha sido utilizado por la Universidad de Nueva York, por ejemplo, para predecir intercambios comerciales entre unidades geográficas en Europa.
- Commuting Zones: mapea las áreas donde vive y trabaja la ciudadanía, en base a traslados, y utilizando algoritmos de machine learning. Esta información solo es accesible, de momento, para instituciones académicas, think-tank u ONGs.
Además, también ofrecen resultados de encuestas sobre el impacto económico en Pymes alrededor del mundo, el cambio climático, la igualdad en el hogar o las tendencias e impacto de la COVID-19 .
Estas herramientas están también disponibles a través del Humanitarian Data Exchange Portal de la Organización de las Naciones Unidas.
Google Health
Google Health tiene el objetivo organizar la información de salud del mundo y hacerla universalmente accesible y útil. Dentro del proyecto se ofrecen tanto servicios para todos los usuarios, como específicos para médicos.
En la parte de servicios generales, podemos encontrar:
- Repositorio de datos abiertos de COVID-19. Agrega datos de más de 20.000 fuentes para ayudar a conocer mejor el comportamiento del virus. Los usuarios pueden descargar los conjuntos de datos sin procesar o visualizarlos a través de mapas y tablas.
- Google Health Studies. Los usuarios pueden unirse a estudios y responder encuestas para ayudar a instituciones e investigadores a comprender mejor los problemas y las necesidades sanitarias específicas de una comunidad. Los datos particulares se encriptan para su posterior agregación y análisis de tal forma que ni Google ni los investigadores reciben ningún dato privado.
Google también desarrolla soluciones tecnológicas dirigidas a mejorar la atención médica. Uno de los campos donde están más enfocado es en los trabajos con Inteligencia Artificial con distintos fines como ayudar a diagnosticar el cáncer o prevenir la ceguera.
Uber Movement
La empresa de movilidad Uber también proporciona datos y herramientas, en este caso, para comprender cómo y por qué se mueven los ciudadanos. A través de la web Uber Movement se pueden visualizar, filtrar y descargar datos gratuitos, agregados y anonimizados de viajes realizados a través de su app. El servicio solo está disponible de momento para algunas ciudades, entre las que se encuentran Madrid y Barcelona.
En concreto cuenta con 3 servicios de datos:
- Travel Times. Proporciona el tiempo medio de viaje entre dos "zonas" de una ciudad para una hora y fecha determinadas.
- Speed. Ofrece datos sobre la velocidad media derivada de las lecturas de vehículos que proporcionan los servicios de Uber, agregadas por segmentos de calles y con una granularidad horaria.
- Mobility HeatMap. Se trata de un mapa de calor que muestra la densidad del tráfico en distintas zonas de cada ciudad.
Gracias a estos datos se pueden comparar los tiempos de traslado y comprender el impacto de diversos eventos en la ciudad. Son de gran utilidad para la toma de decisiones relacionadas con los retos del transporte urbano, desde reducir los embotellamientos y las emisiones hasta mejorar la seguridad vial. Todos los datos están disponible a través de una visualización interactiva, aunque también se puede descargar en formato CSV. Estos datos cuentan con una licencia Creative Commons, Attribution Non-Commercial.

En definitiva, estamos ante 4 ejemplos diferentes de compartición de datos, pero con un fin común: impulsar avances en la sociedad a través de la mejora del conocimiento. Todos estos datos son fundamentales para impulsar nuevas investigaciones, mejorar la toma de decisiones e incluso generar nuevos productos y servicios.
Contenido elaborado por el equipo de datos.gob.es.
El “Centro de soporte para el intercambio de datos” (Support Centre for Data Sharing o SCDS en inglés) nació en 2019 como parte de la estrategia europea para impulsar un ecosistema de datos común. Se trata de un espacio para investigar e informar sobre las prácticas del llamado data sharing (intercambio de datos), que ellos mismos definen como “transacciones de cualquier tipo de información en forma digital, entre diferentes tipos de organizaciones”.
El SCDS proporciona soporte práctico a organismos públicos o privados que busquen compartir sus datos -independientemente del modelo elegido para ello-. Entre otras cuestiones, difunde buenas prácticas y casos de éxito con el objetivo de inspirar a otros en el intercambio de datos. Los ejemplos, que no se limitan al ámbito geográfico de Europa, abarcan diferentes sectores, desde la agricultura hasta la sanidad o la movilidad.
En el informe Data Sharing Practice Examples encontramos algunos de ellos. Este documento se centra principalmente en plataformas e iniciativas de terceros que pueden servir de apoyo a la gobernanza y el cumplimiento normativo en las prácticas de intercambio de datos.
Ejemplos prácticos e iniciativas de intercambio de datos
Uno de los principales retos que se encuentran las organizan que empiezan a desarrollar acciones de intercambio de datos es la falta de confianza que puede generar en la industria y la ciudadanía la compartición de su información. El uso de estándares y soluciones tecnológicas de terceros ayudan a paliar este reto, aumentando también la eficiencia al no tener que dedicar tiempo y recursos al desarrollo propio.
El informe divide los ejemplos que muestra en 3 categorías, en base a su función principal:
-
Catalizadores de espacios de datos: su objetivo es crear espacios para la puesta en común de datos, abordando un sector o territorio específico.
-
Facilitadores políticos/legales: se centran en los retos legales del intercambio de datos, bien desde una posición de soporte u ofreciendo su visión desde la experiencia.
-
Facilitadores tecnológicos: se dedican a desarrollar tecnología - o asesorar sobre ella - para el intercambio de datos de manera general, sin centrarse en un sector específico.
El informe incluye ejemplos relativos a cada una de estas categorías como veremos a continuación.
Catalizadores de espacios de datos: MaaS Madrid y Mobility 360
Empezamos con un ejemplo relativo a nuestro país y al sector de la movilidad. En Madrid conviven operadores públicos y privados de transporte que ofrecen servicios de autobuses, trenes, tranvías, coches, bicicletas y motos.
MaaS Madrid nació como un agregador de datos que permite a los usuarios acceder a la información en tiempo real de los citados operadores en una única plataforma integrada, incorporando la información disponible del transporte público y de los servicios de movilidad compartida adheridos - como coches compartidos, patinetes o bicicletas-. MaaS Madrid fue una primera aproximación, que ha dado paso a Mobility 360, presentada recientemente en una fecha posterior al informe y por ello no incluida en el mismo.
Mobility 360 ofrece “una experiencia de movilidad inteligente, es decir, digital e innovadora que proporciona al usuario alternativas eficientes para realizar sus desplazamientos de forma fácil y fluida”. Esto supone una gran ventaja para los usuarios, que disponen de toda la información centralizada para elegir la ruta y el servicio que mejor responda a sus necesidades, a la vez que se fomenta el uso del transporte público o compartido (con el consiguiente beneficio para el medio ambiente).
Este modelo también tiene ventajas para los operadores, que amplían su visibilidad y se hacen más conocidos entre su público. Además, permite recopilar datos anónimos agregados en tiempo real, muy útiles para la toma de decisiones y la planificación de políticas de movilidad por parte de los entes públicos.

Facilitadores políticos/legales: Technology Industries Finland
Technology Industries of Finland (TIF) es la organización en defensa de las empresas de electrónica, electrotécnica, mecánica y metalúrgica, consultoría de ingeniería y tecnología de la información en el país nórdico, con más de 1.600 miembros. Tras analizar el uso de los datos en estos campos y observar la falta de prácticas establecidas relativas a los derechos de uso de los datos, TIF ha elaborado un modelo de condiciones para el intercambio de información, que están promoviendo dentro y fuera del país.
Este modelo incluye una serie de cláusulas estándar compatibles con la legislación sobre competencia y protección de datos personales de la Unión Europea. TIF recomienda incluir estas cláusulas como apéndices a los acuerdos preexistente entre las partes implicadas en el intercambio de datos.
Los términos del modelo están disponibles en la tienda web de Teknova.

Facilitadores tecnológicos: DataVaccinators
DataVaccinators se centra en el intercambio de datos personales de forma segura. Ofrece una solución de software de código abierto para el almacenamiento y la protección de datos personales mediante el uso de técnicas de seudonimización aplicadas en el momento de generación de los datos, que son separados en distintas bases de datos y cifrados.
DataVaccinators se puede integrar en cualquier aplicación. Los desarrolladores pueden integrar otros componentes en la base de datos. El código fuente puede verse y descargarse en GitHub (con licencia AGPL), al igual que la implementación en JavaScipt (con licencia MIT).
Esta solución está dirigida a cualquier tipo de organización, aunque es especialmente útil para hospitales, universidades, bancos, aseguradoras o fabricantes, que pueden aprovechar los datos anonimizados de los clientes para extraer tendencias y tomar decisiones.

Accede a más ejemplos
Estos son solo 3 ejemplos, pero el informe incluye muchos más. Además, en la web del SCDS puedes encontrar más casos de éxito. Como bien indican desde el propio SCDS, todavía no ha surgido ningún modelo que se haya impuesto a los demás, por ello es importante documentar y tener constancia de las iniciativas que van surgiendo en este ámbito, para poder elegir la que más se adapte a nuestras necesidades, aunque esta situación tiene el riego de crear silos, en base a la solución elegida por cada operador.
El intercambio de datos entre organizaciones privadas y con organismos públicos en todas sus modalidades puede generar múltiples beneficios, principalmente al proporcionar una mayor información para tomar mejores decisiones que afecten tanto al ámbito económico como social. Pero para aprovecharse de todas sus ventajas es necesario llevar a cabo este intercambio de manera segura, legal y respetuosa con los derechos de privacidad de los ciudadanos. La Unión Europea es consciente de ello y ya está dando pasos en este sentido. Uno de ellos es el Reglamento sobre gobernanza de los datos en el ámbito europeo, dirigido a “ampliar la disponibilidad de datos con miras a su utilización”, a través de mecanismos como los proveedores de servicios de intercambio de datos o el punto único de información.
Contenido elaborado por el equipo de datos.gob.es.