La normativa UNE 0087 define por primera vez en España los principios y requisitos clave para crear y operar en espacios de datos
El pasado día 17 de julio se publicó oficialmente la Especificación UNE 0087 “Definición y caracterización de los Espacios de Datos”, la primera norma española que establece un marco común para estos entornos digitales.
Este hito ha sido posible gracias a la colaboración del Centro de Referencia de Espacios de Datos (CRED), con la Asociación Española de Normalización (UNE). Dicha normativa, que fue aprobada el 20 de junio de 2025 define tres pilares claves en la adhesión a los espacios de datos: interoperabilidad, gobernanza y creación de valor, con el objetivo de ofrecer seguridad jurídica, confianza y un lenguaje técnico común en la economía del dato.
Para su creación, se han formado tres grupos de trabajo con más de 50 participantes de entidades tanto públicas como privadas que han aportado su conocimiento para definir los principios y características clave de estos sistemas colaborativos. Estos grupos de trabajo se han coordinado de la siguiente manera:
- GT1: Definición de Espacios de Datos y Modelo de Madurez.
- GT2: Interoperabilidad Técnica y Semántica.
- GT3: Interoperabilidad legal y organizativa.
La publicación de esta normativa supone, por tanto, un documento de referencia para la creación de espacios de datos seguros y confiables, aplicable en todos los sectores productivos y que sirve de base para futuros documentos guía.
De este modo, para ofrecer unas directrices que faciliten la implementación y desarrollo de los espacios de datos, nace la especificación UNE 0087:2025 para crear un marco inclusivo de referencia que oriente a las organizaciones y que estas se puedan aprovechar de toda la información en un entorno de cumplimiento normativo y soberanía digital. La publicación de esta normativa tiene una serie de beneficios:
- Acelerar el despliegue de los espacios de datos en todos los sectores de la economía.
- Favorecer la sostenibilidad y el escalado / crecimiento de los ecosistemas de compartición de datos.
- Fomentar la colaboración pública /privada, asegurando la convergencia con Europa.
- Avanzar hacia la autonomía tecnológica y la soberanía de los datos en los ecosistemas.
- Promover el descubrimiento de nuevas oportunidades de negocio innovadoras fomentando la colaboración y creación de alianzas estratégicas.
Dentro de la especificación se definen qué son los espacios de datos, de establecen sus características clave de interoperabilidad, gobernanza y generación de valor y se determinan cuáles con los beneficios de su adhesión. La especificación está publicada aquí y es importante añadir que, aunque aparezca un coste de descarga, tiene carácter gratuito, gracias al patrocinio de la Dirección General del Dato.
Con esta herramienta, España da un paso firme en la consolidación de espacios de datos cohesivos, seguros y alineados con el marco europeo, facilitando la implantación de proyectos transversales en diferentes sectores.
España da un paso clave hacia la economía del dato con el lanzamiento del Kit Espacios de Datos, un programa de ayudas que subvencionará la integración de entidades públicas y privadas en espacios de datos sectoriales.
Los espacios de datos son ecosistemas seguros en los que organizaciones, tanto públicas como privadas, comparten información de forma interoperable, bajo reglas comunes y con garantías de privacidad. Éstos permiten desarrollar nuevos productos, mejorar la toma de decisiones y aumentar la eficiencia operativa, en sectores como la salud, la movilidad o la agroalimentación, entre otros.
Hoy, el Ministerio para la Transformación Digital y de la Función Pública, a través de la Secretaría de Estado de Digitalización e Inteligencia Artificial ha publicado en el BOE las bases que regulan la concesión de ayudas a entidades interesadas en incorporarse de forma efectiva a un espacio de datos.
Este programa, que recibe el nombre de “Kit Espacios de Datos”, estará gestionado por Red.es y subvencionará los costes en los que hayan incurrido las entidades beneficiarias para conseguir su incorporación a un espacio de datos elegible, es decir, que cumpla los requisitos fijados en las bases, a contar desde el día de la publicación de estas.
Destinatarios y financiación
Este plan de ayudas está dirigido a entidades tanto públicas como privadas, así como Administraciones Públicas. Dentro de los beneficiarios de estas ayudas se encuentran los participantes, que son aquellas entidades que buscan integrase en estos ecosistemas para compartir y aprovechar datos y servicios.
Para la ejecución de este plan, el Gobierno ha lanzado una ayuda de hasta 60 millones de euros que se repartirán, según el tipo de entidad o el nivel de integración de la siguiente manera:
- Entidades privadas y públicas con actividad económica tendrán una ayuda de hasta 15.000€ en régimen de incorporación efectiva o de hasta 30.000€ si se incorpora como proveedor.
- Por otro lado, las Administraciones Públicas tendrán financiación de hasta 25.000€ si se incorporan de manera efectiva, o de hasta 50.000€ si lo hacen como proveedor.
La incorporación de empresas de diferentes sectores en los espacios de datos generará beneficios tanto a nivel empresarial como para la economía nacional como el aumento de la capacidad de innovación de las empresas beneficiarias, la creación de nuevos productos y servicios basados en el análisis de los datos y la mejora de la eficiencia operativa y toma de decisiones.
Se prevé que la convocatoria se publique durante el cuarto trimestre de 2025. Las subvenciones se solicitarán en régimen de concurrencia no competitiva, por orden de llegada y hasta agotar los fondos disponibles.
Con la publicación en el BOE de estas bases reguladoras se pretende dinamizar el ecosistema de datos en España, fortalecer la competitividad de la economía en el ámbito global y consolidar la sostenibilidad financiera de modelos de negocio innovadores.
Más información:
Bases reguladoras en el BOE.
Página de LinkedIn del Centro de Referencia de Espacios de Datos.
Hace tan solo unos días, la Dirección General de Tráfico publicó el nuevo Programa Marco para Prueba de Vehículos Automatizados que, entre otras medidas, contempla “la entrega obligatoria de informes, tanto periódicos y finales como en caso de incidentes, que permitirán a la DGT evaluar la seguridad de las pruebas y publicar información básica […] garantizando la transparencia y la confianza pública”.
El avance de la tecnología digital está facilitando que el sector del transporte se enfrente a una revolución sin precedentes respecto a la conducción de vehículos autónomos, ofreciendo mejorar significativamente la seguridad vial, la eficiencia energética y la accesibilidad de la movilidad.
El despliegue definitivo de estos vehículos depende en gran medida de la disponibilidad, calidad y accesibilidad de grandes volúmenes de datos, así como de un marco jurídico adecuado que asegure la protección de los diversos bienes jurídicos implicados (datos personales, secreto empresarial, confidencialidad…), la seguridad del tráfico y la transparencia. En este contexto, los datos abiertos y la reutilización de la información del sector público se manifiestan como elementos esenciales para el desarrollo responsable de la movilidad autónoma, en particular a la hora de garantizar unos adecuados niveles de seguridad en el tráfico.
La dependencia de los datos en los vehículos autónomos
La tecnología que da soporte a los vehículos autónomos se sustenta en la integración de una compleja red de sensores avanzados, sistemas de inteligencia artificial y algoritmos de procesamiento en tiempo real, lo que les permite identificar obstáculos, interpretar las señales de tráfico, predecir el comportamiento de otros usuarios de la vía y, de una forma colaborativa, planificar rutas de forma completamente autónoma.
En el ecosistema de vehículos autónomos, la disponibilidad de datos abiertos de calidad resulta estratégica para:
- Mejorar la seguridad vial, de manera que puedan utilizarse datos de tráfico en tiempo real que permitan anticipar peligros, evitar accidentes y optimizar rutas seguras a partir del análisis masivo de datos.
- Optimizar la eficiencia operativa, ya que el acceso a información actualizada sobre el estado de las vías, obras, incidencias y condiciones de tráfico permite una planificación más eficiente de los desplazamientos.
- Impulsar la innovación sectorial, facilitando la creación de nuevas herramientas digitales que facilitan la movilidad.
En concreto, para garantizar un funcionamiento seguro y eficiente de este modelo de movilidad se requiere el acceso continuo a dos categorías fundamentales de datos:
- Datos variables o dinámicos, que ofrecen información en constante cambio como la posición, velocidad y comportamiento de otros vehículos, peatones, ciclistas o las condiciones meteorológicas en tiempo real.
- Datos estáticos, que comprenden información relativamente permanente como la localización exacta de señales de tráfico, semáforos, carriles, límites de velocidad o las principales características de la infraestructura viaria.
El protagonismo de los datos suministrados por las entidades públicas
Las fuentes de las que provienen tales datos son ciertamente diversas. Esto resulta de gran relevancia por lo que se refiere a las condiciones en que dichos datos estarán disponibles. En concreto, algunos de los datos son proporcionados por entidades públicas, mientras que en otros casos el origen proviene de empresas privadas (fabricantes de vehículos, proveedoras de servicios de telecomunicaciones, desarrolladoras de herramientas digitales…) con sus propios intereses o, incluso, de las personas que utilizan los espacios públicos, los dispositivos y las aplicaciones digitales.
Esta diversidad exige un diferente planteamiento a la hora de facilitar la disponibilidad de los datos en condiciones adecuadas, en concreto por las dificultades que pueden plantearse desde el punto de vista jurídico. Con relación a las Administraciones Públicas, la Directiva (UE) 2019/1024 relativa a datos abiertos y reutilización de información del sector público establece obligaciones claras que serían de aplicación, por ejemplo, a la Dirección General de Tráfico, las Administraciones titulares de las vías públicas o los municipios en el caso de los entornos urbanos. Asimismo, el Reglamento (UE) 2022/868 sobre gobernanza europea de datos refuerza este marco normativo, en particular por lo que se refiere a la garantía de los derechos de terceros y, en concreto, la protección de datos personales.
Más aún, algunos conjuntos de datos deberían proporcionarse en las condiciones establecidas para los datos dinámicos, esto es, aquellos “sujetos a actualizaciones frecuentes o en tiempo real, debido, en particular, a su volatilidad o rápida obsolescencia”, que habrán de estar disponibles “para su reutilización inmediatamente después de su recopilación, a través de las API adecuadas y, cuando proceda, en forma de descarga masiva”.
Incluso, cabría pensar que la categoría de datos de alto valor presenta un especial interés en el contexto de los vehículos autónomos dado su potencial para facilitar la movilidad, en concreto si tenemos en cuenta su potencial para:
- Impulsar la innovación tecnológica, ya que facilitarían a fabricantes, desarrolladores y operadores acceder a información fiable y actualizada, esencial para el desarrollo, validación y mejora continua de sistemas de conducción autónoma.
- Facilitar la supervisión y evaluación desde la perspectiva de la seguridad, ya que la transparencia y accesibilidad de estos datos son presupuestos esenciales desde esta perspectiva.
- Dinamizar el desarrollo de servicios avanzados, puesto que los datos sobre infraestructura vial, señalización, tráfico e, incluso, los resultados de pruebas realizadas en el contexto del citado Programa Marco constituyen la base para nuevas aplicaciones y servicios de movilidad que benefician al conjunto de la sociedad.
Sin embargo, esta condición no aparece expresamente recogida para los datos vinculados al tráfico en la definición realizada a nivel europeo, por lo que, al menos de momento, no cabría exigir a las entidades públicas la difusión de los datos que aplican a los vehículos autónomos en las singulares condiciones establecidas para los datos de alto valor. No obstante, en este momento de transición para el despliegue de los vehículos autónomos, resulta fundamental que las Administraciones públicas publiquen y mantengan actualizados en condiciones adecuadas para su tratamiento automatizado, algunos conjuntos de datos, como los relativos a:
- Señales viales y elementos de señalización vertical.
- Estados de semáforos y sistemas de control de tráfico.
- Configuración y características de carriles.
- Información sobre obras y alteraciones temporales de tráfico.
- Elementos de infraestructura vial críticos para la navegación autónoma.
La reciente actualización del catálogo oficial de señales de tráfico, que entra en vigor el 1 de julio de 2025 incorpora señalizaciones adaptadas a nuevas realidades, como es el caso de la movilidad personal. Sin embargo, requiere de una mayor concreción por lo que se refiere a la disponibilidad de los datos relativos a las señales en las referidas condiciones. Para ello será necesaria la intervención de las autoridades responsables de la señalización de las vías.
La disponibilidad de los datos en el contexto del espacio europeo de movilidad
Partiendo de estos condicionamientos y de la necesidad de disponer de los datos de movilidad generados por empresas privadas y particulares, los espacios de datos aparecen como el entorno jurídico y de gobernanza óptimo para facilitar su accesibilidad en condiciones adecuadas.
En este sentido, las iniciativas para el despliegue del espacio de datos europeo de movilidad, creado en 2023, constituyen una oportunidad para integrar en su diseño y configuración medidas que den soporte a la necesidad de acceso a los datos que exigen los vehículos autónomos. Así pues, en el marco de esta iniciativa sería posible liberar el potencial de los datos de movilidad y, en concreto:
- Facilitar la disponibilidad de los datos en condiciones específicas para las necesidades de los vehículos autónomos.
- Promover la interconexión de diversas fuentes de datos vinculadas a los medios de transporte ya existentes, pero también de los emergentes.
- Acelerar la transformación digital que suponen los vehículos autónomos.
- Reforzar la soberanía digital de la industria automovilística europea, reduciendo la dependencia de grandes corporaciones tecnológicas extranjeras.
En definitiva, los vehículos autónomos pueden suponer una transformación fundamental en la movilidad tal y como hasta ahora se ha concebido, pero su desarrollo depende entre otros factores de la disponibilidad, calidad y accesibilidad de datos suficientes y adecuados. El Proyecto de Ley de Movilidad Sostenible que actualmente se encuentra en tramitación en las Cortes Generales constituye una magnífica oportunidad para reforzar el papel de los datos a la hora de facilitar la innovación en este ámbito, lo que sin duda favorecería el desarrollo de los vehículos autónomos. Para ello será imprescindible, de una parte, contar con un entorno de compartición de datos que haga compatible el acceso a los datos con las adecuadas garantías para los derechos fundamentales y la seguridad de la información; y, de otra, diseñar un modelo de gobernanza que, como se enfatiza en el Programa impulsado por la Dirección General de Tráfico, facilite la participación colaborativa de “fabricantes, desarrolladores, importadores y operadores de flotas establecidos en España o en la Unión Europea”, lo que plantea importantes desafíos en la disponibilidad de los datos.
Contenido elaborado por Julián Valero, catedrático de la Universidad de Murcia y Coordinador del Grupo de Investigación “Innovación, Derecho y Tecnología” (iDerTec). Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Los datos son un recurso fundamental para mejorar nuestra calidad de vida porque permiten mejorar los procesos de toma de decisiones para crear productos y servicios personalizados, tanto en el sector público como en el privado. En contextos como la salud, la movilidad, la energía o la educación, el uso de datos facilita soluciones más eficientes y adaptadas a las necesidades reales de las personas. No obstante, en el trabajo con datos, la privacidad juega un papel clave. En este post, analizaremos cómo los espacios de datos, el paradigma de computación federada y el aprendizaje federado, una de sus aplicaciones más potentes, plantean una solución equilibrada para aprovechar el potencial de los datos sin poner en riesgo la privacidad. Además, resaltaremos cómo el aprendizaje federado también puede usarse con datos abiertos para mejorar su reutilización de forma colaborativa, incremental y eficiente.
La privacidad, clave en la gestión de datos
Como se ha mencionado anteriormente, el uso intensivo de datos exige una creciente atención a la privacidad. Por ejemplo, en salud digital, un mal uso secundario de datos de historias clínicas electrónicas podría vulnerar derechos fundamentales de pacientes. Una forma eficaz de preservar la privacidad es mediante ecosistemas de datos que prioricen la soberanía de los datos, como es el caso de los espacios de datos. Un espacio de datos es un sistema de gestión federada de datos que permite su intercambio de manera confiable entre proveedores y consumidores. Además, el espacio de datos garantiza la interoperabilidad de los datos para crear productos y servicios que generen valor. En un espacio de datos, cada proveedor mantiene sus propias normas de gobernanza, conservando el control sobre sus datos (es decir, la soberanía sobre sus datos), a la vez que se posibilita su reutilización por consumidores. Esto implica que cada proveedor debe poder decidir qué datos comparte, con quién y bajo qué condiciones, garantizando el cumplimiento de sus intereses y obligaciones legales.
Computación federada y espacios de datos
Los espacios de datos representan una evolución en la gestión de datos, relacionada con un paradigma denominado computación federada (federated computing), donde los datos se reutilizan sin necesidad de que haya un trasiego de datos desde los proveedores de datos hacia los consumidores. En la computación federada, los proveedores transforman sus datos en resultados intermedios que preservan la privacidad con el fin de poder ser enviados a los consumidores de datos. Además, esto posibilita que puedan aplicarse otras técnicas de mejora de la privacidad de datos (Privacy-Enhancing Technologies). La computación federada se alinea perfectamente con arquitecturas de referencia como Gaia-X y su Trust Framework, que establece los principios y requisitos para garantizar un intercambio de datos seguro, transparente y conforme a reglas comunes entre proveedores y consumidores de datos.
Aprendizaje federado
Una de las aplicaciones más potentes de la computación federada es el aprendizaje automático federado (federated learning), una técnica de inteligencia artificial que permite entrenar modelos sin necesidad de centralizar los datos. Es decir, en lugar de enviar los datos a un servidor central para procesarlos, lo que se envía son los modelos entrenados localmente por cada participante.
Estos modelos se combinan posteriormente de manera centralizada para crear un modelo global. A modo de ejemplo, imaginemos un consorcio de hospitales que quiere desarrollar un modelo predictivo para detectar una enfermedad rara. Cada hospital posee datos sensibles de sus pacientes, y compartirlos abiertamente no es viable por cuestiones de privacidad (incluso otras cuestiones legales o éticas). Con el aprendizaje federado, cada hospital entrena localmente el modelo con sus propios datos, y solo comparte los parámetros del modelo (resultados del entrenamiento) de manera centralizada. Así, el modelo final aprovecha la diversidad de datos de todos los hospitales sin comprometer la privacidad individual y las reglas de gobernanza de datos de cada hospital.
El entrenamiento en el aprendizaje federado suele seguir un ciclo iterativo:
- Un servidor central inicia un modelo base y lo envía a cada uno de los nodos distribuidos participantes.
- Cada nodo entrena el modelo localmente con sus datos.
- Los nodos devuelven solo los parámetros del modelo actualizado, no los datos (es decir, se evita el trasiego de datos).
- El servidor central agrega las actualizaciones en los parámetros, resultados del entrenamiento en cada nodo y actualiza el modelo global.
- El ciclo se repite hasta alcanzar un modelo suficientemente preciso.
Figura 1. Visual que representa el proceso de entrenamiento del aprendizaje federados. Elaboración propia
Este enfoque es compatible con diversos algoritmos de aprendizaje automático, incluyendo redes neuronales profundas, modelos de regresión, clasificadores, etc.
Beneficios y desafíos del aprendizaje federado
El aprendizaje federado ofrece múltiples beneficios al evitar el trasiego de datos. Destacamos los siguientes:
- Privacidad y cumplimiento normativo: al permanecer en su origen, se reducen significativamente los riesgos de exposición de los datos y se facilita el cumplimiento de regulaciones como el Reglamento General de Protección de Datos (RGPD).
- Soberanía de los datos: cada entidad mantiene el control total sobre sus datos, lo que evita conflictos de competitividad.
- Eficiencia: evita los costes y la complejidad de intercambiar grandes volúmenes de datos, lo que acelera los tiempos de procesamiento y desarrollo.
- Confianza: facilita la colaboración entre organizaciones sin fricciones.
Existen diversos casos de uso en los cuales el aprendizaje federado es necesario, por ejemplo:
- Salud: hospitales y centros de investigación pueden colaborar en modelos predictivos sin compartir datos de pacientes.
- Finanzas: bancos y aseguradoras pueden construir modelos de detección de fraude o análisis de riesgo compartido, respetando la confidencialidad de sus clientes.
- Turismo inteligente: los destinos turísticos pueden analizar flujos de visitantes o patrones de consumo sin necesidad de unificar las bases de datos de sus actores (tanto públicos como privados).
- Industria: empresas del mismo sector pueden entrenar modelos para mantenimiento predictivo o eficiencia operativa sin revelar datos competitivos.
Aunque sus beneficios son claros en diversidad de casos de uso, el aprendizaje federado también presenta retos técnicos y organizativos:
- Heterogeneidad de datos: los datos locales pueden tener diferentes formatos o estructuras, lo que dificulta el entrenamiento. Además, el esquema de estos datos puede cambiar con el tiempo, lo que representa una dificultad añadida.
- Datos desbalanceados: algunos nodos pueden tener más datos o de mayor calidad que otros, lo que puede sesgar el modelo global.
- Costes computacionales locales: cada nodo necesita recursos suficientes para entrenar el modelo localmente.
- Sincronización: el ciclo de entrenamiento requiere buena coordinación entre nodos para evitar latencias o errores.
Más allá del aprendizaje federado
Aunque la aplicación más destacada de la computación federada es el aprendizaje federado, están surgiendo muchas otras aplicaciones adicionales en la gestión de datos como, por ejemplo, el análisis de datos federado (federated analytics). El análisis de datos federado permite realizar análisis estadísticos y descriptivos sobre datos distribuidos sin necesidad de moverlos a los consumidores, sino que cada proveedor realiza localmente los cálculos estadísticos requeridos y solo comparte con el consumidor los resultados agregados según sus requisitos y permisos. En la siguiente tabla se muestran las diferencias entre aprendizaje federado y análisis de datos federado.
Criterio |
Aprendizaje federado |
Análisis de datos federado |
Objetivo |
Predicción y entrenamiento de modelos de aprendizaje automático. | Análisis descriptivo y cálculo de estadísticas. |
Tipo de tarea | Tareas predictivas (por ejemplo, clasificación o regresión). | Tareas descriptivas (por ejemplo, medias o correlaciones). |
Ejemplo | Entrenar modelos de diagnóstico de enfermedades a través de imágenes médicas procedentes de diversos hospitales. | Cálculo de indicadores sanitarios de un área de salud sin mover los datos entre hospitales. |
Salida esperada | Modelo global entrenado. | Resultados estadísticos agregados. |
Naturaleza | Iterativa. | Directa. |
Complejidad computacional | Alta. | Media. |
Algoritmos | Aprendizaje automático. | Algoritmos estadísticos. |
Figura 1. Tabla comparativa. Fuente: elaboración propia
Aprendizaje federado y datos abiertos: una simbiosis por explorar
En principio, los datos abiertos resuelven los problemas de privacidad antes de su publicación, por lo que se podría pensar que no es preciso hacer uso de técnicas de aprendizaje federado. Nada más lejos de la realidad. El uso de técnicas de aprendizaje federado puede aportar ventajas significativas en la gestión y explotación de los datos abiertos. De hecho, el primer aspecto a resaltar es que los portales de datos abiertos como datos.gob.es o data.europa.eu son entornos federados. Por ello, en estos portales, la aplicación de aprendizaje federado sobre conjuntos de datos de gran tamaño permitiría entrenar modelos directamente en origen, evitando costes de transferencia y procesamiento. Por otro lado, el aprendizaje federado facilitaría la combinación de datos abiertos con otros datos sensibles sin comprometer la privacidad de estos últimos. Finalmente, la naturaleza de una gran variedad de tipos de datos abiertos es muy dinámica (como los datos de tráfico), por lo que el aprendizaje federado habilitaría un entrenamiento incremental, considerando automáticamente nuevas actualizaciones de conjuntos de datos abiertos a medida que se publican, sin necesidad de reiniciar costosos procesos de entrenamiento.
Aprendizaje federado, base para una IA respetuosa con la privacidad
El aprendizaje automático federado representa una evolución necesaria en la forma en que desarrollamos servicios de inteligencia artificial, especialmente en contextos donde los datos son sensibles o están distribuidos entre varios proveedores. Su alineación natural con el concepto de espacio de datos lo convierte en una tecnología clave para impulsar la innovación basada en la compartición de datos, teniendo en cuenta la privacidad y manteniendo la soberanía de los datos.
A medida que la regulación (como el Reglamento relativo al Espacio Europeo de Datos de Salud) y las infraestructuras de espacios de datos evolucionen, el aprendizaje federado, y otros tipos de computación federada, jugarán un papel cada vez más importante en la compartición de datos, maximizando el valor de los datos, pero sin comprometer la privacidad. Finalmente, cabe destacar que, lejos de ser innecesario, el aprendizaje federado puede convertirse en un aliado estratégico para mejorar la eficiencia, gobernanza e impacto de los ecosistemas de datos abiertos.
Jose Norberto Mazón, Catedrático de Lenguajes y Sistemas Informáticos de la Universidad de Alicante. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
La industria actual se enfrenta a uno de los mayores retos de su historia reciente. Las exigencias del mercado, la presión para cumplir objetivos climáticos, la demanda de transparencia por parte de los consumidores y la aceleración tecnológica están convergiendo en una transformación profunda del modelo de producción. Esta transformación no solo busca una mayor competitividad, sino también una producción más resiliente, flexible, eficiente y sostenible.
En este contexto, la digitalización industrial —impulsada por tecnologías como el Internet de las Cosas (IoT en sus siglas en inglés), la inteligencia artificial, el edge computing, o los sistemas ciberfísicos— está generando cantidades ingentes de datos operativos, ambientales y logísticos. Sin embargo, la mera existencia de estos datos no garantiza valor por sí misma. La clave está en gobernarlos adecuadamente, es decir, establecer principios, procesos, roles y tecnologías que aseguren que esos datos sean fiables, accesibles, útiles y seguros. En otras palabras, que los datos estén en condiciones de ser aprovechados para mejorar los procesos industriales.
Por eso, el gobierno del dato industrial se posiciona como un factor estratégico. No se trata solo de “tener datos”, sino de convertirlos en una infraestructura crítica para la toma de decisiones, la optimización de recursos, la automatización inteligente y la transición ecológica. Sin gobierno del dato, no hay industria 4.0 que valga. Y sin industria 4.0, los retos de sostenibilidad, eficiencia energética o trazabilidad completa son inabordables.
En este artículo exploramos por qué el gobierno del dato es esencial en el ámbito industrial, qué beneficios concretos aporta a los procesos productivos y cómo iniciativas como el Espacio de Datos Nacional de Industria pueden acelerar esta transformación.
A continuación, analizamos su impacto a distintos niveles, desde los casos de uso más relevantes hasta los marcos colaborativos que están emergiendo en España.
¿Por qué es clave el gobierno del dato en la industria?
Los datos industriales provienen de una multitud de fuentes distribuidas: sensores IoT, sistemas SCADA, líneas de montaje automatizadas, plataformas de mantenimiento, sistemas ERP o MES (Manufacturing Execution Systems o sistemas de ejecución de fabricación), entre otros. Esta heterogeneidad, si no se gestiona adecuadamente, puede convertirse en una barrera para la integración y el análisis útil de la información.
El gobierno del dato permite superar estas barreras estableciendo las reglas del juego para la captura, almacenamiento, calidad, interoperabilidad, uso, protección y eliminación de los datos. Esto habilita no solo la eficiencia operativa sino también la sostenibilidad a largo plazo. ¿Cómo?
- Reduciendo ineficiencias operativas: al contar con datos precisos, actualizados y bien integrados entre sistemas, se pueden automatizar tareas, evitar reprocesos, y reducir paradas no planificadas. Por ejemplo, una planta puede ajustar la velocidad de sus líneas de producción en tiempo real según el análisis de datos de rendimiento y demanda.
- Mejorando la sostenibilidad: una gestión del dato sólida permite identificar patrones de consumo energético, materiales o emisiones. Con esta información se pueden rediseñar procesos para ser más sostenibles, aplicar ecodiseño y reducir la huella ambiental. El dato, en este caso, actúa como brújula hacia la descarbonización.
- Asegurando el cumplimiento normativo y la trazabilidad: desde la ISO 9001 hasta los nuevos reglamentos de economía circular o el Pasaporte de Producto Digital, las industrias deben demostrar cumplimiento. Esto solo es posible con datos fiables, trazables y auditables.
- Facilitando la interoperabilidad entre sistemas: el gobierno del dato actúa como “pegamento” que une los distintos silos tecnológicos de una organización: calidad, producción, logística, mantenimiento, compras, etc. La normalización y alineación semántica de los datos permite flujos más ágiles y decisiones mejor fundamentadas.
- Impulsando la economía circular: gracias a la trazabilidad total del ciclo de vida de un producto, desde su diseño hasta su reciclaje, es posible identificar oportunidades de reutilización, valorización de materiales y diseño sostenible. Todo ello apoyado en datos que siguen al producto a lo largo de su vida.
¿Cómo debería ser el gobierno del dato en el entorno industrial?
Un modelo de gobierno del dato adaptado a este contexto debe incluir:
▸Roles específicos: es necesario contar con un equipo definido, donde quede clara la responsabilidad y las tareas de cada uno. Algunos de los roles que no pueden faltar son:
- Propietarios del dato (data owners): responsables del uso del dato en su área (producción, calidad, mantenimiento…).
- Gestores de calidad del dato (data stewards): velan por la consistencia, completitud y precisión de la información.
- Equipo de gobierno del dato: coordina la estrategia, define políticas comunes y evalúa el cumplimiento.
▸Procesos estructurados: al igual que los roles, es necesario definir las diversas fases y operaciones a llevar a cabo. Entre ellas se encuentran las siguientes:
- Clasificación y catalogación de activos de datos (por tipo, criticidad, uso).
- Control de calidad de datos: definición de reglas de validación, limpieza de duplicados, gestión de excepciones.
- Ciclo de vida del dato: desde su creación en máquina hasta su archivo o destrucción.
- Acceso y seguridad: gestión de privilegios, auditorías de uso, trazabilidad.
▸Políticas organizativas: para garantizar la interoperabilidad y calidad del dato es necesario contar con estándares, normas y guías que orienten a los usuarios. Algunos ejemplos son:
- Estándares de nomenclatura, formatos, codificación y sincronización.
- Normas para la interoperabilidad entre sistemas (por ejemplo, uso de estándares como OPC UA o ISA-95).
- Guías de uso ético y conforme a la legislación (como el Reglamento de Datos, GDPR o legislación medioambiental).
Este enfoque convierte el dato industrial en un activo gestionado con el mismo rigor que cualquier infraestructura física.
Casos de uso industriales habilitados por el gobierno del dato
Los beneficios del gobierno del dato en la industria se materializan en múltiples aplicaciones prácticas. Algunos de los casos de uso más representativos son:
1.Mantenimiento predictivo
Uno de los grandes clásicos de la industria 4.0. Al combinar datos históricos de mantenimiento con sensores en tiempo real, las organizaciones pueden anticipar fallos en máquinas y evitar paradas inesperadas. Pero esto solo es posible si los datos están gobernados: si se ha definido su frecuencia de captura, formato, responsables, calidad y disponibilidad.
2. Trazabilidad completa del producto
Desde la materia prima hasta el cliente final, cada evento en la cadena de valor queda registrado y es accesible. Esto es vital para sectores como la alimentación, la automoción o la farmacéutica, donde la trazabilidad es tanto un valor añadido como una obligación regulatoria. El gobierno del dato asegura que esta trazabilidad no se pierda, sea verificable y cumpla los estándares de interoperabilidad requeridos.
3. Gemelos digitales y simulación de procesos
Para que un gemelo digital —una réplica virtual de un proceso o sistema físico— funcione, necesita alimentarse de datos precisos, actualizados y coherentes. El gobierno del dato garantiza la sincronización entre el mundo físico y el virtual, y permite generar escenarios de simulación fiables, desde el diseño de una nueva línea de producción hasta la optimización del layout de fábrica, es decir, de los distintos elementos dentro de la planta.
4. Monitorización energética y control de emisiones
El seguimiento en tiempo real del consumo de energía, agua o gases puede revelar ineficiencias ocultas y oportunidades de ahorro. A través de cuadros de mando inteligentes y KPI definidos sobre datos gobernados, las plantas industriales pueden reducir sus costes y avanzar en sus objetivos de sostenibilidad ambiental.
5. Automatización y control de calidad inteligente
Los sistemas de visión artificial y algoritmos de machine learning entrenados con datos de producción permiten detectar defectos en tiempo real, ajustar parámetros automáticamente y mejorar la calidad final. Sin una buena calidad de datos (exactitud, completitud, consistencia), estos algoritmos pueden fallar o generar resultados no confiables.
El Espacio de Datos Nacional de Industria: clave para la colaboración y la competitividad
Para que el gobierno del dato industrial trascienda el ámbito de cada empresa y se convierta en una auténtica palanca de transformación sectorial, es necesario contar con infraestructuras que faciliten la compartición segura, confiable y eficiente de los datos entre organizaciones. En esta línea, se sitúa el Espacio de Datos Nacional de Industria, enmarcado dentro del Plan de Impulso de los Espacios de Datos Sectoriales promovido por el Ministerio para la Transformación Digital y de la Función Pública.
Este espacio tiene como objetivo crear un entorno de confianza donde empresas, asociaciones, centros tecnológicos y administraciones puedan compartir y reutilizar datos industriales de forma interoperable, conforme a principios éticos, legales y técnicos. A través de este marco, se busca habilitar nuevas formas de colaboración, acelerar la innovación y reforzar la autonomía estratégica del tejido productivo nacional.
El sector industrial en España es enormemente diverso, con un ecosistema compuesto por grandes corporaciones, pymes, proveedores, subcontratas, clústeres y centros de I+D. Esta diversidad puede convertirse en una fortaleza si se articula mediante una infraestructura común de datos que facilite la integración y el intercambio de información de forma ordenada y segura. Además, estos datos industriales pueden verse complementados con los datos abiertos publicados por organismos públicos, como los disponibles en el Catálogo Nacional de Datos Abiertos, ampliando así el valor y las posibilidades de reutilización para el conjunto del sector.
Los puntos fuertes de esta infraestructura común permiten:
- Detectar sinergias a lo largo de la cadena de valor, como oportunidades de reciclaje industrial entre sectores distintos (por ejemplo, residuos plásticos de una industria química como materia prima en otra).
- Reducir barreras de entrada a la digitalización, especialmente para pymes que no cuentan con recursos propios para desplegar soluciones avanzadas de análisis de datos, pero sí podrían acceder a servicios o datos compartidos dentro del espacio.
- Fomentar modelos de innovación abierta donde empresas compartan datos de forma controlada para el desarrollo conjunto de soluciones basadas en inteligencia artificial o mantenimiento predictivo.
- Impulsar indicadores agregados sectoriales, como huellas de carbono compartidas, niveles de eficiencia energética o índices de circularidad industrial, que permiten al conjunto del país avanzar de forma más coordinada en los objetivos de sostenibilidad y competitividad.
La creación del Espacio de Datos Nacional de Industria puede suponer una auténtica palanca de modernización para el tejido industrial español:
- Mayor competitividad internacional, al facilitar el cumplimiento con los requisitos del mercado europeo, como el Reglamento de Datos, el Pasaporte de Producto Digital o los estándares de sostenibilidad.
- Agilidad regulatoria y trazabilidad mejorada, permitiendo a las industrias responder con rapidez a auditorías, certificaciones o cambios normativos.
- Capacidad de anticipación, gracias al análisis conjunto de datos de producción, consumo o mercado que permiten prever disrupciones en las cadenas de suministro o la demanda de recursos críticos.
- Creación de nuevos modelos de negocio, basados en la puesta a disposición de productos como servicio, la reutilización de materiales o el alquiler compartido de capacidades industriales.
El despliegue de este espacio nacional no solo busca mejorar la eficiencia de procesos industriales. También aspira a reforzar la soberanía tecnológica y de datos del país, habilitando un modelo donde el valor generado por los datos se quede en las propias empresas, regiones y sectores. En este sentido, el Espacio de Datos Nacional de Industria se alinea con iniciativas europeas como GAIA-X o Manufacturing-X, pero con un enfoque adaptado al contexto y necesidades del ecosistema industrial español.
Conclusiones
El gobierno del dato es un pilar fundamental para que la industria avance hacia modelos más eficientes, sostenibles y resilientes. No basta con disponer de grandes volúmenes de información: es necesario gestionarla correctamente para generar valor real.
Los beneficios son claros: optimización operativa, mejora de la trazabilidad, impulso a la economía circular y soporte a tecnologías como la inteligencia artificial o los gemelos digitales. Pero el verdadero salto se da cuando los datos dejan de gestionarse de forma aislada y pasan a formar parte de un ecosistema compartido.
El Espacio de Datos Nacional de Industria ofrece ese marco de colaboración y confianza, facilitando la innovación, la competitividad y la soberanía tecnológica. Apostar por su desarrollo es invertir en una industria más conectada, inteligente y preparada para los retos del futuro.
Contenido elaborado por Dr. Fernando Gualo, Profesor en UCLM y Consultor de Gobierno y Calidad de datos. El contenido y el punto de vista reflejado en esta publicación es responsabilidad exclusiva de su autor.
Con 24 lenguas oficiales y más de 60 lenguas regionales y minoritarias, la Unión Europea se enorgullece de su diversidad cultural y lingüística. Sin embargo, esta riqueza representa también un desafío significativo en el ámbito digital y tecnológico. Los avances en inteligencia artificial (IA) y procesamiento del lenguaje natural han estado dominados por el inglés, creando un desequilibrio notable en la disponibilidad de recursos lingüísticos para la mayoría de los idiomas europeos.
Este desequilibrio tiene consecuencias directas, como, por ejemplo:
- Desarrollo tecnológico asimétrico: las empresas e investigadores tienen dificultades para crear soluciones de IA adaptadas a determinados idiomas porque los recursos son limitados.
- Dependencia tecnológica: Europa corre el riesgo de depender de soluciones lingüísticas desarrolladas fuera de su contexto cultural y normativo.
Resolver esta brecha no solo es una cuestión de inclusión, sino que también representa una oportunidad económica de gran escala, capaz de generar enormes beneficios tanto en comercio como en innovación tecnológica. Para abordar estos desafíos, la Comisión Europea ha lanzado el European Language Data Space (LDS), una infraestructura descentralizada que promueve el intercambio seguro y controlado de datos lingüísticos entre múltiples actores del ecosistema europeo.
A diferencia de un simple repositorio centralizado, el LDS funciona como un mercado de datos lingüísticos que permite a los participantes compartir, vender o licenciar sus datos bajo condiciones claramente definidas y con control total sobre el uso de los mismos.
El European Language Data Space (LDS, por sus siglas en inglés), con una versión beta operativa, representa un paso decisivo para democratizar las tecnologías del lenguaje en todos los idiomas de la Unión Europea. Te contamos las claves sobre este proyecto y los próximos pasos.
¿Cómo funciona esta plataforma?
El LDS se basa en una arquitectura descentralizada peer-to-peer (P2P) que permite a los usuarios interactuar directamente entre sí, sin necesidad de un servidor central o autoridad única, donde cada participante mantiene el control de sus propios datos. Los elementos clave del funcionamiento de LDS son:
1. Arquitectura descentralizada y soberana
-
Cada participante (ya sea proveedor o consumidor de datos) puede instalar localmente el LDS Connector, un software que permite interactuar directamente con otros participantes sin necesidad de un servidor central. Este enfoque garantiza:
-
Soberanía de datos: los propietarios mantienen control absoluto sobre quién puede acceder a sus datos y qué condiciones de uso.
-
Confianza y seguridad: solo los participantes, entidades jurídicas inscritas en la UE, que cumplan los requisitos y sean autorizados pueden formar parte del ecosistema.
- Interoperabilidad: es compatible con otros espacios de datos europeos, siguiendo estándares comunes.
2. Flujo de intercambio de datos
El proceso de intercambio sigue un flujo estructurado entre dos actores principales:
-
Los proveedores describen sus conjuntos de datos lingüísticos, establecen políticas de acceso (licencias, precios) y publican estas ofertas en el catálogo.
- Los consumidores exploran el catálogo, identifican recursos de interés y, a través de sus conectores, inician negociaciones sobre los términos de uso.
Si ambas partes llegan a un acuerdo, se establece un contrato y se efectúa la transferencia de datos de forma segura entre los conectores.
3. Infraestructura de apoyo
Aunque el intercambio es descentralizado, el LDS incluye elementos de apoyo como:
-
Registro de participantes: garantiza que solo entidades verificadas participen en el ecosistema.
-
Catálogo opcional: facilita la publicación y descubrimiento de recursos disponibles
-
Hub de vocabularios: es un servicio que centraliza los vocabularios controlados, y permite mantener las listas de valores, definiciones, relaciones entre términos, mapeadores entre listas, etc.
- Servicio de monitorización: permite supervisar el funcionamiento general del sistema.
Valor añadido para el ecosistema europeo de datos
El LDS aporta beneficios significativos al panorama digital europeo:
-
Impulso de la IA multilingüe
Al facilitar el acceso a datos lingüísticos de calidad en todos los idiomas europeos, el LDS contribuye directamente al desarrollo de modelos de IA más inclusivos y adaptados a la realidad multilingüe de Europa. Esto resulta especialmente relevante en un momento en que los grandes modelos de lenguaje (LLM) están transformando la interacción entre humanos y máquinas.
-
Fortalecimiento de la economía de datos
Se estima que una verdadera integración lingüística digital podría generar enormes beneficios económicos tanto en comercio como en innovación tecnológica. El LDS crea un mercado donde los datos lingüísticos adquieren valor, incentivando su recopilación, procesamiento y puesta a disposición bajo condiciones justas y transparentes.
-
Preservación de la diversidad lingüística
Al promover el desarrollo tecnológico en todas las lenguas europeas, el LDS contribuye a preservar y revitalizar el patrimonio lingüístico del continente, garantizando que ningún idioma quede rezagado en la revolución digital.
-
El papel crucial de la industria y las administraciones públicas
El éxito del LDS depende fundamentalmente de la participación activa de diversos actores:
-
Datos frescos y de calidad
La plataforma busca atraer especialmente datos "frescos" provenientes de la industria (medios de comunicación, editoriales, servicios al cliente) y del sector público, necesarios para entrenar y mejorar los modelos de lenguaje actuales. Se valoran particularmente:
-
Datos multimodales (texto, audio, vídeo).
-
Contenidos específicos de diversos dominios profesionales.
- Recursos lingüísticos actualizados y relevantes.
-
Participación abierta a todos los actores del ecosistema
El LDS está diseñado para ser inclusivo, permitiendo que tanto organizaciones privadas como entidades públicas participen, siempre que sean entidades jurídicas inscritas en la UE. Ambos tipos de organizaciones pueden actuar como proveedores y/o consumidores de datos.
La participación se formaliza mediante un proceso de validación por parte de la junta de gobernanza, garantizando que todas las organizaciones que cumplan con los requisitos puedan beneficiarse de este mercado común de datos lingüísticos.
¿Cómo participar?
La versión beta del LDS ya está operativa y abierta a nuevos participantes. Las organizaciones interesadas en formar parte de esta iniciativa pueden:
-
Unirse a los grupos de prueba y enfoque: para contribuir al desarrollo y mejora de la plataforma, aquí.
-
Probar el conector LDS: experimentando con la tecnología en entornos controlados.
-
Aportar feedback técnico: ayudando a definir aspectos clave como metadatos, licencias o mecanismos de intercambio.
- Identificar datos relevantes: evaluando qué recursos lingüísticos podrían compartirse a través de la plataforma.
El futuro del LDS
Aunque actualmente el LDS se centra en el intercambio de datos, su visión a medio plazo contempla la posibilidad de integrar servicios lingüísticos y alojamiento de modelos de IA dentro del mismo ecosistema, reforzando así el papel de Europa en el desarrollo de tecnologías del lenguaje. En julio de este año, 2025, se espera poder contar con una versión pre-final y la versión finalizada de LDS está prevista para enero de 2026.
Todos estos aspectos fueron comentados en seminario online y gratuito que celebró el portal de datos abiertos europeo “Data spaces: experience from the European Language Data Space”. Puedes volver a ver el webinar aquí.
En un contexto global donde la soberanía tecnológica se ha convertido en prioridad estratégica, el European Language Data Space representa un paso decisivo para garantizar que la revolución de la IA no deje atrás la riqueza lingüística que caracteriza a Europa.
El acceso a datos financieros y bancarios está revolucionando el sector, promoviendo la transparencia, la inclusión financiera y la innovación en servicios económicos. Sin embargo, la gestión de estos datos enfrenta desafíos normativos que buscan equilibrar apertura con seguridad y privacidad.
Por ese motivo, existen distintas formas de acceder a este tipo de datos, como veremos a continuación.
Open Banking y Open Finance versus Open Data
Estos términos, aunque relacionados, tienen diferencias importantes.
El termino Open Banking hace referencia a un sistema que permite a los bancos y otras instituciones financieras compartir de forma digital y segura los datos financieros de los clientes con terceros. Para ello es necesario que los clientes aprueben expresamente las condiciones de compartición de los datos. Este consentimiento puede ser cancelado en cualquier momento según los deseos del cliente.
Open Finance, por su parte, es una evolución de Open Banking que abarca un rango más amplio de productos y servicios financieros. Cuando hablamos de Open Finance, además de los datos bancarios, se incluyen datos sobre seguros, pensiones, inversiones y otros servicios financieros.
Tanto en el Open Banking como en el Open Finance, los datos no son abiertos (Open Data), sino que solo pueden acceder a ellos aquellos autorizados previamente por el cliente. El intercambio de datos se realiza a través de una interfaz de programación de aplicaciones o API (en sus siglas en inglés), que garantiza la agilidad y seguridad del proceso. Todo ello está regulado por la directiva europea sobre servicios de pago en el mercado interior (conocida como PSD2), aunque desde la Comisión Europea se está trabajando en la actualización del marco normativo.
-
Aplicaciones del Open Banking y el Open Finance:
El propósito de estas actividades es dar acceso a nuevos servicios basados en la información compartida. Por ejemplo, facilitan la creación de apps que unifiquen el acceso a todas las cuentas bancarias de un cliente, aunque sean de diferentes proveedores. Esto mejora la gestión y control de los ingresos y gastos al proporcionar una visión general en un único entorno.
Otro ejemplo de uso es que permiten a proveedores consultar información cruzada de forma más rápida. Por ejemplo, al permitir el acceso a los datos financieros de un cliente, un concesionario podría proporcionar información sobre las opciones de financiación más rápidamente.
Plataformas de datos abiertos sobre banca
Aunque los datos bancarios privados, como todos los tipos de datos personales, están estrictamente regulados y no pueden publicarse abiertamente debido a normativas de protección de la privacidad, sí existen conjuntos de datos financieros que pueden compartirse libremente. Por ejemplo, información agregada sobre tasas de interés, indicadores económicos, datos históricos de mercados bursátiles, tendencias de inversión y estadísticas macroeconómicas, que son accesibles a través de fuentes abiertas.
Estos datos, además de impulsar la transparencia y confianza en los mercados, pueden utilizarse para monitorear tendencias económicas, prevenir fraudes y mejorar la gestión de riesgos a nivel global. Además, empresas fintech, desarrolladores y emprendedores pueden aprovecharlos para crear soluciones como herramientas de análisis financiero, sistemas de pago digitales o de asesoramiento automatizado.
Veamos algunos ejemplos de espacios donde obtener datos abiertos sobre el sector bancario y financiero.
Fuentes internacionales
Algunas de las fuentes internacionales más populares son:
-
Banco Central Europeo: ofrece estadísticas y datos sobre mercados financieros de la zona euro, a través de diversas plataformas. Entre otra información, los usuarios pueden descargar conjuntos de datos sobre la inflación, los tipos de interés bancarios, la balanza de pagos, las finanzas públicas, etc.
-
Banco Mundial: facilita el acceso a datos económicos globales sobre desarrollo financiero, pobreza y crecimiento económico.
-
Fondo Monetario Internacional: proporciona un acceso simplificado a datos macroeconómicos y financieros, como las perspectivas de la economía mundial o regional. También ofrece en abierto los datos de informes como su Fiscal Monitor, donde se analiza la evolución más reciente de las finanzas públicas.
-
Federal Reserve Economic Data (FRED): se centra en información económica de los Estados Unidos, incluyendo indicadores de mercado y tasas de interés. Este repositorio está creado y mantenido por el Departamento de Investigación del Banco de la Reserva Federal de St.Louis.
Fuentes nacionales
A través del Catálogo Nacional de datos abiertos de datos.gob.es se puede acceder a una gran cantidad de conjuntos de datos relacionados con la economía. Uno de los publicadores más destacado es el Instituto Nacional de Estadística (INE), que ofrece datos sobre impagos por entidad financiera, hipotecas, etc.
Además, el Banco de España ofrece distintos productos para aquellos interesados en los datos económicos del país:
- Estadísticas: el Banco de España recopila, elabora y publica un amplio conjunto de estadísticas económicas y financieras. Incluye información sobre tipos de interés y de cambio, cuentas financieras de los sectores institucionales, balanzas de pago e incluso encuestas financieras a las familias, entre otros.
- Cuadro de mando: el Banco de España también ha puesto a disposición de la ciudadanía un visor interactivo que permite consumir datos trimestrales y anuales sobre estadísticas exteriores de una manera más sencilla.
Además, Banco de España ha habilitado una sala segura para que los investigadores puedan acceder a datos valiosos, pero que no pueden abrirse al gran público por su naturaleza. En este sentido encontramos:
- BELab: el laboratorio de datos protegidos gestionado por el Banco de España, que ofrece acceso in situ (Madrid) y en remoto. Estos datos han sido utilizados en diversos proyectos.
- ES_DataLab: laboratorio de microdatos restringido para investigadores que desarrollan proyectos con fines científicos y de interés público. En este caso, agrupa microdatos de diversos organismos, incluyendo el Banco de España.
Los espacios de datos: una oportunidad para el intercambio seguro y controlado de datos financieros
Como acabamos de ver, también existen opciones para facilitar el acceso a datos financieros y bancarios, de una forma controlada y segura. Es aquí donde entran en juego los espacios de datos, ecosistema donde diversos actores comparten datos de manera voluntaria y segura, siguiendo mecanismos comunes de gobernanza, normativos y técnicos.
En este sentido, Europa está impulsando un Espacio Europeo de Datos Financieros (EEDF), una iniciativa clave dentro de la Estrategia Europea de Datos. El EEDF se compone de tres pilares fundamentales:
- Datos de informes públicos (“divulgaciones públicas”): recoge datos de informes financieros (balances, ingresos, estado de resultados), que las empresas financieras están obligadas por ley a divulgar de forma periódica. En este ámbito está la iniciativa de Punto de acceso Único Europeo (ESAP), una plataforma centralizada para acceder a datos de más de 200 informes públicos de más de 150,000 empresas.
- Datos privados de los clientes de los proveedores de servicios financieros: abarca aquellos datos que tienen los proveedores de servicios financieros como los bancos. En este ámbito está el marco para el acceso a los datos financieros, que cubre datos como inversiones, seguros, pensiones, préstamos y ahorros.
- Datos de los informes de supervisión: para este tipo de datos se ha de tener en cuenta la estrategia de supervisión, que abarca datos desde diferentes sectores (bancos, seguros, fondos de pensiones…) con el fin de promover la transformación digital en el sector financiero.
En conclusión, el acceso a datos financieros y bancarios está evolucionando significativamente gracias a diversas iniciativas que han permitido una mayor transparencia y que fomentarán el desarrollo de nuevos servicios, al tiempo que garantizan la seguridad y privacidad de los datos compartidos. El futuro del sector financiero estará condicionado por la capacidad de las instituciones y reguladores para fomentar ecosistemas de datos que impulsen la innovación y la confianza en el mercado.
Un Destino Turístico Inteligente (DTI) se fundamenta en un modelo de gestión basado en la innovación y el uso de tecnología avanzada para optimizar la experiencia del visitante y mejorar la sostenibilidad del destino, a la vez que se fortalece la calidad de vida de los residentes. El modelo DTI se basa en una serie de indicadores que permiten analizar el estado del destino turístico, diagnosticar áreas de mejora y desarrollar planes de acción estratégicos. Este enfoque, promovido por SEGITTUR (Sociedad Estatal para la Gestión de la Innovación y las Tecnologías Turísticas) y otras entidades públicas autonómicas (por ejemplo, el modelo DTI-CV de la Comunitat Valenciana definido por INVATTUR – Instituto Valenciano de Tecnologías Turísticas), se ha consolidado como un pilar clave en la transformación digital del turismo. Este uso intensivo de tecnologías en los DTI los ha transformado en verdaderos centros generadores de datos, los cuales -combinados con fuentes externas- pueden ser utilizados para optimizar la toma de decisiones y mejorar la gestión del destino.
Procedencia de los datos en un DTI y su uso
En un DTI, los datos se generan básicamente a partir de dos ámbitos principales:
- Datos generados por visitantes o turistas: estos crean una huella digital a medida que interactúan con diferentes tecnologías. Esta huella incluye comentarios, valoraciones, imágenes, registros de gasto, ubicaciones y preferencias, que quedan reflejados en aplicaciones móviles, redes sociales o plataformas de reservas. Además, se generan datos de manera pasiva a través de sistemas de pago electrónico o de movilidad urbana, así como dispositivos de medición de afluencia, entre otros.
- Datos generados por el destino turístico: gracias a la sensorización e implementación de redes IoT (Internet of Things o Internet de las cosas), los destinos recopilan información en tiempo real sobre gestión del tráfico, consumo energético, calidad ambiental y uso de servicios (públicos o privados). Además, el destino genera datos esenciales sobre su oferta turística, tales como listados actualizados de alojamientos o establecimientos de hostelería, lugares o eventos de interés turístico y servicios complementarios.
La combinación de estas fuentes de datos en una Plataforma Inteligente de Destinos (PID) como la propuesta por SEGITTUR, permite a los DTI utilizarlos para facilitar una gestión más innovadora y orientada a la mejora de la experiencia.
Título: Ámbitos de generación de datos en un DTI
Fuente: elaboración propia
Existen numerosos ejemplos y buenas prácticas en el uso de estos datos turísticos, implementados por diversos destinos europeos, cuya descripción se documenta en el informe Study on mastering data for tourism by EU destinations. Este informe proporciona una visión detallada sobre las oportunidades que el uso de datos ofrece para mejorar la competitividad del ecosistema turístico. Además, este informe no obvia la importancia de los destinos turísticos como generadores de datos, formulando una serie de recomendaciones para las Administraciones públicas, entre las que destaca el desarrollo de un plan de gestión de datos transversal -es decir, que involucre no solo al área de turismo, sino también a otras como urbanismo y medio ambiente-, garantizando un enfoque integral. Este plan debe impulsar la disponibilidad de datos abiertos, con especial atención a aquellos relacionados con sostenibilidad, accesibilidad y oferta turística especializada.
Modelos de destino turístico inteligente y datos abiertos
En el modelo DTI de SEGITTUR (descrito recientemente en su guía práctica) se establece como requisito la creación de un portal de datos abiertos en los destinos turísticos para facilitar la publicación de datos en el lugar donde se lleva a cabo la actividad turística y su acceso en formatos reutilizables, posibilitando el desarrollo de distintos productos y servicios. No se establecen temáticas específicas, pero se resaltan datos de interés como transporte público, comercios, ofertas de empleo, agenda cultural o sensores ambientales. Resulta interesante la definición de indicadores para evaluar la calidad del portal como la conformidad con los estándares de datos abiertos, la existencia de sistemas para automatizar la publicación de datos o el número de conjuntos de datos disponibles por cada 100.000 habitantes. También se indica que se deben incorporar de manera progresiva nuevos conjuntos de datos a medida que se identifique su utilidad.
Cabe destacar que en otros modelos DTI, como el modelo DTI-CV de INVATTUR anteriormente mencionado, se propone igualmente que los destinos dispongan un portal de datos abiertos en turismo con el fin de fomentar la innovación turística.
Datos turísticos de alto valor
La Unión Europea, a través de la Directiva (UE) 2019/1024 relativa a los datos abiertos y la reutilización de la información del sector público y el Reglamento de ejecución (UE) 2023/138, ha definido conjuntos de datos de alto valor en diversas áreas, incluyendo el turismo dentro de la categoría de datos estadísticos. Se trata de datos sobre flujos turísticos en Europa:
- Pernoctaciones en establecimientos de alojamiento turístico, a nivel nacional, a nivel NUTS 2 (comunidades y ciudades autónomas), nivel NUTS 3 (provincias) y para algunas ciudades específicas.
- Llegada y salida de turistas, gasto turístico, ocupación hotelera, demanda de servicios turísticos, a nivel nacional.
Es interesante resaltar que estos y otros datos se han recogido en Dataestur, la plataforma de datos del turismo en España. Dataestur organiza sus datos en diversas categorías:
- Viajes y ocio: estadísticas sobre la llegada de turistas, valoración de atracciones, visitas a museos y gasto en actividades recreativas.
- Economía: datos sobre empleo en el sector turístico, empresas activas y gasto de los visitantes internacionales.
- Transporte: datos sobre movilidad, incluyendo tráfico aéreo, transporte en autobús y tren, carreteras y puertos.
- Alojamientos: información sobre ocupación hotelera, turismo rural, campings y viviendas turísticas, además de precios, rentabilidad y satisfacción hotelera.
- Sostenibilidad: indicadores sobre calidad del aire, agua y conservación de la naturaleza en destinos turísticos.
- Conocimiento: análisis sobre percepción del visitante, seguridad, conectividad digital, estudios e informes turísticos.
La mayoría de estos datos se recopilan a nivel provincial (NUTS 3), por lo que no se publican a nivel de destino turístico. En este sentido, la Federación Española de Municipios y Provincias (FEMP) propone 80 conjuntos de datos a publicar en abierto por la Administración local que, además, tienen en cuenta los datos de alto valor, aterrizándolos al ámbito local. De entre todos estos conjuntos de datos, se definen explícitamente los siguientes como datos dentro de la categoría de turismo: agenda cultural, alojamientos turísticos, censo de locales comerciales y de ocio, flujos turísticos, lugares de interés turístico y monumentos.
Barreras y oportunidades en la publicación de datos abiertos por parte de los DTI
Después de analizar el estado actual de la gestión de datos en el ámbito turístico, se plantean una serie de oportunidades para los destinos turísticos como generadores de datos abiertos:
- Disposición de datos para su consumo interno: los datos turísticos abarcan múltiples temáticas y se generan en diferentes departamentos dentro de la Administración local, como turismo, urbanismo, movilidad, medio ambiente o economía. Ante este escenario de diversidad de fuentes y responsables, trabajar en la publicación de datos en formatos reutilizables no solo facilita su reutilización por agentes externos, sino que también optimiza su uso dentro de la propia Administración local, permitiendo una gestión más eficiente y basada en datos.
- Fomento de la innovación en turismo: los datos abiertos procedentes de destinos turísticos son una excelente materia prima sobre la cual desarrollar productos y servicios inteligentes de valor añadido para el sector. Esto facilita la colaboración público-privada, promoviendo la creación de una industria tecnológica en torno a los destinos turísticos y los datos abiertos que generan.
- Facilitar la participación de destinos turísticos en espacios de datos: la publicación de datos abiertos permite a los entes gestores de los destinos turísticos incorporarse a espacios de datos de manera más sólida. Por una parte, disponer de datos abiertos facilita la interoperabilidad entre actores del sector. Por otra parte, iniciativas de datos abiertos turísticos incrementan la cultura del dato en los destinos turísticos, impulsando la percepción de la utilidad de una gestión turística basada en datos.
A pesar de estas claras oportunidades, existen diversas barreras que dificultan que los destinos turísticos publiquen datos en formato abierto de manera efectiva:
- Necesidad de presupuesto y recursos técnicos suficientes: la publicación de datos abiertos requiere inversiones en plataformas tecnológicas y en la capacitación de equipos especializados. Esto es más importante, si cabe, en el ámbito turístico donde los datos son heterogéneos, de una diversidad amplia de temáticas y están fragmentados, lo que requiere esfuerzos adicionales en su recopilación, estandarización y publicación coordinada.
- Predominio de pequeñas empresas en destinos turísticos: es preciso dotar de apoyo a las empresas turísticas con el fin de que puedan incorporar el uso de datos abiertos del destino, así como el desarrollo de soluciones basadas en estos datos adaptadas a las necesidades del destino.
- Desconocimiento sobre la utilidad de los datos abiertos: se corre el riesgo de que los datos abiertos sean vistos como una tendencia más que como un recurso estratégico que posibilita beneficios tangibles. En este sentido, los datos se perciben como un recurso interno en lugar de activos que pueden ser compartidos para multiplicar su valor. Falta una mayor difusión de referentes claros y ejemplos de impacto de reutilización de datos abiertos en destinos turísticos que permita profundizar en la incorporación de una cultura del dato a nivel de destino turístico.
- Dificultad en la operacionalización de estrategias de datos: los destinos turísticos han incorporado la publicación de datos abiertos en sus planes estratégicos, pero es necesario su impulso para su implementación efectiva. Una de las cuestiones clave en este sentido es el temor a la pérdida de ventaja competitiva, debido que la publicación de datos abiertos relacionados con la actividad turística de un destino podría reducir su diferenciación frente a otros. Otra preocupación se refiere a los aspectos legales y de protección de datos personales, especialmente en áreas como la movilidad y el consumo turístico.
Conclusiones: el futuro de los datos abiertos en los modelos de DTI
En relación a la gestión de datos, es necesario abordar aspectos que aún no están suficientemente desarrollados en los modelos DTI, como el intercambio de datos en el destino, en lugar de la mera compra de información; la integración transversal de datos a escala local, permitiendo el cruce de información de diferentes áreas (urbanismo, medio ambiente, turismo, etc.); la obtención de un mayor nivel de detalle en los datos, tanto en términos temporales (eventos específicos) como espaciales (zonas o puntos de interés dentro de los destinos), salvaguardando la privacidad; y el desarrollo de una estrategia efectiva de datos abiertos.
Poniendo el foco en este último punto, las estrategias de DTI deben incluir la publicación de datos abiertos. Para ello, es prioritario definir un plan de gestión de datos que permita determinar a cada destino qué datos se producen, cómo se pueden compartir y bajo qué condiciones, garantizando que la apertura de datos no afecte negativamente a la competitividad del destino ni entre en conflicto con la legislación vigente en materia de protección de datos y privacidad.
Una herramienta clave en este proceso es la definición de un catálogo, que permita organizar, priorizar y clasificar los datos disponibles (y sus metadatos) según su valor y utilidad para los diferentes actores del ecosistema turístico. Este catálogo debe permitir que los datos de los DTI cumplan los principios FAIR (Findable, Accessible, Interoperable, Reusable), facilitando su publicación en abierto o permitiendo su integración en espacios de datos (como el espacio de datos europeo de turismo desarrollado en el proyecto DeployTour). En este contexto, cada conjunto de datos identificado y catalogado debería tener dos versiones:
- Una versión abierta, accesible para cualquier usuario y en un formato reutilizable, con una licencia sin restricciones (es decir, un conjunto de datos abiertos).
- Una versión que permita acuerdos específicos para su uso en espacios de datos, donde se mantenga la soberanía y control del destino, estableciendo restricciones de acceso y condiciones de uso.
Independientemente del enfoque adoptado, todos los datos publicados deben cumplir con los principios FAIR, garantizando que sean localizables, accesibles, interoperables y reutilizables, promoviendo su aprovechamiento tanto en el sector público como privado y facilitando el desarrollo de soluciones innovadoras basadas en datos en el ámbito del turismo.
Jose Norberto Mazón, Catedrático de Lenguajes y Sistemas Informáticos de la Universidad de Alicante. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El Pacto Verde Europeo (Green Deal) es la estrategia de crecimiento sostenible de la Unión Europea (UE), diseñada para impulsar una transición ecológica que transforme a Europa en una sociedad justa y próspera, con una economía moderna y competitiva. Dentro de esta estrategia, destacan iniciativas como Objetivo 55 (Fit for 55), que busca reducir las emisiones de la UE en al menos un 55% para 2030, y el Reglamento sobre la Restauración de la Naturaleza (Nature Restoration Regulation), que establece objetivos vinculantes para recuperar ecosistemas, hábitats y especies.
Por otro lado, la Estrategia Europea de Datos (European Data Strategy) posiciona a la UE como líder en economías basadas en datos, promoviendo valores fundamentales como la privacidad y la sostenibilidad. Esta estrategia contempla la creación de espacios de datos sectoriales para fomentar la disponibilidad y compartición de datos, promoviendo su reutilización en beneficio de la sociedad y diversos sectores, entre los que se encuentra el medio ambiente.
En este artículo, se analiza cómo los espacios de datos medioambientales, impulsados por la Estrategia Europea de Datos, desempeñan un papel fundamental en el logro de los objetivos del Pacto Verde Europeo, fomentando el uso innovador y colaborativo de datos.
Espacio de datos del Pacto Verde desde la Estrategia Europea de Datos
En este contexto, la UE impulsa el espacio de datos del Pacto Verde (Green Deal Data Space), diseñado con el fin de apoyar los objetivos del Pacto Verde mediante el uso de datos. Este espacio de datos permitirá compartir datos y utilizar todo su potencial para afrontar desafíos ambientales clave en varios ámbitos: la preservación de la biodiversidad, la gestión sostenible del agua, la lucha contra el cambio climático y el uso eficiente de los recursos naturales, entre otros.
En este sentido, la Estrategia Europea de Datos destaca dos iniciativas:
- Por un lado, la iniciativa GreenData4all que lleva a cabo una actualización de la directiva INSPIRE para permitir un mayor intercambio de datos geoespaciales medioambientales entre los sectores público y privado, y su reutilización efectiva, incluyendo el acceso abierto a la ciudadanía en general.
- Por otro lado, el proyecto Destination Earth que propone la creación de un gemelo digital de la Tierra, mediante el uso, entre otros, de datos satelitales, lo que permitirá simular escenarios relacionados con el cambio climático, la gestión de recursos naturales y la prevención de desastres naturales.
Acciones preparatorias para el desarrollo del espacio de datos del Pacto Verde
Dentro de su estrategia de financiación de acciones preparatorias para el desarrollo de espacios de datos, la UE financia el proyecto GREAT (The Green Deal Data Space Foundation and its Community of Practice). Este proyecto se centra en sentar las bases para el desarrollo del espacio de datos del Pacto Verde mediante tres casos de uso estratégicos: mitigación y adaptación al cambio climático, polución cero y biodiversidad. Un aspecto clave de GREAT es la identificación y definición de un conjunto prioritario de datos medioambientales de alto valor (conjunto mínimo pero ampliable). Este enfoque conecta directamente este proyecto con el concepto de datos de alto valor definido en la Directiva Europea sobre datos abiertos (es decir, aquellos cuya reutilización genera no solo un impacto económico positivo, sino también beneficios sociales y medioambientales). Dentro de los datos de alto valor definidos en el Reglamento de Ejecución destacan los datos relacionados con la observación de la Tierra y el medio ambiente, que incluyen aquellos obtenidos por satélites, sensores terrestres y datos in situ. Estos conjuntos abarcan temas como calidad del aire, clima, emisiones, biodiversidad, ruido, residuos y agua, todos ellos relacionados con el Pacto Verde Europeo.
Aspectos diferenciadores del espacio de datos del Pacto Verde
Llegados a este punto, se pueden destacar tres aspectos diferenciadores del espacio de datos del Pacto Verde.
- En primer lugar, su naturaleza claramente multisectorial exige la consideración de datos procedentes de una amplia variedad de ámbitos, cada uno con sus propios marcos normativos y modelos específicos.
- En segundo lugar, su desarrollo está profundamente vinculado al territorio, lo que implica la necesidad de adoptar un enfoque ascendente (bottom-up) que parta de escenarios concretos y locales.
- Por último, incluye datos de alto valor, lo que resalta la importancia de una implicación activa por parte de las administraciones públicas, además de la colaboración del sector privado y el tercer sector para garantizar su éxito y sostenibilidad.
Por ello, el potencial de los datos medioambientales aumentará significativamente a través de espacios de datos europeos multisectoriales, territorializados y con una gran implicación del sector público.
Desarrollo de espacios de datos medioambientales en el programa HORIZON
Con el fin de desarrollar espacios de datos medioambientales teniendo en cuenta las consideraciones anteriores, tanto de la Estrategia Europea del Dato como de las acciones preparatorias dentro del programa Horizonte Europa (HORIZON), la UE financia cuatro proyectos:
- Urban Data Spaces for Green dEal (USAGE). Este proyecto desarrolla soluciones para garantizar que los datos ambientales a nivel local sean útiles para mitigar los efectos del cambio climático. Esto incluye el desarrollo de mecanismos para hacer que las ciudades generen datos que cumplan los principios FAIR (Findable, Accessible, Interoperable, Reusable) permitiendo su uso para tomar decisiones informadas en el ámbito medioambiental.
- All Data for Green Deal (AD4GD). Este proyecto tiene como objetivo proponer un conjunto de mecanismos para asegurar que los datos de biodiversidad, calidad del agua y calidad del aire cumplan los principios FAIR. Consideran datos de diversas fuentes (teledetección por satélite, redes de observación in situ, sensores conectados a través de IoT, ciencia ciudadana o datos socioeconómicos).
- F.A.I.R. information cube (FAIRiCUBE). El propósito de este proyecto es crear una plataforma que permita la reutilización de datos de biodiversidad y climáticos a través del uso de técnicas de aprendizaje automático. El objetivo es permitir a instituciones públicas que actualmente no tienen fácil acceso a estos recursos que puedan mejorar sus políticas medioambientales y una toma de decisiones basadas en la evidencia (por ejemplo, para la adaptación de ciudades al cambio climático).
- Biodiversity Building Blocks for Policy (B-Cubed). Este proyecto pretende transformar la monitorización de la biodiversidad en un proceso ágil y que genere datos más interoperables. Se consideran datos sobre biodiversidad procedentes de distintas fuentes, como ciencia ciudadana, museos, herbarios o investigaciones; así como su consumo a través de modelos de inteligencia de negocio, como cubos OLAP, para una toma de decisiones informada en la generación de políticas públicas adecuadas para contrarrestar la crisis mundial de la biodiversidad.
Espacios de datos medioambientales y datos de investigación
Finalmente, una fuente de datos que puede desempeñar un papel crucial en el logro de los objetivos del Pacto Verde Europeo son los datos científicos que emanan de resultados de investigación. En este contexto, la iniciativa European Open Science Cloud (EOSC) de la Unión Europea se presenta como una herramienta esencial. EOSC es una infraestructura digital abierta y federada diseñada para proporcionar a la comunidad científica europea acceso a datos y servicios científicos de alta calidad, es decir, un verdadero espacio de datos de investigación. Esta iniciativa busca facilitar la interoperabilidad y el intercambio de datos en todos los campos de la investigación promoviendo la adopción de principios FAIR, por lo que su federación con el espacio de datos del Pacto Verde resulta fundamental.
Conclusiones
Los datos medioambientales son clave para cumplir los objetivos del Pacto Verde Europeo. Para fomentar la disponibilidad y compartición de estos datos, promoviendo su reutilización, la UE está desarrollando una serie de proyectos de espacios de datos medioambientales. Una vez puestos en marcha, estos espacios de datos facilitarán una gestión más eficiente y sostenible de los recursos naturales, mediante una colaboración activa entre todos los actores involucrados (tanto públicos como privados), que impulse la transición ecológica en Europa.
Jose Norberto Mazón, Catedrático de Lenguajes y Sistemas Informáticos de la Universidad de Alicante. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El Ministerio para la Transformación Digital y de la Función Pública, el pasado 17 de diciembre, anunció la publicación de la convocatoria de productos y servicios para espacios de datos, una iniciativa que busca impulsar la innovación y el desarrollo en diversos sectores a través de ayudas económicas. Estas ayudas están diseñadas para apoyar a empresas y organizaciones en la implementación de soluciones tecnológicas avanzadas, promoviendo así la competitividad y la transformación digital en España.
Además, el 30 de diciembre, el Ministerio también lanzó la segunda convocatoria de demostradores y casos de uso. Esta convocatoria tiene como objetivo fomentar la creación y el desarrollo de espacios de datos sectoriales, promoviendo la colaboración y el intercambio de información entre los distintos actores del sector.
El Ministerio ha estado realizando promociones a través de jornadas online para informar y preparar a los interesados sobre las oportunidades y beneficios de los espacios de datos sectoriales. Se espera que estas jornadas continúen a lo largo de enero, brindando más oportunidades para que los sectores interesados se informen y participen.
A continuación, les facilitamos material de su interés:
Segunda convocatoria demostradores y casos de uso
- Demostradores y casos de uso de espacios de datos (2ª convocatoria)
- Buzón de consultas: dcu2.espaciosdedatos@digital.gob.es
- Presentaciones y videos de ayuda:
Productos y servicios
- Convocatoria productos y servicios del Portal de Ayudas
- Buzón de consultas: ps.espaciosdedatos@digital.gob.es
- Presentaciones y videos de ayuda: