Los datos abiertos de salud son uno de los activos más valiosos de nuestra sociedad. Bien gestionados y compartidos de forma responsable, pueden salvar vidas, impulsar descubrimientos médicos o incluso optimizar recursos hospitalarios. Sin embargo, durante décadas, estos datos han permanecido fragmentados en silos institucionales, con formatos incompatibles y barreras técnicas y legales que dificultaban su reutilización. Ahora, la Unión Europea está cambiando radicalmente el panorama con una estrategia ambiciosa que combina dos enfoques complementarios:
- Facilitar el acceso abierto a estadísticas y datos agregados no sensibles.
- Crear infraestructuras seguras para compartir datos personales de salud bajo estrictas garantías de privacidad.
En España, esta transformación ya está en marcha a través del Espacio Nacional de Datos de Salud o grupos de investigación que están a la vanguardia en el uso innovador de datos de salud. Iniciativas como IMPACT-Data, que integra datos médicos para impulsar la medicina de precisión, demuestran el potencial de trabajar con datos de salud de manera estructurada y segura. Y para facilitar que todos estos datos sean fáciles de encontrar y reutilizar se implementan estándares como HealthDCAT-AP.
Todo ello está perfectamente alineado con la estrategia europea del Reglamento del Espacio Europeo de Datos de Salud (EHDS), publicado oficialmente en marzo de 2025 que se integra también con la Directiva de Datos Abiertos (ODD), en vigor desde 2019. Aunque ambos marcos regulatorios tienen alcances distintos, su interacción ofrece oportunidades extraordinarias para la innovación, la investigación y la mejora de la atención sanitaria en toda Europa.
Un reciente informe elaborado por Capgemini Invent para data.europa.eu analiza estas sinergias. En este post, exploramos las principales conclusiones de este trabajo y reflexionamos sobre su relevancia para el ecosistema español de datos abiertos.
Dos marcos complementarios para un objetivo común
Por un lado, el Espacio Europeo de Datos de Salud se centra específicamente en datos de salud y persigue tres objetivos fundamentales:
- Facilitar el acceso internacional a datos sanitarios para la atención al paciente (uso primario).
- Promover la reutilización de estos datos para investigación, políticas públicas e innovación (uso secundario).
- Estandarizar técnicamente los sistemas de historia clínica electrónica (HCE) para mejorar la interoperabilidad transfronteriza.
Por su parte, la Directiva de Datos Abiertos tiene un alcance más amplio: promueve que el sector público ponga a disposición de cualquier usuario datos gubernamentales para su reutilización libre. Esto incluye los conjuntos de datos de alto valor (High-Value Datasets) que deben publicarse gratuitamente, en formatos legibles por máquina y a través de API en seis categorías entre las que no se encontraba “salud” originalmente. Sin embargo, en la propuesta de ampliación de las nuevas categorías que publicó la UE sí aparece la categoría de salud.
La complementariedad entre ambos marcos regulatorios es evidente: mientras la ODD facilita el acceso abierto a estadísticas sanitarias agregadas y no sensibles, el EHDS regula el acceso controlado a datos individuales de salud bajo condiciones estrictas de seguridad, consentimiento y gobernanza. Juntos, conforman un sistema escalonado de compartición de datos que maximiza su valor social sin comprometer la privacidad, en total cumplimiento con el Reglamento General de Protección de Datos (RGPD).
Principales beneficios ordenador por grupos de usuarios
El informe analiza cuatro grupos de usuarios principales y examina tanto los beneficios potenciales como los desafíos que enfrentan al combinar datos del EHDS con datos abiertos.
-
Pacientes: empoderamiento informado con barreras prácticas
Los pacientes europeos obtendrán acceso más rápido y seguro a sus propias historias clínicas electrónicas, especialmente en contextos transfronterizos gracias a infraestructuras como MyHealth@EU. Este proyecto resulta especialmente útil para ciudadanos europeos que se encuentren desplazados en otro país europeo. .
Otro proyecto interesante que informa a la ciudadanía es PatientsLikeMe que reúne a más 850.000 pacientes con enfermedades raras o crónicas en una comunidad online que comparte información de interés sobre tratamientos y otras cuestiones.
-
Profesionales de la salud potencial subordinado a la integración
Por otro lado, los profesionales sanitarios podrán acceder antes y de manera más sencilla a datos clínicos de pacientes, incluso a través de fronteras, mejorando la continuidad asistencial y la calidad del diagnóstico y tratamiento.
La combinación con datos abiertos podría amplificar estos beneficios si se desarrollan herramientas que integren ambas fuentes de información directamente en los sistemas de historia clínica electrónica.
3. Responsables políticos: datos para mejores decisiones
Los cargos públicos son beneficiarios naturales de la convergencia entre EHDS y datos abiertos. La posibilidad de combinar datos salud detallados (previa solicitud y autorización a través de los Organismos de Acceso a Datos Sanitarios que cada Estado miembro debe establecer) con información estadística y contextual abierta permitiría desarrollar políticas basadas en evidencia mucho más sólida.
El informe menciona casos de uso como la combinación de datos de salud con información medioambiental para evaluar impactos sanitarios. Un ejemplo real es el proyecto francés Green Data for Health, que cruza datos abiertos sobre contaminación acústica con información sobre prescripciones de medicamentos para el sueño de más de 10 millones de habitantes, investigando correlaciones entre ruido ambiental y trastornos del sueño.
4. Investigadores y reutilizadores: los principales beneficiarios inmediatos
Los investigadores, académicos e innovadores constituyen el grupo que más directamente se beneficiará de la sinergia EHDS-ODD ya que disponen de las habilidades y herramientas necesarias para localizar, acceder, combinar y analizar datos de múltiples fuentes. Además, su trabajo ya implica habitualmente la integración de diversos conjuntos de datos.
Un estudio reciente publicado en PLOS Digital Health sobre el caso de Andalucía demuestra cómo los datos abiertos en salud pueden democratizar la investigación en IA sanitaria y mejorar la equidad en el tratamiento.
El desarrollo del EHDS está siendo apoyado por programas europeos como EU4Health, Horizon Europe y proyectos específicos como TEHDAS2, que ayudan a definir estándares técnicos y pilotar aplicaciones reales.
Recomendaciones para maximizar el impacto
El informe concluye con cuatro recomendaciones clave que resultan particularmente relevantes para el ecosistema español de datos abiertos:
- Estimular la investigación en la intersección EHDS-datos abiertos mediante financiación específica. Es fundamental incentivar que los investigadores que combinan estas fuentes traduzcan sus hallazgos en aplicaciones prácticas: protocolos clínicos mejorados, herramientas de decisión, estándares de calidad actualizados.
- Evaluar y facilitar el uso directo por profesionales y pacientes. Promover la alfabetización en datos y desarrollar aplicaciones intuitivas integradas en los sistemas existentes (como las historias clínicas electrónicas) podría cambiar esta situación.
- Fortalecer la gobernanza mediante educación y marcos regulatorios claros. A medida que se vayan operativizando las entidades técnicas del EHDS , será esencial contar con una regulación clara que defina unos marcos regulatorios comunes..
- Monitorizar, evaluar y adaptar. El período 2025-2031 verá la entrada en vigor gradual de los distintos requisitos del EHDS. Se recomienda realizar evaluaciones periódicas para valorar cómo se está utilizando realmente el EHDS, qué combinaciones con datos abiertos están generando más valor, y qué ajustes son necesarios.
Además, para que todo esto funcione, el informe sugiere que portales como data.europa.eu (y por extensión, datos.gob.es) deberían destacar ejemplos prácticos que demuestren cómo se complementan los datos abiertos con los datos protegidos de espacios sectoriales, inspirando así nuevas aplicaciones.
En general, el papel de los portales de datos abiertos será fundamental en este ecosistema emergente: no solo como proveedores de conjuntos de datos de calidad, sino también como facilitadores de conocimiento, espacios de encuentro entre comunidades y catalizadores de innovación. El futuro de la sanidad europea se está escribiendo ahora, y los datos abiertos tienen un papel protagonista en esa historia.
El pasado mes de septiembre se lanzó oficialmente la primera edición de los European Data Spaces Awards, una iniciativa impulsada por el Data Spaces Support Centre (DSSC) en colaboración con la Comisión Europea. Estos premios nacen con el objetivo de promover las mejores iniciativas de intercambio de datos, reconociendo sus logros y aumentando su visibilidad. Con ello se busca fomentar buenas prácticas que pueden servir de guía para otros actores del ecosistema de datos europeo. La idea es que los premios se otorguen de manera anual, lo cual ayudará a la comunidad a crecer y mejorar.
¿Por qué son importantes estos premios?
Los datos son uno de los activos económicos más valiosos de Europa, y su aprovechamiento estratégico es fundamental para el desarrollo de tecnologías como la inteligencia artificial (IA). Por ello, la estrategia europea pasa por establecer un mercado único de datos que permita impulsar la innovación de forma efectiva. Sin embargo, en la actualidad, los datos todavía están ampliamente distribuidos entre numerosos agentes del ecosistema europeo.
Los European Data Spaces Awards son especialmente relevantes porque reconocen y promueven iniciativas que ayudan a superar esta problemática: los espacios de datos. Se trata de entornos organizativos y técnicos donde múltiples actores —públicos y privados— comparten datos de forma segura, soberana, controlada y conforme a normas comunes que promueven su interoperabilidad. Esto permite que los datos fluyan entre sectores y fronteras impulsando la innovación.
En España también se está impulsando el desarrollo de espacios de datos a través de iniciativas específicas como el Plan de Impulso de los Espacios de Datos Sectoriales.
Dos categorías de premios
En este contexto, se han creado dos categorías de premios:
- Excelencia en la implicación de usuarios finales y sostenibilidad financiera: reconoce espacios de datos con un fuerte enfoque en el usuario y con modelos financieros viables a largo plazo.
- Espacio de datos emergente más innovador: premia iniciativas nuevas que aportan ideas frescas e innovadoras con alto impacto en el ecosistema europeo.
¿Quién puede participar?
Los European Data Spaces Awards están abiertos a cualquier espacio de datos que cumpla con estos criterios:
- Su autoridad de gobernanza está registrada en la Unión Europea.
- Opera total o parcialmente dentro del territorio europeo.
- Está siendo utilizado activamente para el intercambio de datos.
- Incluye datos restringidos, más allá de los datos abiertos.
Los espacios en fase de implementación también pueden presentar su candidatura, siempre que compartan datos en entornos piloto o preoperativos. En estos casos, el coordinador del proyecto puede actuar en nombre del proyecto.
La evaluación de la elegibilidad se basará en la autoevaluación del solicitante, lo que facilita una participación amplia y representativa del ecosistema europeo de datos.
Un mismo espacio de datos puede presentar su candidatura a ambas categorías, aunque deberá hacer dos solicitudes distintas.
Cronograma: inscripciones abiertas hasta el 7 de noviembre
La competición está estructurada en cuatro fases clave que marcan el ritmo del proceso de participación y evaluación:
- El 23 de septiembre de 2025 se celebró el evento de lanzamiento y se abrió oficialmente el periodo de presentación de candidaturas.
- La fase de envío de solicitudes se extenderá durante 7 semanas, hasta el 7 de noviembre, permitiendo a los espacios de datos preparar y registrar sus propuestas.
- A continuación, se iniciará la fase de evaluación, que comenzará el 17 de diciembre y durará 6 semanas. Durante este tiempo, el Data Spaces Support Centre (DSSC) realizará una revisión interna de elegibilidad y el jurado selecciona a los ganadores.
- Finalmente, los premios se anunciarán y entregarán durante el evento Data Space Symposium (DSS2026), los días 10 y 11 de febrero de 2026 en Madrid. Todos los nominados serán invitados a subir al escenario durante la ceremonia, por lo que obtendrán una gran visibilidad y reconocimiento. Los galardonados no recibirán ninguna compensación monetaria.
Para inscribirse, los participantes deben acceder al formulario online disponible en la página oficial de los premios. Esta página ofrece todos los recursos necesarios para preparar la candidatura, incluidos documentos de referencia, plantillas y actualizaciones sobre el proceso.
El formulario incluye tres elementos obligatorios:
- Preguntas básicas sobre el solicitante y el espacio de datos.
- La autoevaluación de elegibilidad con cuatro preguntas obligatorias.
- Un espacio para subir el Awards Application Document, un documento en formato PDF y cuya plantilla está disponible en la plataforma. (máximo 8 páginas). EL documento, que sigue una estructura alineada con el Maturity Model v2.0, detalla los objetivos y criterios de evaluación por sección.
Además, los participantes cuentan con un espacio para proporcionar, de manera opcional, enlaces a recursos adicionales que ayuden a dar contexto a su propuesta.
Para cualquier duda que pueda surgir durante el proceso, se ha habilitado una plataforma de soporte.
Los European Data Spaces Awards 2025 no solo reconocen la excelencia, sino que visibilizan el impacto de proyectos que están transformando el futuro de los datos en Europa. Si estás interesado en participar, te invitamos a leer las bases completas de la competición en su página web.
Para alcanzar sus objetivos de sostenibilidad medioambiental, Europa necesita información precisa, accesible y actualizada que permita tomar decisiones basadas en evidencias. El Espacio de Datos del Pacto Verde (Green Deal Data Space o GDDS) facilitará esta transformación al integrar diversas fuentes de datos en una infraestructura digital común, interoperable y abierta.
Desde Europa, se está trabajando en su desarrollo a través de diversos proyectos, que han permitido obtener recomendaciones y buenas prácticas para su implementación. ¡Descúbrelas en este artículo!
¿Qué es el Green Deal Data Space?
El Green Deal Data Space (GDDS) es una iniciativa de la Comisión Europea para crear un ecosistema digital que reúna datos de múltiples sectores. Su fin es apoyar y acelerar los objetivos del Pacto Verde: la hoja de ruta de la Unión Europea para lograr una economía sostenible, climáticamente neutra y justa. Los pilares del Pacto Verde incluyen:
- Una transición energética que reduzca las emisiones y mejore la eficiencia.
- El fomento de la economía circular, promoviendo el reciclaje, la reutilización y la reparación de productos para minimizar residuos.
- El impulso de prácticas agrícolas más sostenibles.
- La restauración de la naturaleza y la biodiversidad, protegiendo hábitats naturales y reduciendo la contaminación de aire, agua y suelo.
- La garantía de la justicia social, a través de una transición que facilite que ningún país o comunidad quede atrás.
A través de esta estrategia integral, la UE aspira a convertirse en la primera economía del mundo competitiva y eficiente en el uso de los recursos, logrando emisiones netas de gases de efecto invernadero cero para 2050. El Espacio de Datos del Pacto Verde se posiciona como una herramienta clave para alcanzar estos objetivos. Integrados en la Estrategia Europea del Dato, los espacios de datos son entornos digitales que permite el intercambio fiable de datos, al tiempo que se mantiene la soberanía y se garantiza la confianza y la seguridad en virtud de un conjunto de normas acordadas mutuamente.
En este caso concreto, el GDDS integrará datos de gran valor sobre biodiversidad, contaminación cero, economía circular, cambio climático, servicios forestales, movilidad inteligente y cumplimiento medioambiental. Estos datos serán fáciles de localizar, interoperables, accesibles y reutilizables bajo los principios FAIR (Findability, Accessibility, Interoperability, Reusability).
El GDDS se implementará a través del proyecto SAGE (Espacio de datos para una Europa verde y sostenible) y se basará en los resultados de la iniciativa GREAT (Gobernanza de la innovación responsable).
Un informe con recomendaciones para el GDDS
Como vimos en un artículo anterior, cuatro proyectos pioneros están sentando las bases de este ecosistema: AD4GD, B-Cubed, FAIRiCUBE y USAGE. Estos proyectos, financiados en el marco de la convocatoria HORIZON, han analizado y documentado durante varios años los requisitos necesarios para garantizar que el GDDS siga los principios FAIR. Fruto de ese trabajo, se ha elaborado el informe “Policy Brief: Unlocking The Full Potential Of The Green Deal Data Space”. Se trata de un conjunto de recomendaciones que buscan servir de guía para la implementación exitosa del Espacio de Datos del Pacto Verde.
El informe destaca cinco grandes áreas en las que se concentran los desafíos de la construcción del GDDS:
1. Armonización de datos
Los datos ambientales son heterogéneos, ya que provienen de distintas fuentes: satélites, sensores, estaciones meteorológicas, registros de biodiversidad, empresas privadas, institutos de investigación, etc. Cada proveedor utiliza sus propios formatos, escalas y metodologías. Esto provoca incompatibilidades que dificultan la comparación y la combinación de datos. Para solucionarlo, es esencial:
- Adoptar estándares y vocabularios internacionales ya existentes, como INSPIRE, que abracan múltiples ámbitos temáticos.
- Evitar formatos propietarios, primando aquellos abiertos y bien documentados.
- Invertir en herramientas que permitan transformar datos de un formato a otro de forma sencilla.
2. Interoperabilidad semántica
Garantizar la interoperabilidad semántica es crucial para que los datos puedan entenderse y reutilizarse en diferentes contextos y disciplinas, algo fundamental cuando se comparten datos entre comunidades tan diversas como las que participan en los objetivos del Pacto Verde. A ello hay que sumar que la Ley de Datos (Data Act) obliga a que los participantes en espacios de datos ofrezcan descripciones legibles por máquinas de los datasets, garantizando así su localización, acceso y reutilización. Además, exige que los vocabularios, taxonomías y listas de códigos empleados estén documentados de forma pública y coherente. Para lograrlo es necesario:
- Usar datos enlazados (linked data) y metadatos que ofrezcan conceptos claros y compartidos, a través de vocabularios, ontologías y estándares como los desarrollados por el OGC o las normas ISO.
- Usar los estándares que ya existen para organizar y describir los datos, y solo crear extensiones nuevas cuando sea realmente necesario.
- Mejorar los vocabularios internacionales ya aceptados, dándoles más precisión y aprovechando que las comunidades científicas ya los utilizan ampliamente.
3. Metadatos y curación de datos
Los datos solo alcanzan su máximo valor si están acompañados de metadatos claros que expliquen su origen, calidad, restricciones de uso y condiciones de acceso. Sin embargo, la gestión deficiente de metadatos sigue siendo una barrera importante. En muchos casos, los metadatos son inexistentes, están incompletos o mal estructurados, y a menudo se pierden al traducirse entre estándares no interoperables. Para mejorar esta situación se debe:
- Ampliar los estándares de metadatos existentes para incluir elementos críticos como observaciones, mediciones, trazabilidad de origen, etc.
- Fomentar la interoperabilidad entre estándares de metadatos en uso, mediante herramientas de mapeo y transformación que respondan tanto a las necesidades de datos comerciales como abiertos.
- Reconocer y financiar la creación y mantenimiento de metadatos en proyectos europeos, incorporando la obligación de generar un catálogo estandarizado desde el inicio en los planes de gestión de datos.
4. Intercambio de datos y provisión federada
El GDDS no busca solo centralizar toda la información en un solo repositorio, sino permitir que múltiples actores compartan datos de manera federada y segura. Por tanto, es necesario conseguir un equilibrio entre el acceso abierto y la protección de derechos y privacidad. Para ello se requiere:
- Adoptar y promover tecnologías abiertas y fáciles de usar, que permitan la integración entre datos abiertos y protegidos, cumpliendo con el Reglamento General de Protección de Datos (RGPD).
- Garantizar la integración de diversas API utilizadas por los proveedores de datos y las comunidades de usuarios, acompañadas de demostradores y directrices claras. No obstante, es necesario impulsar el uso de API estandarizadas para facilitar una implantación más fluida, como por ejemplo, las API de OGC (Open Geospatial Consortium) para activos geoespaciales.
- Ofrecer herramientas de conversión y especificaciones claras para permitir la interoperabilidad entre API y formatos de datos.
En paralelo al desarrollo del Eclipse Dataspace Connectors (una tecnología de código abierto para facilitar la creación de espacios de datos), se propone explorar alternativas como catálogos en blockchain o certificados digitales, siguiendo ejemplos como el sistema FACTS (Federated Agile Collaborative Trusted System).
5. Gobernanza inclusiva y sostenible
El éxito del GDDS dependerá de establecer un marco de gobernanza sólido que garantice transparencia, participación y sostenibilidad a largo plazo. No se trata solo de normas técnicas, sino también de reglas justas y representativas. Para avanzar en ello es clave:
- Usar exclusivamente nubes europeas para asegurar la soberanía de los datos, reforzar la seguridad y cumplir con la normativa de la UE, algo que cobra especial importancia ante los desafíos globales actuales.
- Integrar plataformas abiertas como Copernicus, el Portal Europeo de Datos e INSPIRE en el GDDS fortalece la interoperabilidad y facilita el acceso a datos públicos. En este sentido, es necesario diseñar estrategias eficaces para atraer proveedores de datos abiertos y evitar que el GDDS se convierta en un entorno comercial o restringido.
- Obligar a citar los datos en publicaciones académicas financiadas con fondos públicos aumenta su visibilidad y apoyar iniciativas de estandarización fortalece la visibilidad de los datos y asegura su mantenimiento a largo plazo.
- Ofrecer formación integral y promover el uso cruzado de herramientas de armonización evita la creación de nuevos silos de datos y mejora la colaboración entre dominios.
La siguiente imagen resume la relación entre estos bloques:

Conclusión
Todas estas recomendaciones inciden en una idea central: construir un Espacio de Datos del Pacto Verde que cumpla con los principios FAIR no solo es una cuestión técnica, sino también estratégica y ética. Requiere colaboración entre sectores, compromiso político, inversión en capacidades y una gobernanza inclusiva que garantice la equidad y la sostenibilidad. Si Europa logra consolidar este ecosistema digital, estará mejor preparada para afrontar los desafíos medioambientales con decisiones informadas, transparentes y orientadas al bien común.
La normativa UNE 0087 define por primera vez en España los principios y requisitos clave para crear y operar en espacios de datos
El pasado día 17 de julio se publicó oficialmente la Especificación UNE 0087 “Definición y caracterización de los Espacios de Datos”, la primera norma española que establece un marco común para estos entornos digitales.
Este hito ha sido posible gracias a la colaboración del Centro de Referencia de Espacios de Datos (CRED), con la Asociación Española de Normalización (UNE). Dicha normativa, que fue aprobada el 20 de junio de 2025 define tres pilares claves en la adhesión a los espacios de datos: interoperabilidad, gobernanza y creación de valor, con el objetivo de ofrecer seguridad jurídica, confianza y un lenguaje técnico común en la economía del dato.
Para su creación, se han formado tres grupos de trabajo con más de 50 participantes de entidades tanto públicas como privadas que han aportado su conocimiento para definir los principios y características clave de estos sistemas colaborativos. Estos grupos de trabajo se han coordinado de la siguiente manera:
- GT1: Definición de Espacios de Datos y Modelo de Madurez.
- GT2: Interoperabilidad Técnica y Semántica.
- GT3: Interoperabilidad legal y organizativa.
La publicación de esta normativa supone, por tanto, un documento de referencia para la creación de espacios de datos seguros y confiables, aplicable en todos los sectores productivos y que sirve de base para futuros documentos guía.
De este modo, para ofrecer unas directrices que faciliten la implementación y desarrollo de los espacios de datos, nace la especificación UNE 0087:2025 para crear un marco inclusivo de referencia que oriente a las organizaciones y que estas se puedan aprovechar de toda la información en un entorno de cumplimiento normativo y soberanía digital. La publicación de esta normativa tiene una serie de beneficios:
- Acelerar el despliegue de los espacios de datos en todos los sectores de la economía.
- Favorecer la sostenibilidad y el escalado / crecimiento de los ecosistemas de compartición de datos.
- Fomentar la colaboración pública /privada, asegurando la convergencia con Europa.
- Avanzar hacia la autonomía tecnológica y la soberanía de los datos en los ecosistemas.
- Promover el descubrimiento de nuevas oportunidades de negocio innovadoras fomentando la colaboración y creación de alianzas estratégicas.
Dentro de la especificación se definen qué son los espacios de datos, de establecen sus características clave de interoperabilidad, gobernanza y generación de valor y se determinan cuáles con los beneficios de su adhesión. La especificación está publicada aquí y es importante añadir que, aunque aparezca un coste de descarga, tiene carácter gratuito, gracias al patrocinio de la Dirección General del Dato.
Con esta herramienta, España da un paso firme en la consolidación de espacios de datos cohesivos, seguros y alineados con el marco europeo, facilitando la implantación de proyectos transversales en diferentes sectores.
España da un paso clave hacia la economía del dato con el lanzamiento del Kit Espacios de Datos, un programa de ayudas que subvencionará la integración de entidades públicas y privadas en espacios de datos sectoriales.
Los espacios de datos son ecosistemas seguros en los que organizaciones, tanto públicas como privadas, comparten información de forma interoperable, bajo reglas comunes y con garantías de privacidad. Éstos permiten desarrollar nuevos productos, mejorar la toma de decisiones y aumentar la eficiencia operativa, en sectores como la salud, la movilidad o la agroalimentación, entre otros.
Hoy, el Ministerio para la Transformación Digital y de la Función Pública, a través de la Secretaría de Estado de Digitalización e Inteligencia Artificial ha publicado en el BOE las bases que regulan la concesión de ayudas a entidades interesadas en incorporarse de forma efectiva a un espacio de datos.
Este programa, que recibe el nombre de “Kit Espacios de Datos”, estará gestionado por Red.es y subvencionará los costes en los que hayan incurrido las entidades beneficiarias para conseguir su incorporación a un espacio de datos elegible, es decir, que cumpla los requisitos fijados en las bases, a contar desde el día de la publicación de estas.
Destinatarios y financiación
Este plan de ayudas está dirigido a entidades tanto públicas como privadas, así como Administraciones Públicas. Dentro de los beneficiarios de estas ayudas se encuentran los participantes, que son aquellas entidades que buscan integrase en estos ecosistemas para compartir y aprovechar datos y servicios.
Para la ejecución de este plan, el Gobierno ha lanzado una ayuda de hasta 60 millones de euros que se repartirán, según el tipo de entidad o el nivel de integración de la siguiente manera:
- Entidades privadas y públicas con actividad económica tendrán una ayuda de hasta 15.000€ en régimen de incorporación efectiva o de hasta 30.000€ si se incorpora como proveedor.
- Por otro lado, las Administraciones Públicas tendrán financiación de hasta 25.000€ si se incorporan de manera efectiva, o de hasta 50.000€ si lo hacen como proveedor.
La incorporación de empresas de diferentes sectores en los espacios de datos generará beneficios tanto a nivel empresarial como para la economía nacional como el aumento de la capacidad de innovación de las empresas beneficiarias, la creación de nuevos productos y servicios basados en el análisis de los datos y la mejora de la eficiencia operativa y toma de decisiones.
Se prevé que la convocatoria se publique durante el cuarto trimestre de 2025. Las subvenciones se solicitarán en régimen de concurrencia no competitiva, por orden de llegada y hasta agotar los fondos disponibles.
Con la publicación en el BOE de estas bases reguladoras se pretende dinamizar el ecosistema de datos en España, fortalecer la competitividad de la economía en el ámbito global y consolidar la sostenibilidad financiera de modelos de negocio innovadores.
Más información:
Bases reguladoras en el BOE.
Página de LinkedIn del Centro de Referencia de Espacios de Datos.
Hace tan solo unos días, la Dirección General de Tráfico publicó el nuevo Programa Marco para Prueba de Vehículos Automatizados que, entre otras medidas, contempla “la entrega obligatoria de informes, tanto periódicos y finales como en caso de incidentes, que permitirán a la DGT evaluar la seguridad de las pruebas y publicar información básica […] garantizando la transparencia y la confianza pública”.
El avance de la tecnología digital está facilitando que el sector del transporte se enfrente a una revolución sin precedentes respecto a la conducción de vehículos autónomos, ofreciendo mejorar significativamente la seguridad vial, la eficiencia energética y la accesibilidad de la movilidad.
El despliegue definitivo de estos vehículos depende en gran medida de la disponibilidad, calidad y accesibilidad de grandes volúmenes de datos, así como de un marco jurídico adecuado que asegure la protección de los diversos bienes jurídicos implicados (datos personales, secreto empresarial, confidencialidad…), la seguridad del tráfico y la transparencia. En este contexto, los datos abiertos y la reutilización de la información del sector público se manifiestan como elementos esenciales para el desarrollo responsable de la movilidad autónoma, en particular a la hora de garantizar unos adecuados niveles de seguridad en el tráfico.
La dependencia de los datos en los vehículos autónomos
La tecnología que da soporte a los vehículos autónomos se sustenta en la integración de una compleja red de sensores avanzados, sistemas de inteligencia artificial y algoritmos de procesamiento en tiempo real, lo que les permite identificar obstáculos, interpretar las señales de tráfico, predecir el comportamiento de otros usuarios de la vía y, de una forma colaborativa, planificar rutas de forma completamente autónoma.
En el ecosistema de vehículos autónomos, la disponibilidad de datos abiertos de calidad resulta estratégica para:
- Mejorar la seguridad vial, de manera que puedan utilizarse datos de tráfico en tiempo real que permitan anticipar peligros, evitar accidentes y optimizar rutas seguras a partir del análisis masivo de datos.
- Optimizar la eficiencia operativa, ya que el acceso a información actualizada sobre el estado de las vías, obras, incidencias y condiciones de tráfico permite una planificación más eficiente de los desplazamientos.
- Impulsar la innovación sectorial, facilitando la creación de nuevas herramientas digitales que facilitan la movilidad.
En concreto, para garantizar un funcionamiento seguro y eficiente de este modelo de movilidad se requiere el acceso continuo a dos categorías fundamentales de datos:
- Datos variables o dinámicos, que ofrecen información en constante cambio como la posición, velocidad y comportamiento de otros vehículos, peatones, ciclistas o las condiciones meteorológicas en tiempo real.
- Datos estáticos, que comprenden información relativamente permanente como la localización exacta de señales de tráfico, semáforos, carriles, límites de velocidad o las principales características de la infraestructura viaria.
El protagonismo de los datos suministrados por las entidades públicas
Las fuentes de las que provienen tales datos son ciertamente diversas. Esto resulta de gran relevancia por lo que se refiere a las condiciones en que dichos datos estarán disponibles. En concreto, algunos de los datos son proporcionados por entidades públicas, mientras que en otros casos el origen proviene de empresas privadas (fabricantes de vehículos, proveedoras de servicios de telecomunicaciones, desarrolladoras de herramientas digitales…) con sus propios intereses o, incluso, de las personas que utilizan los espacios públicos, los dispositivos y las aplicaciones digitales.
Esta diversidad exige un diferente planteamiento a la hora de facilitar la disponibilidad de los datos en condiciones adecuadas, en concreto por las dificultades que pueden plantearse desde el punto de vista jurídico. Con relación a las Administraciones Públicas, la Directiva (UE) 2019/1024 relativa a datos abiertos y reutilización de información del sector público establece obligaciones claras que serían de aplicación, por ejemplo, a la Dirección General de Tráfico, las Administraciones titulares de las vías públicas o los municipios en el caso de los entornos urbanos. Asimismo, el Reglamento (UE) 2022/868 sobre gobernanza europea de datos refuerza este marco normativo, en particular por lo que se refiere a la garantía de los derechos de terceros y, en concreto, la protección de datos personales.
Más aún, algunos conjuntos de datos deberían proporcionarse en las condiciones establecidas para los datos dinámicos, esto es, aquellos “sujetos a actualizaciones frecuentes o en tiempo real, debido, en particular, a su volatilidad o rápida obsolescencia”, que habrán de estar disponibles “para su reutilización inmediatamente después de su recopilación, a través de las API adecuadas y, cuando proceda, en forma de descarga masiva”.
Incluso, cabría pensar que la categoría de datos de alto valor presenta un especial interés en el contexto de los vehículos autónomos dado su potencial para facilitar la movilidad, en concreto si tenemos en cuenta su potencial para:
- Impulsar la innovación tecnológica, ya que facilitarían a fabricantes, desarrolladores y operadores acceder a información fiable y actualizada, esencial para el desarrollo, validación y mejora continua de sistemas de conducción autónoma.
- Facilitar la supervisión y evaluación desde la perspectiva de la seguridad, ya que la transparencia y accesibilidad de estos datos son presupuestos esenciales desde esta perspectiva.
- Dinamizar el desarrollo de servicios avanzados, puesto que los datos sobre infraestructura vial, señalización, tráfico e, incluso, los resultados de pruebas realizadas en el contexto del citado Programa Marco constituyen la base para nuevas aplicaciones y servicios de movilidad que benefician al conjunto de la sociedad.
Sin embargo, esta condición no aparece expresamente recogida para los datos vinculados al tráfico en la definición realizada a nivel europeo, por lo que, al menos de momento, no cabría exigir a las entidades públicas la difusión de los datos que aplican a los vehículos autónomos en las singulares condiciones establecidas para los datos de alto valor. No obstante, en este momento de transición para el despliegue de los vehículos autónomos, resulta fundamental que las Administraciones públicas publiquen y mantengan actualizados en condiciones adecuadas para su tratamiento automatizado, algunos conjuntos de datos, como los relativos a:
- Señales viales y elementos de señalización vertical.
- Estados de semáforos y sistemas de control de tráfico.
- Configuración y características de carriles.
- Información sobre obras y alteraciones temporales de tráfico.
- Elementos de infraestructura vial críticos para la navegación autónoma.
La reciente actualización del catálogo oficial de señales de tráfico, que entra en vigor el 1 de julio de 2025 incorpora señalizaciones adaptadas a nuevas realidades, como es el caso de la movilidad personal. Sin embargo, requiere de una mayor concreción por lo que se refiere a la disponibilidad de los datos relativos a las señales en las referidas condiciones. Para ello será necesaria la intervención de las autoridades responsables de la señalización de las vías.
La disponibilidad de los datos en el contexto del espacio europeo de movilidad
Partiendo de estos condicionamientos y de la necesidad de disponer de los datos de movilidad generados por empresas privadas y particulares, los espacios de datos aparecen como el entorno jurídico y de gobernanza óptimo para facilitar su accesibilidad en condiciones adecuadas.
En este sentido, las iniciativas para el despliegue del espacio de datos europeo de movilidad, creado en 2023, constituyen una oportunidad para integrar en su diseño y configuración medidas que den soporte a la necesidad de acceso a los datos que exigen los vehículos autónomos. Así pues, en el marco de esta iniciativa sería posible liberar el potencial de los datos de movilidad y, en concreto:
- Facilitar la disponibilidad de los datos en condiciones específicas para las necesidades de los vehículos autónomos.
- Promover la interconexión de diversas fuentes de datos vinculadas a los medios de transporte ya existentes, pero también de los emergentes.
- Acelerar la transformación digital que suponen los vehículos autónomos.
- Reforzar la soberanía digital de la industria automovilística europea, reduciendo la dependencia de grandes corporaciones tecnológicas extranjeras.
En definitiva, los vehículos autónomos pueden suponer una transformación fundamental en la movilidad tal y como hasta ahora se ha concebido, pero su desarrollo depende entre otros factores de la disponibilidad, calidad y accesibilidad de datos suficientes y adecuados. El Proyecto de Ley de Movilidad Sostenible que actualmente se encuentra en tramitación en las Cortes Generales constituye una magnífica oportunidad para reforzar el papel de los datos a la hora de facilitar la innovación en este ámbito, lo que sin duda favorecería el desarrollo de los vehículos autónomos. Para ello será imprescindible, de una parte, contar con un entorno de compartición de datos que haga compatible el acceso a los datos con las adecuadas garantías para los derechos fundamentales y la seguridad de la información; y, de otra, diseñar un modelo de gobernanza que, como se enfatiza en el Programa impulsado por la Dirección General de Tráfico, facilite la participación colaborativa de “fabricantes, desarrolladores, importadores y operadores de flotas establecidos en España o en la Unión Europea”, lo que plantea importantes desafíos en la disponibilidad de los datos.
Contenido elaborado por Julián Valero, catedrático de la Universidad de Murcia y Coordinador del Grupo de Investigación “Innovación, Derecho y Tecnología” (iDerTec). Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Los datos son un recurso fundamental para mejorar nuestra calidad de vida porque permiten mejorar los procesos de toma de decisiones para crear productos y servicios personalizados, tanto en el sector público como en el privado. En contextos como la salud, la movilidad, la energía o la educación, el uso de datos facilita soluciones más eficientes y adaptadas a las necesidades reales de las personas. No obstante, en el trabajo con datos, la privacidad juega un papel clave. En este post, analizaremos cómo los espacios de datos, el paradigma de computación federada y el aprendizaje federado, una de sus aplicaciones más potentes, plantean una solución equilibrada para aprovechar el potencial de los datos sin poner en riesgo la privacidad. Además, resaltaremos cómo el aprendizaje federado también puede usarse con datos abiertos para mejorar su reutilización de forma colaborativa, incremental y eficiente.
La privacidad, clave en la gestión de datos
Como se ha mencionado anteriormente, el uso intensivo de datos exige una creciente atención a la privacidad. Por ejemplo, en salud digital, un mal uso secundario de datos de historias clínicas electrónicas podría vulnerar derechos fundamentales de pacientes. Una forma eficaz de preservar la privacidad es mediante ecosistemas de datos que prioricen la soberanía de los datos, como es el caso de los espacios de datos. Un espacio de datos es un sistema de gestión federada de datos que permite su intercambio de manera confiable entre proveedores y consumidores. Además, el espacio de datos garantiza la interoperabilidad de los datos para crear productos y servicios que generen valor. En un espacio de datos, cada proveedor mantiene sus propias normas de gobernanza, conservando el control sobre sus datos (es decir, la soberanía sobre sus datos), a la vez que se posibilita su reutilización por consumidores. Esto implica que cada proveedor debe poder decidir qué datos comparte, con quién y bajo qué condiciones, garantizando el cumplimiento de sus intereses y obligaciones legales.
Computación federada y espacios de datos
Los espacios de datos representan una evolución en la gestión de datos, relacionada con un paradigma denominado computación federada (federated computing), donde los datos se reutilizan sin necesidad de que haya un trasiego de datos desde los proveedores de datos hacia los consumidores. En la computación federada, los proveedores transforman sus datos en resultados intermedios que preservan la privacidad con el fin de poder ser enviados a los consumidores de datos. Además, esto posibilita que puedan aplicarse otras técnicas de mejora de la privacidad de datos (Privacy-Enhancing Technologies). La computación federada se alinea perfectamente con arquitecturas de referencia como Gaia-X y su Trust Framework, que establece los principios y requisitos para garantizar un intercambio de datos seguro, transparente y conforme a reglas comunes entre proveedores y consumidores de datos.
Aprendizaje federado
Una de las aplicaciones más potentes de la computación federada es el aprendizaje automático federado (federated learning), una técnica de inteligencia artificial que permite entrenar modelos sin necesidad de centralizar los datos. Es decir, en lugar de enviar los datos a un servidor central para procesarlos, lo que se envía son los modelos entrenados localmente por cada participante.
Estos modelos se combinan posteriormente de manera centralizada para crear un modelo global. A modo de ejemplo, imaginemos un consorcio de hospitales que quiere desarrollar un modelo predictivo para detectar una enfermedad rara. Cada hospital posee datos sensibles de sus pacientes, y compartirlos abiertamente no es viable por cuestiones de privacidad (incluso otras cuestiones legales o éticas). Con el aprendizaje federado, cada hospital entrena localmente el modelo con sus propios datos, y solo comparte los parámetros del modelo (resultados del entrenamiento) de manera centralizada. Así, el modelo final aprovecha la diversidad de datos de todos los hospitales sin comprometer la privacidad individual y las reglas de gobernanza de datos de cada hospital.
El entrenamiento en el aprendizaje federado suele seguir un ciclo iterativo:
- Un servidor central inicia un modelo base y lo envía a cada uno de los nodos distribuidos participantes.
- Cada nodo entrena el modelo localmente con sus datos.
- Los nodos devuelven solo los parámetros del modelo actualizado, no los datos (es decir, se evita el trasiego de datos).
- El servidor central agrega las actualizaciones en los parámetros, resultados del entrenamiento en cada nodo y actualiza el modelo global.
- El ciclo se repite hasta alcanzar un modelo suficientemente preciso.
Figura 1. Visual que representa el proceso de entrenamiento del aprendizaje federados. Elaboración propia
Este enfoque es compatible con diversos algoritmos de aprendizaje automático, incluyendo redes neuronales profundas, modelos de regresión, clasificadores, etc.
Beneficios y desafíos del aprendizaje federado
El aprendizaje federado ofrece múltiples beneficios al evitar el trasiego de datos. Destacamos los siguientes:
- Privacidad y cumplimiento normativo: al permanecer en su origen, se reducen significativamente los riesgos de exposición de los datos y se facilita el cumplimiento de regulaciones como el Reglamento General de Protección de Datos (RGPD).
- Soberanía de los datos: cada entidad mantiene el control total sobre sus datos, lo que evita conflictos de competitividad.
- Eficiencia: evita los costes y la complejidad de intercambiar grandes volúmenes de datos, lo que acelera los tiempos de procesamiento y desarrollo.
- Confianza: facilita la colaboración entre organizaciones sin fricciones.
Existen diversos casos de uso en los cuales el aprendizaje federado es necesario, por ejemplo:
- Salud: hospitales y centros de investigación pueden colaborar en modelos predictivos sin compartir datos de pacientes.
- Finanzas: bancos y aseguradoras pueden construir modelos de detección de fraude o análisis de riesgo compartido, respetando la confidencialidad de sus clientes.
- Turismo inteligente: los destinos turísticos pueden analizar flujos de visitantes o patrones de consumo sin necesidad de unificar las bases de datos de sus actores (tanto públicos como privados).
- Industria: empresas del mismo sector pueden entrenar modelos para mantenimiento predictivo o eficiencia operativa sin revelar datos competitivos.
Aunque sus beneficios son claros en diversidad de casos de uso, el aprendizaje federado también presenta retos técnicos y organizativos:
- Heterogeneidad de datos: los datos locales pueden tener diferentes formatos o estructuras, lo que dificulta el entrenamiento. Además, el esquema de estos datos puede cambiar con el tiempo, lo que representa una dificultad añadida.
- Datos desbalanceados: algunos nodos pueden tener más datos o de mayor calidad que otros, lo que puede sesgar el modelo global.
- Costes computacionales locales: cada nodo necesita recursos suficientes para entrenar el modelo localmente.
- Sincronización: el ciclo de entrenamiento requiere buena coordinación entre nodos para evitar latencias o errores.
Más allá del aprendizaje federado
Aunque la aplicación más destacada de la computación federada es el aprendizaje federado, están surgiendo muchas otras aplicaciones adicionales en la gestión de datos como, por ejemplo, el análisis de datos federado (federated analytics). El análisis de datos federado permite realizar análisis estadísticos y descriptivos sobre datos distribuidos sin necesidad de moverlos a los consumidores, sino que cada proveedor realiza localmente los cálculos estadísticos requeridos y solo comparte con el consumidor los resultados agregados según sus requisitos y permisos. En la siguiente tabla se muestran las diferencias entre aprendizaje federado y análisis de datos federado.
|
Criterio |
Aprendizaje federado |
Análisis de datos federado |
|
Objetivo |
Predicción y entrenamiento de modelos de aprendizaje automático. | Análisis descriptivo y cálculo de estadísticas. |
| Tipo de tarea | Tareas predictivas (por ejemplo, clasificación o regresión). | Tareas descriptivas (por ejemplo, medias o correlaciones). |
| Ejemplo | Entrenar modelos de diagnóstico de enfermedades a través de imágenes médicas procedentes de diversos hospitales. | Cálculo de indicadores sanitarios de un área de salud sin mover los datos entre hospitales. |
| Salida esperada | Modelo global entrenado. | Resultados estadísticos agregados. |
| Naturaleza | Iterativa. | Directa. |
| Complejidad computacional | Alta. | Media. |
| Algoritmos | Aprendizaje automático. | Algoritmos estadísticos. |
Figura 1. Tabla comparativa. Fuente: elaboración propia
Aprendizaje federado y datos abiertos: una simbiosis por explorar
En principio, los datos abiertos resuelven los problemas de privacidad antes de su publicación, por lo que se podría pensar que no es preciso hacer uso de técnicas de aprendizaje federado. Nada más lejos de la realidad. El uso de técnicas de aprendizaje federado puede aportar ventajas significativas en la gestión y explotación de los datos abiertos. De hecho, el primer aspecto a resaltar es que los portales de datos abiertos como datos.gob.es o data.europa.eu son entornos federados. Por ello, en estos portales, la aplicación de aprendizaje federado sobre conjuntos de datos de gran tamaño permitiría entrenar modelos directamente en origen, evitando costes de transferencia y procesamiento. Por otro lado, el aprendizaje federado facilitaría la combinación de datos abiertos con otros datos sensibles sin comprometer la privacidad de estos últimos. Finalmente, la naturaleza de una gran variedad de tipos de datos abiertos es muy dinámica (como los datos de tráfico), por lo que el aprendizaje federado habilitaría un entrenamiento incremental, considerando automáticamente nuevas actualizaciones de conjuntos de datos abiertos a medida que se publican, sin necesidad de reiniciar costosos procesos de entrenamiento.
Aprendizaje federado, base para una IA respetuosa con la privacidad
El aprendizaje automático federado representa una evolución necesaria en la forma en que desarrollamos servicios de inteligencia artificial, especialmente en contextos donde los datos son sensibles o están distribuidos entre varios proveedores. Su alineación natural con el concepto de espacio de datos lo convierte en una tecnología clave para impulsar la innovación basada en la compartición de datos, teniendo en cuenta la privacidad y manteniendo la soberanía de los datos.
A medida que la regulación (como el Reglamento relativo al Espacio Europeo de Datos de Salud) y las infraestructuras de espacios de datos evolucionen, el aprendizaje federado, y otros tipos de computación federada, jugarán un papel cada vez más importante en la compartición de datos, maximizando el valor de los datos, pero sin comprometer la privacidad. Finalmente, cabe destacar que, lejos de ser innecesario, el aprendizaje federado puede convertirse en un aliado estratégico para mejorar la eficiencia, gobernanza e impacto de los ecosistemas de datos abiertos.
Jose Norberto Mazón, Catedrático de Lenguajes y Sistemas Informáticos de la Universidad de Alicante. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
La industria actual se enfrenta a uno de los mayores retos de su historia reciente. Las exigencias del mercado, la presión para cumplir objetivos climáticos, la demanda de transparencia por parte de los consumidores y la aceleración tecnológica están convergiendo en una transformación profunda del modelo de producción. Esta transformación no solo busca una mayor competitividad, sino también una producción más resiliente, flexible, eficiente y sostenible.
En este contexto, la digitalización industrial —impulsada por tecnologías como el Internet de las Cosas (IoT en sus siglas en inglés), la inteligencia artificial, el edge computing, o los sistemas ciberfísicos— está generando cantidades ingentes de datos operativos, ambientales y logísticos. Sin embargo, la mera existencia de estos datos no garantiza valor por sí misma. La clave está en gobernarlos adecuadamente, es decir, establecer principios, procesos, roles y tecnologías que aseguren que esos datos sean fiables, accesibles, útiles y seguros. En otras palabras, que los datos estén en condiciones de ser aprovechados para mejorar los procesos industriales.
Por eso, el gobierno del dato industrial se posiciona como un factor estratégico. No se trata solo de “tener datos”, sino de convertirlos en una infraestructura crítica para la toma de decisiones, la optimización de recursos, la automatización inteligente y la transición ecológica. Sin gobierno del dato, no hay industria 4.0 que valga. Y sin industria 4.0, los retos de sostenibilidad, eficiencia energética o trazabilidad completa son inabordables.
En este artículo exploramos por qué el gobierno del dato es esencial en el ámbito industrial, qué beneficios concretos aporta a los procesos productivos y cómo iniciativas como el Espacio de Datos Nacional de Industria pueden acelerar esta transformación.
A continuación, analizamos su impacto a distintos niveles, desde los casos de uso más relevantes hasta los marcos colaborativos que están emergiendo en España.
¿Por qué es clave el gobierno del dato en la industria?
Los datos industriales provienen de una multitud de fuentes distribuidas: sensores IoT, sistemas SCADA, líneas de montaje automatizadas, plataformas de mantenimiento, sistemas ERP o MES (Manufacturing Execution Systems o sistemas de ejecución de fabricación), entre otros. Esta heterogeneidad, si no se gestiona adecuadamente, puede convertirse en una barrera para la integración y el análisis útil de la información.
El gobierno del dato permite superar estas barreras estableciendo las reglas del juego para la captura, almacenamiento, calidad, interoperabilidad, uso, protección y eliminación de los datos. Esto habilita no solo la eficiencia operativa sino también la sostenibilidad a largo plazo. ¿Cómo?
- Reduciendo ineficiencias operativas: al contar con datos precisos, actualizados y bien integrados entre sistemas, se pueden automatizar tareas, evitar reprocesos, y reducir paradas no planificadas. Por ejemplo, una planta puede ajustar la velocidad de sus líneas de producción en tiempo real según el análisis de datos de rendimiento y demanda.
- Mejorando la sostenibilidad: una gestión del dato sólida permite identificar patrones de consumo energético, materiales o emisiones. Con esta información se pueden rediseñar procesos para ser más sostenibles, aplicar ecodiseño y reducir la huella ambiental. El dato, en este caso, actúa como brújula hacia la descarbonización.
- Asegurando el cumplimiento normativo y la trazabilidad: desde la ISO 9001 hasta los nuevos reglamentos de economía circular o el Pasaporte de Producto Digital, las industrias deben demostrar cumplimiento. Esto solo es posible con datos fiables, trazables y auditables.
- Facilitando la interoperabilidad entre sistemas: el gobierno del dato actúa como “pegamento” que une los distintos silos tecnológicos de una organización: calidad, producción, logística, mantenimiento, compras, etc. La normalización y alineación semántica de los datos permite flujos más ágiles y decisiones mejor fundamentadas.
- Impulsando la economía circular: gracias a la trazabilidad total del ciclo de vida de un producto, desde su diseño hasta su reciclaje, es posible identificar oportunidades de reutilización, valorización de materiales y diseño sostenible. Todo ello apoyado en datos que siguen al producto a lo largo de su vida.
¿Cómo debería ser el gobierno del dato en el entorno industrial?
Un modelo de gobierno del dato adaptado a este contexto debe incluir:
▸Roles específicos: es necesario contar con un equipo definido, donde quede clara la responsabilidad y las tareas de cada uno. Algunos de los roles que no pueden faltar son:
- Propietarios del dato (data owners): responsables del uso del dato en su área (producción, calidad, mantenimiento…).
- Gestores de calidad del dato (data stewards): velan por la consistencia, completitud y precisión de la información.
- Equipo de gobierno del dato: coordina la estrategia, define políticas comunes y evalúa el cumplimiento.
▸Procesos estructurados: al igual que los roles, es necesario definir las diversas fases y operaciones a llevar a cabo. Entre ellas se encuentran las siguientes:
- Clasificación y catalogación de activos de datos (por tipo, criticidad, uso).
- Control de calidad de datos: definición de reglas de validación, limpieza de duplicados, gestión de excepciones.
- Ciclo de vida del dato: desde su creación en máquina hasta su archivo o destrucción.
- Acceso y seguridad: gestión de privilegios, auditorías de uso, trazabilidad.
▸Políticas organizativas: para garantizar la interoperabilidad y calidad del dato es necesario contar con estándares, normas y guías que orienten a los usuarios. Algunos ejemplos son:
- Estándares de nomenclatura, formatos, codificación y sincronización.
- Normas para la interoperabilidad entre sistemas (por ejemplo, uso de estándares como OPC UA o ISA-95).
- Guías de uso ético y conforme a la legislación (como el Reglamento de Datos, GDPR o legislación medioambiental).
Este enfoque convierte el dato industrial en un activo gestionado con el mismo rigor que cualquier infraestructura física.
Casos de uso industriales habilitados por el gobierno del dato
Los beneficios del gobierno del dato en la industria se materializan en múltiples aplicaciones prácticas. Algunos de los casos de uso más representativos son:
1.Mantenimiento predictivo
Uno de los grandes clásicos de la industria 4.0. Al combinar datos históricos de mantenimiento con sensores en tiempo real, las organizaciones pueden anticipar fallos en máquinas y evitar paradas inesperadas. Pero esto solo es posible si los datos están gobernados: si se ha definido su frecuencia de captura, formato, responsables, calidad y disponibilidad.
2. Trazabilidad completa del producto
Desde la materia prima hasta el cliente final, cada evento en la cadena de valor queda registrado y es accesible. Esto es vital para sectores como la alimentación, la automoción o la farmacéutica, donde la trazabilidad es tanto un valor añadido como una obligación regulatoria. El gobierno del dato asegura que esta trazabilidad no se pierda, sea verificable y cumpla los estándares de interoperabilidad requeridos.
3. Gemelos digitales y simulación de procesos
Para que un gemelo digital —una réplica virtual de un proceso o sistema físico— funcione, necesita alimentarse de datos precisos, actualizados y coherentes. El gobierno del dato garantiza la sincronización entre el mundo físico y el virtual, y permite generar escenarios de simulación fiables, desde el diseño de una nueva línea de producción hasta la optimización del layout de fábrica, es decir, de los distintos elementos dentro de la planta.
4. Monitorización energética y control de emisiones
El seguimiento en tiempo real del consumo de energía, agua o gases puede revelar ineficiencias ocultas y oportunidades de ahorro. A través de cuadros de mando inteligentes y KPI definidos sobre datos gobernados, las plantas industriales pueden reducir sus costes y avanzar en sus objetivos de sostenibilidad ambiental.
5. Automatización y control de calidad inteligente
Los sistemas de visión artificial y algoritmos de machine learning entrenados con datos de producción permiten detectar defectos en tiempo real, ajustar parámetros automáticamente y mejorar la calidad final. Sin una buena calidad de datos (exactitud, completitud, consistencia), estos algoritmos pueden fallar o generar resultados no confiables.
El Espacio de Datos Nacional de Industria: clave para la colaboración y la competitividad
Para que el gobierno del dato industrial trascienda el ámbito de cada empresa y se convierta en una auténtica palanca de transformación sectorial, es necesario contar con infraestructuras que faciliten la compartición segura, confiable y eficiente de los datos entre organizaciones. En esta línea, se sitúa el Espacio de Datos Nacional de Industria, enmarcado dentro del Plan de Impulso de los Espacios de Datos Sectoriales promovido por el Ministerio para la Transformación Digital y de la Función Pública.
Este espacio tiene como objetivo crear un entorno de confianza donde empresas, asociaciones, centros tecnológicos y administraciones puedan compartir y reutilizar datos industriales de forma interoperable, conforme a principios éticos, legales y técnicos. A través de este marco, se busca habilitar nuevas formas de colaboración, acelerar la innovación y reforzar la autonomía estratégica del tejido productivo nacional.
El sector industrial en España es enormemente diverso, con un ecosistema compuesto por grandes corporaciones, pymes, proveedores, subcontratas, clústeres y centros de I+D. Esta diversidad puede convertirse en una fortaleza si se articula mediante una infraestructura común de datos que facilite la integración y el intercambio de información de forma ordenada y segura. Además, estos datos industriales pueden verse complementados con los datos abiertos publicados por organismos públicos, como los disponibles en el Catálogo Nacional de Datos Abiertos, ampliando así el valor y las posibilidades de reutilización para el conjunto del sector.
Los puntos fuertes de esta infraestructura común permiten:
- Detectar sinergias a lo largo de la cadena de valor, como oportunidades de reciclaje industrial entre sectores distintos (por ejemplo, residuos plásticos de una industria química como materia prima en otra).
- Reducir barreras de entrada a la digitalización, especialmente para pymes que no cuentan con recursos propios para desplegar soluciones avanzadas de análisis de datos, pero sí podrían acceder a servicios o datos compartidos dentro del espacio.
- Fomentar modelos de innovación abierta donde empresas compartan datos de forma controlada para el desarrollo conjunto de soluciones basadas en inteligencia artificial o mantenimiento predictivo.
- Impulsar indicadores agregados sectoriales, como huellas de carbono compartidas, niveles de eficiencia energética o índices de circularidad industrial, que permiten al conjunto del país avanzar de forma más coordinada en los objetivos de sostenibilidad y competitividad.
La creación del Espacio de Datos Nacional de Industria puede suponer una auténtica palanca de modernización para el tejido industrial español:
- Mayor competitividad internacional, al facilitar el cumplimiento con los requisitos del mercado europeo, como el Reglamento de Datos, el Pasaporte de Producto Digital o los estándares de sostenibilidad.
- Agilidad regulatoria y trazabilidad mejorada, permitiendo a las industrias responder con rapidez a auditorías, certificaciones o cambios normativos.
- Capacidad de anticipación, gracias al análisis conjunto de datos de producción, consumo o mercado que permiten prever disrupciones en las cadenas de suministro o la demanda de recursos críticos.
- Creación de nuevos modelos de negocio, basados en la puesta a disposición de productos como servicio, la reutilización de materiales o el alquiler compartido de capacidades industriales.
El despliegue de este espacio nacional no solo busca mejorar la eficiencia de procesos industriales. También aspira a reforzar la soberanía tecnológica y de datos del país, habilitando un modelo donde el valor generado por los datos se quede en las propias empresas, regiones y sectores. En este sentido, el Espacio de Datos Nacional de Industria se alinea con iniciativas europeas como GAIA-X o Manufacturing-X, pero con un enfoque adaptado al contexto y necesidades del ecosistema industrial español.
Conclusiones
El gobierno del dato es un pilar fundamental para que la industria avance hacia modelos más eficientes, sostenibles y resilientes. No basta con disponer de grandes volúmenes de información: es necesario gestionarla correctamente para generar valor real.
Los beneficios son claros: optimización operativa, mejora de la trazabilidad, impulso a la economía circular y soporte a tecnologías como la inteligencia artificial o los gemelos digitales. Pero el verdadero salto se da cuando los datos dejan de gestionarse de forma aislada y pasan a formar parte de un ecosistema compartido.
El Espacio de Datos Nacional de Industria ofrece ese marco de colaboración y confianza, facilitando la innovación, la competitividad y la soberanía tecnológica. Apostar por su desarrollo es invertir en una industria más conectada, inteligente y preparada para los retos del futuro.
Contenido elaborado por Dr. Fernando Gualo, Profesor en UCLM y Consultor de Gobierno y Calidad de datos. El contenido y el punto de vista reflejado en esta publicación es responsabilidad exclusiva de su autor.
Con 24 lenguas oficiales y más de 60 lenguas regionales y minoritarias, la Unión Europea se enorgullece de su diversidad cultural y lingüística. Sin embargo, esta riqueza representa también un desafío significativo en el ámbito digital y tecnológico. Los avances en inteligencia artificial (IA) y procesamiento del lenguaje natural han estado dominados por el inglés, creando un desequilibrio notable en la disponibilidad de recursos lingüísticos para la mayoría de los idiomas europeos.
Este desequilibrio tiene consecuencias directas, como, por ejemplo:
- Desarrollo tecnológico asimétrico: las empresas e investigadores tienen dificultades para crear soluciones de IA adaptadas a determinados idiomas porque los recursos son limitados.
- Dependencia tecnológica: Europa corre el riesgo de depender de soluciones lingüísticas desarrolladas fuera de su contexto cultural y normativo.
Resolver esta brecha no solo es una cuestión de inclusión, sino que también representa una oportunidad económica de gran escala, capaz de generar enormes beneficios tanto en comercio como en innovación tecnológica. Para abordar estos desafíos, la Comisión Europea ha lanzado el European Language Data Space (LDS), una infraestructura descentralizada que promueve el intercambio seguro y controlado de datos lingüísticos entre múltiples actores del ecosistema europeo.
A diferencia de un simple repositorio centralizado, el LDS funciona como un mercado de datos lingüísticos que permite a los participantes compartir, vender o licenciar sus datos bajo condiciones claramente definidas y con control total sobre el uso de los mismos.
El European Language Data Space (LDS, por sus siglas en inglés), con una versión beta operativa, representa un paso decisivo para democratizar las tecnologías del lenguaje en todos los idiomas de la Unión Europea. Te contamos las claves sobre este proyecto y los próximos pasos.
¿Cómo funciona esta plataforma?
El LDS se basa en una arquitectura descentralizada peer-to-peer (P2P) que permite a los usuarios interactuar directamente entre sí, sin necesidad de un servidor central o autoridad única, donde cada participante mantiene el control de sus propios datos. Los elementos clave del funcionamiento de LDS son:
1. Arquitectura descentralizada y soberana
-
Cada participante (ya sea proveedor o consumidor de datos) puede instalar localmente el LDS Connector, un software que permite interactuar directamente con otros participantes sin necesidad de un servidor central. Este enfoque garantiza:
-
Soberanía de datos: los propietarios mantienen control absoluto sobre quién puede acceder a sus datos y qué condiciones de uso.
-
Confianza y seguridad: solo los participantes, entidades jurídicas inscritas en la UE, que cumplan los requisitos y sean autorizados pueden formar parte del ecosistema.
- Interoperabilidad: es compatible con otros espacios de datos europeos, siguiendo estándares comunes.
2. Flujo de intercambio de datos
El proceso de intercambio sigue un flujo estructurado entre dos actores principales:
-
Los proveedores describen sus conjuntos de datos lingüísticos, establecen políticas de acceso (licencias, precios) y publican estas ofertas en el catálogo.
- Los consumidores exploran el catálogo, identifican recursos de interés y, a través de sus conectores, inician negociaciones sobre los términos de uso.
Si ambas partes llegan a un acuerdo, se establece un contrato y se efectúa la transferencia de datos de forma segura entre los conectores.
3. Infraestructura de apoyo
Aunque el intercambio es descentralizado, el LDS incluye elementos de apoyo como:
-
Registro de participantes: garantiza que solo entidades verificadas participen en el ecosistema.
-
Catálogo opcional: facilita la publicación y descubrimiento de recursos disponibles
-
Hub de vocabularios: es un servicio que centraliza los vocabularios controlados, y permite mantener las listas de valores, definiciones, relaciones entre términos, mapeadores entre listas, etc.
- Servicio de monitorización: permite supervisar el funcionamiento general del sistema.
Valor añadido para el ecosistema europeo de datos
El LDS aporta beneficios significativos al panorama digital europeo:
-
Impulso de la IA multilingüe
Al facilitar el acceso a datos lingüísticos de calidad en todos los idiomas europeos, el LDS contribuye directamente al desarrollo de modelos de IA más inclusivos y adaptados a la realidad multilingüe de Europa. Esto resulta especialmente relevante en un momento en que los grandes modelos de lenguaje (LLM) están transformando la interacción entre humanos y máquinas.
-
Fortalecimiento de la economía de datos
Se estima que una verdadera integración lingüística digital podría generar enormes beneficios económicos tanto en comercio como en innovación tecnológica. El LDS crea un mercado donde los datos lingüísticos adquieren valor, incentivando su recopilación, procesamiento y puesta a disposición bajo condiciones justas y transparentes.
-
Preservación de la diversidad lingüística
Al promover el desarrollo tecnológico en todas las lenguas europeas, el LDS contribuye a preservar y revitalizar el patrimonio lingüístico del continente, garantizando que ningún idioma quede rezagado en la revolución digital.
-
El papel crucial de la industria y las administraciones públicas
El éxito del LDS depende fundamentalmente de la participación activa de diversos actores:
-
Datos frescos y de calidad
La plataforma busca atraer especialmente datos "frescos" provenientes de la industria (medios de comunicación, editoriales, servicios al cliente) y del sector público, necesarios para entrenar y mejorar los modelos de lenguaje actuales. Se valoran particularmente:
-
Datos multimodales (texto, audio, vídeo).
-
Contenidos específicos de diversos dominios profesionales.
- Recursos lingüísticos actualizados y relevantes.
-
Participación abierta a todos los actores del ecosistema
El LDS está diseñado para ser inclusivo, permitiendo que tanto organizaciones privadas como entidades públicas participen, siempre que sean entidades jurídicas inscritas en la UE. Ambos tipos de organizaciones pueden actuar como proveedores y/o consumidores de datos.
La participación se formaliza mediante un proceso de validación por parte de la junta de gobernanza, garantizando que todas las organizaciones que cumplan con los requisitos puedan beneficiarse de este mercado común de datos lingüísticos.
¿Cómo participar?
La versión beta del LDS ya está operativa y abierta a nuevos participantes. Las organizaciones interesadas en formar parte de esta iniciativa pueden:
-
Unirse a los grupos de prueba y enfoque: para contribuir al desarrollo y mejora de la plataforma, aquí.
-
Probar el conector LDS: experimentando con la tecnología en entornos controlados.
-
Aportar feedback técnico: ayudando a definir aspectos clave como metadatos, licencias o mecanismos de intercambio.
- Identificar datos relevantes: evaluando qué recursos lingüísticos podrían compartirse a través de la plataforma.
El futuro del LDS
Aunque actualmente el LDS se centra en el intercambio de datos, su visión a medio plazo contempla la posibilidad de integrar servicios lingüísticos y alojamiento de modelos de IA dentro del mismo ecosistema, reforzando así el papel de Europa en el desarrollo de tecnologías del lenguaje. En julio de este año, 2025, se espera poder contar con una versión pre-final y la versión finalizada de LDS está prevista para enero de 2026.
Todos estos aspectos fueron comentados en seminario online y gratuito que celebró el portal de datos abiertos europeo “Data spaces: experience from the European Language Data Space”. Puedes volver a ver el webinar aquí.
En un contexto global donde la soberanía tecnológica se ha convertido en prioridad estratégica, el European Language Data Space representa un paso decisivo para garantizar que la revolución de la IA no deje atrás la riqueza lingüística que caracteriza a Europa.
El acceso a datos financieros y bancarios está revolucionando el sector, promoviendo la transparencia, la inclusión financiera y la innovación en servicios económicos. Sin embargo, la gestión de estos datos enfrenta desafíos normativos que buscan equilibrar apertura con seguridad y privacidad.
Por ese motivo, existen distintas formas de acceder a este tipo de datos, como veremos a continuación.
Open Banking y Open Finance versus Open Data
Estos términos, aunque relacionados, tienen diferencias importantes.
El termino Open Banking hace referencia a un sistema que permite a los bancos y otras instituciones financieras compartir de forma digital y segura los datos financieros de los clientes con terceros. Para ello es necesario que los clientes aprueben expresamente las condiciones de compartición de los datos. Este consentimiento puede ser cancelado en cualquier momento según los deseos del cliente.
Open Finance, por su parte, es una evolución de Open Banking que abarca un rango más amplio de productos y servicios financieros. Cuando hablamos de Open Finance, además de los datos bancarios, se incluyen datos sobre seguros, pensiones, inversiones y otros servicios financieros.
Tanto en el Open Banking como en el Open Finance, los datos no son abiertos (Open Data), sino que solo pueden acceder a ellos aquellos autorizados previamente por el cliente. El intercambio de datos se realiza a través de una interfaz de programación de aplicaciones o API (en sus siglas en inglés), que garantiza la agilidad y seguridad del proceso. Todo ello está regulado por la directiva europea sobre servicios de pago en el mercado interior (conocida como PSD2), aunque desde la Comisión Europea se está trabajando en la actualización del marco normativo.
-
Aplicaciones del Open Banking y el Open Finance:
El propósito de estas actividades es dar acceso a nuevos servicios basados en la información compartida. Por ejemplo, facilitan la creación de apps que unifiquen el acceso a todas las cuentas bancarias de un cliente, aunque sean de diferentes proveedores. Esto mejora la gestión y control de los ingresos y gastos al proporcionar una visión general en un único entorno.
Otro ejemplo de uso es que permiten a proveedores consultar información cruzada de forma más rápida. Por ejemplo, al permitir el acceso a los datos financieros de un cliente, un concesionario podría proporcionar información sobre las opciones de financiación más rápidamente.
Plataformas de datos abiertos sobre banca
Aunque los datos bancarios privados, como todos los tipos de datos personales, están estrictamente regulados y no pueden publicarse abiertamente debido a normativas de protección de la privacidad, sí existen conjuntos de datos financieros que pueden compartirse libremente. Por ejemplo, información agregada sobre tasas de interés, indicadores económicos, datos históricos de mercados bursátiles, tendencias de inversión y estadísticas macroeconómicas, que son accesibles a través de fuentes abiertas.
Estos datos, además de impulsar la transparencia y confianza en los mercados, pueden utilizarse para monitorear tendencias económicas, prevenir fraudes y mejorar la gestión de riesgos a nivel global. Además, empresas fintech, desarrolladores y emprendedores pueden aprovecharlos para crear soluciones como herramientas de análisis financiero, sistemas de pago digitales o de asesoramiento automatizado.
Veamos algunos ejemplos de espacios donde obtener datos abiertos sobre el sector bancario y financiero.
Fuentes internacionales
Algunas de las fuentes internacionales más populares son:
-
Banco Central Europeo: ofrece estadísticas y datos sobre mercados financieros de la zona euro, a través de diversas plataformas. Entre otra información, los usuarios pueden descargar conjuntos de datos sobre la inflación, los tipos de interés bancarios, la balanza de pagos, las finanzas públicas, etc.
-
Banco Mundial: facilita el acceso a datos económicos globales sobre desarrollo financiero, pobreza y crecimiento económico.
-
Fondo Monetario Internacional: proporciona un acceso simplificado a datos macroeconómicos y financieros, como las perspectivas de la economía mundial o regional. También ofrece en abierto los datos de informes como su Fiscal Monitor, donde se analiza la evolución más reciente de las finanzas públicas.
-
Federal Reserve Economic Data (FRED): se centra en información económica de los Estados Unidos, incluyendo indicadores de mercado y tasas de interés. Este repositorio está creado y mantenido por el Departamento de Investigación del Banco de la Reserva Federal de St.Louis.
Fuentes nacionales
A través del Catálogo Nacional de datos abiertos de datos.gob.es se puede acceder a una gran cantidad de conjuntos de datos relacionados con la economía. Uno de los publicadores más destacado es el Instituto Nacional de Estadística (INE), que ofrece datos sobre impagos por entidad financiera, hipotecas, etc.
Además, el Banco de España ofrece distintos productos para aquellos interesados en los datos económicos del país:
- Estadísticas: el Banco de España recopila, elabora y publica un amplio conjunto de estadísticas económicas y financieras. Incluye información sobre tipos de interés y de cambio, cuentas financieras de los sectores institucionales, balanzas de pago e incluso encuestas financieras a las familias, entre otros.
- Cuadro de mando: el Banco de España también ha puesto a disposición de la ciudadanía un visor interactivo que permite consumir datos trimestrales y anuales sobre estadísticas exteriores de una manera más sencilla.
Además, Banco de España ha habilitado una sala segura para que los investigadores puedan acceder a datos valiosos, pero que no pueden abrirse al gran público por su naturaleza. En este sentido encontramos:
- BELab: el laboratorio de datos protegidos gestionado por el Banco de España, que ofrece acceso in situ (Madrid) y en remoto. Estos datos han sido utilizados en diversos proyectos.
- ES_DataLab: laboratorio de microdatos restringido para investigadores que desarrollan proyectos con fines científicos y de interés público. En este caso, agrupa microdatos de diversos organismos, incluyendo el Banco de España.
Los espacios de datos: una oportunidad para el intercambio seguro y controlado de datos financieros
Como acabamos de ver, también existen opciones para facilitar el acceso a datos financieros y bancarios, de una forma controlada y segura. Es aquí donde entran en juego los espacios de datos, ecosistema donde diversos actores comparten datos de manera voluntaria y segura, siguiendo mecanismos comunes de gobernanza, normativos y técnicos.
En este sentido, Europa está impulsando un Espacio Europeo de Datos Financieros (EEDF), una iniciativa clave dentro de la Estrategia Europea de Datos. El EEDF se compone de tres pilares fundamentales:
- Datos de informes públicos (“divulgaciones públicas”): recoge datos de informes financieros (balances, ingresos, estado de resultados), que las empresas financieras están obligadas por ley a divulgar de forma periódica. En este ámbito está la iniciativa de Punto de acceso Único Europeo (ESAP), una plataforma centralizada para acceder a datos de más de 200 informes públicos de más de 150,000 empresas.
- Datos privados de los clientes de los proveedores de servicios financieros: abarca aquellos datos que tienen los proveedores de servicios financieros como los bancos. En este ámbito está el marco para el acceso a los datos financieros, que cubre datos como inversiones, seguros, pensiones, préstamos y ahorros.
- Datos de los informes de supervisión: para este tipo de datos se ha de tener en cuenta la estrategia de supervisión, que abarca datos desde diferentes sectores (bancos, seguros, fondos de pensiones…) con el fin de promover la transformación digital en el sector financiero.
En conclusión, el acceso a datos financieros y bancarios está evolucionando significativamente gracias a diversas iniciativas que han permitido una mayor transparencia y que fomentarán el desarrollo de nuevos servicios, al tiempo que garantizan la seguridad y privacidad de los datos compartidos. El futuro del sector financiero estará condicionado por la capacidad de las instituciones y reguladores para fomentar ecosistemas de datos que impulsen la innovación y la confianza en el mercado.
