Blog

El Open Data Maturity Report (Informe de madurez de datos abiertos) es una evaluación anual que desde 2015 analiza el desarrollo y la evolución de las iniciativas de datos abiertos en la Unión Europea. Coordinado por el Portal Europeo de Datos (data.europa.eu) y realizado en colaboración con la Comisión Europea, este informe evalúa a 36 países participantes: los 27 Estados miembros de la UE, 3 países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza) y 6 países candidatos a la adhesión.

El informe evalúa cuatro dimensiones fundamentales:

  1. Política (estrategias y marcos normativos)
  2. Portal (funcionalidades y usabilidad)
  3. Calidad (estándares de metadatos y datos)
  4. Impacto (reutilización y beneficios generados)

En la edición de 2025 España destacó con una puntuación del 100% en el bloque de impacto respecto a la media europea del 82,1%. En términos generales, ocupa la quinta posición entre los países de la Unión Europea con una puntuación total de 95,6%, formando parte del grupo de los países prescriptores de tendencias.

Un aspecto diferencial de esta edición del informe es la incorporación de un enfoque descriptivo y contextual que complementa el modelo normativo tradicional, creando clústeres de países para permitir comparaciones más justas. Estos clústeres agrupan países con características económicas, sociales, políticas y digitales similares, y se basan en perfiles que explican cómo se implementan las políticas de datos abiertos, no solo qué resultados se obtienen. El objetivo es invitar a los países a mirarse en sus peers (sus semejantes), aprender de experiencias comparables y fomentar un aprendizaje entre iguales más efectivo que el basado únicamente en rankings generales.

Además de cuantificarlo, el informe recoge casos de uso y buenas prácticas que llevan a cabo los países para abrir y reutilizar datos del sector público. En este post, destacamos algunas de ellas que pueden servir de inspiración para continuar mejorando nuestro ecosistema de datos abiertos.

La gobernanza inclusiva y coordinada de Croacia

Uno de los aspectos más destacables del informe 2025 es cómo algunos países han logrado establecer estructuras de gobernanza sólidas que garantizan la coordinación entre diferentes niveles de la administración y la participación de múltiples actores.

Croacia destaca por haber creado en 2025 la Coordinación para la Implementación de la Política de Datos Abiertos, un órgano multisectorial que supervisa el cumplimiento normativo, mejora la accesibilidad de los datos y apoya a las autoridades. Este modelo asegura una participación amplia y garantiza que las iniciativas nacionales y locales estén alineadas. El portal nacional funciona como hub central, complementado por portales locales como el de la ciudad de Zagreb. Además, se fomentan intercambios de conocimiento mediante reuniones de coordinación, actualizaciones periódicas y colaboraciones con universidades, como la Facultad de Ingeniería Eléctrica e Informática de la Universidad de Zagreb.

La estructura completa de gobernanza de datos de Francia

Este país lidera el ranking del Open Data Maturity Report gracias, entre otros, a su modelo de gobernanza integral que integra roles de datos abiertos en todos los niveles administrativos. A nivel nacional, el Administrador General de Datos coordina la política de datos públicos y supervisa una red de chief data officers (responsables de datos) en cada ministerio. Etalab, la unidad nacional de datos abiertos e innovación digital, gestiona esta red y proporciona apoyo técnico.

A nivel ministerial, cada responsable de datos gestiona la política de datos (apertura, calidad y reutilización), apoyado por Etalab. Algunos ministerios designan además oficiales de datos abiertos específicos y data stewards (gestor o administrador de datos) que manejan aspectos técnicos y organizativos de la publicación. A nivel local, cada representante regional (préfet) designa un referente para datos, algoritmos y códigos fuente. La Dirección Interministerial Digital coordina además una red de gestores de API para permitir el acceso dinámico a los datos. También garantizan el cumplimiento de DCAT-AP en sus metadatos, como hacemos en España.

Puedes consultar aquí cómo funciona DCAT-AP y para qué sirve

Implementación efectiva: de la estrategia a la acción en Italia

Las administraciones públicas italianas están obligadas a adoptar planes de publicación de datos, siguiendo las directrices nacionales, que priorizan conjuntos de datos de alto valor, datos dinámicos e información solicitada por usuarios. La implementación se apoya en un robusto sistema de monitorización. La Agencia para la Italia Digital (AgID) realiza seguimiento del progreso mediante su panel de transformación digital, que reporta el crecimiento de conjuntos de datos en dati.gov.it.

Las políticas se actualizan regularmente: el último plan trienal (2024-2026) fue adoptado en diciembre de 2024. Para asistir a los titulares de datos y funcionarios, AgID proporciona orientación, realiza webinarios y lanzó la AgID Academy para fortalecer competencias digitales.

Cultura de reutilización en Polonia y Ucrania

Un aspecto crucial para fomentar la apertura de datos es proporcionar recursos prácticos que guíen a las organizaciones públicas en todo el procesoPolonia destaca por su manual de datos abiertos, cuya segunda edición fue publicada por el Ministerio de Asuntos Digitales.

Este manual actualizado introduce nuevas categorías de datos, explica cómo las regulaciones moldean las políticas de datos abiertos y presenta el Portal de Datos de Polonia.

El manual funciona como una lista de verificación para las oficinas, guiándolas a través de sus responsabilidades para abrir datos y fomentar una cultura de reutilización e incluyen herramientas como una checklist de apertura para el cumplimiento.

En relación, Ucrania también ha adoptado un enfoque hacia la reutilización y la generación de recursos que incentivan esta reutilización de datos. El Ministerio de Transformación Digital ha desarrollado un conjunto completo de recursos y herramientas que incluyen documentación técnica detallada y plantillas para ayudar a preparar y publicar conjuntos de datos alineados con estándares nacionales, cubriendo estructuración de metadatos, licenciamiento y cumplimiento con el estándar DCAT-AP.

El portal nacional incluye funcionalidades de seguimiento de publicación y reutilización de conjuntos de datos. Los proveedores reciben retroalimentación sobre calidad y completitud de sus metadatos, ayudándoles a identificar áreas de mejora. Además, se organizan sesiones de capacitación y talleres regulares para desarrollar las habilidades de los publicadores, promoviendo un entendimiento compartido de los principios de datos abiertos y requisitos técnicos.

Albania: rediseño integral del portal

Este país ejemplifica las mejoras de madurez que pueden lograrse mediante una actualización integral del portal nacional de datos abiertos. La renovación a gran escala del portal mejoró la usabilidad, la transparencia y el compromiso del usuario.

El portal actualizado presenta ahora un sistema de calificación de conjuntos de datos (1-5 estrellas), una sección dedicada de noticias sobre temas de datos abiertos y múltiples opciones de notificación, incluyendo feeds RSS y Atom, y correo electrónico. Los usuarios pueden seguir el progreso de sus solicitudes de datos, que se monitorizan activamente y se resumen las respuestas en informes públicamente disponibles.

Para mejor entender y responder a las necesidades de los usuarios, el equipo del portal rastrea palabras clave de búsqueda, analiza tráfico y realiza encuestas y talleres con usuarios.

Lituania: metodología oficial de monitorización

Una de las prácticas clave destacadas en el informe es la adopción de marcos formales y metodologías estructuradas que proporcionan una forma sistemática de evaluar el impacto de los datos abiertos. Lituania sobresale con un enfoque integral porque define cómo las instituciones deben reportar sobre actividades de datos abiertos, garantizando consistencia, responsabilidad y cumplimiento en todo el sector público.

Además, el Ministerio de Economía e Innovación realizó cálculos para estimar el impacto económico de los datos abiertos. Este análisis proporciona evidencia cuantificable de la contribución de los datos abiertos a la innovación, productividad y creación de empleo. Los resultados muestran que los datos abiertos en Lituania crean un valor de mercado de aproximadamente 566 millones de euros (alrededor del 1,2% del PIB) y respaldan cerca de 8.000 empleos de valor agregado.

Alemania: financiación sistemática para colaboración

La iniciativa mFund de Alemania proporciona apoyo financiero estructurado para proyectos de datos relacionados con movilidad, fomentando asociaciones más allá del gobierno.

Un ejemplo es el proyecto miki (mobil im Kiez), que desarrolla soluciones de navegación y orientación para personas con movilidad limitada mediante el compromiso activo de la sociedad civil. El equipo creó un prototipo nacional con visualizaciones para ciudades como Colonia, Kassel, Múnich, Potsdam y Saarbrücken, mostrando barreras de edificios y superficies de caminos. Estas visualizaciones se integrarán en Wheelmap.org, ayudando a individuos con discapacidades de movilidad.

Conclusión

En conclusión, el Open Data Maturity Report 2025 demuestra que los países europeos más maduros en datos abiertos comparten características comunes: gobernanza inclusiva y bien estructurada, implementación efectiva respaldada por planificación y monitorización, apoyo práctico a publicadores de datos, innovación técnica continua en portales y, crucialmente, medición sistemática del impacto.

Las buenas prácticas aquí destacadas son transferibles y adaptables. Invitamos a las administraciones públicas españolas a explorar estas experiencias, adaptarlas a sus contextos locales y compartir sus propias innovaciones, contribuyendo así a un ecosistema europeo de datos abiertos cada vez más robusto y orientado al impacto.

calendar icon
Blog

Durante más de una década, las plataformas de datos abiertos han medido su impacto a través de indicadores relativamente estables: número de descargas, visitas a la web, reutilizaciones documentadas, aplicaciones o servicios creados en base a ellos, etc. Estos indicadores funcionaban bien en un ecosistema donde los usuarios - empresas, periodistas, desarrolladores, ciudadanos anónimos, etc. - accedían directamente a las fuentes originales para consultar, descargar y procesar los datos.

Sin embargo, el panorama ha cambiado radicalmente. La irrupción de los modelos de inteligencia artificial generativa ha transformado la forma en que las personas acceden a la información. Estos sistemas generan respuestas sin necesidad de que el usuario visite la fuente original, lo que está provocando una caída global del tráfico web en medios, blogs y portales de conocimiento.

En este nuevo contexto, medir el impacto de una plataforma de datos abiertos exige repensar los indicadores tradicionales para incorporar a las métricas ya utilizadas otras nuevas que capturen también la visibilidad e influencia de los datos en un ecosistema donde la interacción humana está cambiando.

Un cambio estructural: del clic a la consulta indirecta

El ecosistema web está experimentando una transformación profunda impulsada por el auge de los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés). Cada vez más personas formulan sus preguntas directamente a sistemas como ChatGPT, Copilot, Gemini o Perplexity, obteniendo respuestas inmediatas y contextualizadas sin necesidad de recurrir a un buscador tradicional.

Al mismo tiempo, quienes continúan utilizando motores de búsqueda como Google o Bing también experimentan cambios relevantes derivados de la integración de la inteligencia artificial en estas plataformas. Google, por ejemplo, ha incorporado funciones como AI Overviews, que ofrece resúmenes generados automáticamente en la parte superior de los resultados, o el Modo IA, una interfaz conversacional que permite profundizar en una consulta sin navegar por enlaces. Esto genera un fenómeno conocido como Zero-Click: el usuario realiza una búsqueda en un motor como Google y obtiene la respuesta directamente en la propia página de resultados. En consecuencia, no tiene necesidad de hacer clic en ningún enlace externo, lo cual limita las visitas a las fuentes originales de las que está extraída la información.

Todo ello implica una consecuencia clave: el tráfico web deja de ser un indicador fiable de impacto. Una página web puede estar siendo extremadamente influyente en la generación de conocimiento sin que ello se traduzca en visitas.

: Métricas para medir el impacto de los datos abiertos en la era de la IA   Share of Model (SOM): mide con qué frecuencia los modelos de IA mencionan o utilizan una fuente.  Análisis de sentimiento: evalúa si las menciones que hace la IA son positivas, neutras o negativas.  Categorización de prompts: identifica en qué temas o áreas los modelos de IA consideran más relevante una fuente.  Tráfico procedente de IA: cuantifica las visitas y clics que llegan a una web desde respuestas generadas por IA.  Reutilización algorítmica: analiza hasta qué punto los datos abiertos se usan para entrenar modelos o alimentar aplicaciones.  Fuente: elaboración propia - datos.gob.es.

Figura 1. Métricas para medir el impacto de los datos abiertos en la era de la IA. Fuente: elaboración propia.

Nuevas métricas para medir el impacto

Ante esta situación, las plataformas de datos abiertos necesitan nuevas métricas que capturen su presencia en este nuevo ecosistema. A continuación, se recogen algunas de ellas.

  1. Share of Model (SOM): presencia en los modelos de IA

Inspirado en métricas del marketing digital, el Share of Model mide con qué frecuencia los modelos de IA mencionan, citan o utilizan datos procedentes de una fuente concreta. De esta forma, el SOM ayuda a ver qué conjuntos de datos concretos (empleo, clima, transporte, presupuestos, etc.) son utilizados por los modelos para responder preguntas reales de los usuarios, revelando qué datos tienen mayor impacto.

Esta métrica resulta especialmente valiosa porque actúa como un indicador de confianza algorítmica: cuando un modelo menciona una página web, está reconociendo su fiabilidad como fuente. Además, contribuye a aumentar la visibilidad indirecta, ya que el nombre de la web aparece en la respuesta incluso cuando el usuario no llega a hacer clic.

  1. Análisis de sentimiento: tono de las menciones en IA

El análisis de sentimiento permite ir un paso más allá del Share of Model, ya que no solo identifica si un modelo de IA menciona una marca o dominio, sino cómo lo hace. Habitualmente, esta métrica clasifica el tono de la mención en tres categorías principales: positivo, neutro y negativo.

Aplicado al ámbito de los datos abiertos, este análisis ayuda a comprender la percepción algorítmica de una plataforma o conjunto de datos. Por ejemplo, permite detectar si un modelo utiliza una fuente como ejemplo de buenas prácticas, si la menciona de forma neutral como parte de una respuesta informativa o si la asocia a problemas, errores o datos desactualizados.

Esta información puede resultar útil para identificar oportunidades de mejora, reforzar la reputación digital o detectar posibles sesgos en los modelos de IA que afecten a la visibilidad de una plataforma de datos abiertos.

  1. Categorización de prompts: en qué temas destaca una marca

Analizar las preguntas que hacen los usuarios permite identificar en qué tipos de consultas aparece con mayor frecuencia una marca. Esta métrica ayuda a entender en qué áreas temáticas -como economía, salud, transporte, educación o clima- los modelos consideran más relevante una fuente.

Para las plataformas de datos abiertos, esta información revela qué conjuntos de datos están siendo utilizados para responder preguntas reales de los usuarios y en qué dominios existe mayor visibilidad o potencial de crecimiento. También permite detectar oportunidades: si una iniciativa de datos abiertos quiere posicionarse en nuevas áreas, puede evaluar qué tipo de contenido falta o qué conjuntos de datos podrían reforzarse para aumentar su presencia en esas categorías.

  1. Tráfico procedente de IA: clics desde resúmenes generados

Muchos modelos ya incluyen enlaces a las fuentes originales. Aunque muchos usuarios no hacen clic en dichos enlaces, algunos sí lo hacen. Por ello, las plataformas pueden empezar a medir:

  • Visitas procedentes de plataformas de IA (cuando estas incluyen enlaces).
  • Clics desde resúmenes enriquecidos en buscadores que integran IA.

Esto supone un cambio en la distribución del tráfico que llega a las webs desde los distintos canales. Mientras el tráfico orgánico —el que proviene de los motores de búsqueda tradicionales— está disminuyendo, empieza a crecer el tráfico referido desde los modelos de lenguaje.

Este tráfico será menor en cantidad que el tradicional, pero más cualificado, ya que quien hace clic desde una IA suele tener una intención clara de profundizar.

Es importante que se tengan en cuenta estos aspectos a la hora de fijar objetivos de crecimiento en una plataforma de datos abiertos.

  1. Reutilización algorítmica: uso de datos en modelos y aplicaciones

Los datos abiertos alimentan modelos de IA, sistemas predictivos y aplicaciones automatizadas. Conocer qué fuentes se han utilizado para su entrenamiento sería también una forma de conocer su impacto. Sin embargo, pocas soluciones proporcionan de manera directa esta información. La Unión Europea está trabajando para promover la transparencia en este campo, con medidas como la plantilla para documentar los datos de entrenamiento de modelos de propósito general, pero su implantación -y la existencia de excepciones a su cumplimiento- hacen que el conocimiento sea aún limitado.

Medir el incremento de accesos a los datos mediante API podría dar una idea de su uso en aplicaciones para alimentar sistemas inteligentes. Sin embargo, el mayor potencial en este campo pasa por colaboración con empresas, universidades y desarrolladores inmersos en estos proyectos, para que ofrezcan una visión más realista del impacto.

Conclusión: medir lo que importa, no solo lo que es fácil de medir

La caída del tráfico web no significa una caída del impacto. Significa un cambio en la forma en que la información circula. Las plataformas de datos abiertos deben evolucionar hacia métricas que reflejen la visibilidad algorítmica, la reutilización automatizada y la integración en modelos de IA.

Esto no significa que las métricas tradicionales deban desaparecer. Conocer los accesos a la web, los conjuntos de datos más visitados o los más descargados sigue siendo una información de gran valor para conocer el impacto de los datos proporcionados a través de plataformas abiertas. Y también es fundamental monitorizar el uso de los datos a la hora de generar o enriquecer productos y servicios, incluidos los sistemas de inteligencia artificial. En la era de la IA, el éxito ya no se mide solo por cuántos usuarios visitan una plataforma, sino también por cuántos sistemas inteligentes dependen de su información y la visibilidad que ello otorga.

Por eso, integrar estas nuevas métricas junto a los indicadores tradicionales a través de una estrategia de analítica web y SEO * permite obtener una visión más completa del impacto real de los datos abiertos. Así podremos saber cómo circula nuestra información, cómo se reutiliza y qué papel juega en el ecosistema digital que hoy da forma a la sociedad.

*El SEO (Search Engine Optimization) es el conjunto de técnicas y estrategias destinadas a mejorar la visibilidad de un sitio web en los motores de búsqueda.

calendar icon
Noticia

España vuelve a destacar en el panorama europeo de datos abiertos. El informe Open Data Maturity 2025 sitúa a nuestro país entre los líderes en la apertura y reutilización de información del sector público, consolidando una trayectoria ascendente en innovación digital.

El informe, elaborado anualmente por el portal europeo de datos, data.europa.eu, evalúa el grado de madurez de los datos abiertos en Europa. Para ello analiza varios indicadores, agrupados en cuatro dimensiones: política, portal, calidad e impacto. En la edición de este año han participado 36 países, incluidos los 27 Estados miembros de la Unión Europea (EU), tres países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza) y seis países candidatos (Albania, Bosnia y Herzegovina, Montenegro, Macedonia del Norte, Serbia y Ucrania). 

Este año, España se sitúa en quinta posición entre los países de la Unión Europea y sexta del total de países analizados, empatada con Italia. En concreto se ha obtenido una puntuación total de 95,6%, muy por encima de la media de los países analizados (81,1%). Con este dato, España mejora su puntuación con respecto a 2024, cuando obtuvo un 94,8%.

España, entre los líderes europeos

Con esta posición, España se sitúa un año más entre los países prescriptores en materia de datos abiertos (trendsetters), es decir, aquellos que marcan tendencia y sirven de ejemplo de buenas prácticas a otros Estados. España comparte grupo con Francia, Lituania, Polonia, Ucrania, Irlanda, la ya mencionada Italia, Eslovaquia, Chipre, Portugal, Estonia y República Checa.

Los países de este grupo cuentan con políticas avanzadas de datos abiertos, alineadas con los progresos técnicos y políticos de la Unión Europea, incluyendo la publicación de conjuntos de datos de alto valor.  Además, existe una coordinación sólida de las iniciativas relacionadas con los datos abiertos en todos los niveles de la administración. Sus portales nacionales ofrecen funciones completas y metadatos de calidad, con escasas limitaciones en publicación o uso. Esto lleva a que los datos publicados se puedan reutilizar más fácilmente para múltiples fines, contribuyendo a generar un impacto positivo en distintos ámbitos.

Gráfico de países integrantes de los distintos clusteres

Figura 1. Países integrantes de los distintos clusters.

Las claves del avance de España

De acuerdo con el informe, España reforzó su liderazgo en materia de datos abiertos mediante el desarrollo de políticas estratégicas, la modernización técnica y la innovación impulsada por la reutilización. En concreto, las mejoras en el ámbito político son las que han impulsado el crecimiento de España:

Puntuación de España en las distintas dimensiones junto con el crecimiento sobre el año anterior.

Figura 2. Puntuación de España en las distintas dimensiones junto con el crecimiento sobre el año anterior.

Tal y como se muestra en la imagen, la dimensión política ha alcanzado una puntuación de 99,2% frente al 96% del año pasado, destacando sobre la media europea que es del 93,1%. El motivo de este crecimiento es el avance en el marco normativo. En este sentido, el informe destaca la configuración del V Plan de Gobierno Abierto, desarrollado a través de un proceso de cocreación en el que participaron todos los grupos de interés. Este plan ha introducido nuevas iniciativas relacionadas con la gobernanza y la reutilización de datos abiertos. Otra cuestión destacada es que España impulsó la publicación de conjuntos de datos de alto valor, en consonancia con el Reglamento de Ejecución (UE) 2023/138.

El resto de dimensiones se mantienen estables, todas ellas con puntuaciones por encima de la media europea: en la dimensión portal se ha obtenido un 95,5% en comparación con el 85,45% europeo, mientras que la de calidad ha sido valorada con un 87,8% versus el 83.4% del resto de países analizados. El bloque de Impacto continúa siendo nuestra gran baza, con un 100% frente al 82.1% europeo. En esta dimensión continuamos posicionándonos como grandes líderes, gracias a una definición clara de reutilización, la medición sistemática del uso de datos y la existencia de ejemplos de impacto en los ámbitos gubernamental, social, ambiental y económico.

Aunque no se hayan producido grandes movimientos en la puntuación de estas dimensiones, el informe sí destaca hitos de España en todos los ámbitosPor ejemplo, la plataforma datos.gob.es se sometió a un importante rediseño, que incluyó ajustes al perfil de metadatos DCAT-AP-ES, con el fin de mejorar la calidad e interoperabilidad. En este sentido, se publicó una guía de implementación específica y se consolidó una comunidad de aprendizaje y desarrollo a través de GitHub. Además, se mejoraron el motor de búsqueda y las herramientas de supervisión del portal, incluyendo el seguimiento de la reutilización externa a través de referencias de GitHub y análisis enriquecidos a través de cuadros de mando interactivos.

La implicación del sector infomediario ha sido clave a la hora de reforzar el liderazgo de España en datos abiertos. El informe  destaca la importancia de actividades como el Encuentro Nacional de Datos Abiertos, con retos que se trabajan conjuntamente  por parte de un equipo multidisciplinar con representantes de instituciones públicas, privadas y académicas,  edición tras edición.   A ello hay que sumar que la Federación Española de Municipios y Provincias identificó 80 conjuntos de datos esenciales en los que los gobiernos locales deben poner el foco a la hora de avanzar en la apertura de información, fomentando la coherencia y reutilización a nivel municipal. 

La siguiente imagen muestra la puntuación específica de cada una de las subdimensiones analizadas:

Puntuación de España en las distintas dimensiones y subcategorías.

Figura 3. Puntuación de España en las distintas dimensiones y subcategorías.

Puedes ver el detalle del informe de España en la web del portal europeo.

Próximos pasos y retos comunes 

El informe finaliza con una serie de recomendaciones concretas para cada grupo de países. Para el grupo de trendsetters, en el que se encuentra España, las recomendaciones no se centran tanto en alcanzar la madurez —ya lograda—, sino en profundizar y expandir su papel como referentes europeos. Algunas de las recomendaciones son:

  • Consolidar ecosistemas temáticos (comunidades de proveedores y reutilizadores) y priorizar los datos de alto valor de forma sistemática.
  • Alinear la acción local con la estrategia nacional, habilitando políticas “data-driven”.  
  • Cooperar con data.europa.eu y otros países para implementar y adaptar un marco de evaluación de impacto con métricas por dominios.
  • Desarrollar perfiles de usuario y permitir sus contribuciones al portal nacional.
  • Mejorar la calidad de datos y metadatos, y su localización, mediante herramientas de validación, inteligencia artificial y flujos centrados en el usuario.
  • Aplicar estándares específicos de dominio para armonizar datasets y maximizar la interoperabilidad, calidad y reutilización.
  • Ofrecer formación avanzada y certificada en normativa y alfabetización de datos.
  • Colaborar internacionalmente en soluciones reutilizables, como software compartido u open source.

España ya trabaja en muchos de estos puntos para continuar mejorando su oferta de datos abiertos. El objetivo es que cada vez más reutilizadores puedan aprovechar de forma sencilla el potencial de la información pública para generar servicios y soluciones que generen un impacto positivo en toda la sociedad.

La posición alcanzada por España en este ranking europeo es fruto del trabajo de todas las iniciativas públicas, empresas, comunidades de usuarios y reutilizadores ligados a los datos abiertos, que impulsan un ecosistema que no deja de crecer. ¡Gracias por el esfuerzo!

calendar icon
Noticia

El pasado 19 de noviembre, la Comisión Europea presentó la Estrategia Unión de Datos (Data Union Strategy), una hoja de ruta que busca consolidar un ecosistema europeo de datos robusto, seguro y competitivo. Esta estrategia se articula en torno a tres pilares fundamentales: ampliar el acceso a datos de calidad para la inteligencia artificial y la innovación, simplificar el marco normativo existente, y proteger la soberanía digital europea. En este post, explicaremos en detalle cada uno de estos pilares, así como el calendario de implementación del plan previsto para los próximos dos años.

Pilar 1: ampliar el acceso a datos de calidad para la IA y la innovación

El primer pilar de la estrategia se centra en garantizar que empresas, investigadores y administraciones públicas tengan acceso a datos de alta calidad que permitan desarrollar aplicaciones innovadoras, especialmente en el ámbito de la inteligencia artificial. Para ello, la Comisión propone una serie de iniciativas interconectadas que abarcan desde la creación de infraestructuras hasta el desarrollo de estándares y facilitadores técnicos. Como parte de este pilar se establecen una serie de acciones: la ampliación de espacios comunes europeos de datos, el desarrollo de los data labsel impulso del Cloud and AI Development Actla ampliación de activos de datos estratégicos y la elaboración de facilitadores para implementar estas medidas.

1.1 Ampliación de los Espacios Comunes Europeos de Datos (CEDS)

Los Espacios Comunes Europeos de Datos constituyen uno de los elementos centrales de esta estrategia:

  • Inversión prevista: 100 millones de euros para su despliegue.

  • Sectores prioritarios: salud, movilidad, energía, administración pública (legal) y medio ambiente.

  • Interoperabilidad: se apuesta por SIMPL para la interoperabilidad entre espacios de datos con el apoyo del Centro Europeo de Competencia en Datos (DSSC, por sus siglas en inglés Data Spaces Support Center).

  • Aplicaciones clave:

    • Espacio Europeo de Datos de Salud (EHDS): mención especial por su función como puente entre los sistemas de datos de salud y el desarrollo de la IA.

    • Nuevo Espacio de Datos de Defensa: para el desarrollo de sistemas de última generación, coordinado por la Agencia Europea de Defensa.

1.2 Laboratorios de datos (Data Labs): el nuevo ecosistema para conectar datos y desarrollo de IA

La estrategia plantea utiliza Data Labs como puntos de conexión entre el desarrollo de inteligencia artificial y los datos europeos.

Estos laboratorios emplean el data pooling, un proceso de combinación y compartición de datos públicos y restringidos provenientes de múltiples fuentes en un repositorio centralizado o entorno compartido. Todo esto facilita el acceso y uso de información. En concreto, los servicios que ofrecen los Data Labs son:

  • Facilita el acceso a los datos.

  • Infraestructura técnica y herramientas.

  • Data pooling.

  • Filtrado de datos y etiquetado 

  • Guía regulatoria y formación.

  • Reducción de la brecha entre los espacios de datos y los ecosistemas de IA.

Plan de implementación:

  • Primera fase: los primeros Data Labs se establecerán en el marco de las AI Factories (gigafactorías de IA), ofreciendo servicios de datos para conectar el desarrollo de IA con los espacios de datos europeos.

  • Data Labs sectoriales: se establecerán de forma independiente en otros ámbitos para cubrir necesidades específicas, por ejemplo, en el sector energético.

  • Modelo autosostenible: se prevé que el modelo de Data Labs pueda desplegarse comercialmente, convirtiéndolo en un ecosistema autosostenible que conecta datos e IA.

1.3 Cloud and AI Development Act: impulso a la nube soberana

Para el impulso de la tecnología de nube, la Comisión propondrá en el primer trimestre de 2026 este nuevo reglamento. Actualmente hay una consulta pública abierta en la que se puede participar aquí.

1.4 Activos de datos estratégicos: sector público, recursos científicos, culturales y lingüísticos

Por un lado, en 2026 se propondrá ampliar la lista de los datos de alto valor High value dataseten inglés o HVDS para incluir datos legales, judiciales y administrativos, entre otros. Y, por otro lado, la Comisión mapeará bases existentes y financiará nuevas infraestructuras digitales.

1.5 Facilitadores horizontales: datos sintéticos, data pooling y estándares

La Comisión Europea elaborará guías y estándares sobre datos sintéticos y se financiará I+D avanzada en técnicas para su generación de a través de Horizon Europe.

Otro tema que la UE quiere impulsar es el data poolingcomo explicamos anteriormente. Compartir datos de etapas tempranas del ciclo productivo puede generar beneficios colectivos, pero persisten barreras por incertidumbre legal y temor a infringir normas de competencia. ¿Su propósito? Convertir el data pooling en una opción confiable y legalmente segura para acelerar avances en sectores críticos.

Finalmente, en materia de estandarización, se solicitará a las organizaciones europeas de normalización (CEN/CENELEC) el desarrollo de nuevos estándares técnicos en dos ámbitos clave: la calidad del dato y el etiquetado. Estos estándares permitirán establecer criterios comunes sobre cómo deben ser los datos para garantizar su fiabilidad y cómo deben etiquetarse para facilitar su identificación y uso en diferentes contextos.

Pilar 2: Simplificación Normativa

El segundo pilar aborda uno de los desafíos más señalados por empresas y organizaciones: la complejidad del marco regulatorio europeo en materia de datos. La estrategia propone una serie de medidas destinadas a simplificar y consolidar la legislación existente.

2.1 Derogaciones y consolidación normativa: hacia un marco más coherente

Se quieren eliminar normativas cuyas funciones ya están cubiertas por legislación más reciente, evitando así duplicidades y contradicciones. En primer lugar, se derogará el Reglamento de Libre Flujo de Datos no Personales (FFoNPD), ya que sus funciones están ahora cubiertas por la Data Act (Ley de Datos). No obstante, se preservará explícitamente la prohibición de localización injustificada de datos, un principio fundamental para el mercado único digital.

Del mismo modo, la Data Governance Act (Reglamento europeo de gobernanza de datos o DGA) será eliminada como norma independiente, migrando sus provisiones esenciales a la Data Act. Este movimiento simplifica el marco regulatorio y, además, alivia la carga administrativa: las obligaciones para los intermediarios de datos pasarán a ser más ligeras y de carácter voluntario.

En cuanto al sector público, la estrategia plantea una consolidación importante. Las normas sobre intercambio de datos públicos, actualmente dispersas entre la DGA y la Directiva de Datos Abiertos (Open Data Directive), se fusionarán en un único capítulo dentro de la Data Act. Esta unificación facilitará tanto la aplicación como la comprensión del marco legal por parte de las administraciones públicas.

2.2 Reforma de cookies: equilibrio entre protección y usabilidad

Otro detalle relevante es la regulación de cookies que experimentará una modernización significativa, integrándose en el marco del Reglamento General de Protección de Datos (RGPD). La reforma busca un equilibrio: por un lado, se legalizarán usos de bajo riesgo que actualmente generan incertidumbre legal; por otro, se simplificarán los banners de consentimiento mediante sistemas de "un solo clic" (one-click). El objetivo es claro: reducir la denominada "fatiga del usuario" ante las solicitudes repetitivas de consentimiento que todos conocemos al navegar por Internet.

2.3 Ajustes al RGPD para facilitar el desarrollo de IA

El Reglamento General de Protección de Datos también será objeto de una reforma focalizada, diseñada específicamente para liberar datos de forma responsable en beneficio del desarrollo de la inteligencia artificial. Esta intervención quirúrgica aborda tres aspectos concretos:

  1. Aclara cuándo puede aplicarse el interés legítimo para el entrenamiento de modelos de IA.

  2. Define con mayor precisión la distinción entre datos anónimos y seudonimizados, especialmente en relación con el riesgo de reidentificación.

  3. Armoniza las evaluaciones de impacto en protección de datos, facilitando su aplicación coherente en toda la Unión.

2. 4 Implementación y Apoyo a la Data Act

La Data Act, recientemente aprobada, será objeto de ajustes para mejorar su aplicación. Por un lado, se refina el alcance del intercambio de datos de empresas a gobiernos (B2G), limitándolo estrictamente a situaciones de emergencia. Por otro lado, se amplía el paraguas de protección: las condiciones favorables que actualmente disfrutan las pequeñas y medianas empresas (PYMES) se extenderán también a las empresas medianas o small mid-caps, aquellas que tienen entre 250 y 749 empleados.

Para facilitar la implementación práctica de la norma, ya se ha publicado un modelo de cláusulas contractuales tipo para el intercambio de datos, proporcionando así una plantilla que las organizaciones pueden utilizar directamente. Además, durante el primer trimestre de 2026 se publicarán dos guías adicionales: una sobre el concepto de "compensación razonable" en los intercambios de datos, y otra destinada a clarificar las definiciones clave de la Data Act que puedan generar dudas interpretativas.

Consciente de que las PYMES pueden tener dificultades para navegar este nuevo marco legal, se creará un Helpdesk Legal en el cuarto trimestre de 2025. Este servicio de asistencia ofrecerá asesoramiento directo sobre la aplicación de la Data Act, dando prioridad precisamente a las pequeñas y medianas empresas que carecen de departamentos jurídicos especializados.

2.5 Evolución de la gobernanza: hacia un ecosistema más coordinado

La arquitectura de gobernanza del ecosistema europeo de datos también experimenta cambios significativos. El European Data Innovation Board (EDIB) evoluciona desde un órgano principalmente consultivo hacia un foro de debates más técnicos y estratégicos, incorporando tanto a los Estados miembros como a representantes de la industria. Para ello, se modificará su articulado con dos objetivos: permitir la inclusión en los debates de las autoridades competentes en materia de Data Act, y dotar de mayor flexibilidad a la Comisión Europea en la composición y funcionamiento del organismo.

Complementariamente, se articulan dos mecanismos adicionales de retroalimentación y anticipación. La Apply AI Alliance canalizará el feedback sectorial, recogiendo las experiencias y necesidades específicas de cada industria. Por su parte, el AI Observatory actuará como radar de tendencias, identificando desarrollos emergentes en el ámbito de la inteligencia artificial y traduciéndolos en recomendaciones de políticas públicas. De este modo, se cierra un círculo virtuoso donde la política se nutre constantemente de la realidad del terreno.

Pilar 3: Protección de la soberanía del dato europeo

El tercer pilar se centra en garantizar que los datos europeos reciban un trato justo y seguro, tanto dentro como fuera de las fronteras de la Unión. La intención es que solo se compartan datos con países de la misma visión regulatoria.

3.1 Medidas específicas para proteger los datos europeos

  • Publicación de guías para evaluar el trato justo de datos de la UE en el extranjero (segundo trimestre 2026):

  • Publicación de toolbox contra prácticas injustas (segundo trimestre 2026):

    • La localización injustificada.

    • La exclusión.

    • Las salvaguardas débiles.

    • La fuga de datos.

  • Adopción de medidas para proteger los datos no personales sensibles.

Todas estas medidas se plantean implementar desde el último cuatrimestre de 2025 y durante todo 2026 en un despliegue progresivo que permitirá una adopción gradual y coordinada de las diferentes medidas, tal y como establece la Data Union Strategy.

En resumen, la Estrategia Unión de Datos representa un esfuerzo integral por consolidar el liderazgo europeo en la economía del dato. Para ello se impulsará el data pooling y los espacios de datos de los Estados miembro, se apostará por los Data Labs y las gigafactorías de IA y se incentivará la simplificación normativa.

calendar icon
Noticia

El portal europeo de datos abiertos ha publicado el tercer volumen de su Observatorio de Casos de Uso (Use Case Observatory, en inglés), un informe que recopila la evolución de proyectos de reutilización de datos en toda Europa. Esta iniciativa pone de relieve los avances logrados en cuatro áreas: impacto económico, gubernamental, social y medioambiental.

El cierre de una investigación de tres años

Entre 2022 y 2025, el portal europeo de datos abiertos ha llevado a cabo un seguimiento sistemático de la evolución de diversos proyectos europeos. La investigación comenzó con una selección inicial de 30 iniciativas representativas, que fueron analizadas en profundidad para identificar su potencial de impacto.

Tras dos años, 13 proyectos continuaron en el estudio, entre los que se encontraban tres españoles: PlanttesTangible DataUniversiDATA-Lab. Se estudió su desarrollo a lo largo del tiempo para comprender cómo la reutilización de datos abiertos puede generar beneficios reales y sostenibles.

La publicación del volumen III en octubre de 2025 marca el cierre de esta serie de informes, tras el volumen I (2022) y el volumen II (2024). Este último documento ofrece una visión longitudinal, mostrando cómo los proyectos han madurado en tres años de observación y qué impactos concretos han generado en sus respectivos contextos.

Conclusiones comunes

Este tercer y último informe recopila una serie de conclusiones clave:

Impacto económico

Los datos abiertos impulsan el crecimiento y la eficiencia en todos los sectores. Contribuyen a la creación de empleo, tanto de forma directa como indirecta, facilitan procesos de contratación más inteligentes y estimulan la innovación en ámbitos como la planificación urbana y los servicios digitales.

El informe muestra el ejemplo de:

  •  Naar Jobs (Bélgica): una aplicación para la búsqueda de empleo cerca del domicilio de los usuarios y focalizada en las opciones de transporte disponible.

Esta aplicación demuestra cómo los datos abiertos pueden convertirse en un motor para el empleo regional y el desarrollo empresarial.

Impacto gubernamental

La apertura de datos fortalece la transparencia, la rendición de cuentas y la participación ciudadana.

A este campo pertenecen dos casos de uso analizados:

Ambos ejemplos evidencian cómo el acceso a la información pública empodera a los ciudadanos, enriquece el trabajo de los medios de comunicación y respalda la elaboración de políticas basadas en evidencia. Todo ello ayuda a reforzar los procesos democráticos y la confianza en las instituciones.

Impacto social

Los datos abiertos promueven la inclusión, la colaboración y el bienestar.

A este campo pertenecen las siguientes iniciativas analizadas:

  • UniversiDATA-Lab (España): repositorio de datos universitarios que facilita aplicaciones analíticas.
  • VisImE-360 (Italia): herramienta para mapear la discapacidad visual y orientar recursos sanitarios.
  • Tangible Data (España): empresa centrada en realizar esculturas físicas que convierten datos en experiencias accesibles.
  • EU Twinnings (Países Bajos): plataforma que compara regiones europeas para encontrar “ciudades gemelas”
  • Open Food Facts (Francia): base de datos colaborativa sobre productos alimenticios.
  • Integreat (Alemania): aplicación que centraliza información pública para apoyar la integración de migrantes.

Todos ellos muestran cómo las soluciones basadas en datos pueden amplificar la voz de los colectivos vulnerables, mejorar los resultados en salud y abrir nuevas oportunidades educativas. Incluso los efectos más pequeños, como la mejora en la vida de una sola persona, pueden resultar significativos y duraderos.

Impacto medioambiental

Los datos abiertos actúan como un poderoso facilitador de la sostenibilidad.

Al igual que pasaba con el impacto ambiental, en esta área encontramos un gran número de casos de uso:

  • Digital Forest Dryads (Estonia): proyecto que emplea datos para monitorizar los bosques y fomentar su conservación.
  • Air Quality in Cyprus (Chipre): plataforma que informa sobre la calidad del aire y apoya políticas ambientales.
  • Planttes (España): aplicación de ciencia ciudadana que ayuda a personas con alergias al polen mediante el seguimiento de la fenología de plantas.
  • Environ-Mate (Irlanda): herramienta que promueve hábitos sostenibles y conciencia ecológica.

Estas iniciativas ponen de relieve cómo la reutilización de datos contribuye a sensibilizar, impulsar cambios de comportamiento y permitir intervenciones específicas para proteger los ecosistemas y fortalecer la resiliencia climática.

El volumen III también señala retos comunes: la necesidad de financiación sostenible, la importancia de combinar datos institucionales con datos generados por la ciudadanía y la conveniencia de involucrar a los usuarios finales en todo el ciclo de vida de los proyectos. Además, subraya la importancia de la colaboración europea y la interoperabilidad transnacional para escalar el impacto.

En conjunto, el informe refuerza la relevancia de seguir invirtiendo en ecosistemas de datos abiertos como herramienta clave para afrontar desafíos sociales y promover una transformación inclusiva.

El impacto de los proyectos españoles en la reutilización de datos abiertos

Como hemos mencionado, tres de los casos de uso analizados en el Use Case Observatory tienen sello español. Estas iniciativas destacan por su capacidad de combinar innovación tecnológica con impacto social y medioambiental, y ponen de manifiesto la relevancia de España dentro del ecosistema europeo de datos abiertos. Su trayectoria demuestra cómo nuestro país contribuye activamente a transformar los datos en soluciones que mejoran la vida de las personas y refuerzan la sostenibilidad y la inclusión. A continuación, hacemos un zoom en lo que el informe dice sobre ellas.

Planttes

Esta iniciativa de ciencia ciudadana ayuda a personas con alergias al polen mediante información en tiempo real sobre plantas alergénicas en floración. Desde su aparición en el Volumen I del Use Case Observatory, ha evolucionado como plataforma participativa en la que los usuarios aportan fotos y datos fenológicos para crear un mapa de riesgo personalizado. Este modelo participativo ha permitido mantener un flujo constante de información validada por investigadores y ofrecer mapas cada vez más completos. Con más de 1.000 descargas iniciales y unos 65.000 visitantes anuales en su web, es una herramienta útil para personas con alergias, educadores e investigadores.

El proyecto ha reforzado su presencia digital, con una creciente visibilidad gracias al apoyo de instituciones como la Universidad Autónoma de Barcelona y la Universidad de Granada, además de la promoción realizada por la empresa Thigis.

Entre sus retos figuran ampliar la cobertura geográfica más allá de Cataluña y Granada y sostener la participación y validación de datos. Por ello, de cara al futuro, busca extender su alcance territorial, fortalecer la colaboración con escuelas y comunidades, integrar más datos en tiempo real y mejorar sus capacidades predictivas.

A lo largo de este tiempo, Planttes se ha consolidado como un ejemplo de cómo la ciencia impulsada por la ciudadanía puede mejorar la salud pública y la conciencia ambiental, demostrando el valor de la ciencia ciudadana en la educación ambiental, la gestión de alergias y el seguimiento del cambio climático.

Tangible data

El proyecto transforma conjuntos de datos en esculturas físicas que representan retos globales como el cambio climático o la pobreza, integrando códigos QR y NFC para contextualizar la información. Reconocido en los EU Open Data Days 2025, Tangible Data ha inaugurado su instalación Tangible climate en el Museo Nacional de Ciencias Naturales de Madrid.

Tangible Data ha evolucionado en tres años desde un proyecto prototipo basado en esculturas 3D para visualizar datos de sostenibilidad hasta convertirse en una plataforma educativa y cultural que conecta los datos abiertos con la sociedad. El Volumen III del Use Case Observatory refleja su expansión en escuelas y museos, la creación de un programa educativo para estudiantes de 15 años y el desarrollo de experiencias interactivas con inteligencia artificial, consolidando su compromiso con la accesibilidad y el impacto social.

Entre sus retos destacan la financiación y la ampliación del programa educativo, mientras que sus objetivos futuros incluyen escalar las actividades escolares, exhibir esculturas de gran formato en espacios públicos y reforzar la colaboración con artistas y museos. En conjunto, sigue fiel a su misión de hacer los datos tangibles, inclusivos y accionables.

UniversiDATA-Lab

UniversiDATA-Lab es un repositorio dinámico de aplicaciones analíticas basadas en datos abiertos de universidades españolas, creado en 2020 como colaboración público-privada y actualmente integrado por seis instituciones. Su infraestructura unificada facilita la publicación y reutilización de datos en formatos estandarizados, reduciendo barreras y permitiendo que estudiantes, investigadores, empresas y ciudadanos accedan a información útil para la educación, la investigación y la toma de decisiones.

En los últimos tres años, el proyecto ha pasado de ser un prototipo a una plataforma consolidada, con aplicaciones activas como el visor de presupuestos y de jubilaciones, y un visor de contratación en fase beta. Además, organiza un datathon periódico que impulsa la innovación y proyectos con impacto social.

Entre sus retos destacan la resistencia interna en algunas universidades y la compleja anonimización de datos sensibles, aunque ha respondido con protocolos sólidos y un enfoque en la transparencia. De cara al futuro, busca ampliar su catálogo, sumar nuevas universidades y lanzar aplicaciones sobre cuestiones emergentes como abandono escolar, diversidad del profesorado o sostenibilidad, aspirando a convertirse en referente europeo en reutilización de datos abiertos en educación superior.

Conclusión

Como conclusión, el tercer volumen del Use Case Observatory confirma que los datos abiertos se han consolidado como una herramienta clave para impulsar la innovación, la transparencia y la sostenibilidad en Europa. Los proyectos analizados —y en particular las iniciativas españolas Planttes, Tangible Data y UniversiDATA-Lab— demuestran que la reutilización de la información pública puede traducirse en beneficios concretos para la ciudadanía, la educación, la investigación y el medio ambiente.

calendar icon
Noticia

El portal europeo de datos, data.europa.eu, ha publicado el Open Data Maturity Index de 2024, un informe anual que evalúa el nivel de madurez de los países europeos en materia de datos abiertos.

Para su elaboración, se ha realizado una encuesta a los 34 países participantes, incluidos los 27 Estados miembros de la Unión Europea, cuatro países candidatos (Bosnia y Herzegovina, Albania, Serbia y Ucrania) y tres países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza).

En la edición de este año, España obtiene una calificación total del 95% sobre 100%. Con ello se coloca en la sexta posición general. Tal y como se refleja en la siguiente imagen, un año más, España se sitúa en el grupo de los llamados países marcadores de tendencia (trendsetter) que son aquellos con mejores puntuaciones del ranking, y entre los que también se encuentran Francia, Polonia, Ucrania, Eslovaquia, Irlanda, Lituania, República Checa, Italia, Estonia y Chipre.

Figura 1: Grupos de países participantes en función de su puntuación global de madurez en datos abiertos

Figura 1: Grupos de países participantes en función de su puntuación global de madurez en datos abiertos

Por encima de la media de la UE27 en las cuatro dimensiones analizadas

La Dimensión Política, centrada en las políticas de datos abiertos de los distintos países, analiza la existencia de modelos de gobernanza nacional para la gestión de datos abiertos y las medidas que se han aplicado para implementar las estrategias existentes.  En estos aspectos, España ha obtenido un 96% frente a la media europea, que se sitúa en 91%. Los aspectos más positivos que se identifican son:

  • Alineamiento con las políticas europeas: El informe resalta que España está plenamente alineada con la Directiva europea relativa a los datos abiertos, entre otras de las recientes regulaciones ligadas al ámbito de los datos que han entrado en vigor.
  • Planes de acción bien definidos: Se subrayan las estrategias desplegadas en diferentes administraciones públicas enfocadas a incentivar la publicación y reutilización de datos generados en tiempo real y datos provenientes de la ciudadanía.
  • Fortalecimiento de competencias: Se focaliza en cómo España ha desarrollado programas formativos para mejorar las habilidades de los funcionarios públicos en gestión y publicación de datos abiertos, asegurando estándares de calidad y fomentando una cultura del dato en la administración pública.

La Dimensión Impacto analiza las actividades realizadas para supervisar y medir, tanto la reutilización de datos abiertos, como el impacto creado fruto de dicha reutilización.  Año tras año, esta viene siendo la dimensión menos madura de toda Europa. Así, frente al 80% de media de la UE, España obtiene una puntuación del 100% por el desarrollo de numerosas actuaciones, entre las que destacan:

  • Colaboración multisectorial: El informe subraya cómo nuestro país se presenta como ejemplo de interacción entre administraciones públicas, empresas privadas y la sociedad civil, materializada en ejemplos tales como los estrechos lazos ente el sector público y la Asociación Multisectorial de la Información (ASEDIE), que elabora año tras año el  informe de ASEDIE sobre reutilización de la información del sector público.
  • Ejemplos de reutilización en sectores clave: Se pone de manifiesto cómo España ha impulsado numerosos casos de reutilización de datos abiertos en áreas estratégicas como medio ambiente, movilidad y energía.
  • Innovación en la comunicación: El documento destaca el esfuerzo invertido en estrategias de comunicación innovadoras para concienciar a la ciudadanía sobre el valor de los datos, y de forma especial a audiencias jóvenes. Se destacan, también la producción de podcasts con entrevistas a expertos en datos abiertos, acompañados de videos promocionales cortos​

La Dimensión Portal se enfoca en analizar las funcionalidades de la plataforma nacional que permitan a los usuarios acceder a los datos abiertos e interaccionar dentro de la comunidad. Con un 96% frente al 82% de la EU27, España se posiciona como uno de los referentes europeos en la mejora de la experiencia de los usuarios y en la optimización de portales nacionales. Los aspectos más destacados en el informe son:  

  • Sostenibilidad y mejora continua: Según refleja el informe, España ha demostrado un fuerte compromiso con la sostenibilidad de la plataforma nacional de datos abiertos (datos.gob.es) y con su adaptación a las nuevas demandas tecnológicas.
  • Interacción con los usuarios: Se subraya como una de las grandes fortalezas la promoción activa desde la plataforma de los datasets disponibles y de los canales a través de los cuales los usuarios pueden solicitar datos que no estén disponibles en el Catálogo Nacional.

Por último, la Dimensión Calidad examina los mecanismos para garantizar la calidad de los (meta)datos. Aquí España obtiene un 88% frente al 79% de la UE. España sigue destacando con iniciativas que garantizan la fiabilidad, accesibilidad y estandarización de los datos abiertos. Algunos puntos fuertes que pone de relieve el informe son:  

  • Automatización de metadatos: Se destaca el empleo de técnicas avanzadas para la recolección automática de metadatos, reduciendo la dependencia de procesos manuales y mejorando la precisión y la actualización en tiempo real. 
  • Guías para la calidad de datos y metadatos: España proporciona múltiples guías prácticas para mejorar la publicación y calidad de los datos abiertos, incluyendo técnicas de anonimización, publicación en formatos tabulares (CSV) y el uso de APIs.

Seguir innovando para mantener la posición avanza de España en la madurez de datos abiertos

Si bien España sigue destacando en la UE gracias a su ecosistema de datos abiertos, los esfuerzos deben continuar. Para ello, en el mismo informe se identifican líneas de trabajo para los países que, como España, buscan seguir manteniendo su posición avanzada en la madurez de datos abiertos y seguir innovando. Entre otras, se refieren las siguientes recomendaciones:

  1. Consolidar ecosistemas de datos abiertos: Fortalecer comunidades temáticas de proveedores y reutilizadores priorizando los conjuntos de datos de alto valor (HVDs) en su desarrollo y promoción.
  2. Impulsar la coordinación: Alinear la estrategia nacional con las necesidades de las agencias y autoridades locales​​.
  3. Desarrollar métricas de impacto específicas por país: Colaborar con universidades, instituciones de investigación y otras entidades para crear marcos de evaluación del impacto.
  4. Medir y divulgar el impacto de los datos abiertos: Realizar evaluaciones periódicas (anuales o bianuales) sobre el impacto económico, ambiental y social de los datos abiertos, promoviendo los resultados para generar apoyo político​​.
  5. Facilitar la participación de la comunidad de datos abiertos: Garantizar que los proveedores mejoren la publicación de datos según las opiniones y calificaciones de los usuarios​.
  6. Incrementar la calidad de los datos y metadatos: Usar herramientas automatizadas y validaciones para mejorar los estándares de publicación, incluso adoptando tecnología de inteligencia artificial para optimizar la calidad de los metadatos​.
  7. Promocionar casos de reutilización exitosos: Publicar y promover casos de éxito en el uso de datos abiertos, interactuar con proveedores y usuarios para identificar necesidades y aplicaciones innovadoras​.

De manera general, el informe pone de manifiesto el buen avance en materia de datos abiertos en toda Europa. Aunque existen áreas de mejora, el panorama open data europeo se va consolidando, con España en las primeras posiciones de la tabla. Puedes leer el informe completo del Open Data Maturity Index 2024 aquí.

calendar icon
Blog

El potencial transformador de las iniciativas de datos abiertos es hoy en día ampliamente reconocido porque ofrecen oportunidades para el fomento de la innovación, una mayor transparencia y la mejora de la eficiencia en muchos procesos. Sin embargo, obtener una medición fiable del impacto real de estas iniciativas resulta complicado.

Desde este mismo espacio hemos planteado también en más de una ocasión la pregunta recurrente de cuál sería la mejor forma de medir el impacto de los datos abiertos, hemos revisado  distintos métodos y buenas prácticas para intentar cuantificarlo, así como analizarlo a través de casos de uso detallados o del impacto específico en temáticas y sectores concretos como el empleo, los datos geográficos, el transporte o los objetivos de desarrollo sostenible. Ahora, gracias al informe "Indicadores para una Evaluación del Impacto de los Datos Abiertos" elaborado por el equipo de data.europa.eu, contamos con un nuevo recurso para no solo entender sino también ser capaz de amplificar el impacto de las iniciativas de datos abiertos a través del diseño de los indicadores adecuados. Gracias a esta publicación podremos llevar a cabo un rápido análisis sobre la importancia de estos indicadores y explicaremos también brevemente cómo se pueden utilizar para aprovechar al máximo el potencial de los datos abiertos.

Comprendiendo los datos abiertos y su cadena de valor

La apertura de datos se refiere a la práctica de hacer que los datos estén disponibles para el público de manera que sean libremente accesibles y utilizables. Más allá de garantizar la simple disponibilidad, el verdadero valor de los datos abiertos radica en su utilización en varios dominios, fomentando el crecimiento económico, mejorando la transparencia del sector público e impulsando la innovación social. Sin embargo, cuantificar el impacto real de la apertura de los datos plantea desafíos significativos debido a las múltiples formas en que se utilizan los datos y las amplias implicaciones que pueden tener para la sociedad.

Para comprender el impacto de los datos abiertos lo primero que debemos conseguir es entender también su cadena de valor, lo que nos proporcionará un marco estructurado y adecuado para conseguir transformar los datos en bruto en conocimientos prácticos. Esta cadena incluye cuatro etapas principales que forman un proceso continuo desde la producción inicial hasta el uso final de los datos: 

Cadena de valor de los datos abiertos

Figura 1: Cadena de valor de los datos abiertos

  1. Recolección: consiste en identificar los datos existentes y establecer los procedimientos necesarios para su catalogación.
  2. Publicación: haciendo que los datos estén disponibles de forma accesible y que sean fáciles de localizar.
  3. Captación: llegará antes cuando los datos sean fáciles de usar y vengan acompañados de los incentivos adecuados para su uso.
  4. Aplicación: ya sea mediante el consumo directo de los datos o a través de alguna transformación que añada nuevo valor a los datos iniciales.

Cada una de estas etapas tendrá una función crítica a la hora de contribuir a la eficacia general y al valor derivado de los datos abiertos. Los indicadores desarrollados para evaluar el impacto de los datos abiertos estarán también estrechamente ligados a cada una de estas etapas, proporcionando una visión integral de cómo los datos se transforman de simple información a una potente herramienta para el desarrollo.

Indicadores para la evaluación del impacto

En el informe se introducen un conjunto de indicadores robustos que están específicamente diseñados para monitorizar las iniciativas de datos abiertos a través de sus productos, efectos e impacto como resultado de su cadena de valor. Estos indicadores no deben ser considerados como simple mediciones, sino como herramientas que nos ayudarán a entender la efectividad de las iniciativas de datos abiertos y a llevar a cabo mejoras estratégicas. Veamos pues estos indicadores un poco más en detalle:

  • Indicadores de producto: son los que se centran en la medición de los resultados inmediatos que llegan al conseguir que los datos abiertos estén disponibles. Algunos ejemplos serían el número de conjuntos de datos liberados, la frecuencia de actualización de los conjuntos de datos, el número de visitantes del catálogo de datos,la accesibilidad de los datos a través de varias plataformas o incluso los esfuerzos llevados a cabo a la hora de promocionar los datos y darles mayor visibilidad. Los indicadores de producción nos ayudan a evaluar la eficiencia de los procesos de publicación y difusión de datos y son generalmente fáciles de medir, aunque únicamente nos darán una medida bastante superficial del impacto.
  • Indicadores de efecto: los indicadores de resultado miden las consecuencias a corto y medio plazo de los datos abiertos. Estos indicadores son cruciales para poder entender cómo los datos abiertos influyen en los procesos de toma de decisiones, dan lugar al desarrollo de nuevas aplicaciones o consiguen mejorar la transparencia gubernamental. Así pues, una mejora en la planificación del transporte público basada en los datos de uso, una mayor participación ciudadana en el desarrollo de las políticas públicas para atajar el cambio climático provocada por la mayor disponibilidad de datos e información, o una mejora de la productividad de los servicios públicos gracias al uso de los datos pueden considerarse ejemplos significativos de indicadores de resultado.
  • Indicadores de impacto: este es el nivel más profundo de medición, ya que los indicadores de impacto evalúan los efectos más amplios y a largo plazo de los datos abiertos. Estos indicadores pueden incluir entre otros beneficios económicos como la creación de empleo o el crecimiento del PIB, impactos sociales como la mejora de la confianza en las entidades públicas, o incluso impactos ambientales como la reducción efectiva de gases de efecto invernadero. En este nivel los indicadores son mucho más complejos y específicos, por lo que deberían definirse para cada dominio específico que se desee analizar y de acuerdo también a los objetivos establecidos dentro de ese dominio.

Indicadores para la evaluación del impacto

Figura 2: Indicadores para la evaluación del impacto

La implementación de estos indicadores en la práctica requerirá de la implantación de un marco metodológico robusto que pueda capturar y analizar datos procedentes de diversas fuentes. Se recomienda combinar métodos de recolección de datos automatizados con otros basados en encuestas para recopilar datos más completos. Este tipo de enfoque dual permite capturar datos cuantitativos a través de sistemas automatizados mientras también incorpora percepciones cualitativas a través del feedback de los usuarios y del análisis de casos de uso más en profundidad.

Mirando hacia el futuro

El futuro de la evaluación del impacto de los datos abiertos mira hacia el refinamiento de los indicadores utilizados para la medición y su consolidación mediante el uso de herramientas de monitorización interactiva. Este tipo de herramientas habilitaría la posibilidad de una evaluación más continua que proporcionaría información en tiempo real sobre cómo se están utilizando los datos abiertos y sus efectos en diferentes sectores. Además, el desarrollo de un sistema de métricas estandarizado para estos indicadores facilitaría el análisis comparativo entre regiones y a lo largo del tiempo, mejorando aún más la comprensión global del impacto de los datos abiertos.

Otro factor importante a tener en cuenta son las posibles consideraciones de privacidad y ética aplicables a los indicadores seleccionados. Como en cualquier otra iniciativa centrada en los datos, las consideraciones relativas a la privacidad y la protección de datos serán primordiales y de obligado cumplimiento para los indicadores desarrollados. Generalmente, esta cuestión no debería resultar especialmente problemática cuando hagamos un seguimiento de los datos. Sin embargo, una vez nos adentramos en su uso por parte de los usuarios podríamos dar lugar a situaciones más delicadas. Asegurar también el anonimato en los indicadores y las prácticas seguras en su gestión es crucial para mantener la confianza y la integridad en los procesos de datos abiertos.

En conclusión, el desarrollo e implementación de indicadores específicos detallados siguiendo las recomendaciones del informe "Indicadores para una Evaluación de Impacto de Datos Abiertos" sería un avance significativo en cuanto a cómo medimos y comprendemos el impacto de los datos abiertos. El refinamiento y la adaptación continua de estos indicadores serán también acciones cruciales a la hora de evolucionar en conjunto con las estrategias de datos abiertos a las que acompañan y su creciente ámbito de influencia. A medio plazo, la Comisión Europea seguirá desarrollando su análisis en esta área de trabajo a través del proyecto data.europa.eu con el objetivo final de poder formular una metodología común para la evaluación del impacto proveniente de la reutilización de los datos públicos y desarrollar una herramienta de monitorización interactiva para su implantación.


Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

Los datos geográficos nos permiten conocer el mundo que nos rodea. Desde la localización de rutas óptimas para viajar hasta el monitoreo de ecosistemas naturales, pasando por la planificación y el desarrollo urbano o la gestión de emergencias, los datos geográficos presentan un gran potencial para impulsar el desarrollo y la eficiencia en múltiples áreas económicas y sociales. Por todo ello, se consideran conjuntos de datos de alto valor por la Comisión Europea, y cuentan con unas obligaciones específicas para que su publicación sea accesible e interoperable

Para conocer cuál es el impacto real de esta tipología de datos, se han realizado diversos informes y estudios. A continuación, se recogen varios de ellos, que inciden en el reto de medir el impacto de la información geográfica. 

Los datos geoespaciales en el Ministerio de Transportes y Movilidad Sostenible. Impacto de la información coproducida por IGN y CNIG (2024)  

  • Puedes leer el informe entero aquí.  

Este informe, elaborado por ASEDIE y el CNIG, pretende obtener conclusiones acerca del uso y la percepción de los servicios coproducidos por el Instituto Geográfico Nacional (IGN) y el Centro Nacional de información Geográfica (CNIG) con el fin de conocer el beneficio que aportan a la actividad diaria de las empresas que los utilizan y a la sociedad. Para ello se ha realizado una encuesta dirigida a las empresas usuarias de datos geoespaciales, gracias a la cual se ha podido elaborar una clasificación de las empresas reutilizadoras de datos geográficos.  

De las 170 empresas consideradas, el 70,0% están constituidas por autónomos y microempresas (menos de 10 empleados). Estas empresas se ubican principalmente en la Comunidad de Madrid (25,6%), Cataluña (16,3%), Andalucía (14%), Comunidad Valenciana (11,6%) y Castilla y León (11,6%). El 53,3% asegura reutilizar datos de las Infraestructuras de Datos Espaciales (IDE) y el 51% datos abiertos del INE, entre otros. Los productos más utilizados son las ortofotos e imágenes de satélite (74%), seguido de los Mapas vectoriales y las bases cartográficas y topográficas (63%), y del LiDAR (58%)

Gráfica que muestra el uso de productos y servicios coproducidos por el IGN y el CNIG.  Los productos más utilizados son las ortofotos e imágenes de satélite (74%), seguido de los Mapas vectoriales y las bases cartográficas y topográficas (63%), y del LiDAR (58%). 

Con respecto a su impacto económico, el informe estima un impacto medio del 35,7% en las ventas de las empresas encuestadas. En concreto, la información geográfica abierta del IGN y CNIG suponen un impacto del 12,4% de las ventas. 

El informe también incluye el análisis de casos de uso recopilados, así como entrevistas en profundidad a empresas del sector como ejemplo de buenas prácticas y, por otra parte, actualiza la información procedente del informe anual de Asedie sobre la Economía del dato en su ámbito infomediario de 2023 respecto a los datos económicos del subsector geográfico.

Beneficios económicos del nodo central de la IDE por CNIG y Universidad de Leuven (2021) 

  • Puedes leer el informe entero aquí 

Este documento desarrolla y prueba una metodología para estimar los beneficios económicos generados por la IDEE, Infraestructura de Datos Espaciales de España (IDEE), que establece la publicación y accesibilidad de los datos espaciales a través servicios web geográficos gratuitos de visualización y de descarga producidos por las organizaciones cartográficas, medioambientales, catastrales, de observación del territorio a nivel nacional, regional y local desde el 2004, de acuerdo con normas, estándares y recomendaciones que garantizan su interoperabilidad. 

El estudio debía responder a la pregunta qué pasaría si la IDEE desaparecería. Para el estudio solo se consideró el nodo central de la IDEE, entendiendo como tal los servicios y datos geográficos coproducidos entre los socios del Sistema Cartográfico Nacional, y centrándose en servicio web de mapas (WMS) y teselas de mapas (WMTS). Los nodos de los ministerios, comunidades autónomas y entidades locales no fueron parte de su alcance. 

Para realizar el cálculo se utilizaron dos vías de investigación: 

  • Comparación con los costes de usar Google Maps. La aplicación de los diferentes escenarios condujo a un beneficio/valor de los 6 WMTS y 13 WMS de mínimo 355.646 y máximo 891.144 euros.

  • Comparación con las tasas que otros países aplican por el uso de sus datos y servicios. A pesar de las dificultades de calcular la tasa por solicitud, debido a la existencia de diferentes enfoques en cada país, el valor total de la IDEE se estimó entre 34.000 y 14 millones de euros.  

Para que otros organismos puedan adaptar el estudio a sus particularidades, se ha creado un fichero Excel, a modo de calculadora, con la siguiente plantilla de cálculo. 

Este informe se une a otros realizados por la IDEE, como estos documentos para estimar el coste medio de la generación de metadatos o la implementación de servicios de visualización y descarga de conjuntos de datos conformes a Inspire, ambos realizado en 2019. 

Informe de rendimiento de ICEARAGON y ARAGEA por el Gobierno de Aragón (2024)  

  • Puedes leer el informe entero aquí 

Los gobiernos regionales también tienen interés en conocer el impacto de sus servicios de información geográfica. Es el caso del Gobierno de Aragón, que recientemente presentó un informe sobre el rendimiento de la Infraestructura de Conocimiento Espacial de Aragón (ICEARAGON) y la Red de Geodesia Activa de Aragón (AREAGA)

En total, se estima que estos servicios han supuesto un ahorro de casi dos millones de euros a todos los aragoneses en 2023. De acuerdo con el informe, ICEARAGÓN recibió casi 5 millones de visitas en 2023, lo cual supuso un incremento del 58,6% respecto a 2022. Estos usuarios realizaron 1,7 millones de descargas.  La mayoría de la información descargada (47,8%) se refiera a capas medioambientales. También han supuesto un gran éxito la información relativa a los límites administrativos (13,8%) y los mapas de Aragón (13,4%). Respecto al perfil del usuario, el 71% es del campo de la topografía y el 27% pertenece al sector agrícola. 

Estos informes sirven de base a los trabajos que realiza la Comisión Europea de manera periódica, donde recopila los avances en los distintos ámbitos de aplicación de INSPIRE. Fruto de este trabajo se generan informes anuales relativos a cada país que incluyen un apartado sobre los costes y beneficios. 

Todo este trabajo de medición y estimación de beneficios pone de manifiesto el valor económico de proporcionar datos y servicios geográficos a la sociedad. Gracias a ello se pueden crear nuevos productos y servicios que impulsan la economía de todo el país y proporcionan beneficios a todos sus ciudadanos.

calendar icon
Noticia

El Portal europeo de datos, data.europa.eu, acaba de hacer público su Data Maturity Index, un índice donde cada año se evalúa el nivel de madurez de los países europeos en materia de datos abiertos. Para su elaboración, se ha realizado una encuesta de evaluación que ha sido completada por 35 países, incluidos los 27 Estados miembros de la Unión Europea, tres países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza) y cinco países candidatos (Bosnia y Herzegovina, Montenegro, Albania, Serbia y Serbia y Ucrania) 

En la edición de este año, España obtiene una calificación del 95% sobre 100%. Con ello se coloca en la quinta posición general y en la cuarta si se tienen en cuenta únicamente los países miembro de la Unión Europea (EU27). Este dato supone una mejora de tres puntos porcentuales con respecto a su calificación del pasado año y la sitúa 12 puntos por encima de la media de la EU27 (83%). 

Las primeras posiciones del ranking las ocupan Francia, Polonia, Ucrania y Estonia.

 

Gráfico del ranking del resultado del Maturity Index según países UE27 y europeos en el que España aparece en quinta posición 

Por encima de la media de la UE27 en todas las dimensiones analizadas 

El índice se acompaña de un informe donde se recoge el análisis realizado y se muestra una visión general de las buenas prácticas aplicadas en Europa. En el caso de España, se encuentra por encima del promedio de la UE-27 en los cuatro indicadores analizados: 

  • Política, centrado en las políticas de datos abiertos de los distintos países. En él se analiza la existencia de modelos de gobernanza nacional para la gestión de datos abiertos y las medidas que se han aplicado para implementar las estrategias existentes. Es el indicador en el que España obtiene una mayor puntuación, con un 99% frente al 89% de la UE27. El informe destaca cómo la estrategia nacional de datos abiertos del país ayuda a promover la apertura de la información pública a través de acciones innovadoras y estructuradas en colaboración con socios públicos y privados. Entre otras cuestiones, la estrategia incluye el objetivo de identificar modelos de negocio y casos de éxito empresarial para compartir prácticas exitosas. El informe también resalta la existencia de diversas estrategias digitales que complementan las políticas específicas sobre datos abiertos, como la estrategia nacional de inteligencia artificial, que incluye disposiciones relacionadas con la disponibilidad de datos abiertos para el funcionamiento y la formación de sistemas de inteligencia artificial. 

  • Impacto, que analiza las actividades realizadas para supervisar y medir tanto la reutilización de datos abiertos como el impacto creado por dicha reutilización. De manera tradicional, esta ha sido la dimensión menos madura de toda Europa. No obstante, España obtiene una puntuación de 96% frente al 77% de la UE27. Los mejores resultados se consiguen en la medición de impacto de casos de uso de datos abiertos en los sectores de medio ambiente, economía y política. 

  • Portal, enfocada en evaluar las funcionalidades de la plataforma nacional que permiten a los usuarios acceder a los datos abiertos y ayudan a impulsar la interacción dentro de la comunidad. Con un 96% frente al 85% de la EU27, España destaca en el uso de herramientas analíticas para conocer el comportamiento del usuario, y en la implementación de estrategias para garantizar la sostenibilidad del portal y el aumento de su visibilidad, incluyendo la presencia en las redes sociales. También se resalta la existencia de un área privada que permite a los editores actuar en función del feedback recibido. 

  • Calidad, que examina los mecanismos para garantizar la calidad de los (meta)datos. Aquí España obtiene un 88% frente al 82% de la UE27. La puntuación de España está impulsada por el cumplimiento de la norma DCAT-AP (ofreciendo materiales didácticos para publicadores), la existencia de un planteamiento sistemático para garantizar que los metadatos estén actualizados y la amplia gama de datos ofrecidos, tanto históricos como actuales.  

Gráfico del grado de madurez de España según indicadores de política, portal, impacto y calidad y su evolución desde 2019 hasta 2023 

El informe también mide cómo están avanzando los países de la EU27 en la aplicación del Reglamento de ejecución sobre conjuntos de datos de gran valor. En este apartado, España se encuentra en novena posición, con un 68% de ejecución. En general, los Estados miembros están haciendo más progresos en los conjuntos de datos geoespaciales y estadísticos. También se está avanzando en los requisitos técnicos y jurídicos subyacentes. 

Recomendaciones generales  

El informe recoge una serie de recomendaciones para España, entre otros países, que incluyen fomentar el desarrollo de iniciativas a nivel local y regional, impulsando una mejor coordinación entre equipos, y activar la red de responsables de datos abiertos para que pongan en marcha actividades de seguimiento dentro de sus organizaciones. También se hace hincapié en la necesidad de promover los cursos de datos abiertos existentes e impulsar nuevos materiales formativos, prestando especial atención a desarrollar conciencia estratégica sobre la reutilización y el impacto de los datos abiertos. 

De manera general, el informe pone de manifiesto el buen avance en materia de datos abiertos en toda Europa. Aunque existen áreas de mejora, el panorama open data europeo se va consolidando, con España en las primeras posiciones de la tabla. 

En 2024, las nuevas oleadas de aplicación de la estrategia europea de datos plantearán a los equipos nacionales nuevos retos. Por un lado, estos deberán redoblar sus esfuerzos para informar a los ciudadanos de las nuevas fuentes de datos surgidas a raíz de iniciativas como la Ley de Gobernanza de Datos y los espacios de datos. En este sentido, será necesaria la coordinación entre las nuevas figuras surgidas de dichos desarrollos legislativos y el tradicional mundo de los datos abiertos, potenciando las evidentes sinergias entre ambos para impulsar la economía del dato y colectivizar el valor generado.  

 

calendar icon
Blog

Existe una cuestión recurrente que siempre ha estado en el aire desde el inicio del movimiento de los datos abiertos y que según se han ido incrementando los esfuerzos y las inversiones en la recopilación y publicación de datos ha ido resonando cada vez con más fuerza: ¿Cuál es el valor de un conjunto de datos?

Esta es una pregunta extremadamente difícil de responder dada no solo la complejidad inherente a los propios datos, que crece además exponencialmente en cuanto comenzamos a combinarlos, sino también a los distintos puntos de vista desde los que se puede abordar la cuestión del valor.

  • Si sabemos que el valor no será inmediato, ¿cómo podemos prever y cuantificar los posibles beneficios en un momento futuro?
  • ¿Podría el valor de los datos llegar a ser negativo en algunos casos, si con ellos podemos causar también algún tipo de ‘daño’?
  • ¿Puede el valor de los datos degradarse a lo largo del tiempo?

Desde este espacio hemos analizado el valor de los datos abiertos para la administración de forma recurrente desde distintos enfoques: los datos de alto valor y su identificación, la perspectiva de los proveedores, las claves del valor de los datos, cómo generar valor a través de los datos o cuál es el valor de los datos en tiempo real. No obstante, el trabajo de análisis e investigación en esta área sigue creciendo imparable. En este sentido, queremos resaltar un trabajo publicado recientemente desde la Universidad de Cambridge. Se trata de un estudio en el desgranan algunos de los métodos más comunes para la valoración de los datos.

Partiendo de su análisis previo sobre las características de los datos y su valor asociado, se ha realizado la revisión de los métodos que existen actualmente. Con ello han llegado a la conclusión de dichos métodos pueden dividirse en varias categorías, cuyas características detallamos a continuación.

Métodos basados en análisis de costes

Este enfoque se basa en el principio tradicional estadístico de la “suma de costes”. Para ello se tienen en cuenta los costes de generación, recopilación, almacenamiento y sustitución de los conjuntos de datos, así como los costes para la organización en caso de que los datos den lugar a algún tipo de pérdida. Estos métodos cuentan con la ventaja de que son relativamente fáciles de calcular, pero, por otro lado, cuentan con la dificultad de tener que diferenciar entre los costes directamente atribuibles a los datos y otros costes indirectos relacionados, por ejemplo, con la variedad de labores profesionales involucradas o los distintos elementos de software utilizados.

Un ejemplo de aplicación de este método es el caso del departamento de estadísticas de Canadá con su análisis de valoración de los costes asociados a la inversión en datos, bases de datos y ciencia de datos en el país.

Métodos basados en análisis de ingresos

En este caso se utilizan las expectativas de flujos de ingresos, tomando como referencia el mercado potencial existente para la explotación de los datos. Para ello se pueden tener en cuenta, por ejemplo, los cánones por uso, las marcas registradas o las patentes. Las principales limitaciones de estos métodos consisten, generalmente, en que requieren aplicar criterios algo más subjetivos y en la complejidad de estimar ese valor cuando los datos no se explotan directamente sino indirectamente, por ejemplo, mediante analítica.

Estos métodos se utilizan en el estudio de la OECD sobre las perspectivas del valor de los datos. En él se calculan los ingresos declarados relacionados con la recopilación y venta de datos a través de la encuesta empresarial de los Estados Unidos.

Métodos basados en análisis de mercado

Generalmente estos son los métodos de preferencia que se suelen usar cuando todos los elementos necesarios para hacer los cálculos están disponibles. Sin embargo, hoy en día existe todavía una gran cantidad de datos en las organizaciones de uso exclusivamente interno, lo cual dificulta el uso de estos métodos, al no ser visible su comportamiento al mercado. Además, estos métodos tampoco pueden incorporar totalmente el valor social de los datos.

Un ejemplo de este método es el análisis realizado en el estudio llevado a cabo por la Comisión Económica para América Latina y el Caribe (CEPAL) sobre los mercados de datos puestos en marcha por la Unión Europea y el Gobierno de Colombia, respectivamente.

Experimentos y encuestas

Esta aproximación al valor de los datos consiste en evaluar el sentimiento de mercado en relación a los datos, preguntando directamente acerca de la disposición a pagar por ciertos datos o a prescindir de ellos. Generalmente se utiliza cuando el valor público de mercado no es conocido o en aquellos casos en el que el valor social tiene un peso importante, como puede ser, por ejemplo, en el área medioambiental. Una limitación de estos métodos es que, cuando los encuestados no son especialistas, puede resultar bastante complicado para ellos evaluar los posibles usos de los datos y, por tanto, su valor completo.

El estudio realizado por la oficina nacional de estadística del Reino Unido es un claro ejemplo de estos métodos de valoración.

Métodos basados en el impacto

En este caso la valoración se lleva a cabo a través de experimentos o casos prácticos que analizan el efecto causal sobre determinados resultados atribuibles a los datos. Esta opción es particularmente útil para los responsables de la elaboración de políticas públicas dirigidas por la evidencia, ya que permiten establecer una relación causa-efecto, lo que facilita la comprensión de los beneficios y la elaboración de una narrativa en favor del uso de los datos. No obstante, si los experimentos no están bien diseñados o no se ajustan bien al contexto específico que queremos analizar, corremos el riesgo de obtener una valoración excesivamente subjetiva.

El framework de evaluación basado en decisiones, propuesto por la Internet of Water Coallition, es un buen ejemplo de cómo aplicar los métodos centrados en el impacto a un caso particular.

Métodos basados en la cadena de actores

Con estos métodos lo que se busca es usar una visión más completa para valorar los datos desde distintos puntos de vista. Esto hace que las evaluaciones puedan ser también más complejas al involucrar distintas definiciones de lo que constituye el valor de los datos. No obstante, también lo convierte en el método más adecuado cuando se quiere evaluar un ecosistema de datos en su conjunto. Además, es un método en alza para las organizaciones que tienen en cuenta la inversión socialmente responsable.

Un ejemplo de cómo se pueden aplicar estos métodos en la práctica en el caso de estudio llevado a cabo con la entidad gestora de las autopistas en InglaterraHighways England.

Métodos basados en el análisis de opciones reales

La principal ventaja de estos métodos es que pueden aplicarse incluso cuando todavía no están definidos todos los posibles casos de uso para los datos. Su objetivo es conseguir una estimación del valor que tendrían los datos en ciertos posibles escenarios futuros – generalmente a través de la simulación por computación – de forma que si se alcanza ese escenario se podría justificar la explotación de los datos. Así pues, ciertas decisiones e inversiones relacionadas con los datos podrían ser aplazadas hasta que se llegue al escenario ideal que maximice el valor de esos datos, pudiendo minimizar así los costes y riesgos asociados hasta ese momento.

El caso de estudio sobre el sector del transporte llevado a cabo en Reino Unido nos ofrece un ejemplo de cómo se podrían aplicar estos métodos usando modelos financieros.

¿Y cuál es el método que tendría que usar en mi caso particular?

Desafortunadamente no existe una regla de oro que nos permita seleccionar un método en concreto. Sin embargo, hay una serie de cuestiones que los autores del estudio sugieren plantearnos a la hora de encontrar el método más adecuado para cada caso:

  • Qué es exactamente lo que estamos valorando: los datos pasan a través de varios estados en su ciclo de vida – desde los datos en crudo a los datos procesados, el análisis o el conocimiento generado. Dependiendo de en qué fase queramos centrar nuestro análisis algunos métodos pueden ser más apropiados que otros.
  • Desde qué punto de vista se lleva a cabo la valoración: el valor puede tener distintas definiciones dependiendo del punto de vista de quién realiza o encarga una valoración. En algunos casos por ejemplo la contención de costes debido a restricciones presupuestarias puede ser lo prioritario, mientras que en otros se podría optar por intentar maximizar el valor social.
  • En qué momento tiene lugar el proceso de evaluación: básicamente habrá que tener en cuenta si la evaluación se llevará a cabo de forma predictiva antes de disponer de todos los elementos evaluados o si se realizará a posteriori, una vez todas las variables sean ya conocidas.
  • Cuál es el propósito de la evaluación: varios de los métodos disponibles omiten o minimizan ciertos aspectos de los datos centrándose en otras características de su proceso de evaluación. Por lo tanto, será necesario conocer con claridad cuáles son las prioridades de nuestra evaluación a la hora de seleccionar el método más adecuado. ¿Es el impacto social lo que nos interesa? ¿La mejora de la productividad? ¿Maximizar la rentabilidad de los datos?

Por tanto, lo primero que deberíamos hacer es un análisis de nuestras necesidades y nuestra propia definición del valor, preguntándonos para ello qué es exactamente lo que queremos evaluar y cuál es la mejor forma de llevar a cabo esa evaluación, para pasar luego a elaborar nuestro propio marco de valoración usando los métodos más apropiados de entre la amplia variedad disponible.


Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon