Documentación

Para cumplir con la Directiva (UE) 2019/1024 y su posterior reglamento de ejecución, los estados miembros de la Unión Europea están trabajando en la puesta a disposición de los llamados datos de alto valor (high-value dataset o HVD, en inglés). El objetivo es que ciudadanos y empresas puedan acceder a dichos datos bajo unos requisitos técnicos que favorezcan su reutilización y su impacto positivo en la sociedad, la economía y el medio ambiente.

La apertura de estos conjuntos de datos supone un gran reto para las administraciones públicas de todos los países de la Unión Europea. Aunque muchos de estos datos ya están a disposición de los usuarios, los países deben identificarlos para poder informar sobre ellos y resolver la alta heterogeneidad en los formatos, estructuras y semánticas. En concreto, a partir de febrero de 2025, los Estados miembros tendrán que informar a la Comisión cada dos años sobre los conjuntos de datos de alto valor disponibles, incluyendo los enlaces a las condiciones de las licencias y las API.

Para ayudar en esta tarea, el Portal Europeo de Datos ha publicado el informe “Report on Data Homogenisation for High-value Datasets donde propone un enfoque metodológico para facilitar la identificación y homogeneización de los HVD. Entre otras cuestiones, el informe ofrece ejemplos de estándares que ayudan a conseguir una mayor interoperabilidad no solo entre datos, sino también entre las aplicaciones que los utilizan.

Un método para la identificación y homogeneización

El informe describe una aproximación metodológica basada en tres pasos:

  1. La identificación de los HVD en los portales de datos ya existentes. Aunque existen algunas pautas para la publicación de HVD,  como estas para aplicar DCAT-AP, la forma de nombrar a los conjuntos de datos ya publicados no es uniforme, lo que hace difícil encontrarlos. El informe propone un protocolo que consiste en definir palabras clave, partiendo de los conjuntos de datos y sus atributos asociados, contenidos en el anexo I del Reglamento de Ejecución. Se trata de utilizar dichas palabras clave para buscar en los distintos portales de datos ya existentes. El informe explica cómo se ha testeado el protocolo de identificación con conjuntos de datos de las categorías de registros empresariales, datos estadísticos y datos sobre redes de transporte, incluyendo tablas con las palabras clave utilizadas.
  2. Localización o desarrollo de modelos de datos, ontologías, vocabularios controlados y/o API comunes. En esta sección, el informe describe algunos recursos de utilidad, los cuales se resumen en la siguiente tabla:
Recurso Descripción Categoría de datos en las que más pueden ayudar, según el informe
Directiva Inspire Características que debe tener la información espacial y sus metadatos.
  • Datos geoespaciales
  • Datos de Observación de la Tierra y medioambientales.
  • Datos meteorológicos
  • Datos sobre redes de transporte.

Especificaciones de datos de la Directiva Inspire

(data specifications)

Modelos, esquemas y reglas de codificación para diferentes áreas temáticas de datos espaciales.

 

 

  • Datos geoespaciales
  • Datos de Observación de la Tierra y medioambientales
  • Datos meteorológicos
  • Datos sobre redes de transporte.
Servicios de red de Inspire (network services) Conjunto de interfaces comunes para servicios web que permiten el descubrimiento, visualización, descarga y transformación de datos espaciales.
  • Datos geoespaciales
  • Datos de Observación de la Tierra y medioambientales
  • Datos meteorológicos
  • Datos sobre redes de transporte.

Directrices técnicas para los metadatos de Inspire

(Inspire technical guidelines for metadata)

Directrices técnicas para metadatos, con los elementos mínimos a incluir definidos en el Reglamento 1205/2008 de la Comisión.
  • Datos geoespaciales
  • Datos de Observación de la Tierra y medioambientales
  • Datos meteorológicos
  • Datos sobre redes de transporte.
Geo-DCATAP Extensión del perfil de aplicación DCAT para describir conjuntos de datos geoespaciales.
  • Datos geoespaciales
Core Location Vocabulary Modelo de datos simplificado que incluye las características fundamentales de una ubicación, representada como una dirección o nombre geográfico, o a través de geometría.
  • Datos geoespaciales
General Multilingual Environmental Thesaurus (GEMET). Vocabulario controlado especializado en información medioambiental. Dispone de una sección de conceptos ligados con las categorías de datos espaciales incluidas en Inspire.
  • Datos geoespaciales
  • Datos de Observación de la Tierra
  • Datos sobre redes de transporte.
Semantic Sensor Network Recomendación del W3C para describir los sensores y sus observaciones.
  • Datos meteorológicos
Quantity, unit, dimension and type (QUDT). Conjunto de ontologías que definen clases básicas, propiedades y restricciones utilizadas para modelar magnitudes físicas, unidades de medida y sus dimensiones en diversos sistemas de medición.
  • Datos meteorológicos
Lista de clasificaciones estadísticas de Eurostat Clasificaciones estadísticas mantenidas por Eurostat, disponibles como Linked Open Data en XKOS, la extensión de SKOS para modelar clasificaciones estadísticas. Se presentan por familia de clasificación, categorizadas por ámbito estadístico y subdominios (por ejemplo, NACE para la actividad económica, la cual describiremos más adelante).
  • Datos estadísticos
Listas de códigos estándar de Eurostat Conjuntos predefinidos y organizados de elementos que presentan conceptos estadísticos mediante códigos únicos
  • Datos estadísticos
Statistical Data and Metadata eXchange (SDMX) Iniciativa mundial para normalizar y armonizar el intercambio de datos y metadatos estadísticos. Ofrece normas técnicas (el modelo de información SDMX), directrices, una arquitectura informática, herramientas y una serie de tutoriales para ayudar a los usuarios.
  • Datos estadísticos
RDF Data Cube Vocabulary Ontología para describir datos multidimensionales, como las estadísticas, que se basa en el núcleo del modelo de información SDMX 2.0.
  • Datos estadísticos
Core Business Vocabulary Mencionado por el propio reglamento, consiste en un modelo de datos simplificado que captura las características fundamentales de una entidad jurídica, como su nombre legal, actividad o dirección.
  • Registros empresariales
Código NACE Códigos para la clasificación de actividades económicas en la Unión Europea. Su revisión NACE 2 fue publicada por la Comisión Europea en octubre de 2022
  • Registros empresariales
Organization ontology Ontología del W3C para apoyar la publicación de datos enlazados relativos a información organizativa, es decir, proporciona una serie de formas de representar la relación entre las personas y las organizaciones, junto con la estructura de información interna de una organización.
  • Registros empresariales
Global Legal Entity Identifier Foundation Base de datos centralizada con información sobre las personas jurídicas que participan en los mercados financieros mundiales. Asigna a cada entidad un código único de Identificador de Personas Jurídicas (Legal Entity Identifier o LEI) reconocido a escala mundial.
  • Registros empresariales
Taxonomía NST Sistema de clasificación para las mercancías transportadas a través de carretera, ferrocarril, vías navegables interiores y mar. Tiene en cuenta la actividad económica asociada al origen de las mercancías.
  • Datos sobre redes de transporte.
Tabla de autoridades de "Transport service" Lista de códigos de los distintos tipos de servicios de transporte facilitada por la sección de Vocabularios de la UE.
  • Datos sobre redes de transporte.

 

Fuente: Report on Data Homogenisation for High-value Datasets

El informe también menciona algunos modelos a utilizar en el ámbito de ciudades inteligentes, como  Smart Data Models y la española Ciudades Abiertas.

  1. La aplicación de dichos modelos. El último paso es la armonización real de los datos. Una vez seleccionados los modelos a utilizar, es el momento de aplicarlos. En esta fase se realizarán los procesos de conversión necesarios para proporcionar los datos en los formatos adecuados y con metadatos de calidad unificados. La forma de aplicar estas transformaciones variará en función del resultado final previsto. Por ejemplo, puede consistir en transformar datos tabulares (valores separados por comas o CSV, Excel, bases de datos relacionales, etc.) en otras fuentes de datos también tabulares pero que sigan la estructura proporcionada en los modelos de datos comunes. También se puede ir más allá y transformarlos en representaciones basadas en árboles (como JSON) o en RDF de acuerdo con las ontologías y vocabularios controlados que se seleccionen.

Conclusiones del informe

El informe finaliza con una serie de conclusiones y recomendaciones. Todavía existen retos en torno a la identificación de los HVD y la aplicación del Reglamento de ejecución en todos los países europeos, sobre todo a la hora de concienciar y difundir sobre su importancia. En las categorías de HVD en las que existen grandes iniciativas de armonización de datos, como Inspire sobre datos geoespaciales o Eurostat sobre HVD estadísticos, podemos encontrar una mayor cantidad de datos disponibles de manera interoperable y armonizada. Por el contrario, en las categorías en las que no existe una iniciativa adoptada de forma mayoritaria, como las empresas y la propiedad de las empresas, aún queda camino por recorrer para aplicar el reglamento.

Las recomendaciones que plantea el informe del Portal Europeo de Datos ayudan a configurar una hoja de ruta para publicar los conjuntos de datos de alto valor en cada una de las categorías definidas por la Comisión Europea. Un reto que las administraciones deberán abordar durante 2024 y que facilitará la reutilización de la información pública.

calendar icon
Noticia

El año llega a su fin y es un buen momento para repasar algunas de las cuestiones que ha marcado el ecosistema de los datos abiertos y la compartición de datos en España, una comunidad que sigue creciendo y construyendo alianzas para el desarrollo de tecnologías innovadoras. Una sinergia que sienta las bases para afrontar un futuro interconectado, digital y lleno de posibilidades.  

A pocos días del 2024, realizamos un balance de noticias, eventos y formaciones de interés que han marcado el año que dejamos atrás. En esta recopilación repasamos algunos avances regulatorios, nuevos portales y proyectos impulsados por el sector público, así como diversos recursos didácticos y documentación de referencia que nos ha dejado 2023. 

Regulación jurídica para el desarrollo de entornos colaborativos 

Durante este año, en datos.gob.es nos hemos hecho eco de noticias relevantes en el sector de los datos abiertos y la compartición de datos. Todas ellas han contribuido a consolidar el contexto adecuado para la interoperabilidad y el impulso del valor de los datos en nuestra sociedad. Realizamos a continuación un repaso de los anuncios más relevantes: 

  • A principios de año la Comisión Europea publicó una primera lista de conjuntos de datos de alto valor que, por la información que atesoran, son de gran valor para la economía, el medio ambiente y la sociedad. Por este motivo, los estados miembros deberán ponerlos a disposición de la ciudadanía antes de verano de 2024. En esta primera lista de categorías se incluye: datos geoespaciales, de observación de la tierra y medioambiente, meteorológicos, estadísticos, de empresas y de movilidad. Por otro lado, a finales de 2023, el mismo organismo hizo una propuesta para ampliar la lista de categorías de conjuntos de datos a considerar de alto valor, añadiendo otras siete propuestas de categorías que se podrían incluir a futuro: pérdida climática, energía, financiero, administración pública y gobierno, salud, justicia y lenguaje. 

  • En el primer trimestre del año, se modificó la Ley 37/2007 sobre reutilización de la información del sector público a la luz de la última Directiva europea de datos abiertos. Ahora, las administraciones públicas deberán cumplir, entre otros, dos requisitos esenciales: incidir en la publicación de datos de alto valor mediante APIs y designar una unidad responsable de información que vele por la correcta apertura de los datos. Estas medidas pretenden estar alineadas con las exigencias de competitividad e innovación que suscitan tecnologías como la IA y con el rol clave que juegan los datos a la hora de configurar espacios de datos. 

  • La publicación de las especificaciones UNE sobre datos ha sido otro hito en materia de estandarización que ha marcado 2023. El volumen de datos no deja de crecer y son necesarios mecanismos que aseguren su adecuado uso y explotación. Para ello, existen: 

  • Otro avance reseñable ha sido la aprobación de la redacción consolidada del Reglamento europeo de Datos (Data Act) que busca proporcionar normas armonizadas para un acceso justo a los datos y su utilización. La estructura jurídica que impulsará la economía del dato en la UE ya es una realidad. El Data Act y el Data Governance Act también aprobado en 2023 contribuirán al desarrollo de un Mercado Único Digital Europeo. 

  • En octubre de 2023 la futura Ley de Europa Interoperable (Interoperable Europe Act) entró en la etapa legislativa final tras obtener el visto bueno de los estados miembros. El objetivo de Interoperable Europe Act es reforzar la interoperabilidad entre las administraciones del sector público en la UE y crear servicios públicos digitales centrados en los ciudadanos y las empresas. 

Avances en el ecosistema de datos abiertos en España 

En este último año han sido muchos los organismos públicos que han apostado por la apertura de sus datos en formatos adecuados para la reutilización, muchos de ellos centrados en temáticas concretas, como la meteorología. Algunos ejemplos son: 

Por otro lado, muchas instituciones que ya publicaban datos abiertos han ido ampliando durante todo el año su catálogo de conjuntos de datos. Es el caso del Instituto Canario de Estadística (ISTAC) que ha implantado diferentes mejoras como la ampliación de su catálogo de datos abiertos semánticos para conseguir una mejor compartición de datos y metadatos. 

En esta línea, también se han firmado más convenios para fomentar la apertura y compartición de datos, así como la adquisición de capacidades relacionadas. Por ejemplo, con universidades: 

Soluciones disruptivas que usan datos abiertos  

La combinación ganadora entre datos abiertos y tecnología ha impulsado el desarrollo de múltiples iniciativas de interés fruto del esfuerzo de las administraciones públicas, como, por ejemplo: 

Durante 2023, las Administraciones Públicas no solo han puesto en marcha proyectos tecnológicos, sino que también han impulsado el emprendimiento alrededor de los datos abiertos con actividades como el concurso de Datos Abiertos de Castilla y León. Un evento en el que se premiaron proyectos desarrollados con datos abiertos como productos o servicios, ideas, trabajos de periodismo de datos y recursos didácticos. 

Formaciones y eventos para estar al día de las tendencias 

Los materiales didácticos sobre datos abiertos y tecnologías relacionadas no ha hecho más que crecer en este 2023. Destacamos algunos recursos gratuitos y virtuales que están disponibles: 

Además, son muchas las actividades que se han llevado a cabo en 2023 para impulsar la cultura del dato. No obstante, si te perdiste alguna, puedes volver a ver las grabaciones online de las siguientes:  

  • En marzo se retrasmitió la Conferencia Europea sobre Datos y Semántica, en la que se presentaron tendencias sobre datos multilingües. 

  • En septiembre se llevó a cabo el II Encuentro Nacional de Datos Abiertos bajo el lema “Llamada urgente a la acción por el medio ambiente”.  El evento continuó la tradición iniciada en 2022 en Barcelona, consolidándose como uno de los principales encuentros en España en el ámbito de la reutilización de datos del sector público y presentando materiales formativos de interés para la comunidad. 

  • En octubre se organizó en Madrid la conferencia sobre interoperabilidad de referencia a nivel europeo: SEMIC 2023, Europa interoperable en la época de la IA.  

Informes y otros documentos de referencia publicados en 2023 

Una vez hemos repasado las noticias, iniciativas, formaciones y eventos, queremos destacar un compendio de conocimiento extenso como es el conjunto de informes en profundidad que se han publicado en 2023 sobre el sector de los datos abiertos y las tecnologías innovadoras. Algunos reseñables son: 

  • La Asociación Multisectorial de la Información (ASEDIE) presentó en abril de 2023 su 11ª edición del Informe del Sector Infomediario en el que repasa la salud de las empresas que trabajan con datos, un sector con potencial de crecimiento. Aquí puedes leer las principales conclusiones

  • A partir de octubre de 2023 España copresidió el Comité de Dirección de la Alianza para el Gobierno Abierto (OGP), una labor que ha implicado impulsar las iniciativas de la OGP y liderar las áreas temáticas de gobierno abierto. Esta organización presentó en 2023 su informe global de la Alianza para el Gobierno Abierto, un documento que pone en valor buenas prácticas como la publicación de grandes volúmenes de datos abiertos por parte de los países europeos. Además, también identifica distintas áreas de mejora como la publicación de más datos de alto valor (HDV) en formatos reutilizables e interoperables.  

  • La Organización por la Economía Cooperativa y el Desarrollo (OECD) ha publicado en noviembre de 2023 un informe sobre principios de la administración pública en el que destacó, entre otros, la digitalización como herramienta para tomar decisiones basadas en datos y aplicar procesos eficaces y eficientes. 

  • Durante este año, la Comisión Europea publicó un informe sobre la integración de los espacios de datos en la estrategia europea de datos. Firmado por expertos y expertas en la materia, este documento establece las bases para implementar los dataspaces europeos. 

  • Por otro lado, el grupo de trabajo de datos abiertos de la Red de Entidades Locales por la Transparencia y la Participación Ciudadana y la Federación Española de Municipios y Provincias presentaron un listado de los 80 conjuntos de datos a publicar para seguir completando las guías publicadas en años anteriores. Lo puedes consultar aquí. 

Estos son solo algunos ejemplos de lo que ha dado de sí el ecosistema de datos abiertos en el último año. Si quieres compartir con datos.gob.es alguna otra novedad, déjanos un comentario o mándanos un email a dinamizacion@datos.gob.es 

calendar icon
Noticia

España continúa avanzando en materia de datos abiertos. Así lo corrobora la última edición del Índice de Datos Abiertos, Útiles y Reutilizables (Open, Useful and Re-usable data), también conocido como OURdata Index. Este informe es elaborado de forma periódica por la OCDE, con el fin de evaluar los esfuerzos realizados por los distintos gobiernos a la hora de diseñar e implementar políticas nacionales de datos abiertos

Lanzado por primera vez en 2015, el Índice contó con dos ediciones posteriores publicadas en 2017 y 2019. En esta cuarta edición se ha producido un cambio de metodología, lo cual no hace posible comparar los resultados con los de ediciones previas. 

Para realizar el análisis, se recopilaron datos relativos a las políticas efectuadas por 40 países en el periodo de 2020-2021. Se trata de un periodo marcado por la pandemia de COVID-19, que ocasionó una situación excepcional en todo el mundo y puso de manifiesto la necesidad por parte de los gobiernos de garantizar el acceso a datos de alta calidad, para fomentar la resiliencia y facilitar respuestas conjuntas de toda la sociedad ante una crisis. 

El informe final se publicará durante el segundo trimestre de 2024. No obstante, la OCDE ha hecho público un resumen donde ya se recogen algunas de las principales conclusiones del estudio.  

España se sitúa entre los líderes mundiales 

De acuerdo con el estudio, España ocupa la quinta posición en materia de datos abiertos, solo por detrás de Corea del Sur, Francia, Polonia y Estonia, tal y como recoge la siguiente gráfica.  

 

El informe evalúa tres pilares y nueve subpilares, todos los cuales tienen el mismo valor en la puntuación final: 

  1. Disponibilidad de datos: este indicador mide hasta qué punto los gobiernos han adoptado e implementado requisitos formales para la publicación de datos abiertos. También evalúa si los distintos actores implicados en el proceso de publicación de datos (stakeholders) están llevando a cabo alguna tarea para identificar la demanda de datos en general y la disponibilidad de conjuntos de datos de gran valor, en particular. En este sentido, hay señalar que, aunque el informe habla de datos de gran valor (high value datasets), no se trata del mismo concepto de datos de alto valor que maneja la UE. En el caso de la OCDE, se tienen en cuenta también otras categorías de gran impacto como sanidad, educación, crímenes y justicia o finanzas públicas, entre otros. El detalle de las categorías que se tienen en cuenta está indicado en el anexo del informe. 

  2. Accesibilidad de los datos: este indicador evalúa si los conjuntos de datos de gran valor gubernamentales se proporcionan en formatos abiertos y reutilizables, actualizados, con una buena calidad de metadatos y a través de interfaces de programación de aplicaciones (API). También analiza la participación de distintos actores en el portal central de datos abiertos y en la mejora de la calidad de los datos. 

  3. Apoyo gubernamental a la reutilización de datos: este indicador estudia hasta qué punto los gobiernos desempeñan un papel proactivo en la promoción de la reutilización de los datos públicos abiertos, dentro y fuera de la administración. 

Diagrama

Descripción generada automáticamente 

Teniendo en cuenta estos indicadores, España se encuentra en el grupo de “países líderes”. Estos países demuestran un enfoque integral de las iniciativas de datos abiertos y, en general, obtienen buenos resultados en todos los aspectos. En el caso concreto de España, destaca a la hora de impulsar la reutilización de datos, donde se sitúa en segundo lugar. Se ha tenido en cuenta cómo desde el ámbito gubernamental se conciencia a las empresas y a la sociedad civil sobre las oportunidades que ofrecen los datos públicos abiertos, participando en asociaciones y eventos de creación conjunta para estimular la reutilización de datos. También se destaca la disponibilidad de iniciativas de concienciación y capacitación para funcionarios públicos en materia de publicación de datos abiertos, análisis y reutilización, así como los esfuerzos para llevar a cabo evaluaciones del impacto de los datos públicos abiertos y la presentación de ejemplos de reutilización. 

Por el contrario, se sitúa en decimoprimera posición en accesibilidad de datos en general, aunque sube hasta la sexta si hablamos de datos de gran valor. Por último, nos situamos en el sexto puesto en materia de accesibilidad. 

Conclusiones generales 

El informe incluye una serie de conclusiones generales de todos los países. De acuerdo con el estudio, sólo el 48% de los conjuntos de datos de gran valor están disponibles como datos abiertos en los países de la OCDE. Aunque la pandemia COVID-19 influyó positivamente en la publicación de datos sanitarios abiertos, sólo el 43% de los conjuntos de datos de esta categoría están disponibles en la actualidad. Por tanto, se anima a la colaboración entre los agentes de la sanidad pública y la privada para fomentar la publicación de estos datos de manera sistemática a escala nacional.  

Los resultados también indican que los países deberían dar prioridad a la publicación de datos abiertos en ámbitos como la contratación pública, los presupuestos públicos y las actuaciones de grupos de presión, así como impulsar aquellos relacionados con la agenda verde, destacando los relacionados con la observación de la Tierra, el medio ambiente y los datos meteorológicos. Además, se debería considerar la posibilidad de poner a disposición de todos los ciudadanos los registros de empresas y los datos de propiedad de las mismas como datos abiertos.  

En el lado contrario de la balanza, existe una gran disponibilidad de datos estadísticos y geoespaciales. 

En general, los países de la OCDE han mejorado la calidad de los datos gubernamentales abiertos, una cuestión importante que también afecta a los recientes avances en Inteligencia Artificial (IA). El panorama en evolución de las aplicaciones de IA hace necesario garantizar la calidad de los datos, prestando especial atención a la calidad de los metadatos y el acceso a través de APIs. 

En definitiva, el informe resalta la importancia de los datos públicos abiertos para la democracia en la era digital, así como a la hora de impulsar la innovación, tanto en el sector público como el privado. 

calendar icon
Noticia

El Portal europeo de datos, data.europa.eu, acaba de hacer público su Data Maturity Index, un índice donde cada año se evalúa el nivel de madurez de los países europeos en materia de datos abiertos. Para su elaboración, se ha realizado una encuesta de evaluación que ha sido completada por 35 países, incluidos los 27 Estados miembros de la Unión Europea, tres países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza) y cinco países candidatos (Bosnia y Herzegovina, Montenegro, Albania, Serbia y Serbia y Ucrania) 

En la edición de este año, España obtiene una calificación del 95% sobre 100%. Con ello se coloca en la quinta posición general y en la cuarta si se tienen en cuenta únicamente los países miembro de la Unión Europea (EU27). Este dato supone una mejora de tres puntos porcentuales con respecto a su calificación del pasado año y la sitúa 12 puntos por encima de la media de la EU27 (83%). 

Las primeras posiciones del ranking las ocupan Francia, Polonia, Ucrania y Estonia.

 

Gráfico del ranking del resultado del Maturity Index según países UE27 y europeos en el que España aparece en quinta posición 

Por encima de la media de la UE27 en todas las dimensiones analizadas 

El índice se acompaña de un informe donde se recoge el análisis realizado y se muestra una visión general de las buenas prácticas aplicadas en Europa. En el caso de España, se encuentra por encima del promedio de la UE-27 en los cuatro indicadores analizados: 

  • Política, centrado en las políticas de datos abiertos de los distintos países. En él se analiza la existencia de modelos de gobernanza nacional para la gestión de datos abiertos y las medidas que se han aplicado para implementar las estrategias existentes. Es el indicador en el que España obtiene una mayor puntuación, con un 99% frente al 89% de la UE27. El informe destaca cómo la estrategia nacional de datos abiertos del país ayuda a promover la apertura de la información pública a través de acciones innovadoras y estructuradas en colaboración con socios públicos y privados. Entre otras cuestiones, la estrategia incluye el objetivo de identificar modelos de negocio y casos de éxito empresarial para compartir prácticas exitosas. El informe también resalta la existencia de diversas estrategias digitales que complementan las políticas específicas sobre datos abiertos, como la estrategia nacional de inteligencia artificial, que incluye disposiciones relacionadas con la disponibilidad de datos abiertos para el funcionamiento y la formación de sistemas de inteligencia artificial. 

  • Impacto, que analiza las actividades realizadas para supervisar y medir tanto la reutilización de datos abiertos como el impacto creado por dicha reutilización. De manera tradicional, esta ha sido la dimensión menos madura de toda Europa. No obstante, España obtiene una puntuación de 96% frente al 77% de la UE27. Los mejores resultados se consiguen en la medición de impacto de casos de uso de datos abiertos en los sectores de medio ambiente, economía y política. 

  • Portal, enfocada en evaluar las funcionalidades de la plataforma nacional que permiten a los usuarios acceder a los datos abiertos y ayudan a impulsar la interacción dentro de la comunidad. Con un 96% frente al 85% de la EU27, España destaca en el uso de herramientas analíticas para conocer el comportamiento del usuario, y en la implementación de estrategias para garantizar la sostenibilidad del portal y el aumento de su visibilidad, incluyendo la presencia en las redes sociales. También se resalta la existencia de un área privada que permite a los editores actuar en función del feedback recibido. 

  • Calidad, que examina los mecanismos para garantizar la calidad de los (meta)datos. Aquí España obtiene un 88% frente al 82% de la UE27. La puntuación de España está impulsada por el cumplimiento de la norma DCAT-AP (ofreciendo materiales didácticos para publicadores), la existencia de un planteamiento sistemático para garantizar que los metadatos estén actualizados y la amplia gama de datos ofrecidos, tanto históricos como actuales.  

Gráfico del grado de madurez de España según indicadores de política, portal, impacto y calidad y su evolución desde 2019 hasta 2023 

El informe también mide cómo están avanzando los países de la EU27 en la aplicación del Reglamento de ejecución sobre conjuntos de datos de gran valor. En este apartado, España se encuentra en novena posición, con un 68% de ejecución. En general, los Estados miembros están haciendo más progresos en los conjuntos de datos geoespaciales y estadísticos. También se está avanzando en los requisitos técnicos y jurídicos subyacentes. 

Recomendaciones generales  

El informe recoge una serie de recomendaciones para España, entre otros países, que incluyen fomentar el desarrollo de iniciativas a nivel local y regional, impulsando una mejor coordinación entre equipos, y activar la red de responsables de datos abiertos para que pongan en marcha actividades de seguimiento dentro de sus organizaciones. También se hace hincapié en la necesidad de promover los cursos de datos abiertos existentes e impulsar nuevos materiales formativos, prestando especial atención a desarrollar conciencia estratégica sobre la reutilización y el impacto de los datos abiertos. 

De manera general, el informe pone de manifiesto el buen avance en materia de datos abiertos en toda Europa. Aunque existen áreas de mejora, el panorama open data europeo se va consolidando, con España en las primeras posiciones de la tabla. 

En 2024, las nuevas oleadas de aplicación de la estrategia europea de datos plantearán a los equipos nacionales nuevos retos. Por un lado, estos deberán redoblar sus esfuerzos para informar a los ciudadanos de las nuevas fuentes de datos surgidas a raíz de iniciativas como la Ley de Gobernanza de Datos y los espacios de datos. En este sentido, será necesaria la coordinación entre las nuevas figuras surgidas de dichos desarrollos legislativos y el tradicional mundo de los datos abiertos, potenciando las evidentes sinergias entre ambos para impulsar la economía del dato y colectivizar el valor generado.  

 

calendar icon
Noticia

La Comisión Europea ha publicado el primer informe sobre el estado de la Década Digital. En él se hace balance de los avances de la Unión Europea en su camino hacia el éxito de la transformación digital, tal como se establece en el ​P​rograma Político 2030 de la Década Digital. El documento parte de los acuerdos y recomendaciones aprobado en el ámbito europeo sobre la digitalización de cara a 2030, entre ellas la Recomendación (UE) 2021/2122 del Consejo​ ​del 26 de noviembre de 2021 sobre un Pacto por la Investigación y la Innovación en Europa. 

Para elaborar el informe se han tenido en cuenta diversos estudios y fuentes estadísticas, como el ​Eurobarómetro sobre la Década Digital​, el Informe de Prospectiva Estratégica para 2021 y 2022, así como distintos conjuntos estadísticos de Eurostat sobre el estado de la tecnología. También incluye el seguimiento de la Declaración Europea sobre Derechos y Principios Digitales para la Década Digital, que traduce la visión de la UE sobre la transformación digital en principios y compromisos. 

​​De acuerdo con el informe, el éxito de la Década Digital será crucial para la prosperidad futura de la UE. ​​La consecución del programa podría desbloquear más de 2,8 billones de euros en valor económico, lo que equivale al 21% de la economía actual de la UE.​ Para alcanzar este fin, el texto destaca la necesidad de incentivar políticas e inversiones en tecnologías, competencias e infraestructuras digitales.  

Sobre esta base, el informe incluye recomendaciones concretas a los Estados miembros antes de la adopción de sus hojas de ruta estratégicas nacionales y para sus futuros ajustes. 

España, un actor destacado 

​​La Comisión ha elaborado un informe para cada país miembro en el que analiza exhaustivamente sus potencias y deberes futuros. Sobre España señala que el país se encuentra “​en una ambiciosa transformación digital de la economía​” y unos altos índices en conectividad: España es, según el informe, uno de los estados de la UE con mejores resultados en infraestructura digital.​​​ 

Los tres aspectos clave analizados en el informe son: 

  1. ​​Conectividad y Administración Pública​ 

En este sentido, el informe señala que España se sitúa “​muy por encima de la media de la UE​” en cuanto a redes fijas de muy alta capacidad, con un 93% de disponibilidad frente al 73% de la media del conjunto UE. En cobertura de fibra “supera ampliamente” la media de la UE, con un 91% de conectividad frente al 56% de la media UE.  

En cuanto a otras tecnologías como el 5G, España se sitúa en la media europea, con un 82% de acceso a la banda ancha mejorada. Además, el documento revela que ya se han asignado el 98% de todas las bandas pioneras 5G en el país y que se están aplicando “medidas adecuadas para alcanzar los objetivos de la Década Digital” como la Ley de Telecomunicaciones de 2022.  

El informe señala asimismo que España “está a la vanguardia de la Administración electrónica y los servicios públicos digitales en la UE”. Además, resalta el esfuerzo de actualización de servicios e infraestructuras para adaptarlos a la “rápida evolución tecnológica” y a las necesidades de las empresas. De hecho, España se sitúa “muy por encima de la media UE” en indicadores que miden el número de personas usuarias de Internet que usan servicios de administración electrónica, con un 84% frente al 74% en la UE o en servicios públicos digitales para ciudadanos, con un 86% de acceso, y de empresas, con un 91%. En este sentido, destaca el trabajo que se ha realizado en la interoperabilidad de los servicios públicos digitales a nivel nacional, regional y local. 

El informe incluye algunas recomendaciones en digitalización del área sanitaria y apunta que el país debe seguir aplicando sus políticas de digitalización de los servicios públicos para “conectar más tipos de proveedores de asistencia sanitaria a los historiales médicos” e implementar medidas "para garantizar una calidad de servicio y una exhaustividad de los datos sanitarios comparables a nivel regional”. 

  1. ​​Desarrollo económico y empresas​ 

En materia de desarrollo económico y tecnológico, el informe alaba el avance del país con el PERTE Chip cuyo objetivo es el desarrollo de semiconductores y tecnologías de vanguardia que permitan reforzar su diseño y producción en la industria española para “fomentar la soberanía estratégica nacional y de la UE”. En este campo, también se resalta la participación de España en el Proyecto Importante de Interés Común Europeo (IPCEI)sobre Microelectrónica y Tecnologías de la Comunicación con 11 participantes directos activos en diversos campos (material, diseño de código abierto, equipos, embalaje, conectividad, fotónica) y que “podrían ayudar a conseguir el primer ordenador europeo con aceleración cuántica para 2025”. 

En cuanto a PYMES, el nivel de desarrollo digital se sitúa en el nivel de la UE (68%) y destaca los esfuerzos “para mejorar la digitalización de las empresas” que se observan en cifras: el 12,3% de las sociedades españolas ya utilizan Inteligencia Artificial y el 14,3% usa Big Data para análisis y uso interno. Además, se une la iniciativa Kit Digital para la aceleración digital de las pymes y el programa Agentes de Cambio para contratar expertos en transformación digital en el ámbito de la pequeña y mediana empresa, una tipología de empresa con elevado número de sociedades en el país y una “importante participación en la economía española”, lo que las convierte en objetivo de reformas e inversiones que “tendrán un impacto multiplicador indirecto”. El informe anima al país a continuar “implementando estas políticas” en el área de digitalización de empresas, en particular en el caso de las PYME. 

  1. Digitalización ciudadana 

Además, a nivel ciudadano, el informe analiza la digitalización de la población española. En este sentido, el documento señala que España obtiene buenos resultados en cuanto a las competencias digitales con un 64% y un 38% de la población que se benefician de estas competencias respectivamente. En ambos casos, la media española se sitúa por encima de la UE. 

Dentro de los esfuerzos que se están realizando a la hora de potenciar los perfiles TIC tanto en el área educativa como en el mercado de trabajo, el informe destaca las medidas para aumentar el número de especialistas en TIC, en particular una ley para modernizar el sistema de educación y formación profesional (EFP), aprobada en marzo de 2022, y un nuevo curso de especialización de FP sobre IA y big data que permita una formación en el nuevo entorno digital. 

El informe, que analiza el estado de la cuestión en 2022, señala la importancia de ese año, que destaca por haber sido el periodo “de una mayor aceleración de las tendencias clave que afectan a la transformación digital de la UE digital de la UE” con avances tecnológicos cada vez más rápidos, como la IA, el cambio climático y las preocupaciones sociales y económicas asociadas, una creciente demanda de conectividad de alta velocidad o la multipolarización de la escena mundial frente a una carrera tecnológica cada vez más intensa.  

El informe concluye que el impacto potencial del cambio tecnológico es significativo y exigirá que la UE sea ágil y rápida en su transformación. 

calendar icon
Documentación

La digitalización en el sector público en España también llegó al ámbito judicial. La primera regulación para establecer un marco legal en este sentido fue la reforma que tuvo lugar a través de la Ley 18/2011, de 5 de julio (LUTICAJ). Desde entonces, se han producido avances en la modernización tecnológica de la Administración de Justicia. El año pasado, el Consejo de Ministros aprobó un nuevo paquete legislativo para abordar de manera definitiva la transformación digital del servicio público de justicia, el Proyecto de Ley sobre Eficiencia Digital.

Este proyecto incorpora diversas medidas específicamente dirigidas a impulsar la gestión basada en datos, en coherencia con el planteamiento general que se ha formulado a través del denominado Manifiesto del Dato de Justicia.

Una vez decidida la apuesta por la gestión basada en datos, ésta debe afrontarse teniendo en cuenta las exigencias e implicaciones del Gobierno Abierto, de manera que no sólo se refuercen las posibilidades de mejora en la gestión interna de la actividad judicial sino, asimismo, las posibilidades de reutilización de la información que se genera como consecuencia del desarrollo de dicho servicio público (RISP).

Los datos abiertos: premisa para la transformación digital de justicia

Para afrontar el desafío de la transformación digital de la justicia, la apertura de los datos es una exigencia fundamental. En esta línea, los datos abiertos requieren de unas condiciones que permitan su integración de manera automatizada en el ámbito judicial. En primer lugar, se debe llevar a cabo una mejora de las condiciones de accesibilidad de los conjuntos de datos que deben estar en formato interoperable y reutilizable. De hecho, existe una necesidad de impulsar un modelo institucional basado la interoperabilidad y el establecimiento de condiciones homogéneas que, desde la normalización adaptada a las singularidades del ámbito judicial, faciliten su integración de manera automatizada.

Con el objetivo de profundizar en la sinergia entre datos abiertos y justicia, el informe elaborado por el experto Julián Valero identifica las claves de la transformación digital en el ámbito judicial, así como una serie de fuentes de datos abiertos de valor en el sector.  

Si quieres saber más sobre el contenido de este informe, puedes ver la entrevista a su autor.

 

A continuación, puedes descargar el informe completo, el resumen ejecutivo y una presentación-resumen.

 

calendar icon
Noticia

La Asociación Multisectorial de la Información (ASEDIE) ha publicado la undécima edición de su Informe sobre el Sector Infomediario, en el que hace un repaso a la salud de las empresas que generan aplicaciones, productos y/o servicios a partir de información del sector público, teniendo en cuenta que  es el poseedor de los datos más valiosos.

Muchos de los conjuntos de datos que permiten al sector infomediario desarrollar soluciones están incluidos en las listas de conjuntos de datos de alto valor (HVDS, por sus siglas en inglés) que la Unión Europea ha publicado recientemente. Una iniciativa que reconoce el potencial de la información pública y se suma al propósito de impulsar la economía del dato en línea con la propuesta de Ley de Datos del Parlamento Europeo.

ASEDIE agrupa a empresas de diferentes sectores que impulsan la economía del dato, que se nutren fundamentalmente de los datos que proporciona el sector público. Entre sus objetivos se encuentra impulsar el sector y contribuir a concienciar a la sociedad de sus beneficios e impacto. No en vano, se estima que la economía del dato genere 270.000 millones de euros de PIB adicional para los Estados miembros de la UE en 2028.

La presentación de esta edición del informe, bajo el título ‘Economía del Dato en el ámbito infomediario’ tuvo lugar el pasado 22 de marzo en la sala Enredadera de Red.es.  En la edición del informe presentada este año han sido identificadas 710 empresas activas, con una facturación de más de 2.278 millones de euros. Hay que destacar que el primer informe en 2013 contó con 444 empresas. Por tanto, el sector ha crecido un 60% en una década.

Principales conclusiones del informe

  • El sector infomediario ha crecido un 12,1%, un dato por encima del crecimiento del PIB nacional que fue de un 7,6%. Estos datos se extraen del análisis de las 472 empresas (un 66% de la muestra) que presentaron sus cuentas en los ejercicios anteriores.
  • El número de empleados es de 22.663. Los trabajadores se encuentran muy concentrados en pocas empresas: el 62% de ellas tiene menos de 10 trabajadores. El subsector que aglutina un mayor número de profesionales es el de Información geográfica, con un 30% del total. Junto con los subsectores Económico financiero, Consultoría técnica y Estudios de mercado, agrupan al 75% de los empleados.
  • El empleo en las empresas del Sector Infomediario crece un 1,7%, frente a la caída de 1,1% en el año anterior. Todos los subsectores han crecido, excepto Turismo y Cultura que se mantienen, y Consultoría técnica y Estudios de mercado, que decrecen.
  • La facturación media por empleado supera los 100.00 euros, incrementándose un 6,6% respecto al ejercicio previo. Por otra parte, el gasto medio por empleado fue de 45.000 euros.
  • El importe de la cifra de negocio agregada es de 2.279.613.288 euros. Los subsectores de Información geográfica y Económico Financiero aglutinan el 46% de las ventas.
  • El capital suscrito agregado es de 250.115.989 euros. Los tres subsectores más capitalizados son Estudios de mercado, Económico Financiero e Información geográfica, que aglutinan el 66% de la capitalización.
  • El resultado neto supera los 180 millones de euros, 70 millones más que el año pasado. El subsector Económico financiero reúne un 66% del total de beneficios.
  • Los subsectores de Información geográfica, Estudios de mercado, Económico financiero e Informática de Infomediación aglutinan al 76% de las empresas infomediarias, contabilizando un total de 540 empresas de las 710 activas.
  • La Comunidad de Madrid es la que acoge a un mayor número de empresas del sector, con un 39%, seguida de Cataluña (13%), Andalucía (11%) y Comunidad Valenciana (9%).

Tal y como recoge el informe, la llegada de nuevas empresas impulsa el desarrollo de un sector que factura ya cerca de 2.300 millones de euros al año, y que crece a un ritmo superior al de otros indicadores macroeconómicos del país. De estos datos se desprende no solo que el Sector Infomediario goza de buena salud, sino también su capacidad de resiliencia y potencial de crecimiento.

Avances del Estudio del impacto de los datos abiertos en España

El informe recoge también los resultados de una encuesta realizada a los diferentes actores que conforman el ecosistema de los datos, en colaboración con la Facultad de Ciencias de la Información de la Universidad Complutense de Madrid. Esta encuesta se presenta como el primer ejercicio de un estudio más ambicioso que pretende conocer el impacto de los datos abiertos en España e identificar las principales barreras en su acceso y puesta a disposición. Para ello, se ha enviado un cuestionario a miembros del sector público, sector privado y sector académico. Entre las principales conclusiones de este primer sondeo, podemos destacar:

  • Como principales barreras a la hora de publicar información, el 65% de los encuestados del sector público menciona la falta de recursos humanos, el 39% la falta de liderazgo político y el 38% la poca calidad de los datos.
  • El mayor obstáculo en el acceso a los datos públicos para su reutilización es para los encuestados del sector público que la información proporcionada en los datos no es homogénea (41,9%). Los encuestados del sector académico señalan la falta de calidad de los datos (43%) y desde el sector privado se cree que la principal barrera es la falta de actualización (49%).
  • En cuanto a la frecuencia de utilización de los datos públicos, el 63% de los participantes asegura usar los datos todos los días o al menos una vez a la semana.
  • El 61% de los encuestados utiliza los datos publicados en el portal datos.gob.
  • Los encuestados creen de forma mayoritaria que el impacto de la apertura de los datos en el sector privado es positivo. Así, el 77% de los encuestados del sector privado indica que acceder a los datos públicos es económicamente viable y el 89% de ellos manifiesta que los datos públicos les permiten desarrollar soluciones útiles.
  • El 95% de los encuestados reclama un compendio de las normativas que afectan al acceso, publicación y reutilización de los datos del sector público.
  • El 27% de los encuestados del sector público afirma no conocer las seis categorías de datos de alto valor establecidas en el Reglamento de ejecución (EU) 20137138 de la Comisión.

Vemos así que la mayoría de los encuestados son conscientes del potencial del sector y del impacto de los datos del sector público, aunque indican que es necesario salvar algunos obstáculos para su reutilización y creen que un compendio de las diferentes normativas existentes facilitaría su puesta en práctica y ayudaría al desarrollo del sector.

Top 3 ASEDIE

Como en ediciones anteriores, el informe incluye la situación del Top 3 ASEDIE, una iniciativa que pretende que todas las Comunidades Autónomas abran de manera completa tres conjuntos de datos, siguiendo unos criterios unificados que faciliten su reutilización, y que se incluye en el IV plan de Gobierno Abierto. En 2019, se propuso la apertura de las bases de datos de Cooperativas, Asociaciones y Fundaciones y actualmente ya hay 16 Comunidades Autónomas en las que se puede acceder de manera completa. Además, en ocho de ellas es posible acceder al NIF con identificador único, algo que permite mejorar la transparencia y que la información sea más veraz.

Teniendo en cuenta los buenos resultados de la primera propuesta, en 2020 se lanzó una nueva petición de apertura de datos, el Segundo Top 3 ASEDIE, en este caso de Certificados de Eficiencia Energética, Registros SAT (Sociedades Agrarias de Transformación) y Polígonos Industriales, cuya evolución ha sido también muy positiva. En el siguiente mapa se puede ver la situación de apertura de estas tres nuevas bases de datos en 2023.

La iniciativa del Top 3 ASEDIE ha sido un éxito y se ha convertido en una referencia en el sector, impulsando la apertura de bases de datos de una manera conjunta y demostrando que es posible armonizar fuentes de datos públicas para ponerlas al servicio de la sociedad. 

Los siguientes pasos en este sentido serán hacer un seguimiento de las bases de datos ya abiertas y realizar una difusión a todos los niveles, incluyendo la identificación de buenas prácticas de la Administración y la selección de ejemplos para incentivar la colaboración público-privada en datos abiertos. Además, se identificará un nuevo top 3 para avanzar en la apertura de nuevas bases de datos, y se lanzará una nueva iniciativa que alcance a los organismos de la Administración General del Estado, con la identificación de un nuevo Top 3 AGE.

Casos de éxito

El informe incluye también una serie de casos de éxito de productos y servicios desarrollados con datos del sector público, como API Market de Iberinform que facilita el acceso y la integración de 52 conjuntos de datos de empresas y autónomos en los sistemas de gestión de las empresas. Otro caso exitoso es el de Geocode, una solución centrada en procesos de estandarización, validación, corrección, codificación y geolocalización de direcciones postales en España y Portugal.

Geomarketing permite aumentar la velocidad de cálculo de datos geoespaciales e Infoempresa.com ha mejorado sus informes de actividad de las empresas españolas, haciéndolos más visuales, completos e intuitivos. Por último, Pyramid Data posibilita el acceso a los Certificados de Eficiencia Energética (CEE) de una cartera inmuebles determinada.

Como ejemplos de buenas prácticas en el sector público, el informe de ASEDIE destaca los datos estadísticos abiertos como motor de la Economía del Dato del Instituto Canario de Estadística (ISTAC) y la tecnología para la apertura de datos del Portal de Datos Abiertos de la Junta de Andalucía.

Como novedad, se ha incorporado la categoría de ejemplos de buenas prácticas en el sector académico, que reconoce el trabajo realizado por el Código Geoespacial y el Informe sobre el estado de los datos abiertos en España III, de la Universidad Rey Juan Carlos y Fundación FIWARE.

El 11º Informe ASEDIE sobre la Economía del Dato en el ámbito infomediario se puede descargar en la web de Asedie en español. También están disponibles las presentaciones de los indicadores económicos y el Top 3 y del Ecosistema de Datos.

En resumen, el informe recoge la buena salud de la industria que confirma su recuperación tras la pandemia, su capacidad de resiliencia y el potencial de crecimiento y, además, se observan los buenos resultados de la colaboración público-privada y su impacto en la economía del dato.

 

 

calendar icon
Noticia

Medir el impacto de los datos abiertos es uno de los retos que tienen por delante las iniciativas open data. Existen diversos métodos, la mayoría de los cuales combinan el análisis cuantitativo con el cualitativo, con el fin de conocer cuál es el valor de determinados conjuntos de datos.

En este contexto, data.europa.eu, el Portal Europeo de Datos Abiertos, ha puesto en marcha un Observatorio de casos de uso (Use Case Observatory). Se trata de un proyecto de investigación sobre el impacto económico, gubernamental, social y medioambiental de los datos abiertos.

¿En qué consiste el Observatorio de casos de uso?

Durante tres años, desde 2022 hasta 2025, el Portal Europeo de Datos realizará el seguimiento de 30 casos de reutilización de datos abiertos. Con ello se busca:

  1. Evaluar cómo se crea el impacto de los datos abiertos
  2. Compartir los retos y logros de los casos de reutilización analizados
  3. Contribuir al debate sobre la metodología a utilizar para medir dicho impacto

Los casos de uso analizados hacen referencia a cuatro áreas de impacto:

  • Impacto económico: Incluye casos de reutilización relacionados con la creación de empresas y la (re)capacitación de los trabajadores, entre otros. Por ejemplo, se incluyen soluciones que ayudan a identificar licitaciones públicas o solicitar puestos de trabajo.
  • Impacto gubernamental: Se refiere a casos de reutilización que impulsan el gobierno electrónico, la transparencia y la rendición de cuentas.
  • Impacto social: Engloba casos de reutilización en los ámbitos de la asistencia sanitaria, el bienestar y la lucha contra la desigualdad.
  • Impacto medioambiental:  Se circunscribe a casos de reutilización que promueven la sostenibilidad y la reducción de energía, incluyendo soluciones relacionadas con el control de la calidad del aire o la preservación de los bosques.

Para seleccionar los casos de uso, se realizó un inventario basado en tres fuentes: los ejemplos recogidos en los estudios de madurez que realiza cada año el portal europeo, las soluciones participantes en el EU Datathon y los ejemplos de reutilización disponibles en el repositorio de casos de uso de data.europa.eu. Solo se tuvieron en cuenta aquellos proyectos desarrollados en Europa, intentando mantener un equilibrio entre los distintos países. Además, se destacaron aquellos proyectos que hubiesen obtenido algún premio o que estuviesen alineados con las prioridades de la Comisión Europea para 2019 a 2024. Para finalizar la selección, desde data.europa.eu se realizaron entrevistas con representantes de los casos de uso que cumplían los requisitos y que estaban interesados en participar en el proyecto.

Tres proyectos españoles entre los casos de uso analizados

Los casos de uso seleccionados se recogen en la siguiente imagen:

Casos de uso analizados por dimensión.  1)	Impacto económico: C4P, Wonder Wanderlust Women, The Youth Public Open Procurement, LocalFocus, Naar Jobs in West-Vlaanderen – To Jobs in West Flanders. 2)	Impacto gubernamental: The Smartfiles Network, The object-based city model, The Waar is mijn stemlokaal? – Where is my polling station?, The non-governmental organisation (NGO) Openpolis, Next Generation Democracy, Statsregnskapet.no, The Institute for Development of Freedom of Information 3)	Impacto social: Medicatio, UniversiDATALab, VisImE-360, OpenActive, Tangible data, Hale & Hearty, EU Twinnings, Open Food Facts, Integreat, Emergency Volunteer Application. 4)	Impacto medioambiental: Digital Forest Dryads’ application, Air Quality Cyprus, Vides SOS, Planttes, Atlas Okolja – Environmental Atlas, Plume Labs, Baltazar, Environ-Mate.

Entre ellos, encontramos tres españoles:

  • En la categoría de Impacto social se sitúa UniversiDATA-Lab, un portal público para el análisis avanzado y automático de los conjuntos de datos publicados por las universidades. Este proyecto, que se hizo con el primer premio del III Desafío Aporta, fue concebido por el equipo creador de  UniversiData, una iniciativa colaborativa orientada e impulsada por universidades públicas con el fin de fomentar los datos abiertos en el sector de la educación superior en España de una forma armonizada. Puedes conocer más sobre estos proyectos en esta entrevista.
  • En la misma categoría también encontramos a Tangible data, un proyecto centrado en la creación de esculturas basadas en datos, para acercarlos a personas sin conocimientos técnicos. Entre otras fuentes de datos, utiliza datasets provenientes de la NASA o de Our World in Data.
  • En la categoría de medio ambiente está Planttes. Se trata de un proyecto de ciencia ciudadana diseñado para informar sobre la presencia de plantas alergénicas en nuestro entorno y el nivel de riesgo de alergia en función de su estado. Este proyecto está promovido por el Punto de Información Aerobiológica (PIA) del Instituto de Ciencia y Tecnología Ambientales (ICTA-UAB) y el Departamento de Biología Animal, Biología Vegetal y Ecología (BABVE), en colaboración con el Centro de Visión por Computador (CVC) y el Library Living Lab, todos ellos de la Universidad Autónoma de Barcelona (UAB).

Primer informe ya disponible

Fruto del trabajo de análisis realizado se desarrollarán tres informes. El primero de ellos, que se acaba de publicar, presenta la metodología y los 30 casos de reutilización seleccionados. Incluye información sobre los servicios que ofrecen, los datos (abiertos) que utilizan y el impacto que tienen en el momento de la redacción. El informe finaliza con un resume de las conclusiones generales y las lecciones aprendidas de esta primera parte del proyecto de investigación, ofreciendo una visión general de los próximos pasos del observatorio.

El segundo y el tercer informe, que verán la luz en 2024 y 2025, evaluarán el progreso de los mismos casos de uso y permitirá ampliar las conclusiones de este primer volumen. Los informes se focalizarán en determinar los logros alcanzados y los retos presentes en un espacio de tres años, lo cual permitirá extrapolar ideas concretas para mejorar las metodologías de evaluación del impacto de los datos abiertos.

El proyecto fue presentado en un webinar el pasado 7 de octubre, cuya grabación está disponible, junto con la presentación utilizada. En el webinar se invitó a participar a representantes de 4 de los casos de uso: Openpolis, Integreat, ANP y OpenFoodFacts.

calendar icon
Documentación

A la hora de publicar datos abiertos, es fundamental garantizar su calidad. Si los datos están bien documentados y cuentan con la calidad necesaria, será más fácil su reutilización, ya que serán menores los trabajos adicionales de depuración y procesamiento. Además, la baja calidad de los datos puede suponer un coste para los publicadores, que pueden llegar a gastar más dinero en solucionar los errores que en evitar con antelación los potenciales problemas.

Para ayudar en esta tarea, en el marco de la Iniciativa Aporta se ha elaborado la “Guía práctica para la mejora de la calidad de datos abiertos, que proporciona un compendio de directrices para actuar sobre cada una de las características que definen la calidad, impulsando su mejora. El documento toma como referente la guía para la calidad de datos de data.europe.eu, publicada en 2021 por la Oficina de Publicaciones de la Unión Europea.

¿A quién está dirigida la guía?

La guía está dirigida a publicadores de datos abiertos, a quienes proporciona una serie de pautas claras para mejorar la calidad de sus datos.

No obstante, esta recopilación también puede orientar a los reutilizadores de datos sobre cómo afrontar las debilidades de calidad que pueden presentar los conjuntos de datos con los que trabajan.

¿Qué incluye la guía?

El documento comienza definiendo las características, según la norma ISO/IEC 25012, que deben cumplir los datos para considerarse de calidad, las cuales se recogen en la siguiente imagen.

Atributos de la calidad de los datos: exactitud, completitud, consistencia, credibilidad, actualidad, accesibilidad, conformidad, confidencialidad, eficiencia, precisión, trazabilidad, comprensibilidad.

A continuación, el grueso de la guía está enfocado en la descripción de recomendaciones y buenas prácticas para evitar los problemas más habituales que suelen surgir a la hora de publicar datos abiertos, estructuradas de la siguiente manera:

  • Una primera parte donde se detallan una serie pautas generales para garantizar la calidad de los datos abiertos, como, por ejemplo, utilizar una codificación de caracteres estandarizada, evitar la duplicidad de registros o incorporar variables con información geográfica. Para cada pauta se proporciona una descripción detallada del problema, las características de calidad afectadas y las recomendaciones para su resolución, junto a ejemplos prácticos que facilitan su comprensión.
  • Una segunda parte con pautas concretas para asegurar la calidad de los datos abiertos según el formato de datos utilizado. Se han incluido pautas específicas para los formatos CSV, XML, JSON, RDF y APIs.
  • Por último, la guía también incluye recomendaciones para la estandarización y enriquecimiento de datos, así como para su documentación, y un listado de herramientas útiles para trabajar la calidad de los datos.

Puedes descargar la guía aquí o al final de la página.

Materiales adicionales

La guía va acompañada de una serie de infografías que recopilan las pautas antes indicadas:

caratula Infografía “Pautas generales para garantizar la calidad de los datos abiertos”

Version accesible

Captura de la infografía " Pautas para asegurar la calidad usando formatos específicos de datos"

Versión accesible

calendar icon
Blog

Existe una cuestión recurrente que siempre ha estado en el aire desde el inicio del movimiento de los datos abiertos y que según se han ido incrementando los esfuerzos y las inversiones en la recopilación y publicación de datos ha ido resonando cada vez con más fuerza: ¿Cuál es el valor de un conjunto de datos?

Esta es una pregunta extremadamente difícil de responder dada no solo la complejidad inherente a los propios datos, que crece además exponencialmente en cuanto comenzamos a combinarlos, sino también a los distintos puntos de vista desde los que se puede abordar la cuestión del valor.

  • Si sabemos que el valor no será inmediato, ¿cómo podemos prever y cuantificar los posibles beneficios en un momento futuro?
  • ¿Podría el valor de los datos llegar a ser negativo en algunos casos, si con ellos podemos causar también algún tipo de ‘daño’?
  • ¿Puede el valor de los datos degradarse a lo largo del tiempo?

Desde este espacio hemos analizado el valor de los datos abiertos para la administración de forma recurrente desde distintos enfoques: los datos de alto valor y su identificación, la perspectiva de los proveedores, las claves del valor de los datos, cómo generar valor a través de los datos o cuál es el valor de los datos en tiempo real. No obstante, el trabajo de análisis e investigación en esta área sigue creciendo imparable. En este sentido, queremos resaltar un trabajo publicado recientemente desde la Universidad de Cambridge. Se trata de un estudio en el desgranan algunos de los métodos más comunes para la valoración de los datos.

Partiendo de su análisis previo sobre las características de los datos y su valor asociado, se ha realizado la revisión de los métodos que existen actualmente. Con ello han llegado a la conclusión de dichos métodos pueden dividirse en varias categorías, cuyas características detallamos a continuación.

Métodos basados en análisis de costes

Este enfoque se basa en el principio tradicional estadístico de la “suma de costes”. Para ello se tienen en cuenta los costes de generación, recopilación, almacenamiento y sustitución de los conjuntos de datos, así como los costes para la organización en caso de que los datos den lugar a algún tipo de pérdida. Estos métodos cuentan con la ventaja de que son relativamente fáciles de calcular, pero, por otro lado, cuentan con la dificultad de tener que diferenciar entre los costes directamente atribuibles a los datos y otros costes indirectos relacionados, por ejemplo, con la variedad de labores profesionales involucradas o los distintos elementos de software utilizados.

Un ejemplo de aplicación de este método es el caso del departamento de estadísticas de Canadá con su análisis de valoración de los costes asociados a la inversión en datos, bases de datos y ciencia de datos en el país.

Métodos basados en análisis de ingresos

En este caso se utilizan las expectativas de flujos de ingresos, tomando como referencia el mercado potencial existente para la explotación de los datos. Para ello se pueden tener en cuenta, por ejemplo, los cánones por uso, las marcas registradas o las patentes. Las principales limitaciones de estos métodos consisten, generalmente, en que requieren aplicar criterios algo más subjetivos y en la complejidad de estimar ese valor cuando los datos no se explotan directamente sino indirectamente, por ejemplo, mediante analítica.

Estos métodos se utilizan en el estudio de la OECD sobre las perspectivas del valor de los datos. En él se calculan los ingresos declarados relacionados con la recopilación y venta de datos a través de la encuesta empresarial de los Estados Unidos.

Métodos basados en análisis de mercado

Generalmente estos son los métodos de preferencia que se suelen usar cuando todos los elementos necesarios para hacer los cálculos están disponibles. Sin embargo, hoy en día existe todavía una gran cantidad de datos en las organizaciones de uso exclusivamente interno, lo cual dificulta el uso de estos métodos, al no ser visible su comportamiento al mercado. Además, estos métodos tampoco pueden incorporar totalmente el valor social de los datos.

Un ejemplo de este método es el análisis realizado en el estudio llevado a cabo por la Comisión Económica para América Latina y el Caribe (CEPAL) sobre los mercados de datos puestos en marcha por la Unión Europea y el Gobierno de Colombia, respectivamente.

Experimentos y encuestas

Esta aproximación al valor de los datos consiste en evaluar el sentimiento de mercado en relación a los datos, preguntando directamente acerca de la disposición a pagar por ciertos datos o a prescindir de ellos. Generalmente se utiliza cuando el valor público de mercado no es conocido o en aquellos casos en el que el valor social tiene un peso importante, como puede ser, por ejemplo, en el área medioambiental. Una limitación de estos métodos es que, cuando los encuestados no son especialistas, puede resultar bastante complicado para ellos evaluar los posibles usos de los datos y, por tanto, su valor completo.

El estudio realizado por la oficina nacional de estadística del Reino Unido es un claro ejemplo de estos métodos de valoración.

Métodos basados en el impacto

En este caso la valoración se lleva a cabo a través de experimentos o casos prácticos que analizan el efecto causal sobre determinados resultados atribuibles a los datos. Esta opción es particularmente útil para los responsables de la elaboración de políticas públicas dirigidas por la evidencia, ya que permiten establecer una relación causa-efecto, lo que facilita la comprensión de los beneficios y la elaboración de una narrativa en favor del uso de los datos. No obstante, si los experimentos no están bien diseñados o no se ajustan bien al contexto específico que queremos analizar, corremos el riesgo de obtener una valoración excesivamente subjetiva.

El framework de evaluación basado en decisiones, propuesto por la Internet of Water Coallition, es un buen ejemplo de cómo aplicar los métodos centrados en el impacto a un caso particular.

Métodos basados en la cadena de actores

Con estos métodos lo que se busca es usar una visión más completa para valorar los datos desde distintos puntos de vista. Esto hace que las evaluaciones puedan ser también más complejas al involucrar distintas definiciones de lo que constituye el valor de los datos. No obstante, también lo convierte en el método más adecuado cuando se quiere evaluar un ecosistema de datos en su conjunto. Además, es un método en alza para las organizaciones que tienen en cuenta la inversión socialmente responsable.

Un ejemplo de cómo se pueden aplicar estos métodos en la práctica en el caso de estudio llevado a cabo con la entidad gestora de las autopistas en InglaterraHighways England.

Métodos basados en el análisis de opciones reales

La principal ventaja de estos métodos es que pueden aplicarse incluso cuando todavía no están definidos todos los posibles casos de uso para los datos. Su objetivo es conseguir una estimación del valor que tendrían los datos en ciertos posibles escenarios futuros – generalmente a través de la simulación por computación – de forma que si se alcanza ese escenario se podría justificar la explotación de los datos. Así pues, ciertas decisiones e inversiones relacionadas con los datos podrían ser aplazadas hasta que se llegue al escenario ideal que maximice el valor de esos datos, pudiendo minimizar así los costes y riesgos asociados hasta ese momento.

El caso de estudio sobre el sector del transporte llevado a cabo en Reino Unido nos ofrece un ejemplo de cómo se podrían aplicar estos métodos usando modelos financieros.

¿Y cuál es el método que tendría que usar en mi caso particular?

Desafortunadamente no existe una regla de oro que nos permita seleccionar un método en concreto. Sin embargo, hay una serie de cuestiones que los autores del estudio sugieren plantearnos a la hora de encontrar el método más adecuado para cada caso:

  • Qué es exactamente lo que estamos valorando: los datos pasan a través de varios estados en su ciclo de vida – desde los datos en crudo a los datos procesados, el análisis o el conocimiento generado. Dependiendo de en qué fase queramos centrar nuestro análisis algunos métodos pueden ser más apropiados que otros.
  • Desde qué punto de vista se lleva a cabo la valoración: el valor puede tener distintas definiciones dependiendo del punto de vista de quién realiza o encarga una valoración. En algunos casos por ejemplo la contención de costes debido a restricciones presupuestarias puede ser lo prioritario, mientras que en otros se podría optar por intentar maximizar el valor social.
  • En qué momento tiene lugar el proceso de evaluación: básicamente habrá que tener en cuenta si la evaluación se llevará a cabo de forma predictiva antes de disponer de todos los elementos evaluados o si se realizará a posteriori, una vez todas las variables sean ya conocidas.
  • Cuál es el propósito de la evaluación: varios de los métodos disponibles omiten o minimizan ciertos aspectos de los datos centrándose en otras características de su proceso de evaluación. Por lo tanto, será necesario conocer con claridad cuáles son las prioridades de nuestra evaluación a la hora de seleccionar el método más adecuado. ¿Es el impacto social lo que nos interesa? ¿La mejora de la productividad? ¿Maximizar la rentabilidad de los datos?

Por tanto, lo primero que deberíamos hacer es un análisis de nuestras necesidades y nuestra propia definición del valor, preguntándonos para ello qué es exactamente lo que queremos evaluar y cuál es la mejor forma de llevar a cabo esa evaluación, para pasar luego a elaborar nuestro propio marco de valoración usando los métodos más apropiados de entre la amplia variedad disponible.


Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon