El Reglamento de ejecución (UE) 2023/138 de la Comisión Europea establece pautas claras para los organismos públicos en la disponibilidad de conjuntos de datos de alto valor en un plazo de 16 meses. Estos conjuntos de datos de alto valor (High value datasets o HVD) se agrupan en los siguientes temas, los cuales ya se describían en este post:
Este artículo se centra en la categoría geoespacial, denominada Conjuntos de Datos de Alto Valor Geoespacial (HVDG).
Para todos los HVDG se deberá aplicar lo indicado en la Directiva 2007/2/CE del Parlamento Europeo y del Consejo, de 14 de marzo de 2007, por la que se establece una infraestructura de información espacial en la Comunidad Europea (INSPIRE), a excepción de parcelas agrícolas y de referencia, para las que se aplica el Reglamento (UE) 2021/2116 del Parlamento Europeo y del Consejo, de 2 de diciembre de 2021.
Tal y como se refleja en la tabla siguiente, el reglamento proporciona información detallada sobre los requisitos a tener en cuenta para estos HVDG, tales como escalas o granularidad y atributos de cada conjunto de datos. Estos complementan a los atributos definidos en el Reglamento Europeo (nº 1089/2010), que establece la interoperabilidad de los conjuntos y los servicios de datos espaciales.
Conjunto de datos | Escala | Atributos |
---|---|---|
Unidades administrativas |
Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000. De municipios a países; unidades marítimas. |
|
Nombres geográficos | No se aplica |
|
Direcciones | No se aplica |
|
Edificios | Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000 |
|
Parcelas catastrales |
Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000 |
|
Parcelas de referencia |
Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000 |
|
Parcelas agrícolas |
Nivel de precisión equivalente a la escala 1:10 000 y a partir de 2016, a escala de 1:5 000 |
|
Para garantizar la accesibilidad y la reutilización de todos estos valiosos conjuntos de datos, es imperativo seguir ciertas disposiciones que faciliten su publicación. Aquí están los requisitos clave:
- Licencia Abierta: Todos los conjuntos de datos deben estar disponibles para su reutilización bajo una licencia Creative Commons BY 4.0, o cualquier licencia abierta equivalente menos restrictiva. Esto fomenta la libertad de compartir y adaptar la información.
- Formato Abierto y Legible por Máquina: Los datos deben presentarse en un formato abierto, legible por máquina y estar documentados públicamente. Esto asegura que la información sea fácilmente comprensible y accesible para cualquier persona o sistema automatizado.
- Interfaces de Programación de Aplicaciones (API) y Descarga Masiva: Se deben proporcionar interfaces de programación de aplicaciones (API) para facilitar el acceso programático a los datos. Además, la descarga masiva directa de conjuntos de datos debe ser posible, permitiendo opciones flexibles para los usuarios según sus necesidades.
- Versión Actualizada: La disponibilidad de los conjuntos de datos en su versión más actualizada es esencial. Esto garantiza que los usuarios accedan a la información más reciente, promoviendo la relevancia y la precisión de los datos.
- Metadatos: La descripción de los datos también se cuidará de manera minuciosa mediante el uso de metadatos. Estos metadatos, como mínimo, incluirán los elementos definidos en el Reglamento (CE) nº 1205/2008 de la Comisión, de 3 de diciembre de 2008. Este reglamento ejecuta la Directiva 2007/2/CE del Parlamento Europeo y del Consejo, y establece los estándares para los metadatos asociados a los conjuntos de datos. El uso de metadatos estandarizados proporciona información adicional esencial para entender, interpretar y utilizar los conjuntos de datos de manera efectiva. Al seguir estos estándares, se facilita la interoperabilidad y la coherencia en la presentación de información, promoviendo así una comprensión más completa y precisa de los datos disponibles.
Estas disposiciones no solo promueven la transparencia y la apertura, sino que también facilitan la colaboración y el uso efectivo de la información en diversos contextos.
¿Cumple España con el Reglamento de los HVD geoespaciales?
La Directiva INSPIRE (Infrastructure for Spatial Information in Europe) determina las reglas generales para el establecimiento de una Infraestructura de Información espacial en la Comunidad Europea basada en las Infraestructuras de los Estados miembros. Aprobada por el Parlamento Europeo y el Consejo el 14 de marzo de 2007 (Directiva 2007/2/CE), entró en vigor el 25 de abril de 2007.
INSPIRE permite encontrar, compartir y utilizar con más facilidad los datos espaciales de diferentes países y en cada una de las regiones, estando los HVD disponibles en el nuevo catálogo de la Comisión de los HVD y en cada uno de los catálogos de las Infraestructuras de Datos Espaciales de las Comunidades Autónomas, así como en el Catálogo Oficial de Datos y Servicios INSPIRE de España. La información está disponible a través de una plataforma online desde la que se puede encontrar datos de distintos países.
ADVERTENCIA: En la actualidad están trabajando en este Geoportal realizando las tareas de volcado de datos, por lo tanto, puede existir alguna incongruencia temporal con los datos aportados, que se corresponden del Catalogo Oficial de Datos y Servicios INSPIRE (CODSI).
En España existe la Ley 14/2010 de 5 de julio sobre las infraestructuras y los servicios de información geográfica en España (LISIGE), que transpone la Directiva 2007/2/CE INSPIRE. Esta ley enmarca los trabajos para poner a disposición todos los datos espaciales nacionales y obliga a adaptarlos a las Guías Técnicas o Directrices recogidos por la Directiva INSPIRE, asegurando así que estos datos sean compatibles e interoperables en un contexto comunitario y transfronterizo.
La LISIGE se aplica a los datos geográficos que cumplan estas condiciones:
- Referirse a una zona geográfica del territorio nacional, el mar territorial, la zona contigua, la plataforma continental y la zona económica exclusiva.
- Haber sido generados por o bajo la responsabilidad de las Administraciones públicas.
- Estar en formato electrónico.
- Ser su producción y mantenimiento competencia de una Administración u organismo del sector público.
- Estar dentro de los temas de los anexos I (Información Geográfica de Referencia), II (Datos Temáticos Fundamentales) o III (Datos Temáticos Generales) referidos en mencionada ley
Además, se aclara que los datos y servicios geográficos regulados por la LISIGE estarán disponibles en el Geoportal de la IDEE y en el CODSI, así como en el resto de los catálogos de las CC. AA., cuyo mantenimiento es responsabilidad del Instituto Geográfico Nacional (IGN).
Gracias a los incansables esfuerzos realizados por toda la administración española desde la publicación de la LISIGE, España ha logrado un hito notable. En la actualidad, se encuentra disponible en el Geoportal de INSPIRE una amplia gama de información clasificada como HVDG. Este logro refleja el compromiso continuo de nuestro país con la transparencia y el acceso a datos geoespaciales de alta calidad.
A enero de 2024, España tiene publicado en el Geoportal de INSPIRE y en el CODSI la siguiente información relacionada con los conjuntos de alto valor geoespacial:
- 31 conjuntos de datos asociados a sus metadatos
- 34 servicios de descarga (WFS, ATOM Feed, OGC Api Feature)
- 28 servicios de visualización (WMS, WMTS)
Analizando los conjuntos de alto valor geoespaciales, vemos que según las temáticas se han publicado en la actualidad:
HVDG España | Conjuntos de datos |
Servicios de descarga |
Servicios de visualización | Recubre el territorio español |
---|---|---|---|---|
![]() Unidades administrativas |
5 | 7 | 7 | Sí |
![]() Nombres geográficos |
7 | 8 | 8 | Sí |
![]() Direcciones |
6 | 5 | 7 | Sí |
![]() Edificios |
5 | 3 | 4 | Sí |
![]() Parcelas catastrales |
3 | 3 | 3 | Sí |
![]() Parcelas de referencia |
3 | 0 | 3 | Sí |
![]() Parcelas agrícolas |
2 | 2 | 2 | Sí |
En la actualidad España cumple con el Reglamento de los HVDG en todas las categorías. En concreto, cumple con la legislación establecida a nivel de escala o granularidad, atributos, licencia, formato, disponibilidad de los datos en API o descarga máxima, con ser la versión más actualizada y con los metadatos.
Al realizar un análisis detallado de los conjuntos de datos publicados en el marco de los HVD, se destacan varios aspectos clave:
- Cobertura Geográfica Integral: Se ha logrado poner a disposición al menos un conjunto de datos que abarca la totalidad del territorio español.
- Metadatos Exhaustivos: Se han generado metadatos para todos los Conjuntos de Alto Valor Geoespacial (HVDG). Estos metadatos se encuentran publicados en el Catálogo Oficial de Datos y Servicios INSPIRE (CODSI),validados para cumplir con los estándares del Reglamento (CE) nº 1205/2008 de la Comisión.
- Servicios de Visualización y Descarga: Todos los HVDG cuentan con servicios de visualización y de descarga. Los servicios de descarga pueden ser de descarga masiva o API de descarga y en estos momentos son WFS y ATOM y en un futuro pueden ser OGC API Feature o API Coverage.
- Licencias y Formatos Abiertos: Todos los servicios publicados están bajo licencia Creative Commons BY 4.0, y los servicios de descarga utilizan formatos estándares y abiertos como el formato GML documentado por la norma internacional ISO 19136.
- Cumplimiento con Modelos de Datos INSPIRE: Casi todos los conjuntos de datos cumplen con los modelos de datos INSPIRE, garantizando así la coherencia y calidad de los atributos establecidos en el reglamento de HVDG.
- Datos Actualizados y Mantenidos: Los servicios de descarga garantizan la disponibilidad de datos en su versión más actualizada. Cada administración pública responsable de los datos se encarga del mantenimiento y la actualización de la información.
Este análisis resalta el compromiso y la eficiencia en la gestión de datos geoespaciales en España, contribuyendo a la transparencia, accesibilidad y calidad en la información proporcionada a la comunidad.
Se debe resaltar que, en España, se cumple con todos los requisitos de los HVDG. Organismos como el CNIG y el ICGC o el Gob. de Navarra, además de publicar a través de servicios WFS o ATOM, está ya trabajando en tener publicados estos conjuntos de datos con las API de OGC.
El Geoportal de INSPIRE se ha convertido en una valiosa fuente de información, gracias a la dedicación y colaboración de diversas entidades gubernamentales, entre ellas las españolas. Este avance no solo resalta el progreso en la implementación de estándares geoespaciales, sino que también fortalece la base para el desarrollo sostenible y la toma de decisiones informadas en España. ¡Un logro significativo para el país en el ámbito geoespacial!
Contenido elaborado por Mayte Toscano, Senior Consultant en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Para cumplir con la Directiva (UE) 2019/1024 y su posterior reglamento de ejecución, los estados miembros de la Unión Europea están trabajando en la puesta a disposición de los llamados datos de alto valor (high-value dataset o HVD, en inglés). El objetivo es que ciudadanos y empresas puedan acceder a dichos datos bajo unos requisitos técnicos que favorezcan su reutilización y su impacto positivo en la sociedad, la economía y el medio ambiente.
La apertura de estos conjuntos de datos supone un gran reto para las administraciones públicas de todos los países de la Unión Europea. Aunque muchos de estos datos ya están a disposición de los usuarios, los países deben identificarlos para poder informar sobre ellos y resolver la alta heterogeneidad en los formatos, estructuras y semánticas. En concreto, a partir de febrero de 2025, los Estados miembros tendrán que informar a la Comisión cada dos años sobre los conjuntos de datos de alto valor disponibles, incluyendo los enlaces a las condiciones de las licencias y las API.
Para ayudar en esta tarea, el Portal Europeo de Datos ha publicado el informe “Report on Data Homogenisation for High-value Datasets” donde propone un enfoque metodológico para facilitar la identificación y homogeneización de los HVD. Entre otras cuestiones, el informe ofrece ejemplos de estándares que ayudan a conseguir una mayor interoperabilidad no solo entre datos, sino también entre las aplicaciones que los utilizan.
Un método para la identificación y homogeneización
El informe describe una aproximación metodológica basada en tres pasos:
- La identificación de los HVD en los portales de datos ya existentes. Aunque existen algunas pautas para la publicación de HVD, como estas para aplicar DCAT-AP, la forma de nombrar a los conjuntos de datos ya publicados no es uniforme, lo que hace difícil encontrarlos. El informe propone un protocolo que consiste en definir palabras clave, partiendo de los conjuntos de datos y sus atributos asociados, contenidos en el anexo I del Reglamento de Ejecución. Se trata de utilizar dichas palabras clave para buscar en los distintos portales de datos ya existentes. El informe explica cómo se ha testeado el protocolo de identificación con conjuntos de datos de las categorías de registros empresariales, datos estadísticos y datos sobre redes de transporte, incluyendo tablas con las palabras clave utilizadas.
- Localización o desarrollo de modelos de datos, ontologías, vocabularios controlados y/o API comunes. En esta sección, el informe describe algunos recursos de utilidad, los cuales se resumen en la siguiente tabla:
Recurso | Descripción | Categoría de datos en las que más pueden ayudar, según el informe |
---|---|---|
Directiva Inspire | Características que debe tener la información espacial y sus metadatos. |
|
Especificaciones de datos de la Directiva Inspire (data specifications) |
Modelos, esquemas y reglas de codificación para diferentes áreas temáticas de datos espaciales.
|
|
Servicios de red de Inspire (network services) | Conjunto de interfaces comunes para servicios web que permiten el descubrimiento, visualización, descarga y transformación de datos espaciales. |
|
Directrices técnicas para los metadatos de Inspire (Inspire technical guidelines for metadata) |
Directrices técnicas para metadatos, con los elementos mínimos a incluir definidos en el Reglamento 1205/2008 de la Comisión. |
|
Geo-DCATAP | Extensión del perfil de aplicación DCAT para describir conjuntos de datos geoespaciales. |
|
Core Location Vocabulary | Modelo de datos simplificado que incluye las características fundamentales de una ubicación, representada como una dirección o nombre geográfico, o a través de geometría. |
|
General Multilingual Environmental Thesaurus (GEMET). | Vocabulario controlado especializado en información medioambiental. Dispone de una sección de conceptos ligados con las categorías de datos espaciales incluidas en Inspire. |
|
Semantic Sensor Network | Recomendación del W3C para describir los sensores y sus observaciones. |
|
Quantity, unit, dimension and type (QUDT). | Conjunto de ontologías que definen clases básicas, propiedades y restricciones utilizadas para modelar magnitudes físicas, unidades de medida y sus dimensiones en diversos sistemas de medición. |
|
Lista de clasificaciones estadísticas de Eurostat | Clasificaciones estadísticas mantenidas por Eurostat, disponibles como Linked Open Data en XKOS, la extensión de SKOS para modelar clasificaciones estadísticas. Se presentan por familia de clasificación, categorizadas por ámbito estadístico y subdominios (por ejemplo, NACE para la actividad económica, la cual describiremos más adelante). |
|
Listas de códigos estándar de Eurostat | Conjuntos predefinidos y organizados de elementos que presentan conceptos estadísticos mediante códigos únicos |
|
Statistical Data and Metadata eXchange (SDMX) | Iniciativa mundial para normalizar y armonizar el intercambio de datos y metadatos estadísticos. Ofrece normas técnicas (el modelo de información SDMX), directrices, una arquitectura informática, herramientas y una serie de tutoriales para ayudar a los usuarios. |
|
RDF Data Cube Vocabulary | Ontología para describir datos multidimensionales, como las estadísticas, que se basa en el núcleo del modelo de información SDMX 2.0. |
|
Core Business Vocabulary | Mencionado por el propio reglamento, consiste en un modelo de datos simplificado que captura las características fundamentales de una entidad jurídica, como su nombre legal, actividad o dirección. |
|
Código NACE | Códigos para la clasificación de actividades económicas en la Unión Europea. Su revisión NACE 2 fue publicada por la Comisión Europea en octubre de 2022 |
|
Organization ontology | Ontología del W3C para apoyar la publicación de datos enlazados relativos a información organizativa, es decir, proporciona una serie de formas de representar la relación entre las personas y las organizaciones, junto con la estructura de información interna de una organización. |
|
Global Legal Entity Identifier Foundation | Base de datos centralizada con información sobre las personas jurídicas que participan en los mercados financieros mundiales. Asigna a cada entidad un código único de Identificador de Personas Jurídicas (Legal Entity Identifier o LEI) reconocido a escala mundial. |
|
Taxonomía NST | Sistema de clasificación para las mercancías transportadas a través de carretera, ferrocarril, vías navegables interiores y mar. Tiene en cuenta la actividad económica asociada al origen de las mercancías. |
|
Tabla de autoridades de "Transport service" | Lista de códigos de los distintos tipos de servicios de transporte facilitada por la sección de Vocabularios de la UE. |
|
Fuente: Report on Data Homogenisation for High-value Datasets
El informe también menciona algunos modelos a utilizar en el ámbito de ciudades inteligentes, como Smart Data Models y la española Ciudades Abiertas.
- La aplicación de dichos modelos. El último paso es la armonización real de los datos. Una vez seleccionados los modelos a utilizar, es el momento de aplicarlos. En esta fase se realizarán los procesos de conversión necesarios para proporcionar los datos en los formatos adecuados y con metadatos de calidad unificados. La forma de aplicar estas transformaciones variará en función del resultado final previsto. Por ejemplo, puede consistir en transformar datos tabulares (valores separados por comas o CSV, Excel, bases de datos relacionales, etc.) en otras fuentes de datos también tabulares pero que sigan la estructura proporcionada en los modelos de datos comunes. También se puede ir más allá y transformarlos en representaciones basadas en árboles (como JSON) o en RDF de acuerdo con las ontologías y vocabularios controlados que se seleccionen.
Conclusiones del informe
El informe finaliza con una serie de conclusiones y recomendaciones. Todavía existen retos en torno a la identificación de los HVD y la aplicación del Reglamento de ejecución en todos los países europeos, sobre todo a la hora de concienciar y difundir sobre su importancia. En las categorías de HVD en las que existen grandes iniciativas de armonización de datos, como Inspire sobre datos geoespaciales o Eurostat sobre HVD estadísticos, podemos encontrar una mayor cantidad de datos disponibles de manera interoperable y armonizada. Por el contrario, en las categorías en las que no existe una iniciativa adoptada de forma mayoritaria, como las empresas y la propiedad de las empresas, aún queda camino por recorrer para aplicar el reglamento.
Las recomendaciones que plantea el informe del Portal Europeo de Datos ayudan a configurar una hoja de ruta para publicar los conjuntos de datos de alto valor en cada una de las categorías definidas por la Comisión Europea. Un reto que las administraciones deberán abordar durante 2024 y que facilitará la reutilización de la información pública.
La Federación Española de Municipios y Provincias (FEMP) aprobó a finales de 2023 dos ordenanzas tipo que abordan el progreso en dos áreas clave: la transparencia y el gobierno del dato. Ambos documentos no solo mejorarán la calidad de los procesos, sino que facilitarán el acceso, gestión y la reutilización de los datos. En este post, analizaremos la segunda ordenanza elaborada en el seno de la Red de Entidades por la Transparencia y Participación Ciudadana de la FEMP en su búsqueda de definir modelos de referencia comunes. En concreto, la ordenanza relativa al gobierno del dato.
La utilidad y buen hacer de la Ordenanza Tipo del Gobierno del Dato en la Entidad Local ha sido resaltada por la Asociación Multisectorial de la Información (ASEDIE), quien le otorgó el premio en la categoría ‘Impulsando el conocimiento del dato’ en su 15º Conferencia Internacional ASEDIE.
Bajo esta premisa, el documento aborda todos los elementos relacionados con la obtención, gestión y explotación de los datos para plantearlos como un bien común, es decir, garantizando su apertura, accesibilidad y reutilización. Este es un objetivo relevante para las administraciones locales, ya que gracias a ello pueden mejorar su funcionamiento, los servicios que presta y la toma de decisiones. El gobierno del dato es el marco que guía y garantizar este proceso y esta ordenanza plantea un marco normativo flexible que las diferentes administraciones puedan adaptar según sus necesidades concretas.
¿Qué es el gobierno del dato?
El Gobierno del Dato aborda de forma integral todos los aspectos relacionados con la obtención, gestión y explotación de los datos, así como su apertura y reutilización por toda la sociedad de forma igualitaria. Por tanto, podemos definirlo como una función organizativa responsable de rendir cuentas sobre el uso eficaz, eficiente y aceptable de los datos por parte de la organización, necesaria para acometer la estrategia de negocio. Así lo describen las especificaciones UNE 0077:2023 de Gobierno del Dato y UNE 78:2023 de Gestión del Dato, que recogen procesos estandarizados para guiar a las organizaciones en el establecimiento de mecanismos aprobados y validados que den soporte organizacional a los aspectos relacionados con la apertura y publicación de datos, para su posterior uso por la ciudadanía y otras instituciones.
¿Cómo se desarrolló la Ordenanza de Gobierno del Dato de la FEMP?
Para desarrollar la Ordenanza Tipo de Gobierno del Dato en la Entidad Local, se constituyó en 2022 un grupo de trabajo multidisciplinar que contaba con trabajadores de las AAPP, empresas privadas, representantes del sector infomediario, la Oficina del Dato, universidades, etc. Este equipo planteó dos objetivos principales que marcarían el contenido del documento:
- Elaborar guías para ayuntamientos y otras AAPP donde se defina la estrategia a seguir para poner en marcha un proyecto de datos abiertos.
- Crear un modelo de referencia de conjuntos de datos común a todas las AAPP para facilitar la reutilización de la información.
Teniendo en cuenta estos dos retos, a principios de 2023 el grupo de trabajo de la FEMP empezó a establecer aspectos, estructura, contenidos y plan de trabajo. Durante los meses posteriores, se llevaron a cabo trabajos de redacción, elaboración y consenso de un borrador único.
Además, se organizó un proceso participativo en la plataforma Idea Zaragoza para nutrir el documento con las aportaciones de expertos de todo el país y socios de las FEMP.
El resultado de todo el trabajo se sustentó en la Carta Internacional de Datos Abiertos (Open Data Charter-ODC), las recomendaciones emanadas de la Oficina del Dato del Gobierno de España y la normativa europea y nacional existente sobre esta materia.
Aspectos novedosos y estructura de la Ordenanza de Gobierno del Dato
La Ordenanza Tipo de Gobierno del Dato de la FEMP es acorde al contexto en el que se ha presentado; es decir, reconoce aspectos relevantes del momento actual que estamos viviendo. Alguna de las características a destacar del documento es la premisa de garantizar y potenciar los derechos de las personas tanto físicas como jurídicas y respetar el Reglamento General de Protección de Datos. El reglamento hace especial hincapié en la proporcionalidad de la anonimización para garantizar la privacidad de las personas.
Otro aspecto novedoso de la norma es que aporta la visión de los datos de alto valor definidos por la Comisión Europea desde la perspectiva de la administración local. Además, la Ordenanza Tipo reconoce un régimen único para el acceso y reutilización de la información pública, acorde a la Ley 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno, y la Ley 37/2007, sobre reutilización de la información del sector público.
Más allá de garantizar el marco jurídico y normativo, la Ordenanza de la FEMP también aborda los datos asociados a la inteligencia artificial, sinergia tecnológica puntera que cada día ofrece grandes soluciones innovadoras. Para que una inteligencia artificial funcione correctamente, es necesario contar con datos de calidad que ayuden a su entrenamiento. En relación con este punto, la ordenanza define unos requisitos de calidad (Artículo 18) y métricas para su evaluación que se adaptan a cada contexto específico y que abordan cuestiones como la exactitud, portabilidad o confidencialidad, entre otras. El documento establece garantías para que el uso de los datos se lleve a cabo respetando los derechos de las personas.
Todos estos aspectos novedosos forman parte de la Ordenanza Tipo de Gobierno del Dato para Entidades Locales de la FEMP que se organiza en la siguiente estructura:
- Disposiciones generales: Este primer apartado presenta el dato como principal activo digital de las Administraciones Públicas como activo estratégico, y del objeto, principios y derecho de la ciudadanía.
- Planificación, organización e instrumentos para el gobierno del dato: En este punto se define la organización y competencias para el gobierno del dato. Además, se destaca la importancia de mantener un inventario de conjuntos de datos y fuentes de información (Artículo 9).
- Los datos: Este capítulo reconoce los requisitos de publicación y los estándares de seguridad, la importancia del uso de vocabularios de referencia, y las categorías de conjuntos de datos cuya apertura debe ser priorizada, en concreto, las 80 tipologías referidas por la FEMP como más relevantes.
- Ciclo de vida: En este apartado se destaca, por un lado, la obtención, apertura, conservación y utilización de los datos; y, por otro, los límites, supresión y destrucción de los datos cuando se precise de la realización de estas actuaciones. cuando se precise de la realización de estas actuaciones.
- Acceso, publicación y reutilización: El quinto capítulo aborda cuestiones relativas a la explotación de los datos como es el uso de licencias específicas, los derechos exclusivos, el pago por reutilización o la solicitud previa para acceder a determinados conjuntos de datos
- Responsabilidad y garantías: El último punto describe el régimen sancionador y el disciplinario, y las responsabilidades civil y penal del reutilizador.
En definitiva, la publicación de la Ordenanza sobre Gobierno del Dato en Entidades Locales dota a las administraciones locales de una regulación flexible y define estructuras administrativas que buscan la mejora de la gestión, la reutilización y el impulso de una sociedad basada en el dato.
Puedes acceder al documento completo aquí: Ordenanza tipo de Gobierno del Dato en la Entidad Local.
El concepto de datos de alto valor (High-Value datasets) fue introducido por el Parlamento Europeo y el Consejo de la Unión Europea hace 4 años, en la Directiva (UE) 2019/1024. En ella se definían como una serie de conjuntos de datos con un gran potencial para generar “beneficios para la sociedad, el medio ambiente y la economía”. Por ello, los estados miembro debían impulsar su apertura de manera gratuita, en formatos legibles por máquinas, a través de APIs, en forma de descarga masiva y descritos de forma exhaustiva mediante metadatos.
De manera inicial, la directiva proponía en su anexo seis categorías temáticas a considerar como de alto valor: datos geoespaciales, observación de la tierra y medioambientales, meteorológicos, estadísticos, registros empresariales y datos sobre redes de transporte. Estas categorías fueron detalladas posteriormente en un reglamento de ejecución publicado en diciembre de 2022. Además, para facilitar su apertura, en junio de 2023 se editó un documento con pautas sobre cómo usar DCAT-AP para su publicación.
Nuevas categorías de datos a considerar de alto valor
Estas categorías iniciales siempre estuvieron abiertas a su ampliación. En este sentido, la Comisión Europea acaba de publicar el informe “Identification of data themes for the extensions of public sector High-Value Datasets” donde se incluyen siete nuevas categorías que se estudia considerar como datos de alto valor
-
Pérdida climática: Hace referencia a los datos relacionados con los enfoques y acciones necesarios para evitar, minimizar y abordar los daños asociados al cambio climático. Ejemplos de conjuntos de datos de esta categoría son las pérdidas económicas y no económicas derivadas de los fenómenos meteorológicos extremos o los cambios de evolución lenta, como el aumento del nivel del mar o la desertificación. También incluye datos relacionados con los sistemas de alerta temprana ante desastres naturales, la repercusión de las medidas de mitigación o datos de investigación sobre la atribución de fenómenos extremos al cambio climático.
-
Energía: Esta categoría incluye estadísticas completas sobre la producción, transporte, comercio y consumo final de fuentes de energía primarias y secundarias, tanto renovables como no renovables. Algunos ejemplos de conjuntos de datos a considerar son los indicadores de precios y consumo o la información sobre seguridad energética.
-
Finanzas: Se trata de información sobre la situación de las empresas privadas y las administraciones públicas, que puede utilizarse para evaluar el rendimiento empresarial o la sostenibilidad económica, así como para definir estrategias de gasto e inversión. Incluye conjuntos de datos sobre registros de empresas, estados financieros, fusiones y adquisiciones, así como informes financieros anuales.
-
Gobierno y administración pública: Esta temática incluye aquellos datos que los servicios y empresas públicas recopilan para informar y mejorar la acción de gobierno y la administración de una unidad territorial específica, ya sea un estado, una región o un municipio. Incluye datos relativos al gobierno (por ejemplo, actas de reuniones), los ciudadanos (censos o registro en los servicios públicos) y las infraestructuras gubernamentales. Estos datos se reutilizan posteriormente para fundamentar la elaboración de políticas, prestar servicios públicos, optimizar los recursos y la asignación presupuestaria, así como proporcionar información procesable y transparente a ciudadanos y empresas.
-
Salud: Este concepto identifica los conjuntos de datos que cubren el bienestar físico, y mental de la población, haciendo referencia tanto a aspectos objetivos como subjetivos de la salud de las personas. También incluye indicadores clave sobre el funcionamiento de los sistemas de asistencia sanitaria y la seguridad en el trabajo. Algunos ejemplos son los datos relativos a la Covid-19, la equidad sanitaria o el listado de servicios prestados por los centros sanitarios.
-
Justicia y asuntos jurídicos: Identifica conjuntos de datos que permiten reforzar la capacidad de respuesta, la rendición de cuentas y la interoperabilidad de los sistemas judiciales de la UE, cubriendo ámbitos como la aplicación de la justicia, el sistema jurídico o la seguridad pública, es decir, aquella que garantiza la protección de los ciudadanos. Los conjuntos de datos sobre justicia y asuntos jurídicos incluyen documentación de jurisprudencia nacional o internacional, decisiones de tribunales y fiscales generales, así como actos jurídicos y su contenido.
-
Datos lingüísticos: Hace referencia a expresiones escritas u orales que están en la base de la inteligencia artificial, el procesamiento del lenguaje natural y el desarrollo de servicios relacionados. La Comisión ofrece una definición bastante amplia de esta categoría de datos, todos ellos agrupados bajo la denominación de "datos lingüísticos multimodales". Pueden incluir repositorios de colecciones de textos, corpus de lenguas habladas, recursos de audio, o grabaciones de vídeo.
Para realizar esta selección, los autores del informe llevaron a cabo una investigación documental, así como consultas a administraciones públicas, expertos en datos y empresas privadas mediante una serie de talleres y encuestas. Además de esta evaluación, el equipo del estudio cartografió y analizó el ecosistema normativo en torno a cada categoría, así como las iniciativas políticas relacionadas con su armonización y puesta en común, especialmente en relación con la creación de Espacios Comunes Europeos de Datos.
Potencial para las PYMEs y las plataformas digitales
Además de definir estas categorías, el estudio también ofrece una estimación de alto nivel sobre el impacto de las nuevas categorías en las pequeñas y medianas empresas, así como en las grandes plataformas digitales. Una de las conclusiones del estudio es que la relación coste-beneficio de la apertura de datos es similar en todos los nuevos temas, destacando especialmente aquellos relativos a las categorías "Finanzas" y "Gobierno y administración pública".
Basándose en los conjuntos de datos disponibles públicamente, también se realizó una estimación del grado de madurez actual de los datos pertenecientes a las nuevas categorías, según su cobertura territorial y su grado de apertura (teniendo en cuenta si estaban abiertos en formatos leíbles por máquinas, con metadatos adecuados, etc.). Para maximizar la relación coste-beneficio global, el estudio sugiere seleccionar para cada categoría temática una aproximación distinta: en base a su nivel de madurez, se recomienda indicar un mayor o menor número de criterios obligatorios para su publicación, asegurándose así el evitar solapamientos entre los nuevos temas y con los datos de alto valor ya existentes.
Puedes leer el estudio completo en este enlace.
Las administraciones públicas (AA.PP.) tienen el deber de publicar sus conjuntos de datos abiertos en formatos reutilizables, tal y como dicta la Directiva Europea 2019/1024 que modifica la Ley 37/2007 de 16 de noviembre, sobre reutilización de la información del sector público. Esta regulación, alineada con la Estrategia de datos de la Unión Europea, determina que las AA.PP. dispongan de catálogos propios de datos abiertos para fomentar el uso y la reutilización de la información pública.
Uno de estos catálogos es el Portal de Datos Abiertos de Canarias que cuenta con más de 7.450 conjuntos de datos abiertos, gratuitos y reutilizables de hasta 15 organizaciones de la comunidad autónoma. La Consejería de Agricultura, Ganadería, Pesca y Soberanía Alimentaria (CAGPSA) del Gobierno de Canarias forma parte de esta lista. Dentro de su eje de trabajo de Gobierno Abierto, la CAGPSA ha impulsado con decisión la apertura de sus datos.
A través de un proceso de análisis, depuración y normalización de los datos, la CAGPSA ha conseguido publicar más de 20 conjuntos de datos en el portal, garantizando así la calidad en la reutilización de la información por parte de cualquier persona interesada.
Análisis, normalización de los datos y protocolo de apertura de datos para el Gobierno de Canarias
Para lograr este hito en la gestión de los datos, la Consejería de Agricultura, Ganadería, Pesca y Soberanía Alimentaria del Gobierno de Canarias ha llevado a cabo la definición y ejecución de un protocolo de apertura de datos, en el que se incluyen tareas tales como:
- Elaboración de inventario y priorización de fuentes de datos a publicar.
- Análisis, depuración y normalización de conjuntos de datos priorizados.
- Solicitud de carga de conjuntos de datos en el Portal de Datos Abiertos de Canarias.
- Atención a peticiones derivadas de los conjuntos de datos publicados.
- Actualización de conjuntos de datos publicados.
La normalización de los datos ha sido un factor clave para la Consejería, y en este sentido, ha tenido en cuenta activos semánticos internacionales (entre ellos clasificaciones de las Naciones Unidas y sus diversas agencias o Eurostat) y ha aplicado pautas definidas en estándares internacionales, como lo es SDMX o las marcadas por datos.gob.es, para garantizar la calidad de los datos publicados.
La CAGPSA no solo ha volcado esfuerzos en la normalización y publicación de los datos, sino que también ha proporcionado soporte al personal de la Consejería en la gestión y mantenimiento de los mismos, impartiendo sesiones de formación y concienciación. Por otra parte, ha elaborado un manual para la reutilización de los datos donde se contemplan las pautas a tener en cuenta en el momento de valorar qué datos se pueden publicar, basadas en las directivas europeas y estatales relativas a los datos abiertos y reutilización de información del sector público. De este modo, ha dado respuesta a las inquietudes del personal de la Consejería frente a la publicación de datos de carácter personal o comercial.
Como fruto de este trabajo, la Consejería ha colaborado activamente con el Portal de Datos Abiertos de Canarias para la publicación de los conjuntos de datos y para la definición del protocolo de apertura de datos establecido para todo el Gobierno de Canarias.
Compromiso por la calidad y la reutilización de la información
La CAGPSA ha sido especialmente destacada por la publicación del conjunto de datos de Sociedades Agrarias de Transformación (SAT), que se encuentra dentro del top 3 de la Asociación Multisectorial de la Información (ASEDIE) en 2021. Esta iniciativa ha sido valorada por esta Asociación en diversas ocasiones por su enfoque en la calidad de los datos y su gestión.
Su labor en la normalización de los datos y el soporte al personal de la Consejería, así como la colaboración con el portal de datos abiertos y la amplia oferta de conjuntos de datos, sitúan a la CAGPSA como referente en este ámbito en la comunidad autónoma de Canarias.
Desde datos.gob.es, aplaudimos este tipo de ejemplos y destacamos las buenas prácticas sobre apertura de datos por parte de las administraciones públicas. La iniciativa de la Consejería de Agricultura, Ganadería, Pesca y Soberanía Alimentaria del Gobierno de Canarias es un paso relevante que nos acerca a las ventajas que los datos abiertos y su reutilización aportan a la ciudadanía. El compromiso de la Consejería por la apertura de datos contribuye al objetivo europeo y nacional de lograr una administración orientada al dato.
Actualizado: 21/03/2024
En enero de 2023, la Comisión Europea publicó un listado de conjuntos de datos de alto valor que los organismos del sector público deberían poner a disposición de la ciudadanía en un plazo máximo de 16 meses. El principal objetivo de establecer la lista de conjuntos de datos de alto valor es garantizar que los datos públicos de mayor potencial socioeconómico se pongan a disposición para su reutilización con una restricción jurídica y técnica mínima, y sin coste alguno. Dentro de estos conjuntos de datos del sector público, algunos como los meteorológicos o los relativos a la calidad del aire, resultan especialmente interesantes para desarrolladores y creadores de servicios como aplicaciones o páginas webs, que reportan valor añadido e importantes beneficios para la sociedad, el medioambiente o la economía.
La publicación del Reglamento se acompañó de unas preguntas frecuentes para ayudar a los organismos públicos a entender el beneficio de los HVDS (High Value Datasets) en la sociedad y la economía, así como para explicar algunos aspectos sobre la obligatoriedad y las ayudas para la publicación.
En línea con esta propuesta, la Vicepresidenta Ejecutiva para una Europa adaptada a la era digital, Margrethe Vestager, declaró lo siguiente en la nota de prensa lanzada por la Comisión Europea:
“Poner a disposición del público conjuntos de datos de gran valor beneficiará tanto a la economía como a la sociedad, por ejemplo, ayudando a combatir el cambio climático, reduciendo la contaminación atmosférica urbana y mejorando las infraestructuras de transporte. Se trata de un paso práctico hacia el éxito de la Década Digital y la construcción de un futuro digital más próspero”.
De forma paralela, Thierry Breton, Comisario de Mercado Interior, quiso añadir también las siguientes palabras a colación del anuncio del listado de los datos de alto valor: “Los datos son una piedra angular de nuestra competitividad industrial en la UE. Con la nueva lista de conjuntos de datos de alto valor estamos desbloqueando una gran cantidad de datos públicos en beneficio de todos. Las nuevas empresas y las pymes podrán utilizar estos para desarrollar nuevos productos y soluciones innovadoras que mejoren la vida de los ciudadanos de la UE y de todo el mundo”.
Seis categorías para aglutinar los nuevos conjuntos de datos de alto valor
De este modo, el reglamento se crea al amparo de la Directiva Europea de Datos Abiertos, que define seis categorías para diferenciar los nuevos conjuntos de datos de alto valor solicitados:
- Geoespaciales
- De observación de la Tierra y medioambiente
- Meteorológicos
- Estadísticos
- De empresas
- De movilidad
No obstante, tal y como recoge la nota de prensa de la Comisión Europea, esta gama temática podría ampliarse posteriormente en función de la evolución de la tecnología y el mercado. Así, los conjuntos de datos estarán disponibles en formato legible por máquina, a través de una interfaz de programación de aplicaciones (API) y, si fuera relevante, también con opción de descarga masiva.
Además, la reutilización de conjuntos de datos como los de movilidad o geolocalización de edificios puede ampliar las oportunidades de negocio disponibles para sectores como la logística o el transporte. De forma paralela, los datos de observación meteorológica, de radar, de calidad del aire o de contaminación del suelo también pueden apoyar la investigación y la innovación digital, así como la elaboración de políticas en la lucha contra el cambio climático.
En definitiva, una mayor disponibilidad de datos y, en especial de alto valor, tiene la capacidad de impulsar el espíritu empresarial ya que estos conjuntos de datos pueden ser un recurso importante para que las pymes desarrollen nuevos productos y servicios digitales, lo que a su vez también puede atraer nuevos inversores.
Descubre más en esta infografía:
Desde la publicación de la Directiva (UE) 2019/1024 relativa a los datos abiertos y la reutilización de la información del sector público, la Comisión Europea está llevando a cabo una serie de acciones para desarrollar el concepto de datos de alto valor que esta directiva introdujo como importante novedad en junio de 2019.
Recordamos que los conjuntos de datos de alto valor se definen en dicha directiva como “documentos cuya reutilización está asociada a considerables beneficios para la sociedad, el medio ambiente y la economía, en particular debido a su idoneidad para la creación de servicios de valor añadido, aplicaciones y puestos de trabajo nuevos, dignos y de calidad”. La Directiva además propone una primera lista de seis categorías temáticas de conjuntos de datos de alto valor: geoespacial, observación de la Tierra y medio ambiente, meteorología, estadística, sociedades y propiedad de sociedades, y movilidad.
En estos tres años se han puesto en marcha numerosas iniciativas con el fin de profundizar en la liberación de este tipo de conjuntos de datos y avanzar hacia la obtención de los beneficios económicos y sociales derivados de su reutilización. Se han lanzado estudios como el “Impact Assessment study on the list of High Value Datasets” de la DG CONNECT de la Comisión, que presenta diferentes opciones identificadas para realizar intervenciones a nivel político ligadas a los conjuntos de datos de alto valor en las seis áreas temáticas. O el informe “High-value datasets: understanding the perspective of data providers” publicado por el portal oficial de datos europeos que pretende entender la perspectiva de los proveedores de datos y que recoge interesantes conclusiones como que dicha perspectiva no es suficiente para comprender dónde reside realmente ese “alto valor”.
También se ha convocado en 2022 una consulta pública para para conocer la opinión de la ciudadanía sobre su proyecto de ley de datos de alto valor, Este proyecto de ley contiene ya una lista de conjuntos de datos específicos de alto valor y las disposiciones para su publicación y reutilización, lo cual representará un avance muy significativo en los objetivos de la propia directiva. A finales de junio, el proyecto de ley fue presentado también ante el Comité de datos abiertos y reutilización de la información del sector público compuesto por representantes de los países de la UE y se esperan nuevos progresos en septiembre de 2022.
Por su parte, los Estados miembros también van realizando sus propios trabajos en paralelo, como en el caso de España que ya comenzó dedicando el Encuentro Aporta de 2019 al impulso de los datos de alto valor.
Sin embargo, el foco de la Unión Europea en este tipo de datos de alto valor como impulsor de la economía no es único en el mundo y existen otras iniciativas con diferente grado de avance e impacto que tienen objetivos similares.
Los conjuntos de datos de interés nacional en Australia
En el caso de Australia, pionera en este sentido, el primer Plan de Acción Nacional de la Asociación de Gobierno Abierto de Australia 2016-2018 ya contenía entre sus objetivos la implementación de acciones para el desarrollo y publicación de un marco de trabajo para los conjuntos de datos de alto valor y para diseñar a través del proceso de consulta legislativa la mejor manera de facilitar el intercambio y uso de estos conjuntos de datos.
La Comisión de Productividad en 2018 recomendó reconocer un nuevo tipo de activo de datos, los conjuntos de datos de interés nacional, definidos como conjuntos de datos que generarían beneficios significativos para la sociedad en general y que serían un subconjunto especial de los datos de alto valor. El gobierno de Australia se comprometió en ese momento a nombrar un Comisionado Nacional de Datos, para implementar, supervisar y regular un marco de intercambio y publicación de datos más simple y eficiente.
Sin embargo, en el año 2019 el informe de autoevaluación de fin de período para el primer plan de acción nacional de gobierno abierto de Australia 2016-18 ya reconocía el retraso de la iniciativa. Los trabajos fueron reanudados por el Comisionado Nacional de Datos, que basándose en el trabajo anterior siguen conceptualizando un marco para identificar datos de alto valor, aunque por el momento no se ha liberado ninguna documentación para el público en general.
Alineando los datos abiertos en Canadá
El Grupo de Trabajo de Gobierno Abierto de Canadá (COGWG) ya comenzó en su plan de acción 2016-2018 a trabajar en su compromiso para alinear los conjuntos de datos en todo el país y en concreto en el desarrollo de una lista de conjuntos de datos de alto valor prioritarios para su publicación en colaboración entre las diferentes jurisdicciones. El plan reconocía que la publicación de tipos comunes de datos en todas las jurisdicciones canadienses ayudaría a fomentar la innovación y proporcionaría un importante impacto socioeconómico.
En 2018 el Grupo de Trabajo de Gobierno Abierto de Canadá publicó una lista inicial con 17 conjuntos de datos de alto valor, cuya publicación debían priorizar los gobiernos federales, provinciales, territoriales y municipales de todo Canadá. Esta lista es parte de un informe en el que se proporcionan criterios comunes para ayudar a identificar conjuntos de datos de alto valor y está basada en trabajos realizados para unificar los criterios de los diferentes niveles gubernamentales, en encuestas a las partes interesadas y en estándares internacionales.
En el plan de acción nacional de gobierno abierto 2018-2020 se recoge el compromiso de llevar a cabo un proyecto piloto para estandarizar entre diferentes jurisdicciones cinco conjuntos de datos de alto valor de la lista previamente identificada en el plan anterior.
Aunque los resultados no se han publicado de forma abierta, el sistema de evaluación del plan reconoce el retraso en el cumplimiento de este objetivo ya que sólo pudieron completarse los estándares preliminares de 4 de los 5 conjuntos de datos de alto valor. Estos estándares están disponibles a través de un sistema de intranet para todos los funcionarios públicos canadienses (federales, provinciales, territoriales y municipales), académicos y estudiantes, así como a todos los canadienses por invitación. Sin embargo, ninguno de los trabajos se ha hecho público ni se conoce cuáles son los conjuntos de datos en los que están trabajando.
India comienza los trabajos de identificación de conjuntos de datos
Más recientemente, en 2022, el gobierno de la India ha publicado una nota de antecedentes de accesibilidad de datos y política de uso en la India anunciando el desarrollo de nuevas políticas para mejorar el acceso, la calidad y el uso de los datos, en línea con las necesidades tecnológicas de la próxima década.
Al igual que en otras iniciativas de otras regiones del mundo se reconoce la falta de criterios comunes para identificar y mantener de forma consistente los conjuntos de datos de alto valor. Por ello prevé desarrollar un marco de política de datos que haga accesibles datos de múltiples fuentes (públicas y privadas) a través de canales G2G, G2B, B2G y B2B.
El objetivo también es similar al de otras iniciativas, por una parte, obtener servicios públicos más eficientes, y conseguir que una nueva generación de empresas emergentes impulse la innovación digital y el crecimiento en la economía de la India.
Los enfoques que se están siguiendo en las diferentes regiones del mundo para identificar y liberar conjuntos de datos de alto valor son muy similares e incluyen la realización de consultas públicas, la formación de comités de expertos, la realización de proyectos pilotos y la definición de marcos de evaluación. Sin embargo, vemos que el desarrollo está siendo mucho más lento del esperado y que algunas iniciativas como las comenzadas en Canadá o en Australia antes que en la propia Unión Europea no han finalizado aún y por tanto no se conoce el impacto de las mismas.
Por el momento parece que el trabajo iniciado por la Unión Europea tiene un mayor grado de avance y lo que es más importante, de transparencia, ya que los resultados se están publicando de forma abierta. Esperemos que la iniciativa no pierda impulso como parece que ha ocurrido en Australia o Canadá y que pronto podamos disfrutar de conjuntos de datos de alto valor disponibles para la reutilización y discutir el impacto que han tenido para la sociedad y para la economía europea.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
La Unión Europea quiere acercar la tecnología digital a las empresas, los ciudadanos y las administraciones públicas. Con este objetivo, lanzó el Programa Europa Digital que busca cerrar la brecha entre la investigación en tecnología digital y su implantación en todos los sectores de la economía y la sociedad. Con una extensión de 6 años (2021-2027), el programa cubre áreas como la supercomputación, la inteligencia artificial, la ciberseguridad y las competencias digitales avanzadas.
Dado que los datos abiertos tienen un potencial clave en el desarrollo de muchas de estas tecnologías disruptivas, no es de extrañar que dentro del programa también encontremos ayudas específicas dirigidas a su desarrollo. Es el caso de las ayudas “Public Sector Open Data for AI and Open Data Platform”, incluidas en la convocatoria Cloud Data and TEF (DIGITAL-2022-CLOUD-AI-02) del programa.
El objetivo de estas ayudas es impulsar la disponibilidad, calidad y facilidad de uso de datos de alto valor del sector público, en cumplimiento con los requisitos indicados en la Directiva de Datos Abiertos y la reutilización de información del sector público. Con ello se pretende impulsar, a su vez, la reutilización y combinación de datos públicos abiertos en toda la UE para el desarrollo de productos y servicios de información, con un especial foco en la Inteligencia Artificial.
La importancia de los datos de alto valor
De acuerdo con la Directiva (UE) 2019/1024, los datos de alto valor son una serie de conjuntos de datos con un gran potencial para generar “beneficios para la sociedad, el medio ambiente y la economía, en particular debido a su idoneidad para la creación de servicios de valor añadido, aplicaciones y puestos de trabajo nuevos, dignos y de calidad”.
De manera inicial, la Directiva recogía 6 categorías de datos a considerar de alto valor: datos geoespaciales, de observación de la Tierra y medio ambiente, meteorológicos, estadísticos, de compañías y de movilidad. No obstante, estas categorías se irán modificando en el futuro para dar respuesta a los cambios tecnológicos y del mercado. En España, el rol de añadir nuevas categorías de datos de alto valor recae en la Oficina del Dato con la colaboración de los actores interesados, tanto públicos como privados, según lo especificado en el Real Decreto-ley 24/2021, de 2 de noviembre, de transposición de varias directivas de la Unión Europea, entre ellas la Directiva 2019/1024.
¿Qué se está buscando?
Las ayudas buscan apoyar a las administraciones públicas a nivel local, regional y nacionales para aumentar la interoperabilidad semántica, técnica y jurídica, así como la portabilidad de datos de alto valor.
Los datasets que se generen fruto de los trabajos deben cumplir las siguientes condiciones:
- Deben estar disponibles de manera gratuita a través de uno o varios portales de datos abiertos de los Estados miembros.
- Deben pertenecer a alguna de las 6 categorías temáticas indicadas en la Directiva (UE) 2019/1024.
- Son válidos tanto los datasets nuevos como aquellos resultantes de la fusión de conjuntos de datos ya existentes, armonizados, mejorados en calidad, etc.
- Deben estar disponibles a través de las interfaces de programación de aplicaciones (API), en un formato legible por máquinas.
- Sus condiciones de publicación y reutilización deben ser compatibles con una licencia estándar abierta.
- Deben contar con unas normas de calidad (listas de atributos, formatos, estructuras, semántica, documentación, condiciones de uso y atributos) que garanticen la interoperabilidad transfronteriza.
En la propuesta se deben proponer indicadores clave de rendimiento (KPI) concretos para evaluar los beneficios de las soluciones implementadas para los ciudadanos y/o empresas.
¿Qué cubre la ayuda?
La ayuda cubre el 50% de los costes reales en una serie de categorías “subvencionables”, entre las que se incluyen los costes de personal, comunicación o compras, entre otros.
¿A quién va dirigida la propuesta?
Las ayudas están dirigidas a las Administraciones Públicas a las que aplican las obligaciones de la Directiva 2019/1024. Los reutilizadores de datos públicos y privados podrán implicarse en la elección de los conjuntos de datos a los que se dará prioridad.
Solo pueden participar entidades jurídicas, no personas naturales, procedentes de los países miembro de la UE, asociados al Espacio Económico Europeo o al Programa Europa Digital.
¿Cómo se puede participar?
Las propuestas deben presentarse electrónicamente a través del Portal de Financiación y Licitaciones de la Comisión Europea, utilizando una serie de formularios previstos en el sistema:
- Formulario de solicitud Parte A. Contiene información administrativa y el presupuesto resumido para el proyecto
- Formulario de solicitud Parte B. Contiene la descripción técnica del proyecto (Máx. 70 páginas).
- Anexos obligatorios y documentos de apoyo
La fecha limite para presentar las solicitudes finaliza el 17 de mayo de 2022.
El favorable régimen de acceso a la información medioambiental
La legislación sobre medio ambiente se ha caracterizado tradicionalmente por establecer un régimen jurídico más beneficioso que el que ha inspirado la normativa general sobre acceso a la información en poder del sector público. En efecto, la Convención de Aarhus, adoptada en 1998, supuso un importante hito al reconocer el derecho de acceso a la información medioambiental en condiciones jurídicas muy avanzadas, imponiendo relevantes obligaciones para las autoridades públicas. En concreto, la Convención parte de una premisa inexcusable: para que la sociedad pueda disfrutar del derecho a un medio ambiente saludable y cumplir el deber de respetarlo y protegerlo debe tener un acceso relevante a la información medioambiental. A tal efecto, de una parte, se reconocía el derecho a obtener información en poder de las autoridades públicas y, de otra, se estableció una obligación dirigida a estas últimas para que hicieran pública cierta información sin que existiera una solicitud previa.
En ejecución de dicho tratado internacional y, en concreto, de las obligaciones asumidas por la Unión Europea a través de la Directiva 2003/4/CE del Parlamento Europeo y del Consejo, de 28 de enero de 2003, relativa al acceso del público a la información medioambiental, se aprobó la Ley 27/2006, de 18 de julio, por la que se regulan los derechos de acceso a la información, de participación pública y de acceso a la justicia en materia de medio ambiente. A diferencia del régimen general que contempla la Ley 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno, la ley 27/2006 no contiene referencia alguna a los a los formatos abiertos y reutilizables. Sin embargo sí incluye los siguientes avances:
- establece la obligación de proporcionar la información incluso cuando, sin haberla generado directamente en el ejercicio de sus funciones, se encuentre en poder de la entidad a la que se solicita;
- exige que los motivos de denegación de la solicitud de acceso se interpreten de manera restrictiva, de manera que en caso de duda a la hora de interpretar las excepciones previstas legalmente se ha de favorecer el acceso a la información;
- para los supuestos en que no se resuelva y notifique la solicitud en el plazo establecido se aplica la regla del silencio positivo y, por tanto, se entenderá otorgado el acceso.
La incidencia de la normativa sobre datos abiertos y reutilización de la información del sector público
Al igual que sucediera en la anterior regulación, la Directiva (UE) 1024/2019 excluye su aplicación en aquellos supuestos en los que la correspondiente regulación de los Estados miembros limite el acceso. No sería este, por tanto, el caso del medio ambiente ya que, al margen de los supuestos en los que no procede el acceso, con carácter general la disponibilidad de la información se encuentra especialmente asegurada. En consecuencia, salvo por lo que se refiere a las excepciones legales a la obligación de facilitar información ambiental, no existen restricciones específicas que supongan un obstáculo a la hora de facilitar su reutilización.
Por otro lado, entre las principales novedades de normativa europea destaca una medida que, en última instancia, obliga a que los Estados miembros adapten su regulación por lo que se refiere al acceso a la información medioambiental. En efecto, el capítulo V de la Directiva establece un régimen singular para los denominados conjuntos de datos de alto valor que, con carácter general, estarán disponibles gratuitamente, serán legibles por máquina, se suministrarán a través de API y, cuando proceda, se proporcionarán en forma de descarga masiva. Precisamente, este régimen jurídico tan favorable se contempla, entre otros, para el ámbito de la Observación de la Tierra y el Medio Ambiente, si bien los conjuntos de datos específicos a los que se aplicará están todavía pendiente de una decisión por parte de la Comisión Europea tras la elaboración de un extenso análisis de impacto cuyo resultado definitivo se encuentra aún pendiente de concretar.
Por otra parte, siguiendo el modelo regulatorio europeo, entre las novedades que el Real Decreto-ley 24/2021, de 2 de noviembre ha incorporado a la legislación española sobre reutilización de la información del sector público destaca una referida a los datos de alto valor. En concreto, el artículo 3.ter de la Ley 37/2007 contempla la posibilidad de que, además de los conjuntos de datos que establezca la Comisión Europea, se puedan añadir otros a nivel nacional por el Ministerio de Asuntos Económicos y Transformación Digital teniendo en cuenta la selección que realice la División Oficina del Dato, de manera que se podrían ampliar, en su caso, los referidos específicamente al medio ambiente.
El potencial de los datos de alto valor relativos al medio ambiente
Como señala la propia regulación europea, la reutilización de los conjuntos de datos de alto valor se plantea como una herramienta para facilitar, entre otros objetivos, la creación y dinamización de aplicaciones y servicios digitales de valor añadido que tengan el potencial de generar considerables beneficios para la sociedad, el medio ambiente y la economía. Así, en este ámbito los datos abiertos pueden tener un importante papel a la hora de afrontar desde la innovación tecnológica a desafíos de enorme relevancia como el cambio climático, la deforestación y, en general, los retos que plantea la conservación del medio ambiente.
Por otro lado, el desarrollo de aplicaciones y servicios digitales puede servir para dinamizar las zonas rurales e impulsar modelos turísticos que pongan en valor el conocimiento y la protección de los recursos naturales, sobre todo teniendo en cuenta el rico y variado patrimonio natural existente en España, para lo cual resulta imprescindible disponer de conjuntos de datos específicos, en particular por lo que se refiere a los espacios naturales.
En última instancia, desde la perspectiva y las exigencias del Gobierno Abierto, la accesibilidad de la información ambiental, según los estándares de los datos de alto valor conforme a las previsiones de la normativa sobre reutilización de la información del sector público, podría tener un refuerzo destacado al facilitar el control social de las decisiones de las entidades públicas y la participación ciudadana. Sin embargo, para ello resulta imprescindible superar el modelo en que se ha sustentado tradicionalmente el marco normativo sobre acceso a la información ambiental ya que, aun cuando en su momento supuso un avance destacado, lo cierto es que la regulación de 2006 no incorpora referencia alguna a las posibilidades de innovación tecnológica basadas en los datos abiertos.
En definitiva, parece llegado el momento de suscitar un debate acerca de una eventual actualización de la normativa sectorial sobre acceso a la información medioambiental con la finalidad de dar cumplimiento a las exigencias del régimen jurídico contemplado en la Directiva (UE) 1024/2019.
Contenido elaborado por Julián Valero, catedrático de la Universidad de Murcia y Coordinador del Grupo de Investigación “Innovación, Derecho y Tecnología” (iDerTec).
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Cuando pensamos en datos abiertos nuestra primera intuición suele estar dirigida hacia los datos generados por los organismos del sector público en el ejercicio de sus funciones y que son puestos a disposición de los ciudadanos y empresas para su reutilización, esto es, en datos abiertos del sector público o datos públicos abiertos. Y es normal, porque la información del sector público representa una fuente extraordinaria de datos y el uso inteligente de estos datos, incluido su tratamiento a través de aplicaciones de inteligencia artificial, tiene un gran potencial transformador en todos los sectores de la economía, tal como reconoce la directiva europea relativa a los datos abiertos y la reutilización de la información del sector público
Una de las novedades más interesantes que introdujo la directiva fue la definición inicial aunque ampliable de 6 categorías temáticas de conjuntos de datos de alto valor, cuya reutilización está asociada a considerables beneficios para la sociedad, el medio ambiente y la economía. Estas seis áreas, Geoespacial, Observación de la Tierra y medio ambiente, Meteorología, Estadística, Sociedades y propiedad de sociedades y Movilidad, son las que en 2019 se consideraron con un mayor potencial para la creación de servicios de valor añadido y aplicaciones basadas en tales conjuntos de datos. Sin embargo, desde la óptica de un 2021 en el que va a cumplirse prácticamente un año de crisis sanitaria global, parece claro que en esta lista se echan de menos dos áreas clave con un gran potencial impacto para la sociedad como son la salud y la educación.
De hecho, encontramos que por una parte los centros educativos están exentos explícitamente de algunas obligaciones en la directiva y por otra que los datos del sector salud apenas si son mencionados. La directiva, por tanto, no aporta un desarrollo de estas dos áreas que las circunstancias sobrevenidas con la pandemia de covid-19 han puesto en la primera línea de las prioridades de la sociedad.
La disponibilidad de los datos de salud y educación
A pesar de que los sistemas de salud, tanto públicos como privados, generan y custodian en las historias clínicas de las personas una enorme cantidad de datos de gran valor, la disponibilidad de estos datos es muy escasa debido a la muy elevada complejidad de su tratamiento de forma segura. Normalmente los conjuntos de datos relativos a la salud solo están a disposición de la entidad que los genera, a pesar del gran valor que su liberación podría tener para el avance de la investigación científica.
Algo equivalente podría decirse de los datos que se generan en la interacción de los estudiantes con las plataformas educativas, que en general tampoco están disponibles como datos abiertos. Al igual que en el sector salud estos conjuntos de datos habitualmente solo están a disposición de sus propietarios, para quienes constituyen un valioso activo para la mejora de las plataformas, lo cual solo es una pequeña parte de su valor potencial para la sociedad.
La directiva establece que los datos de alto valor deberían publicarse en formatos abiertos que puede utilizar, reutilizar y compartir libremente cualquier persona con cualquier fin. Además, con el objetivo de garantizar su máxima repercusión y facilitar la reutilización, los conjuntos de datos de alto valor deberían ponerse a disposición para su reutilización con muy pocas restricciones legales y sin coste alguno.
Los datos de salud son altamente sensibles para la privacidad de las personas, por lo que siempre es necesario tener presente el delicado compromiso entre el respeto a la privacidad y la necesidad de apoyar el avance en la investigación científica. Probablemente la consideración de los datos de salud y educación como datos abiertos de alto valor debiera mantener algunas restricciones particulares por la naturaleza y sensibilidad propia de estos datos y potenciar figuras como la donación de datos con fines de investigación por parte de los pacientes o el intercambio con el mismo fin entre investigadores. En este sentido la regulación sobre protección de datos de 2018 introdujo la posibilidad de reutilizar datos con fines de investigación siempre que se adopten las oportunas medidas de seudonimización y el resto de garantías previstas legalmente.
La importancia de la colaboración público-privada
La educación y la salud son dos áreas en los que el sector privado o la colaboración del sector público y privado está realizando interesantes avances para convertir parte del potencial de los datos abiertos en beneficios para la sociedad. La publicación de datos abiertos no es patrimonio exclusivo del sector público y existe una larga tradición de colaboración entre la iniciativa privada y el sector público, en gran medida canalizado a través de las universidades. Veamos algunos ejemplos:
- Existen un buen número de iniciativas como la pionera The UCI Machine Learning Repository fundada en 1987 como un repositorio de conjuntos de datos que utiliza la comunidad de inteligencia artificial para el análisis empírico de algoritmos de aprendizaje automático. Este repositorio ha sido citado en más de 1000 ocasiones, el número más alto de citas obtenido en el dominio de las ciencias de la computación. En este y otros repositorios gestionados también por universidades o fundaciones con donaciones de empresas privadas podemos encontrar también conjuntos de datos abiertos liberados por empresas o en los que éstas han colaborado activamente para su creación o desarrollo.
- También las grandes empresas tecnológicas, sin duda inspiradas por estas iniciativas, mantienen buscadores o repositorios de datos abiertos como el buscador de conjuntos de datos de Google, el registro de datos abiertos de AWS, o los conjuntos de datos de Microsoft Azure, donde los conjuntos de datos relacionados con la salud o la educación son cada vez más habituales.
- En cuanto a datos que pueden contribuir a mejorar educación por ejemplo, The Open University publica OULAD (OpenUniversity Learning Analytics Dataset), un conjunto de datos abiertos de analítica del aprendizaje que contiene datos sobre cursos, estudiantes y sus interacciones con el entorno de aprendizaje virtual para siete cursos. Sin embargo, existen muy pocos conjuntos de datos homologables cuya utilización de forma conjunta en proyectos sin duda permitirían desarrollar mayores avances en áreas como la detección del riesgo de abandono por parte de los estudiantes.
- En lo que se refiere al sector salud, merece la pena destacar el caso de la plataforma española HealthData 29, desarrollada por Fundación 29, que tiene como objetivo crear la infraestructura necesaria para que sea posible publicar de forma segura conjuntos de datos abiertos de salud para que estén disponibles para la comunidad con fines de investigación. Como parte de esta infraestructura Fundacion 29 ha publicado el Health Data Playbook que es una guía para la creación dentro del marco técnico y legal vigente de un repositorio público de datos procedentes de los sistemas de salud, de manera que puedan ser utilizados en la investigación médica. En la elaboración de esta guía han colaborado Microsoft como socio tecnológico y Garrigues como socio jurídico y está destinada a las organizaciones que investigan en salud.
Por el momento la plataforma sólo tiene disponible el conjunto de datos Covid Data Save Lives (COVIDDSL) publicado por el Grupo Hospitalario Universitario HM Hospitales, compuesto por datos clínicos de las interacciones registradas en el proceso de tratamiento del covid-19. Sin embargo, se trata de un excelente ejemplo del potencial que podemos estar desaprovechando en el mundo entero por no haber recogido y publicado de forma sistematizada y a escala global una mayor y mejor cantidad de datos de los pacientes diagnosticados de covid-19. La creación de modelos predictivos de la evolución de la enfermedad en los pacientes, el desarrollo de modelos epidemiológicos sobre la propagación del virus o la extracción de conocimiento sobre el comportamiento del virus para el desarrollo de vacunas son sólo algunos de los casos de uso que se verían beneficiados por una mayor disponibilidad de estos datos.
La educación y la salud son dos de las grandes preocupaciones de todas las sociedades desarrolladas del mundo porque están estrechamente relacionadas con el bienestar de sus ciudadanos. Pero quizá nunca hemos sido tan conscientes de ello como en el último año y esto representa una extraordinaria oportunidad para impulsar iniciativas que contribuyan a liberar una mayor cantidad de datos abiertos de salud y educación. Ya sea como datos de alto valor o con cualquier otra figura estos conjuntos de datos son clave para que podamos reaccionar mejor ante futuras situaciones de crisis sanitaria pero también para ayudarnos a superar las secuelas de la actual.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.