4 ejemplos de armonización de conjuntos de datos

Fecha de la noticia: 10-06-2021

4 ejemplos de proyectos de armonización

En cualquier proyecto relacionado con datos, es habitual contar con distintas fuentes de información. Los datos son clave para empresas y administraciones públicas, en la toma de decisiones o como base para la puesta en marcha de proyectos, servicios o productos. Pero si dichas fuentes de datos muestran la información de forma heterogénea, es complicado operar.

En el mundo de los datos abiertos, cada administración cubre un ámbito distinto, bien sea territorial – municipal, provincial, autonómico o estatal – o competencial -por ejemplo, cada ministerio aborda datos de un área concreta: transición ecológica, sanidad, movilidad, etc.-. Para poder realizar proyectos que cubran varios ámbitos, necesitaremos datos interoperables. Si no, el intercambio e integración de datos dentro de una organización y entre organizaciones será incompatible.

¿Por qué es importante la armonización de los datos?

En la actualidad, las administraciones públicas gestionan grandes cantidades de datos en distintos formatos, con diferentes métodos de gestión. Lo habitual es alojar múltiples copias en muchos repositorios diferentes. Estos datos se divulgan, a menudo, en portales por toda Europa sin ninguna armonización en términos de contenido y presentación. Este hecho explica el bajo nivel de reutilización de la información existente sobre ciudadanos y empresas. La armonización de la información permite logra datos consistentes y coherentes de manera que sean compatibles y comparables, unificando formatos, definiciones y estructuras.

Esta conformación de los datos se puede hacer de manera individual para cada proyecto, pero supone un gran coste en tiempo y recursos. Por ello es necesario impulsar estándares que nos permitan contar con unos datos ya armonizados. A continuación, se recogen varios ejemplos de iniciativas que abogan por buscar requisitos comunes, los cuales están recogidos en este visual:

 

4 ejemplos de proyectos de armonización de conjuntos de datos: Ministerio de Transporte, Movilidad y Agenda Urbana, UniversiData, FEMP y Asedie.

El Ministerio de Transporte, Movilidad y Agenda Urbana

El Ministerio de Transporte, Movilidad y Agenda Urbana trabaja en un Punto de Acceso Nacional (PAN) en el que se recogen datos unificados de los diferentes medios de transporte. La creación de este portal responde al cumplimiento del Reglamento Delegado (UE) 2017/1926 de la Comisión, que establece la obligatoriedad para las autoridades, operadores, gestores y proveedores de servicios de transporte de suministrar información sobre desplazamientos multimodales en la UE, en base a una serie de especificaciones que aseguren su disponibilidad y fiabilidad. Entre otras cuestiones, indica que es necesario describir adecuadamente el contenido y la estructura de los datos de desplazamientos y tráfico pertinentes utilizando los metadatos apropiados.

La creación de este Punto de Acceso Único fue recogida por el BOE el pasado 22 de febrero. El texto indica que se hará pública, siempre que sea posible y de forma gratuita, la información mínima universal sobre el tráfico en relación con la seguridad vial, prestando especial atención a los servicios en tiempo real.

En este momento el PAN cuenta con datos de la DGT, el Gobierno Vasco, la Generalitat de Catalunya, el Ayuntamiento de Madrid y la empresa Tomtom.

Federación de Municipios y Provincias de España

La Federación de Municipios y Provincias de España (FEMP) cuenta con un grupo de datos abiertos que ha elaborado dos guías para ayudar a los ayuntamientos a poner en marcha iniciativas de datos abiertos. Una de ellas es la propuesta de 40 conjuntos de datos que toda administración debería abrir para facilitar la reutilización de la información del sector público. Esta guía no solo busca uniformidad en las categorías de datos publicadas, sino también en la forma en que se publican. Se ha creado una ficha para cada conjunto de datos propuesto con información acerca de la frecuencia de actualización, los formatos o la forma de visualización recomendada.

Entre los planes de futuro de la FEMP está revisar los conjuntos publicados hasta la fecha para valorar si añadir o quitar conjuntos de datos e incluir nuevos ejemplos prácticos. 

También en el ámbito de las ciudades, destaca una iniciativa para aterrizar aún más la armonización de un subconjunto acotado de datasets realizada en el marco del proyecto de Ciudades Abiertas, que cuenta con la colaboración de Red.es. Los ayuntamientos participantes en el proyecto – A Coruña, Madrid, Santiago de Compostela y Zaragoza- han consensuado la apertura de 27 conjuntos de datos armonizados. Actualmente se han desarrollado vocabularios comunes para 16 de ellos y se sigue trabajando en los demás.

ASEDIE y su Top 3

En 2019, la Asociación Multisectorial de la Información (ASEDIE) puso en marcha una iniciativa para que todas las Comunidades Autónomas abriesen de manera completa tres conjuntos de datos: las bases de datos de cooperativas, asociaciones y fundaciones. Se proponía, además, que todas siguieran unos criterios unificados que facilitasen su reutilización, como la incorporación del NIF de cada una de las entidades.

Los resultados han sido muy positivos. A día de hoy, 15 comunidades autónomas tienen abiertas al menos dos de las tres bases de datos.  Destaca la base de datos de Asociaciones que ha sido abierta por las 17 CC.AA.

En 2020, ASEDIE propuso un nuevo Top 3 y comenzó a impulsar la apertura de nuevas bases de datos: establecimientos comerciales, polígonos industriales y registros SAT. No obstante, debido a que no todas las CC.AA. cuentan con registro de establecimientos comerciales (debido a que no es una competencia autonómica), este conjunto de datos se ha sustituido por el Registro de Certificados de Eficiencia Energética.

UniversiData

UniversiData es un proyecto colaborativo para impulsar los datos abiertos ligados a la educación superior en España de una forma armonizada. A día de hoy, son cinco las universidades que se han unido al proyecto: la Universidad Autónoma de Madrid, la Universidad Complutense de Madrid, la Universidad Rey Juan Carlos, la Universidad de Valladolid y la Universidad Carlos III de Madrid (UC3M).

En el marco del proyecto se ha desarrollado la especificación "Núcleo Común", con el objetivo de dar respuesta a dos preguntas que las Universidades se plantean a la hora de abrir sus datos: ¿Qué datasets debo publicar? ¿Y cómo debo hacerlo? Es decir, con que campos, granularidad, formatos, codificaciones, frecuencia, etc. La codificación Núcleo Común se ha creado atendiendo a o la Ley de transparencia, acceso a la información pública y buen gobierno. Para su desarrolla también se ha tenido en cuenta dos Ránkings de Transparencia de Universidades (el de la Fundación Compromiso y Transparencia y el de Dyntra), así como el documento “Hacia una Universidad abierta: Recomendaciones para el S.U.E.”, de la Conferencia de Rectores de las Universidades Españolas (CRUE).

Todas estas iniciativas ponen de manifiesto como la armonización de datos puede mejora la utilidad de los datos. Si contamos con datos unificados, será más sencilla su reutilización, al disminuir el tiempo y el coste de su análisis y gestión.


Contenido elaborado por el equipo de datos.gob.es.