DCAT-AP 2.0.1, ¿cómo ha evolucionado la especificación de referencia europea para la descripción de catálogos de datos abiertos?

Fecha de la noticia: 07-06-2021

imosaico con la palabra "standars" e iconos que representan diversos sectores

DCAT-AP es la especificación europea para la descripción de catálogos de datos abiertos. Su referente es el estándar Data Catalog Vocabulary (DCAT) de W3C, creado para facilitar la interoperabilidad entre catálogos de datos publicados en la web. DCAT permite disponer de un vocabulario de propiedades que posibilita describir catálogos y recursos de información.  

¿Qué norma de referencia tenemos en España? 

El marco normativo en España establece la Norma Técnica de Interoperabilidad de Reutilización de recursos de información (NTI-RISP) como la especificación de referencia para la puesta a disposición de recursos de información elaborados o custodiados por el sector público, cumpliendo con lo establecido en la Ley sobre reutilización de la información del sector público (Ley 37/2007, modificada posteriormente por la Ley 18/2015 y la 9/2017 por la que se trasponen las Directivas 2014/23/UE y 2014/24/UE). Este marco normativo vigente declara que los documentos de las Administraciones y organismos del sector público son reutilizables en los términos previstos en dicha Ley. Es relevante destacar que la NTI-RISP es anterior tanto a la primera versión DCAT (2014) como a la primera versión de DCAT-AP (2013). 

¿Qué aportan las especificaciones para describir catálogos de datos abiertos? 

Una particularidad de estas especificaciones es la capacidad expresiva que permiten, dado que el número de términos o propiedades disponibles en el vocabulario delimita la cantidad de características a describir sobre los catálogos y los recursos de datos que alberga. DCAT-AP, además, tiene como objetivo proporcionar un marco común descriptivo para catálogos "generalistas" de datos que albergan normalmente datos que proceden de catálogos de diferentes dominios de conocimiento -por ejemplo, del dominio geográfico o estadístico-. Por ello, resulta más factible encontrar un soporte que ofrezca mayor detalle descriptivo utilizando vocabularios especializados –por ejemplo, INSPIRE en el contexto geográfico-, cuando se describen catálogos de datos temáticos. En esta línea, con el objetivo de converger con estándares previamente establecidos, se desarrollaron dos extensiones a partir de DCAT-AP: GeoDCAT-AP y StatDCAT-AP para representar metadatos de contextos geográfico y estadístico, respectivamente. 

Por tanto, el reto de una especificación para la descripción de catálogos de datos abiertos generalistas es doble:  

  • En primer lugar, incorporar la máxima capacidad descriptiva para que los usuarios conozcan el máximo detalle posible asociado a los datasets que reutilizarán. 

  • En segundo lugar, aprovechar los esfuerzos realizados por los editores de conjuntos de datos ya publicados en catálogos temáticos existentes implementados en base a estándares establecidos. 

Para ello, DCAT-AP evoluciona a una versión 2.0.1 (publicada en junio de 2020) que incorpora una serie de características que alientan la próxima evolución de la NTI-RISP, aportando un considerable incremento de propiedades para enriquecer la descripción de catálogos de datos, mejorar su interoperabilidad e incorporar metadatos de uso habitual en el contexto geográfico o estadístico, como el linaje, la resolución de la información o la descripción de servicios de datos, entre otros.  

¿Qué características relevantes implementa el nuevo DCAT-AP 2.0.1? 

A continuación, destacamos una relación de novedades que incorpora esta nueva versión de DCAT-AP que van a ser claves en la próxima actualización de la NTI-RISP: 

  • Servicios de datos. Es una de las aportaciones más relevantes de esta evolución de DCAT-AP. Permite la descripción de servicios de datos, como APIs o Servicios Web, como alternativa a los metadatos utilizados para describir la disponibilidad de recursos descargables. La especificación contempla, además, que un servicio de datos -por ejemplo, un servicio visor de mapas- pueda tener más de un endpoint y, por tanto, más de una descripción para un único dataset.  
  • Roles de agentes. Es otro aspecto que en el contexto geográfico tiene amplio recorrido. De hecho, la extensión GeoDCAT-AP incorpora hasta 11 roles o responsabilidades definidas acorde a la iniciativa INSPIRE. DCAT-AP 2.0.1 admite tres roles de agente que aporta la posibilidad de especificar un punto de contacto o de agente al que se puede contactar para obtener información relativa al recurso, al creador o agente que creó el recurso y al editor o agente que publica y mantiene dicho recurso. 
  • Versionado, abre la posibilidad a mantener la especificación de una secuencia entre diferentes versiones de un conjunto de datos. Aporta la posibilidad de describir las diferencias entre una versión y su predecesora. 
  • Procedencia. Con la incorporación de metadatos que describen la procedencia, ahora será posible considerar situaciones en las que estas descripciones se importan o exportan desde y hacia otros catálogos de datos -por ejemplo, de una IDE o de un portal de datos estadísticos-. Así se permite que los usuarios comprendan de dónde provienen los datos y cómo pueden haber sido modificados a lo largo del tiempo 
  • Granularidad. Siempre que sea aplicable, es importante disponer de propiedades de contexto espacial y temporal para indicar resoluciones de datos - en unidades de longitud o de tiempo- para todos los tipos de recursos descritos en un catálogo, independientemente del contexto. 
  • Gobernanza de datasets. DCAT-AP 2.0.1 ofrece un mejor soporte para implementar modelos de gobernanza de datos incorporando, además de los relatados anteriormente, aspectos para identificar recursos agregados de varios publicadores, relaciones entre recursos y otros metadatos que permiten describir con precisión ciclos de vida de los datos, como la planificación de disponibilidad de un dataset o el estado de una determinada distribución en cuanto a su completitud, suspensión de disponibilidad u obsolescencia. 
  • Uso de vocabularios controlados, que se mantiene como una constante en las diferentes evoluciones de la especificación. En esta se concretan referencias a vocabularios que viene desarrollando JoinUp para, entre otros ajustes de metadatos, modelos de licencia reconocidos internacionalmente, frecuencia de actualización de datasets, formatos de datos e idiomas, así como temáticas y subtemáticas de datos compatibles con la iniciativa INSPIRE
  • Validación. La especificación incorpora además una serie de plantillas SHACL para validar y controlar la calidad de grafos RDF de catálogos de datos compatibles con DCAT-AP 2.0.1. 

Como se ha indicado en numerosos artículos relacionados con Open Data, los metadatos son fundamentales para una reutilización eficiente de los datos. El uso de vocabularios estándar para describir las características de los datos disponibles en los catálogos, -fruto del consenso entre los agentes del ecosistema de datos-, facilitan esa tarea y permiten que éstos sean interoperables entre sí. La estandarización favorece el descubrimiento de los datos mediante mecanismos de federación de metadatos entre catálogos. 

DCAT-AP 2.0.1, es un sólido paso adelante para crear catálogos más eficientes y el camino a recorrer en la evolución de las normas técnicas de referencia para describir recursos de información reutilizables. En la hoja de ruta de la política de Datos Abiertos está la evolución de la NTI-RISP vigente para adaptarla a la especificación DCAT-AP 2.0.1 y, como en el caso de la previa, se recomienda fijar en el marco regulatorio su obligado cumplimiento.


Contenido elaborado por el equipo de datos.gob.es.