Blog

Contexto y necesidad de actualización

Los datos son un recurso clave en la transformación digital de las Administraciones Públicas. Asegurar su acceso, interoperabilidad y reutilización es fundamental para mejorar la transparencia, fomentar la innovación y facilitar el desarrollo de servicios públicos eficientes y centrados en la ciudadanía.

En este contexto, la Norma Técnica de Interoperabilidad de Reutilización de Recursos de Información (NTI-RISP) es el marco regulador en España para la gestión y apertura de datos públicos desde 2013. La norma establece condiciones comunes sobre selección, identificación, descripción, formato, condiciones de uso y puesta a disposición de los documentos y recursos de información elaborados o custodiados por el sector público, relativos a numerosos ámbitos de interés como la información social, económica, jurídica, turística, sobre empresas, educación, etc., cumpliendo plenamente con lo establecido en la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público.

En los últimos meses se viene acometiendo una modernización del texto dentro del objetivo europeo y español de potenciar la economía del dato, impulsando su intercambio a gran escala dentro de entornos distribuidos y federados, garantizando las adecuadas condiciones de ciberseguridad y respetando los principios y valores europeos.

La nueva norma, en fase de tramitación, refiere un nuevo modelo de metadatos alineado con las últimas versiones de los estándares europeos, que facilitan la descripción de los conjuntos de datos y recursos de información reutilizables puestos a disposición pública.

Este nuevo modelo de metadatos, denominado DCAT-AP-ES, adopta las directrices del esquema europeo de intercambio de metadatos DCAT-AP (Data Catalog Vocabulary – Aplication Profile) con algunas restricciones y ajustes adicionales. DCAT-AP-ES está alineando con los estándares europeos DCAT-AP 2.1.1 y la extensión DCAT-AP-HVD 2.2.0, que incorpora los requisitos para los Conjuntos de Alto Valor (HVD, High-Value Datasets) definidos por la Comisión Europea.

¿Qué es DCAT-AP y cómo se aplica en España?

DCAT-AP es un perfil de aplicación basado en el vocabulario DCAT del W3C, diseñado para mejorar la interoperabilidad de los catálogos de datos abiertos del sector público en Europa. Su objetivo es proporcionar un modelo común de metadatos que facilite el intercambio, agregación y federación de catálogos de diferentes países y organizaciones (interoperabilidad).

DCAT-AP-ES, como perfil de aplicación de DCAT-AP en España, está diseñado para adaptarse a las particularidades del contexto nacional, garantizando una gestión eficiente de los datos abiertos a nivel estatal, autonómico y local.

DCAT-AP-ES, se establece como el estándar a considerar en la nueva versión de la NTI-RISP, que a su vez se enmarca en el Esquema Nacional de Interoperabilidad (ENI), regulado por el Real Decreto 4/2010, que establece las condiciones para la reutilización de la información del sector público en España.

Principales novedades de DCAT-AP-ES

La nueva versión de DCAT-AP-ES introduce mejoras significativas que facilitan la interoperabilidad y la gestión de datos en el ecosistema digital. Entre otras:

Alineación con DCAT-AP

  • Mayor compatibilidad con los catálogos de datos abiertos europeos al alinear la NTI-RISP con el estándar comunitario DCAT-AP.
  • Inclusión de propiedades avanzadas para mejorar la descripción de conjuntos de datos y servicios de datos, de cara a asegurar las posibilidades indicadas a continuación.

Incorporación de metadatos para la descripción de los Conjuntos de Alto Valor (HVD)

  • Facilitación del cumplimiento de la regulación europea sobre datos de alto valor.
  • Posibilidad de descripción detallada de los datos en sectores clave como geoespacial, meteorología, de observación de la tierra y medio ambiente, estadístico, movilidad y empresas.

Mejoras en la descripción de servicios de datos

  • Inclusión de metadatos específicos para describir API y servicios de acceso a datos.
  • Posibilidad de expresar un conjunto de datos en diferentes contextos (ej. geoespacial, con un servidor cartográfico, o estadístico, con una API de datos).

Soporte para procedencia y calidad de datos

  • Incorporación de nuevas propiedades para gestionar ciclos de vida, versionado y origen.
  • Implementación de mecanismos de validación y control de calidad mediante SHACL, asegurando la coherencia y estructura de los metadatos en los catálogos.

Uso de vocabularios controlados y mejores prácticas

  • Adaptación de vocabularios estandarizados para licencias, formatos de datos, idiomas y temáticas.
  • Mayor claridad en la clasificación de datos para facilitar su descubrimiento.

Gobernanza de datos y mejora en la gestión de agentes

  • Especificación de roles de los agentes (creador, publicador) y puntos de contacto.
  • Metadatos mejorados para representar la procedencia de los recursos.

Validación de conformidad y calidad de los metadatos

  • Guías para ayudar en la validación de metadatos que cumplan con DCAT-AP-ES.
  • Validación de grafos DCAT-AP-ES conforme a plantillas SHACL.

Beneficios clave de la actualización

La adopción de DCAT-AP-ES representa un salto cualitativo en la gestión y reutilización de los datos abiertos en España. Entre sus beneficios destacan: 

✅ Facilita la federación de catálogos y el descubrimiento de datos. 
✅ Mejora la interoperabilidad con el ecosistema europeo de datos abiertos. 
✅ Cumple con las normativas europeas de datos abiertos. 
✅ Aumenta la calidad de los metadatos mediante mecanismos de validación. 
✅ Asegura que los datos sean FAIR (Findable, Accessible, Interoperable, Reusable).

Implementación y próximos pasos

¿Cuándo entrará en vigor?

El nuevo perfil de aplicación DCAT-AP-ES se implementará progresivamente en los catálogos de datos abiertos en España. Su aplicación será de carácter obligatorio una vez entre en vigor el texto de la modificación de la norma que, como se indicaba anteriormente, se encuentra en fase de tramitación administrativa pero ya es compatible con el federador de datos.gob.es

¿Existen materiales de apoyo y recursos para la implementación de DCAT-AP-ES?

El equipo gestor de la plataforma datos.gob.es ha desarrollado la Guía de implementación de DCAT-AP-ES, disponible en el repositorio de datos.gob.es.

Este repositorio se irá enriqueciendo a medida que se identifiquen nuevas necesidades de los usuarios que apliquen el estándar. Así mismo, se desarrollarán guías de ayuda y recursos didácticos que faciliten su adopción por parte de los organismos publicadores. Todas las novedades y recursos que vayan generándose en el contexto del perfil de aplicación se anunciarán y referirán puntualmente en datos.gob.es.

¿Dónde encontrar más información?

La documentación actualizada, guías y recursos estarán accesibles en datos.gob.es y en el repositorio de código asociado. En el momento actual se dispone de los siguientes:

Descubre más en este vídeo:

 Y en infografía (haz clic para acceder a la versión interactiva y accesible):

calendar icon
Blog

Los datos son el motor de la innovación, y su potencial transformador se refleja en todos los ámbitos, destacando especialmente en el de la salud. Desde diagnósticos más rápidos hasta tratamientos personalizados y políticas públicas más eficaces, el uso inteligente de la información sanitaria tiene el poder de cambiar vidas de forma profunda y significativa.

Pero, para que estos datos desplieguen todo su valor y se conviertan en una fuerza real para el progreso, es fundamental que "hablen el mismo idioma". Es decir, que estén bien organizados, sean fáciles de encontrar y puedan compartirse de forma segura y coherente entre distintos sistemas, países y profesionales.

Aquí es donde entra en juego HealthDCAT-AP, una nueva especificación europea que, aunque suene técnico, tiene mucho que ver con nuestro bienestar como ciudadanos. HealthDCAT-AP está diseñado para describir los datos de salud —desde estadísticas agregadas hasta registros clínicos anonimizados— de manera homogénea, clara y reutilizable, a través de metadatos. En definitiva, no actúa sobre los datos clínicos en sí, sino que facilita que puedan localizarse y comprenderse mejor gracias a una descripción estandarizada.

HealthDCAT-AP se ocupa exclusivamente de los metadatos, es decir, de cómo se describen y organizan los conjuntos de datos en los catálogos, diferenciándose de HL7, FHIR y DICOM que estructuran el intercambio de información clínica e imágenes; CDA que describe la arquitectura de los documentos; y SNOMED CT, LOINC y CIE-10 que estandarizan la semántica de diagnósticos, procedimientos y observaciones para garantizar que los datos tengan el mismo significado en cualquier contexto

Este artículo explora cómo HealthDCAT-AP, en el contexto del Espacio Europeo de Datos Sanitarios (EHDS) y del Espacio Nacional de Datos Sanitarios (ENDS), aporta valor principalmente a quienes reutilizan los datos —como investigadores, innovadores o responsables de políticas públicas— y, en última instancia, beneficia también a la ciudadanía a través de los avances que estos generan.

¿Qué es HealthDCAT-AP y cuál es su relación con DCAT-AP?

Imagina una biblioteca enorme llena de libros sobre salud, pero sin ningún sistema para organizarlos. Buscar una información concreta sería una tarea caótica. Con los datos de salud ocurre algo similar: si no están bien descritos, localizarlos y reutilizarlos es prácticamente imposible.

HealthDCAT-AP nace para resolver este reto. Es una especificación técnica europea que permite describir de forma clara y uniforme los conjuntos de datos sanitarios dentro de catálogos de datos a, facilitando su búsqueda, acceso, comprensión y reutilización. En otras palabras, hace que la descripción de los datos sanitarios hable el mismo idioma en toda Europa, lo que resulta clave para mejorar la atención, la investigación y las políticas de salud.

Esta especificación técnica se basa en DCAT-AP, la especificación general utilizada para describir catálogos de conjuntos de datos del sector público en Europa. Mientras que DCAT-AP proporciona una estructura común para todo tipo de datos, HealthDCAT-AP es su extensión especializada en salud, que adapta y amplía ese modelo para cubrir las particularidades de los datos clínicos, epidemiológicos o biomédicos.

HealthDCAT-AP fue desarrollado en el marco del proyecto piloto europeo EHDS2 (European Health Data Space 2) y continúa evolucionando gracias al apoyo de proyectos como HealthData@EU Pilot, que trabajan en el despliegue de la futura infraestructura europea de datos sanitarios. La especificación está en desarrollo activo y su versión más reciente, junto con documentación y ejemplos, puede consultarse públicamente en su repositorio oficial de GitHub.

Así mismo, HealthDCAT-AP está diseñado para aplicar los principios FAIR que los datos sean Encontrables, Accesibles, Interoperables y Reutilizables. Esto significa que, aunque los datos sanitarios puedan ser complejos o sensibles, su descripción (metadatos) es clara, estandarizada y útil. Cualquier profesional o institución —ya sea en España o en otro país europeo— puede saber qué datos existen, cómo acceder a ellos y con qué condiciones. Esto fomenta la confianza, la transparencia y el uso responsable de los datos sanitarios. HealthDCAT-AP es además una piedra angular del EHDS y por ende del ENDS. Su adopción permitirá que hospitales, centros de investigación o administraciones compartan información de forma coherente y segura a lo largo de toda Europa. Así, se impulsa la colaboración entre países y se maximiza el valor de los datos para beneficio de toda la ciudadanía.

Para facilitar su uso y adopción, desde Europa, bajo las iniciativas mencionadas anteriormente, se han creado herramientas como el editor y el validador HealthDCAT-AP, que permiten a cualquier organización generar descripciones de conjuntos de datos a través de los metadatos que sean compatibles sin necesidad de conocimientos técnicos avanzados. Esto elimina barreras y anima a más entidades a participar en este ecosistema de datos de salud en red.

¿Cómo contribuye HealthDCAT-AP al valor público de los datos de salud?

Aunque HealthDCAT-AP es una especificación técnica centrada en la descripción de conjuntos de datos de salud, su adopción tiene implicaciones prácticas que van más allá del ámbito tecnológico. Al ofrecer una forma común y estructurada de documentar qué datos existen, cómo pueden utilizarse y en qué condiciones, contribuye a que distintos actores —desde hospitales y administraciones hasta centros de investigación o startups— puedan acceder, combinar y reutilizar mejor la información disponible, habilitando el denominado uso secundario de la misma, más allá del uso primario asistencial.

A continuación, se detallan algunos de los ámbitos donde su contribución técnica se traduce en beneficios concretos para el conjunto de la sociedad.

  • Diagnósticos más rápidos y tratamientos personalizados: cuando los datos están bien organizados y son accesibles para quienes los necesitan, los avances en investigación médica se aceleran. Esto permite desarrollar herramientas de inteligencia artificial que detectan enfermedades antes, identificar patrones en grandes poblaciones y adaptar tratamientos al perfil de cada paciente. Es la base de la medicina personalizada, que mejora resultados y reduce riesgos.
  • Mejor acceso al conocimiento sobre qué datos existen: HealthDCAT-AP permite a investigadores, gestores sanitarios o autoridades localizar más fácilmente conjuntos de datos útiles, gracias a su descripción estandarizada. Esto puede facilitar, por ejemplo, el análisis de desigualdades en salud o la planificación de recursos en situaciones de crisis.
  • Mayor transparencia y trazabilidad: El uso de metadatos permite saber quién es responsable de cada conjunto de datos, con qué finalidad se puede usar y en qué condiciones. Esto fortalece la confianza en el ecosistema de reutilización de datos.
  • Servicios sanitarios más eficientes: la estandarización de los metadatos mejora los flujos de información entre centros, regiones y sistemas. Esto reduce la burocracia, evita duplicidades, optimiza el uso de recursos y libera tiempo y dinero que pueden reinvertirse en mejorar la atención directa a los pacientes.
  • Más innovación y nuevas soluciones para el ciudadano: al facilitar el acceso a mayores conjuntos de datos, HealthDCAT-AP impulsa el desarrollo de nuevas herramientas digitales centradas en el paciente: apps de autocuidado, sistemas de seguimiento remoto, comparadores de servicios, etc. Muchas de estas soluciones nacen fuera del sistema sanitario —en universidades, startups o asociaciones— pero benefician directamente a la ciudadanía.
  • Una Europa conectada en torno a la salud: al compartir una forma común de describir los datos, HealthDCAT-AP hace posible que un conjunto de datos creado en España pueda ser comprendido y utilizado en Alemania o Finlandia, y viceversa. Esto favorece la colaboración internacional, refuerza la cohesión europea y garantiza que los ciudadanos se beneficien de avances científicos independientemente de su país.

¿Y qué papel juega España en todo esto?

España no solo está alineada con el futuro del dato sanitario en Europa: está participando activamente en su construcción. Gracias a una sólida base legal, un sistema sanitario ampliamente digitalizado, la experiencia acumulada en la compartición segura de información de salud dentro del SNS, y una larga trayectoria en datos abiertos —a través de iniciativas como datos.gob.es—, nuestro país se encuentra en una posición privilegiada para contribuir y beneficiarse del Espacio Europeo de Datos Sanitarios (EHDS).

Desde hace años, España ha desarrollado marcos legales y capacidades técnicas que anticipan muchos de los requisitos del Reglamento EHDS. La digitalización generalizada de la atención sanitaria y la experiencia en el uso de datos de forma segura y responsable permiten avanzar hacia un modelo interoperable, ético y orientado al bien común.

En este contexto, el proyecto del Espacio Nacional de Datos de Salud supone un paso decisivo. Esta iniciativa tiene como objetivo, convertirse en la plataforma nacional de referencia para el análisis y explotación de datos sanitarios para uso secundario., concibiéndose como catalizador de la investigación e innovación en salud, referente en la aplicación de soluciones disruptivas y puerta de acceso a diferentes orígenes de datos. Todo ello se realiza bajo condiciones estrictas de anonimización, seguridad, transparencia y protección de derechos, garantizando que los datos solo se utilicen con fines legítimos y con pleno respeto a la normativa vigente.

La familiaridad de España con estándares como DCAT-AP facilita el despliegue de HealthDCAT-AP. Plataformas como datos.gob.es, que ya actúan como punto de referencia en la publicación de datos abiertos, serán clave en su despliegue y difusión.

Conclusiones

HealthDCAT-AP puede sonar a algo técnico, pero en realidad es una especificación que puede llegar a repercutir en nuestra vida diaria. Al ayudar a describir mejor los datos de salud, facilita que esa información se utilice de forma útil, segura y responsable.

Esta especificación permite que la descripción de conjuntos de datos hable el mismo idioma en toda Europa. Así, se pueden encontrar más fácilmente, compartir con quien corresponde y reutilizar para fines que nos benefician a todos: diagnósticos más rápidos, tratamientos más personalizados, decisiones de salud pública más acertadas o nuevas herramientas digitales que mejoran nuestra calidad de vida.

España, gracias a su experiencia en datos abiertos y a su sistema sanitario digitalizado, está participando activamente en esta transformación realizando un esfuerzo conjunto entre profesionales, instituciones, empresas, investigadores, etc. y también ciudadanos. Porque cuando los datos se entienden y se gestionan bien, pueden marcar la diferencia. Pueden salvar tiempo, recursos, e incluso vidas.

HealthDCAT-AP no es solo una especificación técnica: es un paso adelante hacia una salud más conectada, transparente y centrada en las personas. Una especificación pensada para maximizar el uso secundario de la información de salud, y para que, con ello, todos como ciudadanos podamos salir beneficiados.


Contenido elaborado por Dr. Fernando Gualo, Profesor en UCLM y Consultor de Gobierno y Calidad de datos. El contenido y el punto de vista reflejado en esta publicación es responsabilidad exclusiva de su autor.

calendar icon
Blog

Los datos abiertos tienen un rol relevante en el desarrollo tecnológico por muchos motivos. A modo de ejemplo, son un componente fundamental en la toma de decisiones informadas, en la evaluación de procesos o incluso en el impulso de la innovación tecnológica. Siempre y cuando, cuenten con la calidad óptima, estén actualizados y respeten los aspectos éticos, los datos pueden ser el ingrediente clave para el alcanzar el éxito de un proyecto.

A fin de aprovechar plenamente las ventajas de los datos abiertos en la sociedad, la Unión Europea cuenta con diversas iniciativas para impulsar la economía del dato, un modelo digital único que fomenta el intercambio de datos, destacando la soberanía y el gobierno de los mismos, el marco ideal y necesario para los datos abiertos.

En la economía del dato, tal y como recoge la regulación vigente, se garantiza la privacidad de las personas y la interoperabilidad de los datos. El marco regulatorio se encarga de velar por el cumplimiento de esta premisa.  Ejemplo de ello puede ser la modificación de la Ley 37/2007 para la reutilización de información del sector público en cumplimiento de la Directiva Europea 2019/1024. Esta regulación se alinea con la Estrategia de datos de la Unión Europea que define un horizonte con un mercado único de datos en el que se facilite un intercambio mutuo, libre y seguro entre el sector público y el privado.

Para lograr este objetivo, se deben abordar cuestiones clave, como preservar ciertas garantías jurídicas o acordar unas características comunes de descripción de metadatos que deben cumplir los dataset para facilitar el acceso y uso de los datos entre sectores, es decir, utilizar un lenguaje común que permita la interoperabilidad entre catálogos de conjuntos de datos.

¿Qué son los estándares de metadatos?

Un primer paso hacia la interoperabilidad y reutilización de los datos es desarrollar mecanismos que habiliten una descripción homogénea de los mismos y que, además, dicha descripción sea fácilmente interpretable y procesable tanto por humanos como por máquinas. En este sentido, se han ido creando diferentes vocabularios que, con el tiempo, se han ido consensuando hasta convertirse en estándares. 

Los vocabularios estandarizados ofrecen una semántica que sirve como base para la publicación de conjuntos de datos que actúa como "leyenda" para facilitar la comprensión del contenido de los datos. Al fin y al cabo, se puede decir que estos vocabularios proporcionan una colección de metadatos para describir los datos que se publican; y como todos los usuarios de esos datos tienen acceso a los metadatos y entienden su significado, es más fácil interoperar y reutilizar los datos.

W3C: Estándares DCAT y DCAT-AP

A nivel internacional, se pueden destacar varias organizaciones que crean y mantienen estándares:

  • World Wide Web Consortium (W3C): desarrolla el Vocabulario de Catálogos de Datos (DCAT): un estándar de descripción diseñado con el objetivo de facilitar la interoperabilidad entre catálogos de conjuntos de datos publicados en la web.

    • Posteriormente, tomando como base DCAT, se desarrolló DCAT-AP, una especificación para el intercambio de descripciones de datos publicados en los portales de datos en Europa que cuenta con extensiones de DCAT-AP más específicas como:

      • GeoDCAT-AP que extiende DCAT-AP para la publicación de datos  espaciales.
      • StatDCAT-AP que igualmente, extiende DCAT-AP para describir datasets de contenidos estadísticos.

ISO: Organización de Estandarización Internacional

Además de World Wide Web Consortium, existen otras organizaciones que se dedican a la estandarización, por ejemplo, la Organización de Estandarización Internacional (ISO, por sus siglas en inglés Internacional Standarization Organisation).

  • Entre otros muchos tipos de estándares, ISO también ha definido normas de estandarización de metadatos de catálogos de datos:
    • ISO 19115 para describir información geográfica. Como ocurre en DCAT, también se han desarrollado extensiones y especificaciones técnicas a partir de ISO 19115, por ejemplo:
      • ISO 19115-2 para datos ráster e imágenes.
      • ISO 19139 proporciona una implementación en XML del vocabulario.

El horizonte en los estándares de metadatos: retos y oportunidades

Tanto W3C como ISO trabajan en el desarrollo y mantenimiento de vocabularios estandarizados y adaptados a las necesidades de los usuarios. Su trabajo contribuye a lograr un ecosistema de datos abiertos interoperables que facilite la reutilización. Sin embargo, la interoperabilidad a menudo se encuentra con obstáculos derivados de debilidades de calidad, como pueden ser datos obsoletos, dificultades para acceder e interoperar con ellos o metadatos incompletos.

A pesar de ello, como se ha demostrado, la compartición de datos es un mecanismo fundamental en la economía del dato. Así que garantizar la interoperabilidad y reutilización de estos es una acción clave para abordar el desarrollo de la economía de los datos en línea con las expectativas de las organizaciones en lo que se refiere a innovación.

Entre las múltiples ventajas que ofrece la reutilización de conjuntos de datos y su interoperabilidad se puede destacar la creación de aplicaciones y servicios que aportan un valor a la sociedad o ayudan en la evaluación de políticas, por ejemplo.

Además, la reutilización e interoperabilidad de los conjuntos de datos favorece el desarrollo económico en general, y la economía del dato, en particular. Se estima que esta industria alcanzará un valor de 829.000 millones de euros en 2025, según previsiones de la Unión Europea. Para poder aprovechar los beneficios que ofrece compartir datos, primero, se deben acordar y respetar unas normas de descripción comunes: los estándares para describir metadatos de catálogos de conjuntos de datos.

calendar icon
Blog

DCAT-AP es la especificación europea para la descripción de catálogos de datos abiertos. Su referente es el estándar Data Catalog Vocabulary (DCAT) de W3C, creado para facilitar la interoperabilidad entre catálogos de datos publicados en la web. DCAT permite disponer de un vocabulario de propiedades que posibilita describir catálogos y recursos de información.  

¿Qué norma de referencia tenemos en España? 

El marco normativo en España establece la Norma Técnica de Interoperabilidad de Reutilización de recursos de información (NTI-RISP) como la especificación de referencia para la puesta a disposición de recursos de información elaborados o custodiados por el sector público, cumpliendo con lo establecido en la Ley sobre reutilización de la información del sector público (Ley 37/2007, modificada posteriormente por la Ley 18/2015 y la 9/2017 por la que se trasponen las Directivas 2014/23/UE y 2014/24/UE). Este marco normativo vigente declara que los documentos de las Administraciones y organismos del sector público son reutilizables en los términos previstos en dicha Ley. Es relevante destacar que la NTI-RISP es anterior tanto a la primera versión DCAT (2014) como a la primera versión de DCAT-AP (2013). 

¿Qué aportan las especificaciones para describir catálogos de datos abiertos? 

Una particularidad de estas especificaciones es la capacidad expresiva que permiten, dado que el número de términos o propiedades disponibles en el vocabulario delimita la cantidad de características a describir sobre los catálogos y los recursos de datos que alberga. DCAT-AP, además, tiene como objetivo proporcionar un marco común descriptivo para catálogos "generalistas" de datos que albergan normalmente datos que proceden de catálogos de diferentes dominios de conocimiento -por ejemplo, del dominio geográfico o estadístico-. Por ello, resulta más factible encontrar un soporte que ofrezca mayor detalle descriptivo utilizando vocabularios especializados –por ejemplo, INSPIRE en el contexto geográfico-, cuando se describen catálogos de datos temáticos. En esta línea, con el objetivo de converger con estándares previamente establecidos, se desarrollaron dos extensiones a partir de DCAT-AP: GeoDCAT-AP y StatDCAT-AP para representar metadatos de contextos geográfico y estadístico, respectivamente. 

Por tanto, el reto de una especificación para la descripción de catálogos de datos abiertos generalistas es doble:  

  • En primer lugar, incorporar la máxima capacidad descriptiva para que los usuarios conozcan el máximo detalle posible asociado a los datasets que reutilizarán. 

  • En segundo lugar, aprovechar los esfuerzos realizados por los editores de conjuntos de datos ya publicados en catálogos temáticos existentes implementados en base a estándares establecidos. 

Para ello, DCAT-AP evoluciona a una versión 2.0.1 (publicada en junio de 2020) que incorpora una serie de características que alientan la próxima evolución de la NTI-RISP, aportando un considerable incremento de propiedades para enriquecer la descripción de catálogos de datos, mejorar su interoperabilidad e incorporar metadatos de uso habitual en el contexto geográfico o estadístico, como el linaje, la resolución de la información o la descripción de servicios de datos, entre otros.  

¿Qué características relevantes implementa el nuevo DCAT-AP 2.0.1? 

A continuación, destacamos una relación de novedades que incorpora esta nueva versión de DCAT-AP que van a ser claves en la próxima actualización de la NTI-RISP: 

  • Servicios de datos. Es una de las aportaciones más relevantes de esta evolución de DCAT-AP. Permite la descripción de servicios de datos, como APIs o Servicios Web, como alternativa a los metadatos utilizados para describir la disponibilidad de recursos descargables. La especificación contempla, además, que un servicio de datos -por ejemplo, un servicio visor de mapas- pueda tener más de un endpoint y, por tanto, más de una descripción para un único dataset.  
  • Roles de agentes. Es otro aspecto que en el contexto geográfico tiene amplio recorrido. De hecho, la extensión GeoDCAT-AP incorpora hasta 11 roles o responsabilidades definidas acorde a la iniciativa INSPIRE. DCAT-AP 2.0.1 admite tres roles de agente que aporta la posibilidad de especificar un punto de contacto o de agente al que se puede contactar para obtener información relativa al recurso, al creador o agente que creó el recurso y al editor o agente que publica y mantiene dicho recurso. 
  • Versionado, abre la posibilidad a mantener la especificación de una secuencia entre diferentes versiones de un conjunto de datos. Aporta la posibilidad de describir las diferencias entre una versión y su predecesora. 
  • Procedencia. Con la incorporación de metadatos que describen la procedencia, ahora será posible considerar situaciones en las que estas descripciones se importan o exportan desde y hacia otros catálogos de datos -por ejemplo, de una IDE o de un portal de datos estadísticos-. Así se permite que los usuarios comprendan de dónde provienen los datos y cómo pueden haber sido modificados a lo largo del tiempo 
  • Granularidad. Siempre que sea aplicable, es importante disponer de propiedades de contexto espacial y temporal para indicar resoluciones de datos - en unidades de longitud o de tiempo- para todos los tipos de recursos descritos en un catálogo, independientemente del contexto. 
  • Gobernanza de datasets. DCAT-AP 2.0.1 ofrece un mejor soporte para implementar modelos de gobernanza de datos incorporando, además de los relatados anteriormente, aspectos para identificar recursos agregados de varios publicadores, relaciones entre recursos y otros metadatos que permiten describir con precisión ciclos de vida de los datos, como la planificación de disponibilidad de un dataset o el estado de una determinada distribución en cuanto a su completitud, suspensión de disponibilidad u obsolescencia. 
  • Uso de vocabularios controlados, que se mantiene como una constante en las diferentes evoluciones de la especificación. En esta se concretan referencias a vocabularios que viene desarrollando JoinUp para, entre otros ajustes de metadatos, modelos de licencia reconocidos internacionalmente, frecuencia de actualización de datasets, formatos de datos e idiomas, así como temáticas y subtemáticas de datos compatibles con la iniciativa INSPIRE
  • Validación. La especificación incorpora además una serie de plantillas SHACL para validar y controlar la calidad de grafos RDF de catálogos de datos compatibles con DCAT-AP 2.0.1. 

Como se ha indicado en numerosos artículos relacionados con Open Data, los metadatos son fundamentales para una reutilización eficiente de los datos. El uso de vocabularios estándar para describir las características de los datos disponibles en los catálogos, -fruto del consenso entre los agentes del ecosistema de datos-, facilitan esa tarea y permiten que éstos sean interoperables entre sí. La estandarización favorece el descubrimiento de los datos mediante mecanismos de federación de metadatos entre catálogos. 

DCAT-AP 2.0.1, es un sólido paso adelante para crear catálogos más eficientes y el camino a recorrer en la evolución de las normas técnicas de referencia para describir recursos de información reutilizables. En la hoja de ruta de la política de Datos Abiertos está la evolución de la NTI-RISP vigente para adaptarla a la especificación DCAT-AP 2.0.1 y, como en el caso de la previa, se recomienda fijar en el marco regulatorio su obligado cumplimiento.


Contenido elaborado por el equipo de datos.gob.es.

calendar icon
Documentación

En el Plan de Acción de la Conferencia Internacional de Datos Abiertos, el desarrollo de capacidades se ha convertido en un aspecto prioritario dentro del movimiento open data internacional. Al fin y al cabo la necesidad de herramientas formativas es imprescindible para los líderes responsables de las políticas RISP, los productores y reutilizadores de datos, el sector público y privado, e incluso, los ciudadanos. Por ello, facilitar herramientas formativas que permitan a los diferentes agentes avanzar en la apertura y reutilización constituye una tarea prioritaria.

Con este objetivo, desde la línea de difusión, sensibilización y formación de Iniciativa Aporta, se han elaborado ocho unidades didácticas, dirigidas a todo tipo de público: desde ciudadanos que se acercan por primera vez a los datos abiertos hasta reutilizadores y empleados públicos, responsables de iniciativas de apertura de la información, que deseen ampliar sus conocimientos.

Las unidades formativas están diseñada para entender los conceptos básicos del movimiento open data, para conocer buenas prácticas en la implementación de políticas de datos abiertos y su reutilización, pautas metodológicas para la apertura, normativas técnicas como DCAT-AP y NTI-RISP o además del uso de herramientas de tratamiento de datos, entre otros aspectos.

En la elaboración de los recursos, se han tenido en cuenta dos tipos de aprendizaje. El aprendizaje por descubrimiento, orientado a ampliar los conocimientos para resolver las dudas y reflexiones planteadas y el aprendizaje significativo basado en el conocimiento previo, a través del uso de ejemplos prácticos para contextualizar y aplicar los conceptos tratados.

Además, los módulos formativos contienen materiales complementarios a través de enlaces a páginas externas y documentos para su descarga sin necesidad de conexión. De esta forma, se le brinda la oportunidad al alumno de ampliar sus conocimientos y familiarizarse con fuentes relevantes donde obtener información fiable y actualizada sobre el sector open data.

Todas las unidades se distribuyen bajo la licencia Creative Commons Share-Alike Attribution Licence (CC-BY-SA) que permite copiar, distribuir el material en cualquier medio o formato y adaptarlo para crear nuevos recursos a partir de él.

¿Qué contenidos están disponibles?¿Qué contenidos están disponibles?

El material formativo elaborado por Iniciativa Aporta consta de ocho unidades didácticas que abordan los siguientes contenidos del sector de la apertura y reutilización de la información del sector público:

  1. Conceptos básicos, beneficios del Open Data y Barreras
  2. Marco Normativo
  3. Tendencias y buenas prácticas en la implementación de políticas de datos abiertos
  4. La reutilización de datos públicos en su papel transformador
  5. Pautas metodológicas para la apertura de datos
  6. DCAT-AP y la Norma Técnica de Interoperabilidad de Reutilización de Recursos de Información (NTI-RISP)
  7. Uso de herramientas básicas de tratamiento de datos
  8. Buenas prácticas en el diseño de APIs y Linked Data

¿En qué consisten las unidades didácticas?¿En qué consisten las unidades didácticas?

Cada unidad está diseñada para que el alumno adquiera o amplíe sus conocimientos sobre el sector de la apertura y reutilización del sector público. Con el fin de facilitar su comprensión, todas ellas cuentan con una estructura similar que incluye objetivos, contenidos, actividades de evaluación, ejemplos prácticos, información complementaria y conclusiones.

Todas las unidades didácticas puede realizarse de forma online, directamente desde el portal de datos.gob.es o, en su defecto, también es posible su descarga en el equipo del usuario e, incluso, su carga en una plataforma LMS.

¿Es necesario realizar todas las unidades didácticas?¿Es necesario realizar todas las unidades didácticas?

Cada unidad independiente en sí misma; permitiendo al alumno adquirir los conocimientos necesarios en una materia específica acorde a sus necesidades formativas. No obstante, aquellos alumnos que deseen poseer una visión más completa del sector RISP, tienen la oportunidad de realizar la serie completa de ocho unidades didácticas para conocer en profundidad los aspectos más relevantes de las iniciativas de datos abiertos.

¿Dónde están publicadas las unidades didácticas?¿Dónde están publicadas las unidades didácticas?

Las unidades didácticas están disponibles dentro de la sección web “Documentación” bajo la categoría “Materiales formativos” para su realización a través del portal online o para su descarga en el equipo del alumno.

Materiales formativos de la Iniciativa Aporta

 
calendar icon
Documentación

El perfil de aplicación DCAT-AP tiene como objetivo describir, mediante metadatos, los catálogos y conjuntos de datos de los portales europeos de datos abiertos. Para ello, se basa en el Vocabulario de Catálogos de Datos (DCAT), publicado por el W3C. En concreto, el DCAT-AP es una especificación donde se describen una serie de restricciones (como el rango de las propiedades) sobre el modelo DCAT.

En un contexto donde no dejan de producirse cambios económicos, tecnológicos y sociales, este perfil de aplicación está en continua evolución y mejora para responder a las demandas de los usuarios. El organismo encargado de la gestión del mantenimiento y de la evolución de DCAT-AP es JoinUp, una plataforma colaborativa creada por la Comisión Europea y financiada por la Unión Europea mediante los Programas ISA e ISA2. A través de esta herramienta, se han publicado las diferentes versiones de DCAT-AP, así como las guías prácticas de implementación de la norma.

Para ayudar a aquellos organismos que tengan dudas sobre cómo aplicar este perfil, a continuación recogemos los principales documentos y recursos disponibles sobre DCAT-AP en JoinUp:

Documentos Descripción
Versiones de DCAT-AP A través de una línea de tiempo se muestran las distintas actualizaciones que se han publicado sobre los perfiles DCAT-AP. De esta forma se puede acceder fácilmente a la última versión.
Pautas de implementación Incluye una lista de guías técnicas y organizacionales para facilitar la implementación de DCAT-AP, donde se incluyen ejemplos de implementaciones que pueden ayudar a resolver los distintos retos. Además, aquellos usuarios que lo deseen pueden compartir sus propios desarrollos (como por ejemplo federadores).
Análisis de las extensiones de los países sobre DCAT-AP A partir de la especificación DCAT-AP, cada país de la Unión Europea ha realizado una serie de adaptaciones, para satisfacer las necesidades propias. Este análisis abarca dichas extensiones, buscando patrones repetitivos que podrían usarse como entrada para versiones futuras de DCAT-AP.
GeoDCAT-AP Es una extensión de DCAT-AP para el intercambio de descripciones de conjuntos de datos y servicios geoespaciales.
StatDCAT-AP Es una extensión de DCAT-AP para el intercambio de descripciones de conjuntos de datos y servicios estadísticos.
Política de gestión de cambios y versiones Se trata de documentación relativa a los cambios que se realizan en DCAT-AP. En ella se analizan 3 tipos de cambios en función del impacto que tengan en la interoperabilidad: errores, cambios semánticos menores (minor) y cambios semánticos importantes (major).
Librería de herramientas Incluye herramientas desarrolladas por SEMIC o por los usuarios que promueven la interoperabilidad semántica.
Librería de documentación En esta sección se realiza un seguimiento de los estudios llevados a cabo bajo distintas acciones del Programa ISA², agrupadas por temáticas.

 

Además de estos recursos, existen grupos de trabajo que han desarrollado informes aplicados a campo concretos, como la  investigación. Por su parte, el propio W3C también han publicado informes y herramientas para ayudar a los usuarios,  como esta guía sobre casos de uso y requerimientos para el intercambio de datos, en este caso sobre DCAT.

Para estar al día de todos los cambios que se producen y de los documentos que se publican, aquellos usuarios que los deseen pueden suscribirse al proyecto de GitHub creado para poner en común experiencias, retos encontrados y sugerencias de nuevas funcionalidades.

Datos.gob.es también forma parte de la red de colaboradores de Joinup, por lo que participa activamente en la difusión de los contenidos y recursos creados para facilitar la implementación de DCAT-AP. Si quieres saber más sobre el perfil de aplicación DCAT-AP, te recomendamos el informe DCAT-AP y sus extensiones: Contexto y evolución.

calendar icon
Documentación

Uno de los principales retos que surgen a la hora de abordar una iniciativa de Open Data es definir la arquitectura de la información y facilitar la interoperabilidad entre los catálogos de datos publicados por distintos portales en la Web. Para solucionar este reto, el Consorcio World Wide Web (W3C) publicó el Vocabulario de Catálogos de Datos (DCAT), un vocabulario RDF para describir catálogos de datos, basado en 3 conceptos clave: catálogo, conjunto de datos (Dataset) y distribución.

Conceptos principales de DCAT

Sobre este vocabulario, y dentro del proyecto JoinUP, una plataforma colaborativa creada por la Comisión Europea, un grupo internacional de expertos desarrolló el perfil de Aplicación de DCAT para portales de datos europeos (DCAT-AP). Se trata de una especificación donde se describen diversas restricciones (como el rango de las propiedades) sobre el modelo DCAT. Su objetivo es facilitar la homogeneización y la búsqueda cruzada mediante el uso de metadatos entre distintos portales europeos de datos generados por el sector público y puestos a su disposición para su reutilización.

El informe DCAT-AP y sus extensiones: contexto y evolución, desarrollado en el marco de la Iniciativa Aporta, surge con la idea de contextualizar y profundizar en el perfil de aplicación DCAT-AP, y en el vocabulario DCAT en el que está basado. El informe incluye una descripción de ambas publicaciones, así como una definición de los organismos e instituciones implicados en su definición.

Ampliaciones y cambios de las extensiones de DCAT-AP

En base a DCAT-AP se han desarrollado extensiones sectoriales, algunas de las más relevantes en ámbitos de aplicación especificos se describen en el informe: DCAT-AP HVD, extensión de DCAT-AP para la descripción de datos de alto valor, GeoDCAT-AP, una extensión de DCAT-AP para el intercambio de descripciones de conjuntos de datos y servicios geoespaciales, StatDCAT-AP, una extensión de DCAT-AP para el intercambio de descripciones de conjuntos de datos y servicios estadísticos, MLDCAT-AP que extiende DCAT-AP en el campo del aprendizaje automático, y BRegDCAT-AP para describir los aspectos fundamentales de registros administrativos públicos.

Desde su aparición y a lo largo de estos años, prácticamente la totalidad de los Estados miembros de la Unión Europea han ido extendiendo el perfil de aplicación DCAT-AP para poder satisfacer sus necesidades. Se hace especial énfasis en lo referente a España, donde existe la particularidad de que la “extensión”- la Norma Técnica de Interoperabilidad de Reutilización de recursos de información (NTI-RISP) - fue previa a la propia especificación DCAT-AP que a fecha de cierre de la edición de este informe evoluciona a la extensión de referencia DCAT-AP-ES. La NTI-RISP establece el marco común relativo a la apertura y uso de documentos y recursos de información elaborados o custodiados por la administración pública. Esta Norma técnica busca asegurar la persistencia de la información y el uso de formatos, así como fomentar los términos y condiciones de uso adecuados.

Por último, como referencia, se listan algunas extensiones DCAT-AP implementadas por los diferentes Estados miembro.

calendar icon
Documentación

Este documento constituye una guía de aplicación de la Norma Técnica de Interoperabilidad de Reutilización de recursos de información del sector público, y como tal, su objetivo es servir como herramienta de apoyo para la aplicación e implementación de lo dispuesto en mencionada norma. La guía incluye tanto citas explícitas al texto de la NTI como explicaciones y contenidos complementarios a aquella. A lo largo del desarrollo de la guía, se presentan y explican con detalle las directrices para que las Administraciones públicas desarrollen sus propias políticas de reutilización de documentos y recursos de información a reconocer dentro de sus ámbitos competenciales.

 

calendar icon
Noticia

La Comisión Europea da un paso importante al terminar la especificación DCAT Application Profile (o simplemente DCAT-AP), elaborada conjuntamente por el Programa ISA, la Oficina de Publicaciones y DG Connect. Esta especificación es una extensión del vocabulario W3C Data Catalogue Vocabulary (DCAT) y la definición de una política normativa para su aplicación en la descripción de conjuntos de datos públicos en Europa.

El objetivo de DCAT es bastante simple y, por eso, ha tenido una gran acogida en la comunidad open data desde su publicación como recomendación W3C en enero del 2014. Este es: proporcionar un vocabulario RDF (un conjunto de clases y propiedades) para describir de manera estructurada el contenido de datasets y catálogos de datos en la web. De manera breve, imaginemos una organización que quiere publicar un conjunto de ficheros CSV sobre indicadores económicos de cierta temática. Gracias a DCAT, esta entidad puede proporcionar descripciones procesables (en RDF) identificando esos ficheros como un catálogo (dcat:Catalogue), en el que cada fichero en particular es un dataset (dcat:Dataset) cuya temática se identifica a través de elementos (skos:Concept) de un vocabulario controlado, un tesauro, una taxonomía, etc.

Las aportaciones principales de DCAT-AP se pueden resumir en los siguientes puntos:

  1. No introduce un nuevo vocabulario. Al contrario, su objetivo es definir de manera concreta el uso de algunas propiedades y clases de DCAT para la publicación de datos dentro de la Unión Europea. En aquellas extensiones necesarias para la descripción de catálogos y datasets y que no están presentes en DCAT se reutilizan de otros vocabularios existentes (como es el caso de foaf:Document para identificar a los portales web en los que se publican los catálogos).
  2. Define una política completa para el uso de DCAT-AP, especificando qué clases y propiedades son obligatorias, recomendadas u opcionales en la aplicación del vocabulario dentro de la Unión Europea.
  3. Establece unos principios normativos de conformidad para la publicación y consumo de documentos DCAT-AP (Sección 6 de la especificación).
  4. Explica el uso de los vocabularios controlados (en SKOS) para la descripción de la temática de los datasets, expandiendo el breve ejemplo anterior; es realmente importante la recomendación explícita sobre la reutilización de vocabularios europeos, como Eurovoc, lo que abre la puerta a posibles aplicaciones de DCAT-AP en el campo de la contratación pública.

Además se están realizando actualmente nuevos desarrollos sobre DCAT-AP en los siguientes puntos:

  1. Extensión de DCAT-AP para el intercambio de descripciones sobre datasets y servicios espaciales: GeoDCAT-AP. El grupo de trabajo ya ha publicado una primera especificación (v1.0), todavía en fase de “working draft”. Su principal objetivo es proporcionar una sintaxis RDF para combinar los esquemas de metadatos de la iniciativa INSPIRE y la ISO 19115:2003, de acuerdo a los principios de conformidad establecidos por DCAT-AP.
  2. Extensión de DCAT-AP para la publicación de conjuntos de datos estadísticos: StatDCAT-AP. Con este objetivo se ha creado recientemente un grupo de trabajo, que entre sus primeras acciones está encontrar metadatos relevantes comunes entre los diferentes portales de publicación de datos estadísticos, como es el caso de Eurostat. Buscando similaridades, StatDCAT-AP pretende ser para el vocabulario RDF Data Cube, lo mismo que el esquema de metadatos SDMX/EMS lo es para la especificación SDMX.

Finalmente, la Comisión Europea ha abierto una línea de actividad para la elaboración de unas guías de implementación de DCAT-AP. En este sentido, se busca la participación abierta de diferentes organizaciones europeas, que contribuyan aportando experiencias reales en la aplicación de DCAT-AP y los problemas y desafíos que se han encontrado en su implementación. Con todo, esta nueva especificación y su temprana adopción por el Portal de Datos Europeo es muy buena señal para el mundo Open Data. La especificación (v1.1) está publicada en el marco del proyecto JoinUp

calendar icon
Documentación

Con la aparición de nuevos portales de datos abiertos a escala local, regional y nacional, el sector privado y los ciudadanos pueden tener dificultades a la hora de encontrar y reutilizar la información pública.

Bajo este marco, dentro del proyecto europeo JoinUP, un grupo internacional de expertos, entre los que se encuentra el equipo de la Iniciativa Aporta, trabajaron en el desarrollo del DCAT-AP, una especificación diseñada para homogeneizar las descripciones de los conjuntos de datos publicados en los diferentes portales open data. Gracias a ella, se permite la búsqueda cruzada de datos procedentes de diferentes canales, mejorando la identificación de la información pública en Europa más allá de las fronteras geográficas o los sectores de actividad.

El grupo internacional de expertos aunó sus esfuerzos en la construcción de un perfil de aplicación de DCAT cumpliendo las siguientes metas: identificación de los elementos esenciales y atributos del DCAT en el contexto europeo; definición de los vocabularios a utilizar en el proyecto y determinación del mínimo necesario de metadatos para el intercambio entre los diferentes portales del continente.  

Con el fin de asegurar la consistencia en la descripción de los metadatos publicados en los portales, se han tenido en cuenta dos escenarios principales para la consecución de los objetivos marcados por el grupo de expertos:

  • Los usuarios de los datos no saben con exactitud qué datos están disponibles y qué administraciones públicas los custodian. Para solventar este problema y mejorar la interoperabilidad de la información procedente de diferentes fuentes, es fundamental cuidar la calidad de los metadatos para agilizar y facilitar la búsqueda de la información.
  • Los proveedores de datos desean impulsar la reutilización de su información optimizando su acceso y búsqueda. En múltiples ocasiones, publicar online los metadatos es más importante incluso que hacer que la información esté disponible, al permitir que los datos aparezcan en otros portales, ampliando su visibilidad y reduciendo costes. 

DCAT-AP satisface las necesidades de los portales open data europeos al permitir la interoperabilidad semántica con otras aplicaciones reutilizando diccionarios ya definidos como EuroVoc y vocabularios de metadatos como Dublin Core, SDMX o Inspire metadata.

calendar icon