Documentación

Medir el impacto de los datos abiertos es uno de los retos que tienen por delante las iniciativas de datos abiertos. En este contexto, el Portal de Datos Europeo ha puesto en marcha un observatorio de casos de uso que constará de diversos informes.

En el primer informe se presenta la metodología y 30 casos de reutilización seleccionados, incluyendo información sobre los servicios que ofrecen, los datos (abiertos) que utilizan y el impacto que tienen. Por último se presentan las conclusiones generales y las lecciones aprendidas en esta primera parte del proyecto. Para seleccionar los casos de uso, se realizó un inventario basado en tres fuentes: los ejemplos recogidos en los estudios de madurez que realiza cada año el portal europeo, las soluciones participantes en el EU Datathon y los ejemplos de reutilización disponibles en el repositorio de casos de uso de data.europa.eu.

Este informe se encuentra disponible en el siguiente enlace: "Observatorio de casos de uso: seguimiento de 3 años de 30 casos de reutilización para comprender el impacto económico, gubernamental, social y medioambiental de los datos abiertos (Volumen I) "

 

calendar icon
Documentación

Este informe, que publica el Portal de Datos Europeo, analiza el potencial de reutilización de los datos en tiempo real. Los datos en tiempo real ofrecen información con alta frecuencia de actualización sobre el entorno que nos rodea (por ejemplo, información sobre el tráfico, datos meteorológicos, mediciones de la contaminación ambiental, información sobre riesgos naturales, etc.).

El documento resume los resultados y conclusiones de un seminario web organizado por el equipo del Portal de Datos Europeo celebrado el pasado 5 de abril de 2022, donde se explicaron diferentes formas de compartir datos en tiempo real desde plataformas de datos abiertos.

En primer lugar, el informe hace un repaso sobre el fundamento de los datos en tiempo real e incluye ejemplos que justifican el valor que aporta este tipo de datos para, a continuación, describir dos enfoques tecnológicos sobre cómo compartir datos en tiempo real del ámbito de IoT y el transporte. Incluye, además, un bloque que resume las principales conclusiones de las preguntas y comentarios de los participantes que giran, principalmente, en torno a difentes necesidades de fuentes de datos y funcionalidades requeridas para su reutilización.

Para terminar, basándose en el feedback y la discusión generada, se proporciona un conjunto de recomendaciones y acciones a corto y medio plazo sobre cómo mejorar la capacidad para localizar fuentes de datos en tiempo real a través del Portal de Datos Europeo.

Este informe se encuentra disponible en el siguiente enlace: "Datos en tiempo real: Enfoques para integrar fuentes de datos en tiempo real en data.europa.eu"

calendar icon
Noticia

Medir el impacto de los datos abiertos es uno de los retos que tienen por delante las iniciativas open data. Existen diversos métodos, la mayoría de los cuales combinan el análisis cuantitativo con el cualitativo, con el fin de conocer cuál es el valor de determinados conjuntos de datos.

En este contexto, data.europa.eu, el Portal Europeo de Datos Abiertos, ha puesto en marcha un Observatorio de casos de uso (Use Case Observatory). Se trata de un proyecto de investigación sobre el impacto económico, gubernamental, social y medioambiental de los datos abiertos.

¿En qué consiste el Observatorio de casos de uso?

Durante tres años, desde 2022 hasta 2025, el Portal Europeo de Datos realizará el seguimiento de 30 casos de reutilización de datos abiertos. Con ello se busca:

  1. Evaluar cómo se crea el impacto de los datos abiertos
  2. Compartir los retos y logros de los casos de reutilización analizados
  3. Contribuir al debate sobre la metodología a utilizar para medir dicho impacto

Los casos de uso analizados hacen referencia a cuatro áreas de impacto:

  • Impacto económico: Incluye casos de reutilización relacionados con la creación de empresas y la (re)capacitación de los trabajadores, entre otros. Por ejemplo, se incluyen soluciones que ayudan a identificar licitaciones públicas o solicitar puestos de trabajo.
  • Impacto gubernamental: Se refiere a casos de reutilización que impulsan el gobierno electrónico, la transparencia y la rendición de cuentas.
  • Impacto social: Engloba casos de reutilización en los ámbitos de la asistencia sanitaria, el bienestar y la lucha contra la desigualdad.
  • Impacto medioambiental:  Se circunscribe a casos de reutilización que promueven la sostenibilidad y la reducción de energía, incluyendo soluciones relacionadas con el control de la calidad del aire o la preservación de los bosques.

Para seleccionar los casos de uso, se realizó un inventario basado en tres fuentes: los ejemplos recogidos en los estudios de madurez que realiza cada año el portal europeo, las soluciones participantes en el EU Datathon y los ejemplos de reutilización disponibles en el repositorio de casos de uso de data.europa.eu. Solo se tuvieron en cuenta aquellos proyectos desarrollados en Europa, intentando mantener un equilibrio entre los distintos países. Además, se destacaron aquellos proyectos que hubiesen obtenido algún premio o que estuviesen alineados con las prioridades de la Comisión Europea para 2019 a 2024. Para finalizar la selección, desde data.europa.eu se realizaron entrevistas con representantes de los casos de uso que cumplían los requisitos y que estaban interesados en participar en el proyecto.

Tres proyectos españoles entre los casos de uso analizados

Los casos de uso seleccionados se recogen en la siguiente imagen:

Casos de uso analizados por dimensión.  1)	Impacto económico: C4P, Wonder Wanderlust Women, The Youth Public Open Procurement, LocalFocus, Naar Jobs in West-Vlaanderen – To Jobs in West Flanders. 2)	Impacto gubernamental: The Smartfiles Network, The object-based city model, The Waar is mijn stemlokaal? – Where is my polling station?, The non-governmental organisation (NGO) Openpolis, Next Generation Democracy, Statsregnskapet.no, The Institute for Development of Freedom of Information 3)	Impacto social: Medicatio, UniversiDATALab, VisImE-360, OpenActive, Tangible data, Hale & Hearty, EU Twinnings, Open Food Facts, Integreat, Emergency Volunteer Application. 4)	Impacto medioambiental: Digital Forest Dryads’ application, Air Quality Cyprus, Vides SOS, Planttes, Atlas Okolja – Environmental Atlas, Plume Labs, Baltazar, Environ-Mate.

Entre ellos, encontramos tres españoles:

  • En la categoría de Impacto social se sitúa UniversiDATA-Lab, un portal público para el análisis avanzado y automático de los conjuntos de datos publicados por las universidades. Este proyecto, que se hizo con el primer premio del III Desafío Aporta, fue concebido por el equipo creador de  UniversiData, una iniciativa colaborativa orientada e impulsada por universidades públicas con el fin de fomentar los datos abiertos en el sector de la educación superior en España de una forma armonizada. Puedes conocer más sobre estos proyectos en esta entrevista.
  • En la misma categoría también encontramos a Tangible data, un proyecto centrado en la creación de esculturas basadas en datos, para acercarlos a personas sin conocimientos técnicos. Entre otras fuentes de datos, utiliza datasets provenientes de la NASA o de Our World in Data.
  • En la categoría de medio ambiente está Planttes. Se trata de un proyecto de ciencia ciudadana diseñado para informar sobre la presencia de plantas alergénicas en nuestro entorno y el nivel de riesgo de alergia en función de su estado. Este proyecto está promovido por el Punto de Información Aerobiológica (PIA) del Instituto de Ciencia y Tecnología Ambientales (ICTA-UAB) y el Departamento de Biología Animal, Biología Vegetal y Ecología (BABVE), en colaboración con el Centro de Visión por Computador (CVC) y el Library Living Lab, todos ellos de la Universidad Autónoma de Barcelona (UAB).

Primer informe ya disponible

Fruto del trabajo de análisis realizado se desarrollarán tres informes. El primero de ellos, que se acaba de publicar, presenta la metodología y los 30 casos de reutilización seleccionados. Incluye información sobre los servicios que ofrecen, los datos (abiertos) que utilizan y el impacto que tienen en el momento de la redacción. El informe finaliza con un resume de las conclusiones generales y las lecciones aprendidas de esta primera parte del proyecto de investigación, ofreciendo una visión general de los próximos pasos del observatorio.

El segundo y el tercer informe, que verán la luz en 2024 y 2025, evaluarán el progreso de los mismos casos de uso y permitirá ampliar las conclusiones de este primer volumen. Los informes se focalizarán en determinar los logros alcanzados y los retos presentes en un espacio de tres años, lo cual permitirá extrapolar ideas concretas para mejorar las metodologías de evaluación del impacto de los datos abiertos.

El proyecto fue presentado en un webinar el pasado 7 de octubre, cuya grabación está disponible, junto con la presentación utilizada. En el webinar se invitó a participar a representantes de 4 de los casos de uso: Openpolis, Integreat, ANP y OpenFoodFacts.

calendar icon
Documentación

Este informe que publica el Portal de Datos Europeo explora los llamados Citizen Generated Data (CGD). Esta categoría de datos hace referencia a aquellos generados por los ciudadanos. Existe una carencia de este tipo de datos dentro de los portales de datos abiertos europeos, principalmente debido a la falta de publicación y gestión de CGDs por parte de las administraciones públicas.

En el documento se realiza un análisis de diversos portales de datos abiertos, cuyo principal objetivo es proporcionar una visión de los CGDs que pueden formar parte de dichos portales y cómo incluirlos por parte de las administraciones públicas. Cabe destacar que durante el análisis, se establece un marco para la descripción, referencia y caracterización de los CGDs.

Por último, basándose en las conclusiones del análisis previo, el documento ofrece una serie de recomendaciones y pautas para los publicadores de datos. El objetivo es aumentar y mejorar la presencia de CGDs en la publicación de datos abiertos, involucrando a los ciudadanos en el diseño de la política, los procesos y la gobernanza.

Este informe se encuentra disponible en el siguiente enlace: "Data.europa.eu y los datos generados por ciudadanos"

 

calendar icon
Noticia

La Directiva europea 2019/1024 de datos abiertos y reutilización de la información del sector público hace hincapié, entre otros muchos aspectos, en la importancia de publicar datos en tiempo real. En realidad, el documento habla de datos dinámicos, que define como “documentos en formato digital, sujetos a actualizaciones frecuentes o en tiempo real debido a su volatilidad o rápida obsolescencia”. De acuerdo con la Directiva, los organismos públicos deben poner estos datos a disposición de la ciudadanía para su reutilización inmediatamente después de su recogida, mediante APIs adecuadas y, cuando sea posible, como descarga masiva.

Para profundizar en esta situación, el Portal de Datos Europeo, Data.europa.eu, ha publicado el informe Real-time data 2022: Approaches to integrating real-time data sources in data.europa.eu” que analiza el potencial de los datos en tiempo real. Para ello toma como base los resultados de un seminario web celebrado por el data.europa.eu el 5 de abril de 2022, cuya grabación está disponible en su página web.

Además de detallar las conclusiones del evento, el informe ofrece un breve resumen de la información y las tecnologías presentadas en el mismo, de gran utilidad para compartir datos en tiempo real.

La importancia de los datos en tiempo real

El informe comienza explicando qué son los datos en tiempo real: aquellos que se actualizan con frecuencia y se entregan inmediatamente después de su recogida, como decíamos anteriormente. Estos datos pueden ser de una naturaleza muy heterogénea. El siguiente cuadro recoge algunos ejemplos:

Ejemplos de datos en tiempo real: 1. Mediciones estacionarias: por ejemplo, series temporales. 2. Datos de seguimiento: por ejemplo, monitorización de envíos o vehículos. 3. Datos medidos a lo largo de trayectorias: por ejemplo, trayectos en coche. 4. Imágenes: por ejemplo, flujos de vídeo de cámaras, datos de radar. Fuente: Informe "Real-time data 2022: Approaches to integrating real-time data sources in data.europa.eu", data.europa.eu (2022)

Este tipo de datos son muy utilizados para dar forma a aplicaciones que informan del tráfico, el precio de la energía, el tiempo que va a hacer o los flujos de personas en determinados espacios. Puedes descubrir más sobre el valor de los datos en tiempo real en este otro artículo.

Estándares para compartir datos en tiempo real

La interoperabilidad es uno de los factores más importantes a tener en cuenta a la hora de seleccionar la tecnología más adecuada para el intercambio de datos en tiempo real. Se precisa un lenguaje común, es decir, formatos de datos comunes e interfaces de acceso a datos que permitan el flujo de datos en tiempo real. Dos estándares que ya son muy utilizados en el ámbito del Internet de las cosas (IoT en sus siglas en inglés) y que pueden ayudar en este sentido son:

SensorThings API (STA)

SensorThings API, de Open Geospatial Consortium, surgió en 2016 y ha sido considerado como una buena práctica para la compartición de datos cumpliendo con la Directiva INSPIRE.

Este estándar supone un marco abierto y unificado que permite codificar y proporcionar acceso a los flujos de datos generados por sensores. Se basa en las especificaciones REST y JSON y sigue los principios del estándar OData (OASIS Open Data Protocol).

STA ofrece funcionalidades comunes para crear, leer, actualizar y eliminar recursos de sensores. Permite la formulación de consultas complejas adaptadas al modelo de datos subyacente, lo que permite un acceso más directo a los datos concretos que el usuario necesita. Entre las opciones de consulta, destacan los filtrados por período de tiempo, parámetros observados o propiedades del recurso, que permiten reducir el volumen de datos descargados. También permite ordenar el contenido de un resultado por criterios especificados por el usuario y proporciona una integración directa con el estándar MQTT, el cual se explica a continuación.

Message Queuing Telemetry Transport (MQTT)

MQTT fue inventado por el Dr. Andy Stanford-Clark, de IBM, y Arlen Nipper, de Arcom (ahora Eurotech), en 1999. Al igual que STA, también es un estándar de OASIS.

El protocolo MQTT permite el intercambio de mensajes según el principio de publicación/suscripción. El elemento central de MQTT es el uso de brokers, que toman los mensajes entrantes de los publicadores y los distribuyen a todos los usuarios que tienen una suscripción para ese tipo de datos. En este tipo de entornos, los datos se organizan por temas, que se definen libremente y permiten agrupar los mensajes en canales temáticos a los cuales se suscriben los usuarios.

Ente las ventajas de este sistema está la reducción de la latencia, su sencillez y agilidad, lo que facilita su implementación y uso en entornos restringidos (por ejemplo, con un ancho de banda o conectividad limitados).

 En el caso del portal europeo, los usuarios ya pueden encontrar conjuntos de datos en tiempo real basados en MQTT. Sin embargo, aún no existe un enfoque común para proporcionar metadatos sobre los brokers y los temas que ofrecen, por lo que se continúa trabajando en ello.

Otras conclusiones del informe

Como se comentaba al principio, el webinar del 5 de abril también sirvió para recoger las opiniones de los participantes sobre el uso de los datos en tiempo real, los retos actuales en la disponibilidad de datos y las necesidades de futuras mejoras. Unas opiniones que también recoge este informe.

Entre las categorías de datos en tiempo real más valoradas, los usuarios destacaron la información sobre el tráfico y los datos meteorológicos. También se mencionaron los datos relativos a contaminación atmosférica, alérgenos, seguimiento de inundaciones e información bursátil. En este sentido, se reclamaron más datos y más detallados, especialmente en el ámbito de la movilidad y de la energía con el fin de poder comparar los precios de los productos básicos.  Los usuarios también destacaron algunos inconvenientes para localizar datos en tiempo real en el portal europeo, entre los que destaca la heterogeneidad de la información, que hace necesario el uso de normas y formatos comunes a los distintos países.

Para finalizar, el informe proporciona un conjunto de recomendaciones sobre cómo mejorar la capacidad de localizar fuentes de datos en tiempo real a través de data.europa.eu. Para ello se han establecido una serie de acciones a corto y medio plazo, que incluyen la recogida de casos de uso, el soporte a los proveedores de datos o el desarrollo de buenas prácticas para unificar los metadatos.

Puedes leer el informe completo en este enlace.

calendar icon
Documentación

Este informe que publica el European Data Portal (EDP) tiene como objetivo ayudar a los usuarios de datos abiertos en el aprovechamiento del potencial de los datos generados por el programa Copernicus.

El proyecto Copernicus genera datos de alto valor obtenidos vía satélite, generando una gran cantidad de datos sobre la observación terrestre, en consonancia con el objetivo del portal Europeo de Datos de aumentar la accesibilidad y el valor de los datos abiertos.

El informe aborda las siguientes cuestiones, ¿Qué puedo hacer con los datos de Copernicus?, ¿Cómo puedo acceder a los datos? ,y ¿Qué herramientas necesito para utilizar los datos? utilizando la información que se encuentra en el Portal Europeo de Datos, catálogos especializados y examinando ejemplos prácticos de aplicaciones que usen datos de Copernicus.

Este informe se encuentra disponible en este enlace: "Copernicus data for the open data community"

calendar icon
Documentación

Este informe que publica el European Data Portal (EDP) trata los siguientes temas. 

¿Cuáles son las necesidades de los reutilizadores de datos abiertos de las instituciones del sector público en Europa?. Esta pregunta es fundamental para facilitar la publicación de datos abiertos y el apoyo a los reutilizadores de las instituciones de la UE y las autoridades públicas de los Estados miembros en función de sus necesidades para la elaboración de políticas, la prestación de servicios y la gestión organizativa.

Este documento de debate ofrece una visión general del estado de los métodos e indicadores existentes en el panorama europeo de los datos abiertos para evaluar las necesidades de las instituciones públicas como reutilizadores de datos.

Esta visión general sirve de base para impulsar un debate con las partes interesadas del sector público sobre los métodos e indicadores adecuados para medir la demanda de datos de las instituciones públicas con el fin de fomentar la publicación de datos en función a dicha demanda.

El informe se encuentra disponible en este enlace: "Measuring Data Demand Within the Public Sector"

calendar icon
Documentación

Este informe que publica el European Data Portal (EDP)  trata los siguientes temas.

Hacer que los datos estén disponibles como datos abiertos en todos los Estados miembros de la UE es vital para aprovechar su potencial para la sociedad y la economía europea. Con el fin de aumentar el impacto de manera efectiva, los esfuerzos deben dirigirse a los conjuntos de datos que tienen el mayor potencial en la sociedad y la economía.

En la normativa sobre datos abiertos y reutilización de la información del sector público, se encarga a la Comisión Europea que adopte un reglamento de aplicación en el que se especifiquen los conjuntos de datos de alto valor.

La línea argumental desarrollada en este informe es paralela a lo que la Comisión ha realizado durante el primer trimestre de 2021, para preparar el reglamento de aplicación que incluye una lista de conjuntos de datos de alto valor. Este informe revisa la literatura pertinente, las decisiones políticas y las iniciativas nacionales para permitir una comprensión más profunda de la situación en torno a la evaluación del valor de los conjuntos de datos.

El informe se encuentra disponible en este enlace: "Conjuntos de datos de alto valor: entendiendo la perspectiva de los proveedores de datos"

calendar icon
Documentación

Este informe que publica el European Data Portal (EDP) explora los desarrollos e iniciativas existentes y emergentes en torno al intercambio de datos usando espacios de datos.

El objetivo es doble: identificar a los propietarios de datos abiertos que participan en la implantación de espacios de datos y reflexionar sobre el papel que podrían desempeñar los portales de datos abiertos (con especial atención a data.europa.eu) en esta implementación.

Tras realizarse una investigación documental y entrevistas con los promotores de espacios de datos, se analiza como data.europa.eu podría posicionarse en los espacios de datos comunes europeos que están surgiendo.

El informe se encuentra disponible en este enlace:  "Data.europa.eu y los espacios comunes de datos europeos: un informe sobre retos y oportunidades"

calendar icon
Documentación

Este informe que publica el European Data Portal (EDP) tiene como objetivo avanzar en el debate sobre la sostenibilidad a medio y largo plazo de las infraestructuras de los portales de datos abiertos.

Ofrece recomendaciones a los publicadores de datos abiertos y a los intemediarios de datos sobre cómo hacer que los datos abiertos estén disponibles y como promover su reutilización. Está basado en el trabajo realizado anteriomente por el equipo de data.europa.eu, en la investigación sobre la gestión de datos abiertos, y en la interacción entre los humanos y los datos.

Teniendo en cuenta las conclusiones, se proponen 10 recomendaciones para el aumento en la reutilización de los datos.

El informe se encuentra disponible en este enlace: " Principles and recommendations to make data.europa.eu data more reusable: A strategy mapping report "

calendar icon