El portal europeo de datos, data.europa.eu, ha publicado el Open Data Maturity Index de 2024, un informe anual que evalúa el nivel de madurez de los países europeos en materia de datos abiertos.
Para su elaboración, se ha realizado una encuesta a los 34 países participantes, incluidos los 27 Estados miembros de la Unión Europea, cuatro países candidatos (Bosnia y Herzegovina, Albania, Serbia y Ucrania) y tres países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza).
En la edición de este año, España obtiene una calificación total del 95% sobre 100%. Con ello se coloca en la sexta posición general. Tal y como se refleja en la siguiente imagen, un año más, España se sitúa en el grupo de los llamados países marcadores de tendencia (trendsetter) que son aquellos con mejores puntuaciones del ranking, y entre los que también se encuentran Francia, Polonia, Ucrania, Eslovaquia, Irlanda, Lituania, República Checa, Italia, Estonia y Chipre.
Figura 1: Grupos de países participantes en función de su puntuación global de madurez en datos abiertos
Por encima de la media de la UE27 en las cuatro dimensiones analizadas
La Dimensión Política, centrada en las políticas de datos abiertos de los distintos países, analiza la existencia de modelos de gobernanza nacional para la gestión de datos abiertos y las medidas que se han aplicado para implementar las estrategias existentes. En estos aspectos, España ha obtenido un 96% frente a la media europea, que se sitúa en 91%. Los aspectos más positivos que se identifican son:
- Alineamiento con las políticas europeas: El informe resalta que España está plenamente alineada con la Directiva europea relativa a los datos abiertos, entre otras de las recientes regulaciones ligadas al ámbito de los datos que han entrado en vigor.
- Planes de acción bien definidos: Se subrayan las estrategias desplegadas en diferentes administraciones públicas enfocadas a incentivar la publicación y reutilización de datos generados en tiempo real y datos provenientes de la ciudadanía.
- Fortalecimiento de competencias: Se focaliza en cómo España ha desarrollado programas formativos para mejorar las habilidades de los funcionarios públicos en gestión y publicación de datos abiertos, asegurando estándares de calidad y fomentando una cultura del dato en la administración pública.
La Dimensión Impacto analiza las actividades realizadas para supervisar y medir, tanto la reutilización de datos abiertos, como el impacto creado fruto de dicha reutilización. Año tras año, esta viene siendo la dimensión menos madura de toda Europa. Así, frente al 80% de media de la UE, España obtiene una puntuación del 100% por el desarrollo de numerosas actuaciones, entre las que destacan:
- Colaboración multisectorial: El informe subraya cómo nuestro país se presenta como ejemplo de interacción entre administraciones públicas, empresas privadas y la sociedad civil, materializada en ejemplos tales como los estrechos lazos ente el sector público y la Asociación Multisectorial de la Información (ASEDIE), que elabora año tras año el informe de ASEDIE sobre reutilización de la información del sector público.
- Ejemplos de reutilización en sectores clave: Se pone de manifiesto cómo España ha impulsado numerosos casos de reutilización de datos abiertos en áreas estratégicas como medio ambiente, movilidad y energía.
- Innovación en la comunicación: El documento destaca el esfuerzo invertido en estrategias de comunicación innovadoras para concienciar a la ciudadanía sobre el valor de los datos, y de forma especial a audiencias jóvenes. Se destacan, también la producción de podcasts con entrevistas a expertos en datos abiertos, acompañados de videos promocionales cortos
La Dimensión Portal se enfoca en analizar las funcionalidades de la plataforma nacional que permitan a los usuarios acceder a los datos abiertos e interaccionar dentro de la comunidad. Con un 96% frente al 82% de la EU27, España se posiciona como uno de los referentes europeos en la mejora de la experiencia de los usuarios y en la optimización de portales nacionales. Los aspectos más destacados en el informe son:
- Sostenibilidad y mejora continua: Según refleja el informe, España ha demostrado un fuerte compromiso con la sostenibilidad de la plataforma nacional de datos abiertos (datos.gob.es) y con su adaptación a las nuevas demandas tecnológicas.
- Interacción con los usuarios: Se subraya como una de las grandes fortalezas la promoción activa desde la plataforma de los datasets disponibles y de los canales a través de los cuales los usuarios pueden solicitar datos que no estén disponibles en el Catálogo Nacional.
Por último, la Dimensión Calidad examina los mecanismos para garantizar la calidad de los (meta)datos. Aquí España obtiene un 88% frente al 79% de la UE. España sigue destacando con iniciativas que garantizan la fiabilidad, accesibilidad y estandarización de los datos abiertos. Algunos puntos fuertes que pone de relieve el informe son:
- Automatización de metadatos: Se destaca el empleo de técnicas avanzadas para la recolección automática de metadatos, reduciendo la dependencia de procesos manuales y mejorando la precisión y la actualización en tiempo real.
- Guías para la calidad de datos y metadatos: España proporciona múltiples guías prácticas para mejorar la publicación y calidad de los datos abiertos, incluyendo técnicas de anonimización, publicación en formatos tabulares (CSV) y el uso de APIs.
Seguir innovando para mantener la posición avanza de España en la madurez de datos abiertos
Si bien España sigue destacando en la UE gracias a su ecosistema de datos abiertos, los esfuerzos deben continuar. Para ello, en el mismo informe se identifican líneas de trabajo para los países que, como España, buscan seguir manteniendo su posición avanzada en la madurez de datos abiertos y seguir innovando. Entre otras, se refieren las siguientes recomendaciones:
- Consolidar ecosistemas de datos abiertos: Fortalecer comunidades temáticas de proveedores y reutilizadores priorizando los conjuntos de datos de alto valor (HVDs) en su desarrollo y promoción.
- Impulsar la coordinación: Alinear la estrategia nacional con las necesidades de las agencias y autoridades locales.
- Desarrollar métricas de impacto específicas por país: Colaborar con universidades, instituciones de investigación y otras entidades para crear marcos de evaluación del impacto.
- Medir y divulgar el impacto de los datos abiertos: Realizar evaluaciones periódicas (anuales o bianuales) sobre el impacto económico, ambiental y social de los datos abiertos, promoviendo los resultados para generar apoyo político.
- Facilitar la participación de la comunidad de datos abiertos: Garantizar que los proveedores mejoren la publicación de datos según las opiniones y calificaciones de los usuarios.
- Incrementar la calidad de los datos y metadatos: Usar herramientas automatizadas y validaciones para mejorar los estándares de publicación, incluso adoptando tecnología de inteligencia artificial para optimizar la calidad de los metadatos.
- Promocionar casos de reutilización exitosos: Publicar y promover casos de éxito en el uso de datos abiertos, interactuar con proveedores y usuarios para identificar necesidades y aplicaciones innovadoras.
De manera general, el informe pone de manifiesto el buen avance en materia de datos abiertos en toda Europa. Aunque existen áreas de mejora, el panorama open data europeo se va consolidando, con España en las primeras posiciones de la tabla. Puedes leer el informe completo del Open Data Maturity Index 2024 aquí.
Los datos abiertos deben ser accesibles por naturaleza, es decir, deben estar disponibles de forma gratuita y sin barreras que puedan restringir su acceso y reutilización. La accesibilidad es una cuestión fundamental y compleja, ya que significa que estos conjuntos de datos no solo deben estar disponibles en formatos reutilizables, sino que cualquier persona debe poder acceder a ellos e interpretarlos.
Para que el acceso a la información de los datos abiertos sea democrático, estos deben cumplir unos criterios de accesibilidad fundamentales que afectan tanto al soporte (web) como a la forma en que se muestra su contenido (por ejemplo, a través de visualizaciones). En este contexto, este post profundiza en los principios esenciales para asegurar que los datos abiertos sean inclusivos y útiles para una audiencia diversa. Descubre recomendaciones dirigidas a mejorar la accesibilidad de los portales y plataformas de datos abiertos, así como buenas prácticas para la visualización de datos, con el foco puesto en la importancia de un diseño inclusivo que considere las necesidades de todos los usuarios.
Niveles de accesibilidad web
Si nos centramos en el soporte, los portales de datos abiertos pueden tomar como fuente de referencia en accesibilidad web las especificaciones que identifica World Wide Web Consortium (W3C), principal organización internacional de normalización y la estandarización de la Web, que establece pautas de accesibilidad que debe cumplir una web.
-
Perceptible: La información y los componentes de la interfaz de usuario deben presentarse a los usuarios de forma que puedan percibirlos, independientemente de las dificultades físicas o cognitivas que puedan tener.
-
Operable: Los componentes de la interfaz de usuario y la navegación deben ser manejables. Por lo tanto, los usuarios que utilicen el teclado en lugar del ratón deben poder interactuar correctamente con una página web, no debe imponerse a los usuarios un límite de tiempo para completar las interacciones y deben ofrecerse formas de navegar y encontrar contenidos fácilmente.
-
Comprensible: El texto debe ser claro y fácil de entender, la interfaz de usuario y la navegación deben ser coherentes y predecibles, y las páginas web deben ayudar a los usuarios cuando cometan errores al rellenar un formulario, por ejemplo.
-
Robusta: El contenido debe ser sólido para que lo interpreten con fiabilidad varios navegadores web y otros programas informáticos, como lectores de pantalla.
Para cada pauta existen criterios de conformidad que se pueden comprobar. Estos criterios se clasifican en tres niveles: A, AA, AAA.
Los niveles, de menos a más, son:
A. Mínimo: Todos los contenidos no textuales como imágenes y vídeos deben tener alternativa textual; los vídeos y audios deben tener subtítulos; se debe poder navegar por el contenido de la página sólo con el teclado; la página debe tener un título claro y un idioma asignado.
AA. Aceptable: Además de todos los requisitos del nivel A, se suman otras funcionalidades como, por ejemplo, los vídeos en directo deben tener también subtítulos; la relación de contraste entre el texto y el fondo debe ser al menos de 4,5:1; el texto debe ser redimensionable hasta el 200% sin perder contenido ni funcionalidad; no deben utilizarse imágenes de texto.
AAA. Óptimo: Este nivel exige todas las características de los niveles A y AA, junto a otros requisitos como la interpretación de vídeos en lengua de signos o la relación de contraste entre el texto y el fondo de al menos de 7:1.
Webs y visualizaciones de datos abiertos accesibles
Teniendo en cuenta las condiciones y recomendaciones que marca W3C, el Portal Europeo de Datos abiertos ofrece una Guía de Visualización de Datos que recoge las mejores prácticas de accesibilidad en la visualización de datos. Siguiendo las directrices que marca esta Guía, para respetar la inclusividad desde el diseño, una buena visualización de datos debe cumplir tres condiciones: que se pueda percibir, que se pueda entender y que se pueda adaptar.
- Que se pueda percibir: los colores deben estar adaptados para personas con problemas de visión, la fuente debe tener el tamaño y contraste adecuado.
- Que se pueda entender: la interfaz debe ser amigable para el usuario e intuitiva. Siempre y cuando sea posible, el gráfico debe ser comprensible independientemente de la formación del usuario.
- Que se pueda adaptar: la visualización debe ser responsive, es decir, que se adapte a las dimensiones de cada dispositivo electrónica, flexible, editable o con opciones de visualización para personas con discapacidad cognitiva.
Una vez hemos identificado estas tres condiciones, podemos analizar si nuestro gráfico cumple con ellas prestando atención a cuestiones como el uso de una paleta de color adecuada para personas con problemas de visión, que cuente con buen contraste y un título y texto entendible. También es recomendable que lleven un texto alternativo (adaptado a personas con discapacidad intelectual) e incluso, cuando se considere necesario, una guía de visualización para entender el gráfico.
Herramientas para mejorar la accesibilidad
Para emplear los principios de accesibilidad en la visualización de datos podemos hacer uso de tres recursos:
- Herramientas para auditar la accesibilidad: También es una buena práctica realizar auditorías de accesibilidad, por ejemplo, con Chartability que analiza los sitios web teniendo en cuenta todos los aspectos relacionado con la inclusión.
- HTML: Lenguaje de marcado fundamental de la web se desarrolló pensando en la accesibilidad, por lo que utilizar sus elementos de forma semánticamente correcta es una forma sencilla de garantizar un nivel básico de accesibilidad. Esto se aplica al contexto de una visualización (que debe utilizar elementos como encabezados y párrafos de forma correcta, por ejemplo), a los elementos interactivos (como enlaces, botones y entradas) y a los elementos de una visualización propiamente dicha. Es decir, siempre que sea posible es mejor ofrecer una visualización con html que en formato imagen (jpg o png). Cuando no sea posible, será necesario dotar de una alternativa accesible (un alternative text, como se mencionaba anteriormente).
- SVG: Los gráficos vectoriales escalables o gráficos vectoriales redimensionables (del inglés: Scalable Vector Graphics (SVG) es un formato de gráficos vectoriales bidimensionales, tanto estáticos como animados, en formato de lenguaje de marcado extensible XML (Extensible Markup Language), es decir que se compone por código y cuya especificación es un estándar abierto desarrollado por el W3C para generar gráficos accesibles.
- Datawrapper: Es una, entre numerosas herramientas de visualización de datos, que ofrece la posibilidad de probar paletas de colores accesibles, así como escribir una descripción alternativa, entre otras funciones relacionadas con la accesibilidad.
En resumen, la visualización de datos es un método para hacer más accesible un conjunto de datos y sus visualizaciones. Tener en cuenta estos consejos sobre accesibilidad e incorporarlos por defecto en el diseño a la hora de presentar visualmente un conjunto de datos enriquecerá el resultado y permitirá que llegue a una audiencia más amplia.
Contenido elaborado a partir de la Guía de Visualización de Datos de El Portal Europeo de Datos Abiertos: https://data.europa.eu/apps/data-visualisation-guide/accessibility-of-data-visualisation
El Observatorio de Casos de Uso (Use Case Observatory, en inglés) es una iniciativa liderada por data.europa.eu, el Portal Europeo de Datos Abiertos. Se trata de un proyecto de investigación sobre el impacto económico, gubernamental, social y medioambiental de los datos abiertos. El proyecto se prolongará durante tres años, desde 2022 hasta 2025, en los que el Portal Europeo de Datos realizará el seguimiento de 30 casos de reutilización de datos abiertos e irá publicando conclusiones en entregas periódicas.
En 2022 hizo un primer informe y ahora, en abril de 2024, ha presentado el volumen 2 del análisis exploratorio en torno al uso de los datos abiertos. En esta segunda entrega, analiza trece de los casos de uso iniciales que permanece en estudio, tres de ellos españoles, y expone, a modo de conclusiones, los siguientes puntos:
- El documento subraya en primer lugar el alto potencial de la reutilización de datos abiertos.
- Destaca que muchas organizaciones y aplicaciones deben su propia existencia a los datos abiertos.
- Asimismo, señala la necesidad de liberar de forma más amplia, el impacto potencial de los datos abiertos en la economía, la sociedad y el medio ambiente.
- Para lograr el punto anterior, señala el apoyo continuo a la comunidad de reutilización como crucial para identificar oportunidades de crecimiento financiero.
Los tres casos españoles: UniversiDATA-Lab, Tangible Data y Planttes
Para seleccionar los casos de uso, el Observatorio realizó un inventario basado en tres fuentes: los ejemplos recogidos en los estudios de madurez que realiza cada año el portal europeo, las soluciones participantes en el EU Datathon y los ejemplos de reutilización disponibles en el repositorio de casos de uso de data.europa.eu. Solo se tuvieron en cuenta aquellos proyectos desarrollados en Europa, intentando mantener un equilibrio entre los distintos países.
Además, se destacaron aquellos proyectos que hubiesen obtenido algún premio o que estuviesen alineados con las prioridades de la Comisión Europea para 2019 a 2024. Para finalizar la selección, desde data.europa.eu se realizaron entrevistas con representantes de los casos de uso que cumplían los requisitos y que estaban interesados en participar en el proyecto.
En esta segunda ocasión, el nuevo informe reseña un proyecto del área de impacto económico, tres del ámbito gubernamental, seis del área social y cuatro medioambientales.
Tanto en el primer volumen como en este, destaca tres casos españoles: UniversiDATA-Lab y Tangible Data, del ámbito social y Planttes, en la categoría de medioambiente.
UniversiDATA-Lab, la unión de seis universidades en torno a los datos abiertos
En el caso de UniversiDATA-Lab está enfocado en la educación superior. Es un portal público para el análisis avanzado y automático de los conjuntos de datos publicados por las seis universidades españolas que forman parte del portal UniversiDATA: la Universidad Autónoma de Madrid (UAM), la Universidad Carlos III de Madrid, la Universidad Complutense de Madrid (UCM), la Universidad de Huelva, la Universidad de Valladolid (UVa) y la Universidad Juan Carlos I.
El objetivo de UniversiDATA-Lab es transformar los análisis estáticos de la sección del portal en resultados dinámicos. El informe del Observatorio señala que este proyecto “fomenta el uso de recursos compartidos” entre los distintos centros universitarios. También destaca como impacto reseñable la puesta en marcha de aplicaciones web dinámicas que leen en tiempo real el catálogo de UniversiDATA, obtienen todos los datos disponibles y realizan análisis de datos en línea.
Respecto al informe anterior, elogia su “esfuerzo considerable para convertir datos intrincados en información de fácil manejo”, además de señalar que este proyecto proporciona documentación detallada para ayudar a los usuarios a comprender la naturaleza de los datos analizados.
Tangible Data, haciendo comprensibles los datos espaciales
En el caso de Tangible Data, se trata de un proyecto que transforma los datos de su contexto digital a un contexto físico mediante la creación de esculturas de datos en el espacio público. Estas esculturas de datos ayudan a las personas que carecen de ciertas competencias digitales a comprenderlos. Para ello, utiliza como fuentes de datos los de organismos internacionales (por ejemplo, NASA, Banco Mundial) y otras plataformas similares.
En este segundo volumen destacan su evolución “significativa”, ya que desde el pasado año el proyecto ha pasado de realizar pruebas de producto mínimo viable a la entrega de proyectos integrales. Esto les ha permitido “explorar oportunidades comerciales y educativas, como exposiciones, talleres, etc.”, tal y como se extrapola de las entrevistas realizadas. Además, los cuatro procesos clave (diseño, creación, entrega y medición) se han estandarizado y han hecho que el proyecto sea globalmente accesible y rápidamente desplegable.
Planttes, iniciativa medioambiental que se cuela en el Observatorio
El tercer ejemplo español, Planttes, es una aplicación de ciencia ciudadana que informa a los usuarios sobre qué plantas están en flor y si esto puede afectar a las personas alérgicas al polen. Utiliza los datos abiertos del Punto de información sobre aerobiología (PIA-UAB), entre otros, que complementa con datos que aportan los usuarios para crear mapas personalizados.
De este proyecto, el Observatorio señala que, aprovechando la participación de la comunidad y la tecnología, “la iniciativa ha logrado avances significativos en la comprensión y mitigación del impacto de las alergias al polen con el compromiso de fomentar la concienciación y la educación en los años venideros”.
Respecto al trabajo desarrollado, señala que Planttes ha evolucionado pasando de ser una aplicación móvil a una aplicación web con el fin de mejorar la accesibilidad. El objetivo de esta transición es facilitar a los usuarios el uso de la plataforma sin las limitaciones de las aplicaciones móviles.
El Observatorio de Casos de Uso entregará su tercer volumen en el año 2025. Su razón de ser se enmarca más allá de analizar y reseñar los logros alcanzados y los retos presentes. Al tratarse de un proyecto continuo durante tres años, permitirá extrapolar ideas concretas para mejorar las metodologías de evaluación del impacto de los datos abiertos.
La Infraestructura de Pruebas para el Análisis de Datos (BDTI, por sus siglas en inglés, Big Data Test Infrastructure) es una herramienta financiada por el Programa Digital Europeo, que permite a las administraciones públicas realizar análisis con datos abiertos y herramientas de código abierto con el fin de impulsar la innovación.
Esta herramienta, alojada en la nube y de uso gratuito, se creó en 2019 para acelerar la transformación digital y social. Con este planteamiento y siguiendo también la Directiva Europea de Datos Abiertos, la Comisión Europea llegó a la conclusión de que, para lograr un impulso digital y económico, debía aprovecharse el poder de los datos de las administraciones públicas; es decir, aumentar su disponibilidad, calidad y usabilidad. Es así como nace BDTI, con el propósito de fomentar la reutilización de esta información proporcionando un entorno de prueba de análisis gratuito que permite a las administraciones públicas crear prototipos de soluciones en la nube antes de implementarlas en el entorno de producción de sus propias instalaciones.
¿Qué herramientas ofrece BDTI?
Big Data Test Infrastructure ofrece a las administraciones públicas europeas un conjunto de herramientas estándar de código abierto para el almacenamiento, procesamiento y análisis de sus datos. La plataforma consta de máquinas virtuales, clústeres de análisis e instalaciones de almacenamiento y de red. Las herramientas que ofrece son:
- Bases de datos: para almacenar datos y realizar consultas sobre los datos almacenados. El BDTI incluye actualmente una base de datos relacional (PostgreSQL), una base de datos orientada a documentos (MongoDB) y una base de datos gráfica (Virtuoso).
- Lago de datos: para almacenar grandes cantidades de datos estructurados y sin estructurar (MinIO). Los datos en bruto no estructurados se pueden procesar con configuraciones desplegadas de otros bloques de construcción (componentes BDTI) y almacenarse en un formato más estructurado dentro de la solución de lago de datos.
- Entornos de desarrollo: proporcionan las capacidades informáticas y las herramientas necesarias para realizar actividades estándar de análisis de datos sobre datos que provienen de fuentes externas, como lagos de datos y bases de datos.
- JupyterLab, un entorno de desarrollo interactivo y online para crear cuadernos Jupyter, código y datos.
- Rstudio, un entorno de desarrollo integrado para R, un lenguaje de programación para computación estadística y gráficos.
- KNIME, una plataforma de análisis, informes e integración de datos de código abierto que cuenta con componentes para el aprendizaje automático y la minería de datos, que se puede utilizar para todo el ciclo de vida de la ciencia de datos.
- H2O.ai, una plataforma de aprendizaje automático (machine learning o ML) e inteligencia artificial (IA) de código abierto diseñada para simplificar y acelerar la creación, el funcionamiento y la innovación con ML e IA en cualquier entorno.
- Procesamiento avanzado: también se pueden crear clústeres y herramientas para procesar grandes volúmenes de datos y realizar operaciones de búsqueda en tiempo real (Apache Spark, Elasticsearch y Kibana
- Visualización: BDTI también ofrece aplicaciones para visualizar datos como Apache Superset, capaz de manejar datos a escala de petabytes o Metabase.
- Orquestación: para la automatización de los procesos basados en datos durante todo su ciclo de vida, desde la preparación de datos hasta la toma de decisiones basadas en ellos y la realización de acciones basadas en esas decisiones, se ofrece:
- Apache Airflow, una plataforma de gestión de flujos de trabajo de código abierto que permite programar y ejecutar fácilmente canalizaciones de datos complejas.
A través de estas herramientas que se encuentran en entorno nube, los trabajadores públicos de países de los países de la UE pueden crear sus propios proyectos piloto para demostrar el valor que los datos pueden aportar a la innovación. Una vez finalizado el proyecto, los usuarios tienen la posibilidad descargar el código fuente y los datos para continuar el trabajo por sí mismos, utilizando entornos de su elección. Además, la sociedad civil, la academia y el sector privado pueden participar en estos proyectos piloto, siempre y cuando haya una entidad pública involucrada en el caso de uso.
Casos de éxito
Estos recursos han posibilitado la creación de proyectos diversos en diferentes países de la UE. En la web de BDTI, se recogen algunos ejemplos de casos de uso. Por ejemplo, Eurostat llevó a cabo un proyecto piloto en el que se utilizaron datos abiertos de anuncios de empleo en internet para mapear la situación de los mercados laborales europeos. Otros casos de éxito fue la optimización de la contratación pública por parte de la Agencia Noruega de Digitalización, los esfuerzos de intercambio de datos por parte de la European Blood Alliance y el trabajo para facilitar la comprensión del impacto de COVID-19. sobre la ciudad de Florencia .
En España, BDTI hizo posible un proyecto de minería de datos en la Conselleria de Sanitat de la Comunidad Valenciana. Gracias a BDTI se pudieron extraer conocimientos de la enorme cantidad de artículos clínicos científicos; una tarea que apoyó a clínicos y gestores en sus prácticas clínicas y en su trabajo diario.
Cursos, boletín y otros recursos
Además de publicar casos de uso, la web Big Data Test Infrastructure ofrece un curso online y gratuito para aprender a sacar el máximo partido a BDTI. Este curso se centra en un caso de uso altamente práctico: analizar la financiación de proyectos verdes e iniciativas en regiones contaminadas de la UE, utilizando datos abiertos de data.europa.eu y otras fuentes abiertas.
Por otro lado, recientemente se ha lanzado una newsletter de envío mensual sobre las últimas noticias de BDTI, buenas prácticas y oportunidades de análisis de datos para el sector público.
En definitiva, la reutilización de los datos del sector público (RISP) es una prioridad para la Comisión Europea y BDTI (Big Data Test Infrastructure) una de las herramientas que contribuyen a su desarrollo. Si trabajas en la administración pública y te interesa utilizar BDTI regístrate aquí.
Para cumplir con la Directiva (UE) 2019/1024 y su posterior reglamento de ejecución, los estados miembros de la Unión Europea están trabajando en la puesta a disposición de los llamados datos de alto valor (high-value dataset o HVD, en inglés). El objetivo es que ciudadanos y empresas puedan acceder a dichos datos bajo unos requisitos técnicos que favorezcan su reutilización y su impacto positivo en la sociedad, la economía y el medio ambiente.
La apertura de estos conjuntos de datos supone un gran reto para las administraciones públicas de todos los países de la Unión Europea. Aunque muchos de estos datos ya están a disposición de los usuarios, los países deben identificarlos para poder informar sobre ellos y resolver la alta heterogeneidad en los formatos, estructuras y semánticas. En concreto, a partir de febrero de 2025, los Estados miembros tendrán que informar a la Comisión cada dos años sobre los conjuntos de datos de alto valor disponibles, incluyendo los enlaces a las condiciones de las licencias y las API.
Para ayudar en esta tarea, el Portal Europeo de Datos ha publicado el informe “Report on Data Homogenisation for High-value Datasets” donde propone un enfoque metodológico para facilitar la identificación y homogeneización de los HVD. Entre otras cuestiones, el informe ofrece ejemplos de estándares que ayudan a conseguir una mayor interoperabilidad no solo entre datos, sino también entre las aplicaciones que los utilizan.
Un método para la identificación y homogeneización
El informe describe una aproximación metodológica basada en tres pasos:
- La identificación de los HVD en los portales de datos ya existentes. Aunque existen algunas pautas para la publicación de HVD, como estas para aplicar DCAT-AP, la forma de nombrar a los conjuntos de datos ya publicados no es uniforme, lo que hace difícil encontrarlos. El informe propone un protocolo que consiste en definir palabras clave, partiendo de los conjuntos de datos y sus atributos asociados, contenidos en el anexo I del Reglamento de Ejecución. Se trata de utilizar dichas palabras clave para buscar en los distintos portales de datos ya existentes. El informe explica cómo se ha testeado el protocolo de identificación con conjuntos de datos de las categorías de registros empresariales, datos estadísticos y datos sobre redes de transporte, incluyendo tablas con las palabras clave utilizadas.
- Localización o desarrollo de modelos de datos, ontologías, vocabularios controlados y/o API comunes. En esta sección, el informe describe algunos recursos de utilidad, los cuales se resumen en la siguiente tabla:
Recurso | Descripción | Categoría de datos en las que más pueden ayudar, según el informe |
---|---|---|
Directiva Inspire | Características que debe tener la información espacial y sus metadatos. |
|
Especificaciones de datos de la Directiva Inspire (data specifications) |
Modelos, esquemas y reglas de codificación para diferentes áreas temáticas de datos espaciales.
|
|
Servicios de red de Inspire (network services) | Conjunto de interfaces comunes para servicios web que permiten el descubrimiento, visualización, descarga y transformación de datos espaciales. |
|
Directrices técnicas para los metadatos de Inspire (Inspire technical guidelines for metadata) |
Directrices técnicas para metadatos, con los elementos mínimos a incluir definidos en el Reglamento 1205/2008 de la Comisión. |
|
Geo-DCATAP | Extensión del perfil de aplicación DCAT para describir conjuntos de datos geoespaciales. |
|
Core Location Vocabulary | Modelo de datos simplificado que incluye las características fundamentales de una ubicación, representada como una dirección o nombre geográfico, o a través de geometría. |
|
General Multilingual Environmental Thesaurus (GEMET). | Vocabulario controlado especializado en información medioambiental. Dispone de una sección de conceptos ligados con las categorías de datos espaciales incluidas en Inspire. |
|
Semantic Sensor Network | Recomendación del W3C para describir los sensores y sus observaciones. |
|
Quantity, unit, dimension and type (QUDT). | Conjunto de ontologías que definen clases básicas, propiedades y restricciones utilizadas para modelar magnitudes físicas, unidades de medida y sus dimensiones en diversos sistemas de medición. |
|
Lista de clasificaciones estadísticas de Eurostat | Clasificaciones estadísticas mantenidas por Eurostat, disponibles como Linked Open Data en XKOS, la extensión de SKOS para modelar clasificaciones estadísticas. Se presentan por familia de clasificación, categorizadas por ámbito estadístico y subdominios (por ejemplo, NACE para la actividad económica, la cual describiremos más adelante). |
|
Listas de códigos estándar de Eurostat | Conjuntos predefinidos y organizados de elementos que presentan conceptos estadísticos mediante códigos únicos |
|
Statistical Data and Metadata eXchange (SDMX) | Iniciativa mundial para normalizar y armonizar el intercambio de datos y metadatos estadísticos. Ofrece normas técnicas (el modelo de información SDMX), directrices, una arquitectura informática, herramientas y una serie de tutoriales para ayudar a los usuarios. |
|
RDF Data Cube Vocabulary | Ontología para describir datos multidimensionales, como las estadísticas, que se basa en el núcleo del modelo de información SDMX 2.0. |
|
Core Business Vocabulary | Mencionado por el propio reglamento, consiste en un modelo de datos simplificado que captura las características fundamentales de una entidad jurídica, como su nombre legal, actividad o dirección. |
|
Código NACE | Códigos para la clasificación de actividades económicas en la Unión Europea. Su revisión NACE 2 fue publicada por la Comisión Europea en octubre de 2022 |
|
Organization ontology | Ontología del W3C para apoyar la publicación de datos enlazados relativos a información organizativa, es decir, proporciona una serie de formas de representar la relación entre las personas y las organizaciones, junto con la estructura de información interna de una organización. |
|
Global Legal Entity Identifier Foundation | Base de datos centralizada con información sobre las personas jurídicas que participan en los mercados financieros mundiales. Asigna a cada entidad un código único de Identificador de Personas Jurídicas (Legal Entity Identifier o LEI) reconocido a escala mundial. |
|
Taxonomía NST | Sistema de clasificación para las mercancías transportadas a través de carretera, ferrocarril, vías navegables interiores y mar. Tiene en cuenta la actividad económica asociada al origen de las mercancías. |
|
Tabla de autoridades de "Transport service" | Lista de códigos de los distintos tipos de servicios de transporte facilitada por la sección de Vocabularios de la UE. |
|
Fuente: Report on Data Homogenisation for High-value Datasets
El informe también menciona algunos modelos a utilizar en el ámbito de ciudades inteligentes, como Smart Data Models y la española Ciudades Abiertas.
- La aplicación de dichos modelos. El último paso es la armonización real de los datos. Una vez seleccionados los modelos a utilizar, es el momento de aplicarlos. En esta fase se realizarán los procesos de conversión necesarios para proporcionar los datos en los formatos adecuados y con metadatos de calidad unificados. La forma de aplicar estas transformaciones variará en función del resultado final previsto. Por ejemplo, puede consistir en transformar datos tabulares (valores separados por comas o CSV, Excel, bases de datos relacionales, etc.) en otras fuentes de datos también tabulares pero que sigan la estructura proporcionada en los modelos de datos comunes. También se puede ir más allá y transformarlos en representaciones basadas en árboles (como JSON) o en RDF de acuerdo con las ontologías y vocabularios controlados que se seleccionen.
Conclusiones del informe
El informe finaliza con una serie de conclusiones y recomendaciones. Todavía existen retos en torno a la identificación de los HVD y la aplicación del Reglamento de ejecución en todos los países europeos, sobre todo a la hora de concienciar y difundir sobre su importancia. En las categorías de HVD en las que existen grandes iniciativas de armonización de datos, como Inspire sobre datos geoespaciales o Eurostat sobre HVD estadísticos, podemos encontrar una mayor cantidad de datos disponibles de manera interoperable y armonizada. Por el contrario, en las categorías en las que no existe una iniciativa adoptada de forma mayoritaria, como las empresas y la propiedad de las empresas, aún queda camino por recorrer para aplicar el reglamento.
Las recomendaciones que plantea el informe del Portal Europeo de Datos ayudan a configurar una hoja de ruta para publicar los conjuntos de datos de alto valor en cada una de las categorías definidas por la Comisión Europea. Un reto que las administraciones deberán abordar durante 2024 y que facilitará la reutilización de la información pública.
El Portal europeo de datos, data.europa.eu, acaba de hacer público su Data Maturity Index, un índice donde cada año se evalúa el nivel de madurez de los países europeos en materia de datos abiertos. Para su elaboración, se ha realizado una encuesta de evaluación que ha sido completada por 35 países, incluidos los 27 Estados miembros de la Unión Europea, tres países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza) y cinco países candidatos (Bosnia y Herzegovina, Montenegro, Albania, Serbia y Serbia y Ucrania)
En la edición de este año, España obtiene una calificación del 95% sobre 100%. Con ello se coloca en la quinta posición general y en la cuarta si se tienen en cuenta únicamente los países miembro de la Unión Europea (EU27). Este dato supone una mejora de tres puntos porcentuales con respecto a su calificación del pasado año y la sitúa 12 puntos por encima de la media de la EU27 (83%).
Las primeras posiciones del ranking las ocupan Francia, Polonia, Ucrania y Estonia.
Por encima de la media de la UE27 en todas las dimensiones analizadas
El índice se acompaña de un informe donde se recoge el análisis realizado y se muestra una visión general de las buenas prácticas aplicadas en Europa. En el caso de España, se encuentra por encima del promedio de la UE-27 en los cuatro indicadores analizados:
-
Política, centrado en las políticas de datos abiertos de los distintos países. En él se analiza la existencia de modelos de gobernanza nacional para la gestión de datos abiertos y las medidas que se han aplicado para implementar las estrategias existentes. Es el indicador en el que España obtiene una mayor puntuación, con un 99% frente al 89% de la UE27. El informe destaca cómo la estrategia nacional de datos abiertos del país ayuda a promover la apertura de la información pública a través de acciones innovadoras y estructuradas en colaboración con socios públicos y privados. Entre otras cuestiones, la estrategia incluye el objetivo de identificar modelos de negocio y casos de éxito empresarial para compartir prácticas exitosas. El informe también resalta la existencia de diversas estrategias digitales que complementan las políticas específicas sobre datos abiertos, como la estrategia nacional de inteligencia artificial, que incluye disposiciones relacionadas con la disponibilidad de datos abiertos para el funcionamiento y la formación de sistemas de inteligencia artificial.
-
Impacto, que analiza las actividades realizadas para supervisar y medir tanto la reutilización de datos abiertos como el impacto creado por dicha reutilización. De manera tradicional, esta ha sido la dimensión menos madura de toda Europa. No obstante, España obtiene una puntuación de 96% frente al 77% de la UE27. Los mejores resultados se consiguen en la medición de impacto de casos de uso de datos abiertos en los sectores de medio ambiente, economía y política.
-
Portal, enfocada en evaluar las funcionalidades de la plataforma nacional que permiten a los usuarios acceder a los datos abiertos y ayudan a impulsar la interacción dentro de la comunidad. Con un 96% frente al 85% de la EU27, España destaca en el uso de herramientas analíticas para conocer el comportamiento del usuario, y en la implementación de estrategias para garantizar la sostenibilidad del portal y el aumento de su visibilidad, incluyendo la presencia en las redes sociales. También se resalta la existencia de un área privada que permite a los editores actuar en función del feedback recibido.
-
Calidad, que examina los mecanismos para garantizar la calidad de los (meta)datos. Aquí España obtiene un 88% frente al 82% de la UE27. La puntuación de España está impulsada por el cumplimiento de la norma DCAT-AP (ofreciendo materiales didácticos para publicadores), la existencia de un planteamiento sistemático para garantizar que los metadatos estén actualizados y la amplia gama de datos ofrecidos, tanto históricos como actuales.
El informe también mide cómo están avanzando los países de la EU27 en la aplicación del Reglamento de ejecución sobre conjuntos de datos de gran valor. En este apartado, España se encuentra en novena posición, con un 68% de ejecución. En general, los Estados miembros están haciendo más progresos en los conjuntos de datos geoespaciales y estadísticos. También se está avanzando en los requisitos técnicos y jurídicos subyacentes.
Recomendaciones generales
El informe recoge una serie de recomendaciones para España, entre otros países, que incluyen fomentar el desarrollo de iniciativas a nivel local y regional, impulsando una mejor coordinación entre equipos, y activar la red de responsables de datos abiertos para que pongan en marcha actividades de seguimiento dentro de sus organizaciones. También se hace hincapié en la necesidad de promover los cursos de datos abiertos existentes e impulsar nuevos materiales formativos, prestando especial atención a desarrollar conciencia estratégica sobre la reutilización y el impacto de los datos abiertos.
De manera general, el informe pone de manifiesto el buen avance en materia de datos abiertos en toda Europa. Aunque existen áreas de mejora, el panorama open data europeo se va consolidando, con España en las primeras posiciones de la tabla.
En 2024, las nuevas oleadas de aplicación de la estrategia europea de datos plantearán a los equipos nacionales nuevos retos. Por un lado, estos deberán redoblar sus esfuerzos para informar a los ciudadanos de las nuevas fuentes de datos surgidas a raíz de iniciativas como la Ley de Gobernanza de Datos y los espacios de datos. En este sentido, será necesaria la coordinación entre las nuevas figuras surgidas de dichos desarrollos legislativos y el tradicional mundo de los datos abiertos, potenciando las evidentes sinergias entre ambos para impulsar la economía del dato y colectivizar el valor generado.
Los datos abiertos son una fuente de conocimiento muy valiosa para nuestra sociedad. Gracias a ellos, se pueden crear aplicaciones que contribuyen al desarrollo social y soluciones que ayudan a configurar el futuro digital de Europa y alcanzar los Objetivos de Desarrollo Sostenible (ODS).
El portal de datos abiertos europeo (data.europe.eu) organiza eventos en línea para poner en valor aquellos proyectos que se han llevado a cabo con fuentes de datos abiertos y han ayudado a hacer frente a alguno de los retos a los que nos enfrentamos como sociedad: desde la lucha contra el cambio climático, el impulso de la economía, la consolidación de la democracia europea o la transformación digital.
En lo que llevamos de año, en 2023 se han celebrado cuatro seminarios para analizar el impacto positivo que tienen los datos abiertos en cada una de las temáticas mencionadas. Todo el material que se presentó en los eventos está publicado en el portal europeo y las grabaciones están disponibles en su canal de Youtube, al alcance de cualquier usuario interesado.
En este post, realizamos un primer repaso de los casos de uso presentados en materia de impulso a la economía y a la democracia, así como los conjuntos de datos abiertos que se emplearon para su desarrollo.
Soluciones que impulsan la economía y el estilo de vida europeo
En un mundo en constante evolución, donde los desafíos económicos y las aspiraciones de un estilo de vida próspero convergen, la Unión Europea ha demostrado una capacidad inigualable para forjar soluciones innovadoras que no solo impulsan su propia economía, sino que también elevan el estándar de vida de sus ciudadanos. En este contexto, los datos abiertos han jugado un papel fundamental en el desarrollo de aplicaciones que han dado respuesta a desafíos actuales y han sentado las bases para un futuro próspero y prometedor. Dos de estos proyectos se presentaron en el segundo webinar de la serie “Stories of use cases”, un evento sobre “Datos abiertos para fomentar la economía y el estilo de vida europeo”: UNA WOMEN y YouthPOP.
El primero de ellos se centra en solucionar uno de los retos más relevantes que debemos superar para lograr una sociedad justa: la desigualdad de género. La eliminación de la brecha de género es un problema social y económico muy complejo. Según estimaciones del Foro Económico Mundial, se necesitarán 132 años para lograr la paridad de género total en Europa. La aplicación UNA Women nace con el propósito de reducir esa cifra, asesorando a las mujeres jóvenes para que puedan tomar mejores decisiones a la hora de elegir su futuro en cuanto a educación y primeros pasos en sus carreras profesionales. En este caso de uso, la empresa ITER IDEA ha utilizado más de 6 millones de líneas de datos procesados de distintas fuentes, como data.europa.eu, Eurostat, Censis, Istat (Instituto nacional de estadística de Italia) o NUMBEO.
El segundo caso de uso presentado también va dirigido a la población joven. Se trata de la aplicación YouthPOP (Youth Públic Open Procurement), una herramienta que anima a los jóvenes a participar en procesos de contratación pública. Para el desarrollo de esta app se han utilizado datos de data.europa.eu, Eurostat y ESCO, entre otros. Youth POP tiene entre sus objetivos mejorar el empleo juvenil y contribuir al correcto funcionamiento de la democracia en Europa.
Datos abiertos para impulsar y consolidar la democracia europea
En esta línea, el uso de los datos abiertos también contribuye a fortalecer y consolidar la democracia europea. Los datos abiertos desempeñan un papel fundamental en nuestras democracias a través de las siguientes vías:
- Proporcionando a los ciudadanos información confiable.
- Fomentando la transparencia en los gobiernos e instituciones públicas.
- Combatiendo la desinformación y las noticias falsas.
El tema del tercer webinar organizado por datos.europa.eu sobre casos de uso es “Datos abiertos y un nuevo impulso a la democracia europea”, evento en el que se presentaron dos soluciones innovadoras: EU Integrity Watch y EU Institute For Freedom of Information.
En primer lugar, EU Integrity Watch es una plataforma que proporciona herramientas en línea para que los ciudadanos, periodistas y la sociedad civil monitoricen la integridad de las decisiones tomadas por los políticos en la Unión Europea. Esta web ofrece visualizaciones para comprender la información y pone a disposición los datos recopilados y analizados. Los datos analizados se utilizan en divulgaciones científicas, investigaciones periodísticas y otros ámbitos, lo que contribuye a un gobierno más abierto y transparente. Esta herramienta procesa y ofrece datos de Transparency register.
La segunda iniciativa presentada en el webinar sobre democracia con datos abiertos es el EU Institute For Freedom of Information (IDFI), una organización no gubernamental georgiana que se centra en actividades de vigilancia y supervisión de las acciones del gobierno, revelando infracciones y manteniendo informada a la ciudadanía.
Las principales actividades del IDFI incluyen solicitar información pública a los organismos pertinentes, elaborar clasificaciones de organismos públicos, monitorizar los sitios web de dichos organismos y abogar por la mejora del acceso a la información pública, los estándares legislativos y las prácticas relacionadas. Este proyecto obtiene, analiza y presenta conjuntos de datos abiertos procedentes de instituciones públicas nacionales.
En definitiva, los datos abiertos hacen posible el desarrollo de aplicaciones para reducir la brecha laboral de género, impulsar el empleo juvenil o vigilar las acciones de gobierno. Estos son solo algunos ejemplos del valor que pueden ofrecer los datos abiertos a la sociedad.
Conoce más sobre estas aplicaciones en sus seminarios -> Grabaciones aquí
Este informe recoge varias temáticas relevantes para la comunidad europea de datos geoespaciales.
Por un lado, el capítulo dedicado a la "modernización INSPIRE y avance hacia los datos abiertos" trata la evaluación realizada por la Comisión Europea de la directiva INSPIRE y cómo ésta debe avanzar en un futuro próximo. Entre otras conclusiones, determina la oportunidad de simplificación técnica para favorecer una mayor interoperabilidad, además de la necesaria convergencia con la Directiva 2019/1024 sobre datos abiertos, incidiendo en la importancia de puesta a disposición de datos de alto valor (HVDs). En este sentido, el informe incluye una valoración sobre qué temas de datos Inspire son considerados HVDs.
La segunda temática gira en torno al "papel de la información geoespacial para las ciudades inteligentes", donde los datos completos, actualizados y con referencia geoespacial, son considerados un activo fundamental en los proyectos de ciudades inteligentes.
En tercer lugar, el informe recoge un avance de situación sobre determinados aspectos clave analizados en un informe anterior (2021), relacionados, entre otras cuestiones relevantes, con la disponibilidad de OGC API endpoints o el descubrimiento de servicios de streaming de datos procedentes de las APIs de SensorThings.
Por último, el documento, a modo de conclusión, detalla hoja de ruta de potencial interés para el portal de datos europeo de cara a seguir avanzando para mejorar la disponibilidad de información geoespacial.
Este informe se encuentra disponible en el siguiente enlace: "Tendencias geoespaciales 2022: Oportunidades para data.europa.eu a partir de las tendencias emergentes en la comunidad geoespacial"
A lo largo del pasado año, la sección académica de data.europa.eu amplió su oferta formativa sobre datos abiertos publicando nuevas conferencias, cursos y talleres. Así, data.europa.academy compartió un total de 15 webinars relacionados con los datos abiertos, los espacios de datos y otras temáticas y cuestiones técnicas que giran en torno a la economía del dato.
Siguiendo la filosofía de formación online presente en este ámbito de expertise, los profesionales y usuarios interesados en los datos abiertos han podido asistir a las conferencias desde cualquier lugar de la UE, ya que tan solo se requería rellenar un formulario de inscripción vía web.
Entre los webinars del recién concluido 2022 encontramos workshops y seminarios sobre la calidad de los datos abiertos y los metadatos, la perspectiva legal y técnica de la apertura de los datos abiertos, el potencial de los datos abiertos en tiempo real o las oportunidades que estos ofrecen a los ciudadanos a la hora de desarrollar soluciones y servicios.
De esta forma, el abanico de contenidos es muy amplio desde el punto de vista de la temática y el nivel de accesibilidad técnica, lo que facilita el filtrado de los webinars en función de los intereses. Además, como buena parte de las formaciones proceden de informes previamente publicados por el portal de datos europeos, estas cuentan con una documentación de apoyo muy útil a la hora de completar los conocimientos adquiridos.
Con el objetivo de recoger de manera ordenada esta valiosa fuente de conocimiento, a continuación, podrás acceder a las 15 conferencias publicadas a lo largo del pasado año, así como a sus respectivas presentaciones de apoyo.
Calidad de datos y metadatos
- Descripción: Este webinar hace hincapié en explicar por qué los datos y metadatos de alta calidad son la base para obtener resultados beneficiosos en el ámbito productivo, así como para fomentar la toma de decisiones con conocimiento de causa.
- Enlace al visionado: https://www.youtube.com/watch?v=PcyJX8xbyik
Mejores prácticas de datos abiertos: el caso de Estonia, Eslovenia y Ucrania
- Descripción: A través de esta conferencia, desde el portal europeo tratan de explicar la importancia y el impacto que puede llegar a tener la reutilización de datos abiertos. Para ello, recurren a la exposición de buenas prácticas y casos de uso de varios portales europeos basados en este tipo de datos.
- Enlace al visionado: https://www.youtube.com/watch?v=mTVayKTUC-s
Datos en tiempo real
Descripción: Este curso se detiene a explicar qué son los datos en tiempo real y cuáles son los estándares y tecnologías más utilizadas con este tipo de datos.
Enlace al visionado: https://www.youtube.com/watch?v=yl4ZotQQfuk
Demanda y reutilización de datos en el sector público
- Descripción: Este seminario web ofrece una introducción a la reutilización de datos por parte de las instituciones públicas, a la par que pone el foco en la importancia de atender y medir la demanda de datos por parte de este grupo específico de usuarios.
- Enlace al visionado: https://www.youtube.com/watch?v=uTd7Ti0aQNA&t=752s
Oportunidades y retos de los datos generados por los ciudadanos
- Descripción: Este seminario explora cómo los datos generados por los ciudadanos están actualmente disponibles en portales de datos abiertos de diferentes niveles de las administraciones públicas en Europa.
- Enlace al visionado: https://www.youtube.com/watch?v=4FHaerYTFmc&t=1801s
El papel de data.europa.eu en el contexto de los espacios de datos de la UE
- Descripción: Este webinar permite a los proveedores de datos comprender cómo pueden hacer un mejor uso de las diferentes infraestructuras y, así, proporcionar más visibilidad a los activos de datos abiertos evaluando el papel de data.europa.eu en contextos de los espacios comunes europeos de datos.
- Enlace al visionado: https://www.youtube.com/watch?v=DjhGkGMoKso
El anuario regional de Eurostat se digitaliza
- Descripción: Se trata de una conferencia dedicada a la evolución del anuario regional de Eurostat, el cual ha pasado de ser una publicación impresa a convertirse en una publicación digital que funciona como una moderna herramienta interactiva.
- Enlace al visionado: https://www.youtube.com/watch?v=q0mgg4IbXUY
Data.europa.eu - El portal oficial de datos europeos (webinar para proveedores de datos)
- Descripción: Se trata de un seminario que ofrece información general sobre data.europa.eu, un portal que funciona como puerta de acceso a la información del sector público en diferentes portales de datos abiertos de instituciones, agencias y organismos de la UE y organizaciones nacionales e internacionales de todo el mundo. La formación ofrece una visión general de los servicios prestados a través del portal.
- Enlace al visionado: https://www.youtube.com/watch?v=4s9Yol8GsSc
Medición del impacto de los datos abiertos en Europa
- Descripción: El objetivo de esta conferencia es trasladar una visión general sobre cuáles son los métodos destinados a evaluar el impacto de los datos abiertos. Tras una breve introducción, los ponentes invitados pertenecientes a los equipos nacionales de datos abiertos de Polonia y Francia presentaron ejemplos reales que evidencian cómo miden el impacto de los datos abiertos en dichos países.
- Enlace al visionado: https://www.youtube.com/watch?v=Cp7-qSNLR1U
Visualización de datos
- Descripción: Para subrayar el potencial que hay detrás de las visualizaciones de datos, a través de este webinar, y de los materiales formativos adicionales, los usuarios pueden aprender a sacar el máximo partido a los catálogos de datos abiertos a través de distintas formas de visualizarlos.
- Enlace al visionado: https://www.youtube.com/watch?v=XY91H9TcO1A
- Documentos de apoyo: https://data.europa.eu/en/academy/data-visualisation
Historias del Observatorio de Casos de Uso - Volumen I
- Descripción: Este webinar forma parte de una serie de tres sesiones dedicadas al proyecto de investigación "Observatorio de Casos de Uso" y sus publicaciones. En la primera parte de esta formación, se ofrece una visión general del proyecto, su metodología y las conclusiones de la publicación en 2022. Durante la segunda parte del webinar, cuatro de los responsables de los treinta casos de reutilización participantes en la investigación toman la palabra para presentar sus soluciones de datos abiertos.
- Enlace al visionado: https://www.youtube.com/watch?v=-FT0OxfgF0M
Tendencias de los datos geoespaciales
- Descripción: Este seminario se centra en las tendencias emergentes en la comunidad geoespacial y en cómo estas junto a las normas y las nuevas ideas pueden ser relevantes para data.europa.eu.
- Enlace al visionado: https://www.youtube.com/watch?v=Hyt1MNm9l00
Federación de datos geoespaciales en data.europa.eu
- Descripción: Esta formación tiene como finalidad presentar los datos geoespaciales que pueden encontrarse en data.europa.eu, así como explicar el proceso de federación de este tipo de datos. Los ponentes examinaron de cerca un conjunto de datos geoespaciales en data.europa.eu y exploraron el recorrido de sus metadatos desde el geocatálogo de origen hasta el portal.
- Enlace al visionado: https://www.youtube.com/watch?v=7UPneA4QOoo
Entender los datos abiertos desde la perspectiva de la apertura legal (webinar para proveedores de datos)
- Descripción: Se trata de un webinar que pretende explicar y debatir qué implica la apertura desde una perspectiva jurídica y cómo puede lograrse de forma óptima. El objetivo no es proporcionar una formación jurídica puramente teórica, sino identificar las mejores prácticas y los recursos que los proveedores de datos pueden utilizar para lograr la apertura y darse cuenta de cuándo esta no se puede lograr.
- Enlace al visionado: https://www.youtube.com/watch?v=53QdDf4LJN0&t=1s
Entender la apertura técnica de los datos abiertos (webinar para proveedores de datos)
- Descripción: El objetivo de esta formación es guiar a los proveedores de datos a través del principio de apertura técnica y el proceso de gestión de datos para pasar de formatos de datos cerrados a abiertos. Un formato abierto es aquel en el que las especificaciones del programa están a disposición de cualquiera, de forma gratuita y sin limitaciones de reutilización impuestas por los derechos de propiedad intelectual.
- Enlace al visionado: https://www.youtube.com/watch?v=cQMwMXd4n9I&t=17s
De cara al nuevo año que ya está en marcha, el objetivo de data.europa.eu es continuar ampliando los recursos formativos de su sección académica con la programación de seminarios como Datos y el Derecho de la competencia u otro vinculado a la reciente publicación del informe Open Data Maturity 2022.
Si quieres obtener más información sobre los futuros seminarios sigue al portal europeo de los datos abiertos en el siguiente enlace y permanece atento a las novedades en este aspecto emitidas desde datos.gob.es.
Como todos los años, el Portal Europeo de Datos Abiertos acaba de publicar los resultados de su informe Open Data Maturity 2022. Se trata de un estudio que evalúa la madurez de los países europeos en el ámbito de los datos abiertos y ofrece una visión general de las buenas prácticas aplicadas en Europa, las cuales pueden transferirse a otros contextos nacionales y locales. En el estudio participan tanto los estados miembros de la Unión Europea (EU-27) como otros países de la región.
España ha alcanzado una puntuación del 92%, trece puntos por encima de la media de la EU27. Con esta puntuación se sitúa en el grupo de cabeza. El primer puesto ha sido para Francia, seguida de Ucrania y Polonia.
España está por encima de la media europea en los 4 indicadores analizados
El informe mide la madurez en relación con cuatro dimensiones de los datos abiertos:
- Política, centrado en las estrategias de datos abiertos de los distintos países.
- Impacto, donde se analizan las actividades realizadas para supervisar y medir la reutilización de datos abiertos y su impacto.
- Portal, enfocada en evaluar las funciones y características de la plataforma nacional que permite a los usuarios acceder a los datos abiertos e impulsar la interacción dentro de la comunidad.
- Calidad, que examina los mecanismos para garantizar la calidad de los (meta)datos.
En las cuatro categorías, España se sitúa por delante de la media de la EU27, destacando especialmente en el apartado de política. Algunos de los aspectos que el informe destaca de nuestro país son los mecanismos abiertos para comunicar e interactuar desde datos.gob.es con la comunidad de datos abiertos, el uso de cuadros de mando para monitorizar el uso de los datasets o algunos ejemplos de casos de uso concretos, como el Visor de escenarios de cambio climático o Gijón en un clic.
Con esta puntuación, España se encuadra dentro del denominado grupo de prescriptores (Trend setters en inglés). Los países que pertenecen a este grupo destacan por su fuerte compromiso con los datos abiertos, que se manifiesta en una estrategia avanzada, plataformas más maduras y en una metodología activa para la medición del impacto de los datos abiertos.
3 tendencias clave en Europa
El análisis de este año destaca tres tendencias a nivel europeo:
- Los Estados miembros de la UE se están preparando para la implementación de la regulación de los conjuntos de datos de alto valor. La Directiva 2019/1024 destacaba, entre otras cuestiones, un régimen específico para los llamados datos de alto valor, es decir, aquellos cuya reutilización está asociada a considerables beneficios para la sociedad, el medio ambiente y la economía. Aunque todavía no se ha hecho público su reglamento de aplicación, el 96% de los Estados miembros de la UE ya está trabajando en la identificación de datos de alto valor, especialmente en las categorías de datos estadísticos, geoespaciales, de observación de la Tierra y del medio ambiente, y meteorológicos. Además, el 85% ya se está preparado para supervisar y medir su nivel de reutilización y el 63% para garantizar su interoperabilidad con los conjuntos de datos disponibles de otros países. España no es una excepción y se encuentra entre los países más avanzados en esta materia.
- Medir el impacto de los datos abiertos es una prioridad para los Estados miembros de la UE, pero también un gran reto. Los países siguen interesados en comprender y captar la reutilización de los datos abiertos y la creación de valor, pero la recopilación de datos sobre el impacto creado continúa siendo complicada, sobre todo en el ámbito económico.
- En un mundo post-pandémico, los países europeos se enfrentan a nuevos y viejos retos comunes. El impacto de la guerra en Ucrania ha afectado a todos los países, tanto social como económicamente. Los datos abiertos se han puesto de manifiesto como un mecanismo para ayudar a los refugiados o mejorar la gestión energética. Otros retos comunes resaltados en el informe son la falta de recursos y personal cualificado o la dificultad de coordinarse entre los distintos niveles de la administración, entre otros.
Recomendaciones para seguir avanzando en materia de datos abiertos
El informe finaliza con una serie de recomendaciones por grupos de países. En el caso de los prescriptores de datos abiertos, el grupo al que pertenece España, el informe recomienda enfocarse en mantener el ecosistema actual, experimentar y compartir los conocimientos.
En concreto se debe poner el foco en mejorar y consolidar los ecosistemas de datos abiertos mediante el desarrollo de comunidades temáticas de proveedores y reutilizadores. También se recomienda colaborar con data.europa.eu, otros equipos nacionales de datos, universidades e instituciones de investigación para desarrollar un marco experimental de evaluación del impacto.
Entre las cuestiones a priorizar, destacan los conjuntos de datos de alto valor, en base a lo indicado previamente en la Directiva 2019/1024. Además de prepararse para el Reglamento de Gobernanza de Datos, evaluando las opciones existentes para ampliar los portales y que asuman el papel de registro público para aquellas organizaciones ligadas a la cesión altruista de datos.
Puedes leer el informe completo a través de este enlace.