Documentación

La revolución digital está transformando los servicios municipales, impulsada por la creciente adopción de tecnologías de inteligencia artificial (IA) que también se benefician de los datos abiertos. Estos avances tienen potencial para redefinir la manera en que los municipios ofrecen servicios a sus ciudadanos, proporcionando herramientas para mejorar la eficiencia, accesibilidad y sostenibilidad. El presente informe analiza casos de éxito en el despliegue de aplicaciones y plataformas que buscan mejorar diversos aspectos de la vida en los municipios, destacando su potencial para liberar algo más del vasto potencial aún por explotar de los datos abiertos y las tecnologías asociadas a la inteligencia artificial.

Las aplicaciones y plataformas descritas en este informe tienen un alto potencial de replicabilidad en diferentes contextos municipales, ya que abordan problemas que son comunes. La replicación de estas soluciones puede llevarse a cabo mediante la colaboración entre municipios, empresas y desarrolladores, así como a través de la liberación y estandarización de datos abiertos.

A pesar de los beneficios, la adopción de datos abiertos para la innovación municipal también presenta importantes desafíos. Debe garantizarse la calidad, actualización y estandarización de los datos publicados por las entidades locales, así como la interoperabilidad entre diferentes plataformas y sistemas. Además, es necesario reforzar la cultura de datos abiertos entre todos los actores implicados, incluidos los ciudadanos, los desarrolladores, las empresas y las propias administraciones públicas.

Los casos de uso analizados se dividen en cuatro secciones. A continuación, se describen cada una de estas secciones y se muestran algunos ejemplos de las soluciones incluidas en el informe.

Transporte y Movilidad

Uno de los desafíos más significativos en las áreas urbanas es la gestión del transporte y la movilidad. Las aplicaciones que utilizan datos abiertos han demostrado ser efectivas en la mejora de estos servicios. Por ejemplo, aplicaciones como Park4Dis facilitan la localización de plazas de aparcamiento para persona con movilidad reducida, utilizando datos de múltiples municipios y contribuciones de voluntarios. CityMapper, que ha alanzado escala global, por otro lado, ofrece rutas de transporte público optimizadas en tiempo real, integrando datos de diversos modos de transporte para proporcionar la ruta más eficiente. Estas aplicaciones no solo mejoran la movilidad, sino que también contribuyen a la sostenibilidad al reducir la congestión y las emisiones de carbono.

Medio Ambiente y Sostenibilidad

La creciente conciencia sobre la sostenibilidad ha impulsado el desarrollo de aplicaciones que promueven prácticas ecológicas. CleanSpot, por ejemplo, facilita la localización de puntos de reciclaje y la gestión de residuos urbanos. La aplicación incentiva la participación ciudadana en la limpieza y el reciclaje, contribuyendo a la reducción de la huella ecológica. Liight, por su parte, gamifica comportamientos sostenibles, recompensando a los usuarios por acciones como reciclar o usar el transporte público. Estas aplicaciones no solo mejoran la gestión ambiental, sino que también educan y motivan a los ciudadanos a adoptar hábitos más sostenibles.

Optimización de Servicios Públicos Básicos

Las plataformas de gestión de servicios urbanos, como Gestdropper, utilizan datos abiertos para monitorizar y controlar infraestructuras urbanas en tiempo real. Estas herramientas permiten una gestión más eficiente de recursos como el alumbrado público, redes de agua y mobiliario urbano, optimizando el mantenimiento, la respuesta ante incidencias y reduciendo costes operativos. Por otra parte, el despliegue de sistemas de gestión de citas previas, como CitaME, ayuda a reducir los tiempos de espera y mejorar la eficiencia en la atención al ciudadano.

Agregadores de Servicios a los Ciudadanos

Las aplicaciones que centralizan información y servicios públicos, como Badajoz Es Más y AppValencia, mejoran la accesibilidad y la comunicación entre las administraciones y los ciudadanos. Estas plataformas proporcionan datos en tiempo real sobre transporte público, eventos culturales, turismo y trámites administrativos, facilitando la vida en el municipio tanto a los residentes como a los turistas. Por ejemplo, al integrar múltiples servicios en una sola aplicación, se mejora la eficiencia y se reduce la necesidad de desplazamientos innecesarios. Estas herramientas también apoyan a las economías locales al promover eventos culturales y servicios comerciales.

Conclusiones

La utilización de datos abiertos y tecnologías de inteligencia artificial está transformando la gestión municipal, mejorando la eficiencia, accesibilidad y sostenibilidad de los servicios públicos. Los casos de éxito presentados en este informe describen cómo estas herramientas pueden beneficiar tanto a los ciudadanos como a las administraciones públicas convirtiendo las ciudades en entornos más inteligentes, inclusivos y sostenibles, y respondiendo mejor a las necesidades y bienestar de sus habitantes y visitantes.

Escucha el pódcast

Vídeo del pódcast

calendar icon
Blog

La transversalidad de los datos abiertos sobre el tiempo y el clima ha favorecido su uso en ámbitos tan diversos como la agricultura de precisión, la prevención de incendios o la industria forestal de precisión. Pero la relevancia de estos conjuntos de datos radica no solo en su aplicabilidad directa en múltiples industrias, sino también en su contribución a los retos relacionados con el cambio climático y la sostenibilidad ambiental sobre los que pretenden actuar las diferentes líneas de acción del Pacto Verde Europeo.

Los datos meteorológicos están considerados por la Comisión europea, datos de alto valor, de acuerdo con el anexo del Reglamento 2023/138. En este post te explicamos cuáles son los conjuntos de datos concretos que se consideran de alto valor y el nivel de disponibilidad de este tipo de datos en España.

La Agencia Estatal de Meteorología

En España, corresponde a la Agencia Estatal de Meteorología (AEMET) la misión de proporcionar servicios meteorológicos y climatológicos en el ámbito nacional. Como parte del Ministerio para la Transición Ecológica y el Reto Demográfico, AEMET lidera las actividades relacionadas de observación, predicción y estudio de las condiciones meteorológicas y climáticas, así como la investigación relacionada con estos ámbitos. Su misión incluye el suministro y difusión de información y predicciones esenciales de interés general. Una información que también puede servir de apoyo en ámbitos tan relevantes como la protección civil, la navegación aérea, la defensa nacional u otros sectores de actividad.

Para cumplir esta misión, la AEMET gestiona un portal de datos abiertos que habilita la reutilización por parte de personas físicas o jurídicas, con fines comerciales o no comerciales, de una parte de los datos que genera, elabora y custodia en el cumplimiento de sus funciones. Este portal, conocido como AEMET OpenData, ofrece actualmente dos modalidades que posibilitan el acceso y la descarga de los datos en formatos reutilizables:

  • Acceso general, que consiste en un acceso gráfico destinado al público en general a través de interfaces amigables para los humanos.
  • AEMET OpenData API, pensado para interacciones periódicas o programadas en cualquier lenguaje de programación y que permite a los desarrolladores incluir los datos de AEMET en sus propios sistemas de información y aplicaciones.

Adicionalmente, atendiendo a la Reglamento 2023/138, se contempla habilitar una tercera vía de acceso que permitiría a los reutilizadores obtener datasets empaquetados para la descarga masiva en los casos que fuera posible.

Para acceder a cualquiera de los conjuntos de datos, es necesario disponer de una clave de acceso (API Key) que se puede obtener a través de una sencilla solicitud en la que sólo se requiere un correo electrónico, sin ningún otro dato adicional del solicitante, para el envío de la clave de acceso. Se trata de una medida de control para garantizar que el servicio se preste con la calidad adecuada y de forma no discriminatoria para todos los usuarios.

AEMET OpenData, además, fue pionero en Europa en cuanto a la disponibilidad de datos meteorológicos abiertos, reflejando el compromiso de AEMET con la mejora continua de los servicios meteorológicos, el apoyo a la comunidad científica y tecnológica, y el fomento de una sociedad más informada y resiliente frente a los desafíos climáticos.

Los conjuntos de datos de alto valor sobre meteorología

El Anexo del Reglamento (UE) 2023/138 detalla cinco conjuntos de datos meteorológicos de alto valor: observaciones de estaciones meteorológicas, observaciones validadas de datos climáticos, avisos meteorológicos, datos de radar y datos de modelo de predicción numérica (conocidos como predicción meteorológica numérica o PMN). Para cada uno de los conjuntos, el reglamento especifica la granularidad y los principales atributos que deben publicarse.

Si analizamos la correspondencia de los conjuntos de datos que están actualmente disponibles agrupados en 14 categorías en el portal AEMET OpenData, con los cinco conjuntos de datos que pasarán a ser obligatorios en los próximos meses, obtenemos las conclusiones que resumimos en la siguiente tabla:

Conjuntos de datos meteorológicos de alto valor Equivalencia en los conjuntos de datos de AEMET OpenData
Datos de observaciones medidos por estaciones meteorológicas El conjunto de datos “Observación convencional”, generado por el Servicio de Observación, proporciona un elevado número de variables horarias sobre precipitación líquida y sólida, velocidad y dirección del viento, humedad, presión, temperatura del aire, suelo y subsuelo, visibilidad, etc. La actualización se realiza dos veces por hora. Atendiendo al Reglamento se incluirán datos diezminutales con actualización continua.
Datos climáticos: observaciones validadas Dentro de la categoría “Valores Climatológicos”, se proporcionan cuatro conjuntos de datos sobre observaciones de datos climáticos: “Climatologías diarias”, “Climatologías mensuales/anuales”, “Valores normales” y “Extremos registrados”. El conjunto de datos validados proporcionado por el Servicio del Banco Nacional de Datos Climatológicos se actualiza normalmente una vez al día con un retardo de cuatro días debido a los procesos de validación. Entre los atributos disponibles están la temperatura media diaria, la precipitación diaria en su forma estándar de medición de 07 a 07 horas, la humedad relativa media diaria, la dirección de la racha máxima, etc. Atendiendo al Reglamento está planificada la inclusión de climatología horarias.
Avisos meteorológicos Se proporcionan “Avisos de fenómenos meteorológicos adversos” para toda España, o segmentados por provincia o CCAA. Tanto los últimos emitidos como los históricos desde 2018. En ellos, se ofrecen datos de los fenómenos meteorológicos adversos observados y/o previstos, desde el momento actual hasta las siguientes 72 horas. Estos avisos se refieren a cada parámetro meteorológico por nivel de aviso, para cada zona meteorológica definida en el Plan Meteoalerta. Está generado por los Grupos Funcionales de Fenómenos Adversos y la información está disponible en cualquier momento en el que se emite un fenómeno meteorológico adverso, en línea con lo especificado en el Reglamento, que requiere que el conjunto de datos se publique “tal como se expidió o cada hora”. En este caso la AEMET anuncia unas horas preferentes de emisión: 09:00, 11:30, 23:00 y 23:50.
Datos de radar Existen dos conjuntos de datos: “Imagen gráfica radar regional” e “Imagen de la composición nacional de radares”, que proporcionan imágenes de reflectividad, aunque no los otros descritos en el Reglamento (retrodispersión, polarización, precipitaciones, viento y echotop). El conjunto de datos está generado por el grupo de Teledetección Terrestre y la información está disponible con una periodicidad de 10 minutos en vez de los 5 recomendados en el Reglamento. Sin embargo, de acuerdo al Plan Estratégico 2022-2025 de la AEMET, está prevista la actualización de los 15 radares meteorológicos y la incorporación de nuevos radares de mayor resolución, de modo que además de fortalecer el sistema de alerta temprana puedan cumplirse con las obligaciones del Reglamento.
Datos del modelo PMN Existen varios conjuntos de datos con información sobre predicciones, algunos disponibles para descarga y otros disponibles en web: predicción climática, predicción normalizada en texto, predicciones específicas, predicción marítima y mapas de variables meteorológicas de los modelos numéricos HARMONIE-AROME para distintos ámbitos geográficos y periodos de tiempo. Sin embargo, la AEMET, de acuerdo con su documento de preguntas frecuentes, no considera actualmente datos abiertos las salidas de modelos numéricos. La AEMET ofrece la posibilidad de solicitar este o cualquier otro conjunto de datos a través del registro general o de la sede electrónica, pero esta no es una opción contemplada en el Reglamento. Atendiendo a este, está prevista la inclusión de salidas de modelos numéricos atmosféricos y de oleaje.

Figura 1: Tabla con la equivalencia entre los conjuntos de datos de alto valor y  los conjuntos de datos de AEMET OpenData.

 

El reglamento establece además una serie de requisitos para la publicación en cuanto a formato, licencia otorgada, frecuencia de actualización y puntualidad, medio de acceso y metadatos ofrecidos.

En el caso de los metadatos, la AEMET publica, en formato legible por máquina, las características principales del fichero descargado: quién lo elabora, cada cuánto tiempo se prepara, qué contiene y su formato, además de información sobre los campos de datos (variable meteorológica, unidad de medida, etc.). También se especifica el copyright y las condiciones de uso mediante la nota legal. En este sentido, está previsto que se revisen las licencias actuales para que los conjuntos de datos estén disponibles en un esquema de licenciamiento conforme al Reglamento y posiblemente se seguirá la recomendación adoptando la licencia CC BY-SA 4.0.

En definitiva, parece que la larga trayectoria de la Agencia Estatal de Meteorología, ofreciendo datos abiertos de calidad, le ha situado en una buena posición para cumplir con los requisitos del nuevo reglamento, haciendo algunos ajustes en los conjuntos de datos que ya ofrece a través de AEMET OpenData para alinearlos con las nuevas obligaciones. AEMET contempla ir incluyendo en dicho servicio los conjuntos de datos requeridos en el Reglamento y que actualmente no están disponibles, esto a medida que adapte su normativa respecto a precios públicos, así como la infraestructura y sistemas que lo posibiliten. Los conjuntos de datos adicionales que estarán disponibles serán los datos de observación diezminutales, las climatologías horarias y algunos parámetros de datos de los radares regionales y de los modelos numéricos de predicción y oleaje.


Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Documentación

1. Introducción

En la era de la información, la inteligencia artificial ha demostrado ser una herramienta invaluable para una variedad de aplicaciones. Una de las manifestaciones más increíbles de esta tecnología es GPT  (Generative Pre-trained Transformer), desarrollado por OpenAI. GPT es un modelo de lenguaje natural que puede entender y generar texto, ofreciendo respuestas coherentes y contextualmente relevantes. Con la reciente introducción de Chat GPT-4, las capacidades de este modelo se han ampliado aún más, permitiendo una mayor personalización y adaptabilidad a diferentes temáticas.

En este post, te mostraremos cómo configurar y personalizar un asistente especializado en minerales críticos utilizando GPT-4 y fuentes de datos abiertas. Como ya mostramos en previas publicaciones, los minerales críticos son fundamentales para numerosas industrias, incluyendo la tecnología, la energía y la defensa, debido a sus propiedades únicas y su importancia estratégica. Sin embargo, la información sobre estos materiales puede ser compleja y dispersa, lo que hace que un asistente especializado sea particularmente útil.

El objetivo de este post es guiarte paso a paso desde la configuración inicial hasta la implementación de un asistente GPT que pueda ayudarte a resolver dudas y proporcionar información valiosa sobre minerales críticos en tu día a día. Además, exploraremos cómo personalizar aspectos del asistente, como el tono y el estilo de las respuestas, para que se adapte perfectamente a tus necesidades. Al final de este recorrido, tendrás una herramienta potente y personalizada que transformará la manera en que accedes y utilizas la información en abierto sobre minerales críticos.

Accede al repositorio del laboratorio de datos en Github.

En este vídeo, el autor te explica que vas a encontrar tanto en el Github como en Google Colab.

 

2. Contexto

La transición hacia un futuro sostenible no solo implica cambios en las fuentes de energía, sino también en los recursos materiales que utilizamos. El éxito de sectores como baterías de almacenamiento de energía, aerogeneradores, paneles solares, electrolizadores, drones, robots, redes de transmisión de datos, dispositivos electrónicos o satélites espaciales, depende enormemente del acceso a las materias primas críticas para su desarrollo. Entendemos que un mineral es crítico cuando se cumplen los siguientes factores:

  • Sus reservas mundiales son escasas
  • No existen materiales alternativos que puedan ejercer su función (sus propiedades son únicas o muy singulares)
  • Son materiales indispensables para sectores económicos clave de futuro, y/o su cadena de suministro es de elevado riesgo

Puedes aprender más sobre los minerales críticos en el post mencionado anteriormente.

3. Objetivo

Este ejercicio se centra en mostrar al lector cómo personalizar un modelo GPT especializado para un caso de uso concreto. Adoptaremos para ello el enfoque “aprender haciendo”, de tal forma que el lector pueda comprender cómo configurar y ajustar el modelo para resolver un problema real y relevante, como el asesoramiento experto en minerales críticos. Este enfoque práctico no solo mejora la comprensión de las técnicas de personalización de modelos de lenguaje, sino que también prepara a los lectores para aplicar estos conocimientos en la resolución de problemas reales, ofreciendo una experiencia de aprendizaje rica y directamente aplicable a sus propios proyectos.

El asistente GPT especializado en minerales críticos estará diseñado para convertirse en una herramienta esencial para profesionales, investigadores y estudiantes. Su objetivo principal será facilitar el acceso a información precisa y actualizada sobre estos materiales, apoyar la toma de decisiones estratégicas y promover la educación en este campo. A continuación, se detallan los objetivos específicos que buscamos alcanzar con este asistente:

  • Proporcionar información precisa y actualizada:
    • El asistente debe ofrecer información detallada y precisa sobre diversos minerales críticos, incluyendo su composición, propiedades, usos industriales y disponibilidad.
    • Mantenerse actualizado con las últimas investigaciones y tendencias del mercado en el ámbito de los minerales críticos.
  • Asistir en la toma de decisiones:
    • Proporcionar datos y análisis que puedan ayudar en la toma de decisiones estratégicas en la industria y la investigación sobre minerales críticos.
    • Ofrecer comparativas y evaluaciones de diferentes minerales en función de su rendimiento, coste y disponibilidad.
  • Promover la educación y la concienciación en torno a esta temática:
    • Actuar como una herramienta educativa para estudiantes, investigadores y profesionales, ayudando a mejorar su conocimiento sobre los minerales críticos.
    • Aumentar la conciencia sobre la importancia de estos materiales y los desafíos relacionados con su suministro y sostenibilidad.

4. Recursos

Para configurar y personalizar nuestro asistente GPT especializado en minerales críticos, es esencial disponer de una serie de recursos que faciliten la implementación y aseguren la precisión y relevancia de las respuestas del modelo. En este apartado, detallaremos los recursos necesarios que incluyen tanto las herramientas tecnológicas como las fuentes de información que serán integradas en la base de conocimiento del asistente.

Herramientas y Tecnologías

Las herramientas y tecnologías clave para desarrollar este ejercicio son:

  • Cuenta de OpenAI: necesaria para acceder a la plataforma y utilizar el modelo GPT-4. En este post, utilizaremos la suscripción Plus de ChatGPT para mostrarte cómo crear y publicar un GPT personalizado. No obstante, puedes desarrollar este ejercicio de forma similar utilizando una cuenta gratuita de OpenAI y realizando el mismo conjunto de instrucciones a través de una conversación de ChatGPT estándar.
  • Microsoft Excel: hemos diseñado este ejercicio de forma que cualquier persona sin conocimientos técnicos pueda desarrollarlo de principio a fin. Únicamente nos apoyaremos en herramientas ofimáticas como Microsoft Excel para realizar algunas adecuaciones de los datos descargados.

De forma complementaria, utilizaremos otro conjunto de herramientas que nos permitirán automatizar algunas acciones sin ser estrictamente necesaria su utilización:

  • Google Colab: es un entorno de Python Notebooks que se ejecuta en la nube, permitiendo a los usuarios escribir y ejecutar código Python directamente en el navegador. Google Colab es especialmente útil para el aprendizaje automático, el análisis de datos y la experimentación con modelos de lenguaje, ofreciendo acceso gratuito a potentes recursos de computación y facilitando la colaboración y el intercambio de proyectos.
  • Markmap: es una herramienta que visualiza mapas mentales de Markdown en tiempo real. Los usuarios escriben ideas en Markdown y la herramienta las renderiza como un mapa mental interactivo en el navegador. Markmap es útil para la planificación de proyectos, la toma de notas y la organización de información compleja visualmente. Facilita la comprensión y el intercambio de ideas en equipos y presentaciones.

Fuentes de Información

Con estos recursos, estarás bien equipado para desarrollar un asistente GPT especializado que pueda proporcionar respuestas precisas y relevantes sobre minerales críticos, facilitando la toma de decisiones informadas en este campo.

5. Desarrollo del ejercicio

5.1. Construcción de la base de conocimiento

Para que nuestro asistente GPT especializado en minerales críticos sea verdaderamente útil y preciso, es esencial construir una base de conocimiento sólida y estructurada. Esta base de conocimiento será el conjunto de datos e información que el asistente utilizará para responder a las consultas. La calidad y relevancia de esta información determinarán la eficacia del asistente en proporcionar respuestas precisas y útiles.

Búsqueda de Fuentes de Datos

Comenzamos con la recopilación de fuentes de información que nutrirán nuestra base de conocimiento. No todas las fuentes de información son igualmente fiables. Es fundamental evaluar la calidad de las fuentes identificadas, asegurando que:

  • La información esté actualizada: la relevancia de los datos puede cambiar con rapidez, especialmente en campos dinámicos como el de los minerales críticos.
  • La fuente sea confiable y reconocida: es necesario utilizar fuentes de instituciones reconocidas y respetadas en el ámbito académico y profesional.
  • Los datos sean completos y accesibles: es crucial que los datos sean detallados y que estén accesibles para su integración en nuestro asistente.

En nuestro caso, desarrollamos una búsqueda online en diferentes plataformas y repositorios de información tratando de seleccionar información perteneciente a diversas entidades reconocidas:

Selección y preparación de la información

Nos centraremos ahora en la selección y preparación de la información existente en estas fuentes para asegurar que nuestro asistente GPT pueda acceder a datos precisos y útiles.

RMIS del Joint Research Center de la Unión Europea:

  • Información seleccionada:

Seleccionamos el informe “Supply chain analysis and material demand forecast in strategic technologies and sectors in the EU – A foresight study. Se trata de un análisis de la cadena de suministro y la demanda de minerales en tecnologías y sectores estratégicos de la UE. Presenta un estudio detallado de las cadenas de suministro de materias primas críticas y pronostica la demanda de minerales hasta 2050.

  • Preparación necesaria

El formato del documento, PDF, permite la ingesta directa de la información por parte de nuestro asistente. No obstante, como se observa en la Figura 1, existe una tabla especialmente relevante en sus páginas 238-240 donde se analiza, para cada mineral, su riesgo de suministro, tipología (estratégico, crítico o no crítico) y las tecnologías clave que lo emplean. Decidimos, por ello, extraer esta tabla a un formato estructurado (CSV), de tal forma que dispongamos de dos piezas de información que pasarán a formar parte de nuestra base de conocimiento.

Tabla de minerales contenida en el PDF de JRC

Figura 1: Tabla de minerales contenida en el PDF de JRC

Para extraer de forma programática los datos contenidos en esta tabla y transformarlos en un formato más fácilmente procesable, como CSV (comma separated values o valores separados por comas), utilizaremos un script de Python que podemos utilizar a través de la plataforma Google Colab (Figura 2).

Script Python para la extracción de datos del PDF de JRC desarrollado en plataforma Google Colab.

Figura 2: Script Python para la extracción de datos del PDF de JRC desarrollado en plataforma Google Colab.

A modo de resumen, este script:

  1. Se apoya en la librería de código abierto PyPDF2, capaz de interpretar información contenida en ficheros PDF.
  2. Primero, extrae en formato texto (cadena de caracteres) el contenido de las páginas del PDF donde se encuentra la tabla de minerales eliminando todo el contenido que no se corresponde con la propia tabla.
  3. Posteriormente, recorre, línea a línea, la cadena de caracteres convirtiendo los valores en columnas de una tabla de datos. Sabremos que un mineral es utilizado en una tecnología clave si en la columna correspondiente de dicho mineral encontramos un número 1 (en caso contrario contendrá un 0).
  4. Por último, exporta dicha tabla a un fichero CSV para su posterior utilización.

Agencia Internacional de la Energía (IEA):

  • Información seleccionada:

Seleccionamos el informe “Global Critical Minerals Outlook 2024. Este proporciona una visión general de los desarrollos industriales en 2023 y principios de 2024, y ofrece perspectivas a medio y largo plazo para la demanda y oferta de minerales clave para la transición energética. También evalúa los riesgos para la fiabilidad, sostenibilidad y diversidad de las cadenas de suministro de minerales críticos.

  • Preparación necesaria:

El formato del documento, PDF, nos permite la ingesta directa de la información por parte de nuestro asistente virtual. No realizaremos en este caso ninguna adecuación de la información seleccionada.

Base de Datos de Minerales del Instituto Geológico y Minero Español (BDMIN)

  • Información seleccionada:

En este caso, utilizamos el formulario para seleccionar los datos existentes en esta base de datos en cuanto a indicios y yacimientos del ámbito de la metalogenia, en particular seleccionamos aquellos con contenido de Litio.

Selección de conjunto de datos en BDMIN.

Figura 3: Selección de conjunto de datos en BDMIN.

  • Preparación necesaria:

Observamos cómo la herramienta web nos permite la visualización online y también la exportación de estos datos en varios formatos. Seleccionamos, por tanto, todos los datos a exportar y haciendo clic en esta opción, descargamos un fichero Excel con la información deseada.

Herramienta de visualización y descarga en BDMIN

Figura 4: Herramienta de visualización y descarga en BDMIN

Datos descargados BDMIN

Figura 5: Datos descargados BDMIN.

Todos los archivos que componen nuestra base de conocimiento se encuentran GitHub del proyecto, de tal forma que aquel lector que lo desee pueda saltarse la fase de descarga y preparación de la información.

5.2. Configuración y personalización del GPT para minerales críticos

Cuando hablamos de "crear un GPT," en realidad nos estamos refiriendo a la configuración y personalización de un modelo de lenguaje basado en GPT (Generative Pre-trained Transformer) para adaptarlo a un caso de uso específico. En este contexto, no estamos creando el modelo desde cero, sino ajustando cómo el modelo preexistente (como GPT-4 de OpenAI) interactúa y responde dentro de un dominio específico, en este caso, sobre minerales críticos.

En primer lugar, accedemos a la aplicación a través de nuestro navegador y, en caso de no tener una cuenta, seguimos el proceso de registro y login en la plataforma ChatGPT. Como indicamos con anterioridad, para realizar la creación de un GPT paso a paso será necesario disponer de una cuenta Plus. No obstante, aquellos lectores que no dispongan de dicha cuenta, podrán trabajar con una cuenta gratuita interactuando con ChatGPT a través de una conversación estándar.

Captura de la página de inicio de sesión y registro de ChatGPT.

Figura 6: Página de inicio de sesión y registro de ChatGPT.

Una vez iniciada la sesión, seleccionamos la opción "Explorar GPT", y posteriormente hacemos clic en "Crear" para comenzar el proceso de creación de nuestro GPT.

Captura de la página de creación de un nuevo GPT.

Figura 7: Creación de nuevo GPT.

En pantalla se nos mostrará la pantalla dividida de creación de un nuevo GPT: a la izquierda podremos conversar con el sistema para indicarle las características que debe tener nuestro GPT, mientras que a la izquierda podremos interactuar con nuestro GPT para validar que su comportamiento es el adecuado según vayamos avanzando en el proceso de configuración.

Captura de la pantalla de creación de nuevo GPT.

Figura 8: Pantalla de creación de nuevo GPT.

En el GitHub de este proyecto, podemos encontrar todos los prompts o instrucciones que utilizaremos para configurar y personalizar nuestro GPT y que deberemos introducir de forma secuencial en la pestaña "Crear", situada en la pestaña izquierda de nuestras pantallas, para completar los pasos que se detallan a continuación.

Los pasos que vamos a seguir para la creación del GPT son:

  1. En primer lugar, le indicaremos el objetivo y las consideraciones básicas a nuestro GPT para que pueda entender su modo de empleo.

Captura de las instrucciones básicas de nuevo GPT.

Figura 9: Instrucciones básicas de nuevo GPT.

2. Posteriormente crearemos un nombre y una imagen que representen a nuestro GPT y lo hagan fácilmente identificable. En nuestro caso, lo denominaremos MateriaGuru.

Captura de la pantalla para la selección de nombre para nuevo GPT.

Figura 10: Selección de nombre para nuevo GPT.

Captura de la pantalla para la creación de imagen para GPT.

Figura 11: Creación de imagen para GPT.

3. A continuación, construiremos la base de conocimiento a partir de la información anteriormente seleccionada y preparada para nutrir los conocimientos de nuestro GPT.

Captura de la carga de información a la base de conocimiento de nuevo GPT

Captura de la carga de información a la base de conocimiento de nuevo GPT II

Figura 12: Carga de información a la base de conocimiento de nuevo GPT.

4. Ahora, podemos personalizar aspectos conversacionales como su tono, el nivel de complejidad técnica de sus repuesta o si esperamos respuestas escuetas o elaboradas.

5. Por último, desde la pestaña "Configurar", podemos indicar los iniciadores de conversación deseados para que los usuarios que interactúen con nuestro GPT tengan algunas ideas para empezar la conversación de forma predefinida.

Captura de la pestaña Configurar GPT.

Figura 13: Pestaña Configurar GPT.

En la Figura 13 podemos también observar el resultado definitivo de nuestro entrenamiento, donde aparecen elementos clave como su imagen, nombre, instrucciones, iniciadores de conversación o documentos que forma parte de su base de conocimiento.

5.3. Validación y publicación de GPT

Antes de dar por bueno a nuestro nuevo asistente basado en GPT, procederemos a realizar una breve validación de su correcta configuración y aprendizaje respecto a la temática en torno a la que le hemos entrenado. Para ello, preparamos una batería de preguntas que le realizaremos para comprobar que responde de forma adecuada ante un escenario real de utilización.

# Pregunta Respuesta
1 ¿Qué minerales críticos han experimentado una caída significativa en los precios en 2023? Los precios de los minerales para baterías vieron particularmente grandes caídas con los precios del litio cayendo un 75% y los precios del cobalto níquel y grafito cayendo entre un 30% y un 45%.
2 ¿Qué porcentaje de la capacidad solar fotovoltaica (PV) mundial fue añadido por China en 2023? China representó el 62% del aumento en la capacidad solar fotovoltaica global en 2023.
3 ¿Cuál es el escenario que proyecta que las ventas de autos eléctricos (EV) alcanzarán el 65% en 2030? El escenario de emisiones netas cero (NZE) para 2050 proyecta que las ventas de autos eléctricos alcanzarán el 65% en 2030.
4 ¿Cuál fue el crecimiento de la demanda de litio en 2023? La demanda de litio aumentó en un 30% en 2023.
5 ¿Qué país fue el mayor mercado de autos eléctricos en 2023? China fue el mayor mercado de autos eléctricos en 2023 con 8.1 millones de ventas de autos eléctricos representando el 60% del total global.
6 ¿Cuál es el principal riesgo asociado con la concentración de mercado en la cadena de suministro de grafito para baterías? Más del 90% del grafito de grado batería y el 77% de las tierras raras refinadas en 2030 se originan en China lo que representa un riesgo significativo para la concentración del mercado.
7 ¿Qué proporción de la capacidad mundial de producción de celdas de batería estaba en China en 2023? China poseía el 85% de la capacidad de producción de celdas de batería en 2023.
8 ¿Cuánto aumentó la inversión en minería de minerales críticos en 2023? La inversión en minería de minerales críticos creció un 10% en 2023.
9 ¿Qué porcentaje de la capacidad de almacenamiento de baterías en 2023 estaba compuesto por baterías de fosfato de hierro y litio (LFP)? En 2023, las baterías LFP constituían aproximadamente el 80% del mercado total de almacenamiento de baterías.
10 ¿Cuál es el pronóstico para la demanda de cobre en un escenario de emisiones netas cero (NZE) para 2040? En el escenario de emisiones netas cero (NZE) para 2040 se espera que la demanda de cobre tenga el mayor aumento en términos de volumen de producción.

Figura 14: Tabla con batería de preguntas para la validación de nuestro GPT.

Valiéndonos de la parte de previsualización, situada a la derecha de nuestras pantallas, lanzamos la batería de preguntas y validamos que las respuestas se corresponden con aquellas esperadas.

Captura del proceso de validación de respuestas GPT.

Figura 15: Validación de respuestas GPT.

Por último, hacemos clic en el botón "Crear" para finalizar el proceso. Podremos seleccionar entre diferentes alternativas para restringir su utilización por parte de otros usuarios.

Captura de la pantalla para publicación de nuestro GPT.

Figura 16: Publicación de nuestro GPT.

6. Escenarios de uso

En este apartado mostramos varios escenarios en los que podremos sacar partido a MateriaGuru en nuestro día a día. En el GitHub del proyecto podremos encontrar los prompts utilizados para replicar cada uno de ellos.

6.1. Consulta de información de minerales críticos

El escenario más típico de utilización de este tipo de GPTs es la asistencia para resolución de dudas relacionadas con la temática en cuestión, en este caso, los minerales críticos. A modo de ejemplo, hemos preparado una batería de cuestiones que el lector podrá plantear al GPT creado para comprender en mayor detalle la relevancia y situación actual de un material crítico como es el grafito a partir de los informes provistos a nuestro GPT.

Captura del proceso de resolución de dudas de minerales críticos. 

Figura 17: Resolución de dudas de minerales críticos.

También podemos plantearle preguntas concretas sobre la información tabulada provista respecto a los yacimientos e indicios existentes en el territorio español.

Captura de la respuesta a la pregunta sobre reservas de litio en Extremadura.

Figura 18: Reservas de litio en Extremadura.

6.2. Representación de visualizaciones de datos cuantitativos

Otro escenario común, es la necesidad de consultar información cuantitativa y realizar representaciones visuales para su mejor entendimiento. En este escenario, podemos observar cómo MateriaGuru es capaz de generar una visualización interactiva de la producción de grafito en toneladas de los principales países productores.

Captura de la visualización interactiva generada con nuestro GPT.

Figura 19: Generación de visualización interactiva con nuestro GPT.

6.3. Generación de mapas mentales para facilitar la comprensión

Por último, en línea con la búsqueda de alternativas para un mejor acceso y comprensión del conocimiento existente en nuestro GPT, plantearemos a MateriaGuru la construcción de un mapa mental que nos permita entender de una forma visual conceptos clave de los minerales críticos. Para ello, utilizamos la notación abierta Markmap (Markdown Mindmap), que nos permite definir mapas mentales utilizando notación markdown.

Captura del proceso para la generación de mapas mentales desde nuetro GPT.

Figura 20: Generación de mapas mentales desde nuetro GPT.

Deberemos copiar el código generado e introducirlo en un visualizador de markmap para poder generar el mapa mental deseado. Facilitamos aquí una versión de este código generada por MateriaGuru.

Captura de la visualización de mapas mentales

Figura 21: Visualización de mapas mentales.

7. Resultados y conclusiones

En el ejercicio de construcción de un asistente experto utilizando GPT-4, hemos logrado crear un modelo especializado en minerales críticos. Este asistente proporciona información detallada y actualizada sobre minerales críticos, apoyando la toma de decisiones estratégicas y promoviendo la educación en este campo. Primero recopilamos información de fuentes confiables como el RMIS, la Agencia Internacional de la Energía (IEA), y el Instituto Geológico y Minero Español (BDMIN). Posteriormente, procesamos y estructuramos los datos adecuadamente para su integración en el modelo. Las validaciones demostraron que el asistente responde de manera precisa a preguntas relevantes del dominio, facilitando el acceso a su información.

De esta forma, el desarrollo del asistente especializado en minerales críticos ha demostrado ser una solución efectiva para centralizar y facilitar el acceso a información compleja y dispersa.

La utilización de herramientas como Google Colab y Markmap ha permitido una mejor organización y visualización de los datos, aumentando la eficiencia en la gestión del conocimiento. Este enfoque no solo mejora la comprensión y el uso de la información sobre minerales críticos, sino que también prepara a los usuarios para aplicar estos conocimientos en contextos reales.

La experiencia práctica adquirida en este ejercicio es directamente aplicable a otros proyectos que requieran la personalización de modelos de lenguaje para casos de uso específicos.

8. ¿Quieres realizar el ejercicio?

Si quieres replicar este ejercicio, accede a este repositorio donde encontrarás más información (las prompt utilizadas, el código generado por MateriaGuru, etc.)

Además, recuerda que tienes a tu disposición más ejercicios en el apartado sección de “Visualizaciones paso a paso”.


Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

El Centro Nacional de Información Geográfica publica los datos geoespaciales abiertos del Sistema Cartográfico Nacional, del Instituto Geográfico Nacional y de otros organismos a través de aplicaciones web y aplicaciones para móvil para facilitar el acceso y la consulta de los datos geográficos a los ciudadanos.

Los datos geoespaciales se publican a través de servicios web y API para su reutilización, por lo que en el caso de los conjuntos de datos de alto valor como los nombres geográficos, hidrografía o las direcciones tal y como establece la UE, ya están puestos a disposición de la ciudadanía antes de junio de 2024 ya que están asociados a grandes beneficios para la sociedad, el medio ambiente y la economía.

Pero en las aplicaciones que a continuación se enumeran, los datos geográficos se visualizan y se consultan a través de servicios web, por lo que para la descarga de los datos, es posible utilizar directamente los servicios web y API, a través de una plataforma accesible para cualquier usuario con una amplia gama de información geográfica, que abarca desde mapas topográficos hasta imágenes satelitales.

Pero no solo los datos se pueden reutilizar, también el software de las aplicaciones es reutilizable, como, por ejemplo, el visualizador del Potencial de Energía Solar de Edificios que se basa en una API de visualizador, llamada API-CNIG y que permite utilizar la misma herramienta para las diferentes temáticas.

Algunos ejemplos de las aplicaciones son:

Potencial de Energía Solar de Edificios

Ofrece la capacidad fotovoltaica de un edificio según su ubicación y características. Además, ofrece la media a lo largo del año y una malla puntual para identificar cuál sería la mejor localización de las placas solares.

Nomenclátor Geográfico Nacional

Es un buscador de topónimos que recoge las denominaciones, oficiales o normalizadas por los correspondientes organismos competentes referenciadas geográficamente.

Calculadora unificada de direcciones postales

Es un conversor que permite conocer las coordenadas geográficas (latitud y longitud en WGS84) de las direcciones postales de un lugar, y viceversa. En ambos casos, el fichero de entrada es un fichero en formato CSV, admitiendo tanto coordenadas como direcciones postales.

Mapas de España Básicos

Facilita la conexión a los servicios del IGN y al centro de descargas del CNIG para obtener mapas y rutas. Con esta aplicación móvil podrás recorrer las rutas de los Parques Nacionales o las etapas del Camino de Santiago. Permite planificar excursiones utilizando mapas, navegar y realizar recorridos guiados, sin necesidad de tener conexión a internet previa descarga de datos.

Mapa a la carta

Permite crear un mapa a medida usando las series impresas del Mapa Topográfico Nacional a escalas 1:25.000 y 1:50.000. Ofrece la posibilidad de definir su área, incorporar contenidos, personalizar la portada, obtener un fichero pdf e incluso adquirir copias en papel vía correo postal.

IGN Terremotos

Permite la recepción y visualización de todos los eventos sísmicos de España y alrededores. Ofrece la distancia al epicentro del evento sísmico y parámetros epicentrales, así como la geolocalización de la posición del usuario y del epicentro.

Mapas de España

Es un visualizador móvil gratuito ideal para senderismo, ciclismo, correr, esquiar, etc., que utiliza como cartografía de fondo los servicios del Instituto Geográfico Nacional y otro conjunto de servicios de otros Ministerios, como por ejemplo la información Catastral de las parcelas proporcionada por la Dirección General de Catastro.

Camino de Santiago

Incluye información de naturaleza cultural y práctica de cada una de las etapas (albergues, monumentos, etc.), así como una completa Guía del Peregrino que detalla lo que debes conocer antes de comenzar a realizar alguno de los Caminos. Esta aplicación se basa en el software de ESRI.

Parques Nacionales

Muestra información sobre la historia, fauna, flora y excursiones de los Parques Nacionales de España. Incluye cientos de puntos de interés como centros de información, alojamientos, miradores, refugios e incluso rutas para recorrer los parques indicando su duración o dificultad. La app está disponible para su descarga en Android e iOS. Esta aplicación se basa en el software de ESRI.

GeoSapiens IGN

Presenta mapas interactivos, de uso libre y gratuito, para estudiar la geografía física y política de España y el mundo. Consta de diferentes juegos relativos a toda España o por comunidades autónomas, el mundo completo y por continente.

Además de las aplicaciones desarrolladas por el CNIG, que también se presentan en este vídeo, existen muchas otras soluciones digitales realizadas por terceros que reutilizan datos abiertos geoespaciales para ofrecer un servicio a la sociedad. Por ejemplo, en la lista de aplicaciones reutilizadoras de datos.gob.es puedes encontrar desde un mapa que muestra los incendios que se encuentran activos en España en tiempo real hasta una app que señala dónde están las plazas de aparcamiento para personas con movilidad reducida de cada localidad.

En definitiva, cualquier persona puede hacer uso de los datos geográficos abiertos del Sistema Cartográfico Nacional, del Instituto Geográfico Nacional y de otros organismos publicados por el CNIG ampliando así las ventajas que ofrece la disponibilidad de datos abiertos geográficos. ¿Conoces alguna otra aplicación fruto de la reutilización de datos abiertos? Nos la puedes enviar a dinamizacion@datos.gob.es

calendar icon
Blog

El impulso de la eficiencia y sostenibilidad energética es una de las prioridades de la Unión Europea y de España, como refleja el Pacto Verde Europeo. La disponibilidad de datos abiertos relacionados con la producción, distribución y consumo energético permite a gobiernos, empresas y ciudadanos acceder a información esencial para abordar los desafíos del cambio climático y promover un futuro más sostenible.

En este post, exploramos ejemplos de casos de uso que muestran el impacto de los datos abiertos en el panorama energético, así como fuentes de interés donde localizar datos de calidad sobre la materia.

Casos de uso de datos abiertos en el sector energético

79.600 millones de euros. Ese es el ahorro anual estimado gracias a los datos abiertos en el sector energético dentro de la Unión Europea, de acuerdo con el informe “El impacto económico de los datos abiertos: oportunidades de creación de valor en Europa (2020)”. Esto es posible gracias a múltiples proyectos y aplicaciones basadas en datos abiertos que afectan a diversas áreas.

  • Planificación de recursos más eficiente

El acceso a datos abiertos sobre los recursos energéticos disponibles permite identificar las áreas más adecuadas para desarrollar proyectos, asegurando que se maximice el uso de los recursos naturales disponibles. Por ejemplo, en el mar Báltico, se están ampliando las infraestructuras de gas natural para dar respuesta a las crecientes necesidades de la región. Aprovechando los datos avanzados de Copernicus junto a sus propios servicios de vigilancia y predicción (que incluyen datos relativos al viento, las olas, el nivel del agua del mar, las corrientes, el hielo marino, etc.), los gobiernos estonio y finlandés pudieron llevar a cabo una planificación más eficiente para la instalación de una nueva planta.

Asimismo, el Instituto Geográfico Nacional ha puesto a disposición de los usuarios un visor para conocer la incidencia del sol y determinar la mejor ubicación de placas solares. Gracias a este visor se pueden analizar diferentes ubicaciones y orientaciones para identificar la posición que maximiza la captación de energía solar.

  • Consumo más responsable y eficiente

Los datos abiertos también incluyen información sobre el uso y rendimiento de diferentes energías. La Junta de Castilla y León, por ejemplo, cuenta con un dataHub que recoge información de más de 1.500 centros de consumo. Este cuadro de mando permite visualizar el análisis desagregado por tipo de energía (electricidad, gas, gasoil) y por localización geográfica (centros educativos, centros de salud, oficinas administrativas, hospitales, etc.). Gracias a ello pueden comparar el consumo entre los edificios que gestionan y tomar decisiones en pro de la eficiencia, lo cual ha supuesto un ahorro de 2M€ anuales desde 2015 únicamente en el coste fijo de electricidad.

Por su parte el visor Urban3r permite visualizar diferentes indicadores sobre el estado actual de la edificación, los datos de demanda energética de los edificios residenciales en su estado actual y tras someterlos a una rehabilitación energética, así como los costes estimados de estas intervenciones, facilitando la toma de decisiones.

En el mercado encontramos soluciones comerciales también dirigidas a este fin, como Opower, una herramienta que utiliza inteligencia artificial para ofrecer información personalizada a cada cliente, identificando y sugiriendo la sustitución de sistemas ineficientes de calefacción y refrigeración. Otro ejemplo es uplight, que realiza análisis de eficiencia energética para edificios comerciales, empresas de servicios públicos y entidades gubernamentales con recomendaciones operativas y de modernización de instalaciones para reducir el consumo. Estos ejemplos ponen de manifiesto la oportunidad de negocio que supone este nicho de mercado.

  • Posibilidad de elegir proveedores más económicos

Los datos abiertos proporcionan información detallada sobre las tarifas y precios de diferentes proveedores energéticos. Esta transparencia permite a los consumidores comparar fácilmente las ofertas y elegir la opción que mejor se ajusta a sus necesidades. Es el caso de las aplicaciones para elegir gasolineras, como Mejorgasolinera.com o Precioil.es, que ofrecen información detallada sobre las gasolineras del país y permiten filtrar por marcas, localización o carretera y ordenar por precio y distancia. También encontramos soluciones similares para el mercado de la luz, como Tarifaluzhora.

La Comisión Nacional de los Mercados y la Competencia (CNMC) también cuenta con un Comparador de Ofertas de Energía (CNMC), que permite consultar ofertas de gas y electricidad.

  • Transparencia, rendición de cuentas y minimización de daños

La publicación de datos abiertos no solo permite a los ciudadanos y organizaciones acceder a información detallada sobre la producción, distribución y consumo de energía. También aumenta la transparencia en la gestión de recursos y promueve la rendición de cuentas por parte de las empresas energéticas y los gobiernos.

Con ese fin nació OpenOil, que busca disminuir la opacidad de la industria petrolera y, con ello, aumentar la responsabilidad de las empresas del sector. Proporciona un marco de datos abiertos para la gestión de los recursos naturales a nivel supranacional, así como servicios de consultoría y formación para la creación de mecanismos y procesos de gestión de los recursos naturales.

Por su parte, con el fin de minimizar el impacto que generan los vertidos de petróleo en los océanos, el Consejo Superior de Investigaciones Científicas (CSIC), en colaboración con Digital Earth Solutions (DES), han desarrollado un software único capaz de predecir en pocos minutos y con gran precisión la evolución geográfica de cualquier marea negra, pronosticando su trayectoria futura en el océano o estudiando su movimiento hacia atrás en el tiempo para encontrar su origen.

¿Dónde puedo encontrar datos sobre energía?

Si estás pensando en desarrollar una solución de este tipo, estás de suerte, porque en la red hay disponible una gran cantidad de datos abiertos sobre energía.

Si buscas datos de España, además de datos.gob.es, puedes visitar las siguientes páginas web:

  • Instituto para la Diversificación y Ahorro de la Energía (IDAE). IDAE ofrece estadísticas y balances energéticos sectorizados tanto de energía primaria como final, en miles de toneladas equivalentes de petróleo (ktep). En total, se detallan 69 tipos de energía y 128 flujos energéticos y/o sectores. Los datos actualmente disponibles abarcan la serie histórica desde 1990 a 2022.
  • Red Eléctrica de España. REData es el espacio web de Red eléctrica donde podemos encontrar series estadísticas nacionales relativas al sistema eléctrico español, actualizados mes a mes. En este espacio también se puede acceder a información sobre la demanda, generación, balance, intercambio, transporte y mercados eléctricos, cuyos datos están disponibles a través de una API REST. Según la naturaleza del conjunto de datos, podemos encontrar datos que se actualizan anual, trimestral o incluso diariament. Otra herramienta de utilidad de Red Eléctrica es  ESIOS, con datos actualizados de generación, consumo, mercado, precios, etc.
  • Comisión Nacional de los Mercados y la Competencia (CNMC): El portal de datos abiertos CNMC Data proporciona acceso directo a datos e indicadores relativos a los mercados energéticos que supervisa la CNMC: electricidad, gas natural y productos petrolíferos. Podemos encontrar estadísticas sobre los precios del mercado, el número de usuarios beneficiados con el bono social o los porcentajes que supone la energía renovable en el cómputo total, entre otros valores. Los datos se actualizan periódicamente, de forma mensual, trimestral o anual.

También hay disponible una gran cantidad de información a nivel mundial:

  • Unión Europea. En la página web sobre la política energética de la UE, encontramos distintos datos y análisis que abarcan desde la evolución del precio del petróleo en los distintos países miembro hasta posibles escenarios del mercado energético para 2030 y 2050, entre otros muchos. Además, la Dirección General de Energía de la Comisión Europea elabora cada dos años fichas de datos estadísticos sobre energía, basados en datos de Eurostat y del seguimiento de los gases de efecto invernadero que lleva a cabo la UE. Los datos se muestran divididos por países, lo cual permite realizar comparaciones fácilmente. También está disponible la base de datos ENSPRESO, que se centra en los sectores eólico, solar y de biomasa. 
  • Agencia Internacional de la Energía (IEA, en sus siglas en inglés). IEA es una organización internacional creada en 1974 por la Organización para la Cooperación y el Desarrollo Económico (OCDE) con el fin de garantizar el abastecimiento energético. Aunque algunos de los datasets ofrecidos son de pago, en su web también se puede encontrar información en abierto que se puede descargar bajo registro.
  • Otros países: A nivel internacional, podemos encontrar portales detallados por países, como el de Estados Unidos Open Energy Data Initiative (OEDI) o Reino Unido.

Estos son solo algunos ejemplos de soluciones y fuentes de datos que ponen de manifiesto el impacto que puede tener la apertura de datos energéticos en nuestro entorno, tanto a nivel de ahorro de costes como de impulso de la eficiencia. Te invitamos a compartir otras soluciones y portales de datos abiertos en comentarios.

calendar icon
Blog

La huella de carbono es un indicador fundamental para comprender el impacto ambiental de nuestras acciones. Mide la cantidad de emisiones de gases de efecto invernadero que se lanzan a la atmósfera fruto de las actividades humanas, entre las que destaca la quema de combustibles fósiles como el petróleo, el gas natural y el carbón. Estos gases, entre los que se encuentran el dióxido de carbono (CO2), el metano (CH4) y el óxido nitroso (N2O), contribuyen al calentamiento global al retener el calor en la atmósfera de la Tierra.

Son muchas las acciones que se llevan a cabo desde distintos organismos para tratar de reducir la huella de carbono. Entre ellas, las incluidas en el Pacto Verde Europeo o los Objetivos de desarrollo Sostenible. Pero este es un campo en el que cada pequeña acción cuenta y, como ciudadanos, también podemos contribuir a esta meta a través de pequeños cambios en nuestro estilo de vida.

Además, se trata de un campo donde los datos abiertos pueden tener un gran impacto. En concreto, en el informe “El impacto económico de los datos abiertos: oportunidades de creación de valor en Europa (2020)” se resalta como, gracias a los datos abiertos, se ha podido llevar a cabo un ahorro del equivalente a 5,8 millones de toneladas de petróleo cada año en la Unión europea, al impulsar otras energías más verdes. Esto supone, además, un ahorro de 79.600 millones de euros de costes en las facturas de energía.

En este artículo se repasan algunas soluciones que nos ayudan a medir nuestra huella de carbono para tomar conciencia de la situación, así como fuentes de datos abiertos de utilidad.

Calculadoras para conocer tu huella de carbono

La Unión Europea cuenta con una aplicación web donde cada persona puede analizar el ciclo de vida de los productos y la energía que se consume en cinco áreas concretas (alimentación, movilidad, vivienda, electrodomésticos y bienes del hogar), en base a 16 indicadores de impacto ambiental. El usuario introduce ciertos datos, como el gasto energético que realiza o los detalles de su vehículo, y la solución calcula el nivel de impacto. La web también ofrece recomendaciones para mejorar los patrones de consumo. Para su elaboración se han usado datos de Ecoinvent y Agrifoot-print, así como diferentes informes públicos detallados en su metodología..

La ONU también lanzó una solución similar, pero centrada en los bienes de consumo. Permite crear cadenas de valor de productos trazando un mapa de los materiales, procesos y transportes que se han utilizado para su fabricación y distribución, mediante una combinación de datos de actividad específicos de las empresas y datos secundarios. Los factores de emisión y conjuntos de datos para materiales y procesos provienen de una combinación de fuentes de datos como Ecoinvent, el Instituto Sueco de Medio Ambiente, DEFRA (Departamento de Medio Ambiente, Alimentación y Asuntos Rurales de Reino Unido), documentos académicos, etc. La calculadora también está vinculada a la Plataforma para la compensación de la huella de carbono de las Naciones Unidas. Esto permite a los usuarios de la aplicación tomar medidas climáticas inmediatas al contribuir a proyectos ecológicos.de las Naciones Unidas.

Si miramos a nuestro país, en España, el Ministerio para la Transición Ecológica y el Reto Demográfico cuenta con diversas herramientas para facilitar el cálculo de la huella de carbono dirigidas a distintos públicos: organizaciones, ayuntamientos y explotaciones agrícolas. En ellas se tienen en cuenta tanto las emisiones directas, como las indirectas procedentes del consumo de electricidad. Entre otras fuentes de datos, utiliza información del Inventario nacional de Gases de Efecto Invernadero. También ofrece una estimación de las absorciones de dióxido de carbono que genera un proyecto de reducción de emisiones.

Otra herramienta vinculada a este ministerio es ComidaAPrueba, puesta en marcha por la Fundación Vida Sostenible y dirigida a conocer la sostenibilidad de la alimentación de los ciudadanos. La aplicación móvil, disponible tanto para iOs como para Android, permite calcular la huella ambiental de nuestras comidas para que tomemos consciencia del impacto de nuestras acciones. También propone recetas saludables que nos ayudan a reducir el desperdicio alimentario.

Pero no todas las acciones que se desarrollan de este tipo están impulsadas por organismos públicos u asociaciones sin ánimo de lucro. La lucha contra el deterioro de nuestro medio ambiente también es un nicho de mercado que ofrece oportunidades empresariales. Empresas privadas también ofrecen soluciones para calcular la huella de carbono, como climate Hero, la cual de basa en múltiples fuentes de datos.

Fuentes de datos para nutrir las calculadoras de huella de carbono

Como hemos visto, para realizar estos cálculos, estas soluciones necesitan basarse en datos que les permitan calcular la relación entre determinados hábitos de consumo y las emisiones generadas. Para ello, recurren a diversas fuentes de datos, muchas de las cuales son abiertas. En España, por ejemplo, encontramos:

Otros servicios de datos internacionales a considerar son:

  • EarthData. Este servicio proporciona acceso completo y abierto a la colección de datos científicos de la Tierra de la NASA para comprender y proteger nuestro planeta. En este espacio ofrece enlaces a datos de uso común sobre gases de efecto invernadero, incluyendo dióxido de carbono, metano, óxido nitroso, ozono, clorofluorocarbonos y vapor de agua, así como a información sobre su impacto medioambiental.
  • Eurostat. La Oficina estadística de la Comisión Europea publica regularmente estimaciones de las emisiones trimestrales de gases de efecto invernadero de la Unión Europea, desglosadas por actividad económica. Las estimaciones abarcan todos los trimestres desde 2010 hasta la actualidad.
  • Life Cycle Assessment (LCA). Esta plataforma es la base de conocimientos de la Unión Europea en materia de producción y consumo sostenibles. Ofrece un inventario del ciclo de vida de los productos para el análisis de las cadenas de suministro. Para su realización se utilizan datos procedentes de asociaciones empresariales y otras fuentes relacionadas con vectores energéticos, transporte y gestión de residuos.
  • Our World in Data. Uno de los conjuntos de datos más utilizados de este portal contiene información sobre emisiones de CO2 y gases de efecto invernadero a través de métricas clave. Para su elaboración, se han utilizado distintas fuentes de datos primarias como la agencia de información energética de Estados Unidos o The Global Carbon Project. Todos los datos en bruto y los scripts utilizados se encuentran disponibles en su repositorio de GitHub.

Estos repositorios son solo una muestra, pero existen muchas más fuentes de las que extraer datos de valor que nos ayuden a tomar conciencia de la situación climática en la que vivimos y del impacto que nuestras pequeñas acciones del día a día tienen sobre nuestro planeta. Reducir nuestra huella de carbono es crucial para preservar nuestro entorno y garantizar un futuro sostenible. Y solo juntos conseguiremos alcanzar los objetivos fijados.

calendar icon
Documentación

1. Introducción

Las visualizaciones son representaciones gráficas de datos que permiten comunicar, de manera sencilla y efectiva, la información ligada a los mismos. Las posibilidades de visualización son muy amplias, desde representaciones básicas como los gráficos de líneas, de barras o métricas relevantes, hasta visualizaciones configuradas sobre cuadros de mando interactivos.

En esta sección de “Visualizaciones paso a paso” estamos presentando periódicamente ejercicios prácticos haciendo uso de datos abiertos disponibles en  datos.gob.es u otros catálogos similares. En ellos se abordan y describen de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y los análisis pertinentes para, finalmente obtener unas conclusiones a modo de resumen de dicha información.

En cada ejercicio práctico se utilizan desarrollos de código documentados y herramientas de uso gratuito. Todo el material generado está disponible para su reutilización en el repositorio de GitHub de datos.gob.es.

En este ejercicio concreto, exploraremos la actual situación de la penetración de los vehículos eléctricos en España y las perspectivas de futuro de esta tecnología disruptiva en el transporte.

Accede al repositorio del laboratorio de datos en Github.

Ejecuta el código de pre-procesamiento de datos sobre Google Colab.

En este vídeo, el autor te explica que vas a encontrar tanto en el Github como en Google Colab.

2. Contexto: ¿Por qué es importante el vehículo eléctrico?

La transición hacia una movilidad más sostenible se ha convertido en una prioridad global, situando al vehículo eléctrico (VE) en el centro de numerosas discusiones sobre el futuro del transporte. En España, esta tendencia hacia la electrificación del parque automovilístico no solo responde a un creciente interés por parte de los consumidores en tecnologías más limpias y eficientes, sino también a un marco regulatorio y de incentivos diseñado para acelerar la adopción de estos vehículos. Con una creciente oferta de modelos eléctricos disponibles en el mercado, los vehículos eléctricos representan una pieza clave en la estrategia del país para reducir las emisiones de gases de efecto invernadero, mejorar la calidad del aire en las ciudades y fomentar la innovación tecnológica en el sector automotriz.

Sin embargo, la penetración de los vehículos eléctricos en el mercado español enfrenta una serie de desafíos, desde la infraestructura de carga hasta la percepción y el conocimiento del consumidor sobre estos vehículos. La expansión de la red de carga, junto con las políticas de apoyo y los incentivos fiscales, son fundamentales para superar las barreras existentes y estimular la demanda. A medida que España avanza hacia sus objetivos de sostenibilidad y transición energética, el análisis de la evolución del mercado de vehículos eléctricos se convierte en una herramienta esencial para entender el progreso realizado y los obstáculos que aún deben superarse.

3. Objetivo

Este ejercicio se centra en mostrar al lector técnicas para el tratamiento, visualización y análisis avanzado de datos abiertos mediante Python. Adoptaremos para ello el enfoque “aprender haciendo”, de tal forma que el lector pueda comprender la utilización de estas herramientas en el contexto de la resolución de un reto real y de actualidad como es el estudio de la penetración del VE en España. Este enfoque práctico no solo mejora la comprensión de las herramientas de ciencia de datos, sino que también prepara a los lectores para aplicar estos conocimientos en la resolución de problemas reales, ofreciendo una experiencia de aprendizaje rica y directamente aplicable a sus propios proyectos.

Las preguntas a las que trataremos de dar respuesta a través de nuestro análisis son:

  1. ¿Qué marcas de vehículos lideraron el mercado en 2023?
  2. ¿Qué modelos de vehículos fueron los más vendidos en el 2023?
  3. ¿Qué cuota de mercado absorbieron los vehículos eléctricos en el 2023?
  4. ¿Qué modelos de vehículos eléctricos fueron los más vendidos en el 2023?
  5. ¿Cómo han evolucionado las matriculaciones de vehículos a lo largo del tiempo?
  6. ¿Observamos algún tipo de tendencia respecto a la matriculación de vehículos eléctricos?
  7. ¿Cómo esperamos que evolucionen las matriculaciones de vehículos eléctricos el próximo año?
  8. ¿Cuál es la reducción de emisiones de CO2 que podemos esperar gracias a las matriculaciones obtenidas durante el próximo año?

4. Recursos

Para completar el desarrollo de este ejercicio requeriremos el uso de dos categorías de recursos: Herramientas Analíticas y Conjuntos de Datos.

4.1. Conjunto de datos

Para completar este ejercicio utilizaremos un conjunto de datos provisto por la Dirección General de Tráfico (DGT) a través de su portal estadístico, también disponible desde el catálogo Nacional de Datos Abiertos (datos.gob.es). El portal estadístico de la DGT es una plataforma en línea destinada a ofrecer acceso público a una amplia gama de datos y estadísticas relacionadas con el tráfico y la seguridad vial. Este portal incluye información sobre accidentes de tráfico, infracciones, matriculaciones de vehículos, permisos de conducción y otros datos relevantes que pueden ser útiles para investigadores, profesionales del sector y el público en general.

En nuestro caso, utilizaremos su conjunto de datos de matriculaciones de vehículos en España disponibles vía:

Aunque durante el desarrollo del ejercicio mostraremos al lector los mecanismos necesarios para su descarga y procesamiento, incluimos en el repositorio de GitHub asociado los datos preprocesados*, de tal forma que el lector pueda proceder directamente al análisis de los mismos en el caso de que lo desee.

*Los datos utilizados en este ejercicio fueron descargados el 04 de marzo de 2024. La licencia aplicable a este conjunto de datos puede encontrarse en https://datos.gob.es/avisolegal.

4.2. Herramientas analíticas

  • Lenguaje de programación: Python – es un lenguaje de programación ampliamente utilizado en análisis de datos debido a su versatilidad y a la amplia gama de bibliotecas disponibles. Estas herramientas permiten a los usuarios limpiar, analizar y visualizar grandes conjuntos de datos de manera eficiente, lo que hace de Python una elección popular entre los científicos de datos y analistas.
  • Plataforma: Jupyter Notebooks – es una aplicación web que permite crear y compartir documentos que contienen código vivo, ecuaciones, visualizaciones y texto narrativo. Se utiliza ampliamente para la ciencia de datos, análisis de datos, aprendizaje automático y educación interactiva en programación.
  • Principales librerías y módulos:
    • Manipulación de datos: Pandas – es una librería de código abierto que proporciona estructuras de datos de alto rendimiento y fáciles de usar, así como herramientas de análisis de datos.
    • Visualización de datos:
      • Matplotlib: es una librería para crear visualizaciones estáticas, animadas e interactivas en Python.
      • Seaborn: es una librería basada en Matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.
    • Estadística y algoritmia:
      • Statsmodels: es una librería que proporciona clases y funciones para la estimación de muchos modelos estadísticos diferentes, así como para realizar pruebas y exploración de datos estadísticos.
      • Pmdarima: es una librería especializada en la modelización automática de series temporales, facilitando la identificación, el ajuste y la validación de modelos para pronósticos complejos.

5. Desarrollo del ejercicio

Es aconsejable ir ejecutando el Notebook con el código a la vez que se realiza la lectura del post, ya que ambos recursos didácticos son complementarios en las futuras explicaciones

 

El ejercicio propuesto se divide en cuatro fases principales.

5.1 Configuración inicial

Este apartado podrás encontrarlo en el punto 1 del Notebook.

En este breve primer apartado, configuraremos nuestro Jupyter Notebook y nuestro entorno de trabajo para poder trabajar con el conjunto de datos seleccionado. Importaremos las librerías Python necesarias y crearemos algunos directorios donde almacenaremos los datos descargados.

5.2 Preparación de datos

Este apartado podrás encontrarlo en el punto 2 del Notebook.

Todo análisis de datos requiere una fase de acceso y tratamiento de los mismos hasta obtener los datos adecuados en el formato deseado. En esta fase, descargaremos los datos del portal estadístico y los transformaremos al formato Apache Parquet antes de proceder a su análisis.

Aquellos usuarios que quieran profundizar en esta tarea, tienen a su disposición la Guía Práctica de Introducción al Análisis Exploratorio de Datos.

5.3 Análisis de datos

Este apartado podrás encontrarlo en el punto 3 del Notebook.

5.3.1 Análisis descriptivo

En esta tercera fase, comenzaremos nuestro análisis de datos. Para ello, responderemos las primeras preguntas apoyándonos en herramientas de visualización de datos que además nos permitirán familiarizarnos con los mismos. Mostramos a continuación algunos ejemplos del análisis:

  • Top 10 Vehículos matriculados en el 2023: En esta visualización representamos los diez modelos de vehículos con mayor número de matriculaciones durante el año 2023, indicando además el tipo de combustión de estos. Las principales conclusiones son:
    • Los únicos vehículos de fabricación europea que aparecen en el Top 10 son el Arona y el Ibiza de la marca española SEAT. El resto son asiáticos.
    • Nueve de los diez vehículos están propulsados por Gasolina.
    • El único vehículo del Top 10 con un tipo de propulsión diferente es el DACIA Sandero GLP (Gas Licuado de Petróleo).

Gráfica que muestra el Top10 de vehículos matriculados en 2023. Son, por este orden: Arona, Toyota Corolla, MG ZS, Toyota C-HR, Sportage, Ibiza, Nissan Qashqai, Sandero, tucson, Toyota Yaris Cross. Todos son de gasolina, excepto el Sandero que es Gas Licuado de Petróleo.

Figura 1. Gráfica "Top 10 Vehículos matriculados en el 2023"

  • Cuota de mercado por tipo de propulsión: En esta visualización representamos el porcentaje de vehículos matriculado por cada tipo de propulsión (vehículos de gasolina, diésel, eléctricos u otros). Vemos cómo la inmensa mayoría del mercado (>70%) la absorbieron vehículos de gasolina, siendo los diésel la segunda opción, y como los vehículos eléctricos alcanzaron el 5.5%.

Gráfico que muestra los vehículos vendidos en 2023 por tipo de propulsión: gasolina (71,3%), Diesel (20,5%), Eléctrico (5,5%), otros (2,7%).

Figura 2. Gráfica "Cuota de mercado por tipo de propulsión".

  • Evolución histórica de las matriculaciones: Esta visualización representa la evolución de las matriculaciones de vehículos en el tiempo. En ella se muestra el número de matriculaciones mensual entre enero de 2015 y diciembre de 2023 distinguiendo entre los tipos de propulsión de los vehículos matriculados.Podemos observar varios aspectos interesantes en este gráfico:
    • Apreciamos un comportamiento estacional anual, es decir, observamos patrones o variaciones que se repiten a intervalos regulares de tiempo. Vemos cómo recurrentemente en junio/julio aparecen altos niveles de matriculación mientras que en agosto/septiembre decrecen drásticamente. Esto es muy relevante, pues el análisis de series temporales con factor estacional tiene ciertas particularidades.
    • Es muy notable también la enorme caída de matriculaciones producida durante los primeros meses del COVID.
    • Vemos también como los niveles de matriculación post-covid son inferiores a los previos.
    • Por último, podemos observar cómo entre los años 2015 y 2023 la matriculación de vehículos eléctricos va creciendo paulatinamente.

Gráfico que muestra el número de matriculaciones mensual entre enero de 2015 y diciembre de 2023 distinguiendo entre los tipos de propulsión de los vehículos matriculados.

Figura 3. Gráfica "Matriculaciones de vehículos por tipo de propulsión".

  • Tendencia en la matriculación de vehículos eléctricos: Analizamos ahora por separado la evolución de vehículos eléctricos y no eléctricos utilizando mapas de calor como herramienta visual. Podemos observar comportamientos muy diferenciados entre ambos gráficos. Observamos cómo el vehículo eléctrico presenta una tendencia de incremento de matriculaciones año a año y, a pesar de suponer el COVID un parón en la matriculación de vehículos, los años posteriores han mantenido la tendencia creciente.

Gráfica que muestra la tendencia  en la matriculación de vehículos eléctricos a través de un mapa de calor. Se observa cómo van creciendo dichas matriculaciones.

Figura 4. Gráfica "Tendencia en la matriculación de vehículos convencionales vs eléctricos".

5.3.2. Analítica predictiva

Para dar respuesta a la última de las preguntas de forma objetiva, utilizaremos modelos predictivos que nos permitan realizar estimaciones respecto a la evolución del vehículo eléctrico en España. Como podemos observar, el modelo construido nos propone una continuación del crecimiento en las matriculaciones esperadas a lo largo del año serán de 70.000, alcanzando valores cercanos a las 8.000 matriculaciones solo en el mes de diciembre del 2024.

Gráfica que muestra el crecimiento futuro, según la estimación de nuestro modelo, de matriculaciones de vehículos eléctricos".

Figura 5. Gráfica "Predicción de matriculaciones de vehículos electricos".

5. Conclusiones del ejercicio

Como conclusión del ejercicio, podremos observar gracias a las técnicas de análisis empleadas como el vehículo eléctrico está penetrando cada vez a mayor velocidad en el parque móvil español aunque aún se encuentre a una distancia grande de otras alternativas como el Diésel o la Gasolina, por ahora liderado por el fabricante Tesla. Veremos en los próximos años si el ritmo crece al nivel necesario para alcanzar los objetivos de sostenibilidad fijados y si Tesla sigue siendo líder a pesar de la fuerte entrada de competidores asiáticos.

6. ¿Quieres realizar el ejercicio?

Si quieres conocer más sobre el Vehículo Eléctrico y poner a prueba tus capacidades analíticas, accede a este repositorio de código donde podrás desarrollar este ejercicio paso a paso.

Además, recuerda que tienes a tu disposición más ejercicios en el apartado sección de “Visualizaciones paso a paso”.


Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato.Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Aplicación

Es una web que reutiliza datos abiertos para informar sobre cómo están distribuidos los espacios verdes y el arbolado de la ciudad de Valencia. 

La información de la web se divide en tres zonas: 

  1. Valencia ciudad  

  1. Término municipal de Valencia 

  1.  Datos sobre el arbolado de Valencia ciudad 

Los datos que muestra Valencia Verde provienen de catálogos de datos abiertos sobre espacios verdes y arbolado disponibles en  Ajuntament de València – Dades Obertes,  datos del censo de la Oficina d'Estadística de València e información del Institut Cartogràfric Valencià

Gracias a dicha información, se crean visualizaciones en las que los usuarios pueden ver, por ejemplo, el porcentaje de área verde por barrio/distrito y los m2 de zona verde por habitante en cada barrio/distrito. Esta aplicación es un espacio que permite conocer, de manera clara e interactiva, el arbolado, las zonas verdes y su relación con la población y los barrios de Valencia.  

calendar icon
Aplicación

Esta aplicación muestra la ubicación de las estaciones de recargas para vehículos eléctricos dentro de la Comunidad de Castilla y León. El usuario puede seleccionar la provincia de su interés y acceder a la información de las estaciones disponibles. Para cada estación se proporciona diversa información, como su situación, la empresa proveedora, el número de estaciones de carga y los conectores disponibles. 

Además, dentro de la app el usuario también puede encontrar información sobre los programas de incentivos a la movilidad eléctrica, como el Plan MOVES III

Los datos geográficos de dichos cargadores se han obtenido de los servidores de la plataforma pública de Datos Abiertos de Castilla y León. 

calendar icon
Documentación

Los Objetivos de Desarrollo Sostenible (ODS) son un conjunto de metas adoptadas por la comunidad internacional que buscan abordar los desafíos más urgentes de nuestro tiempo. Estos objetivos nacieron simultaneamente junto con la Alianza Mundial para los Datos del Desarrollo Sostenible y la Carta Internacional de Datos Abiertos, que proporcionaron una coalición de expertos dispuestos a poner los beneficios de los datos abiertos a disposición de la nueva agenda de desarrollo. 

En este sentido, los datos abiertos juegan un papel muy relevante dentro de la agenda de desarrollo como indicadores de evolución en los ODS, porque permiten medir y evaluar su progreso, así como mejorar la rendición de cuentas a través de la compartición de esos datos con el resto de la comunidad, aportando un gran valor de múltiples formas:  

  • Facilitando la toma de decisiones a la hora de diseñar políticas y estrategias que ayuden a cumplir con los objetivos;
  • Identificando desigualdades y desafíos específicos entre distintas regiones o grupos de población;
  • Mejorando la eficiencia en la implementación de políticas y programas; o
  • Como motor de innovación a través de la investigación y desarrollo.

Hoy en día, existen grandes bases de datos globales, tanto generalistas como temáticas, que podemos utilizar para estos fines, además de todas las fuentes de datos nacionales disponibles en nuestro propio país. No obstante, todavía queda camino por recorrer en este aspecto: la proporción de indicadores de los ODS que son conceptualmente claros y tienen una buena cobertura nacional aún es del 66%, según el último informe de progreso de los ODS publicado en 2023. Esto da lugar a que sigamos teniendo que hacer frente a lagunas de datos en áreas tan vitales como la pobreza, el hambre, la educación, la igualdad, la sostenibilidad, el clima, los mares y la justicia, entre otros. Además, existe también una carencia bastante general y significativa de datos desglosados por edad y/o por sexo, lo que hace muy difícil poder supervisar adecuadamente el posible avance de los objetivos en cuanto a los grupos de población más vulnerables.  

En este informe, se realiza un recorrido a través del doble papel que los datos abiertos juegan a la hora de dar soporte al avance nacional y global en la consecución de los ODS. La primera parte del informe se centra en el papel más conocido de los datos abiertos como meros indicadores a la hora de medir el avance de los objetivos, mientras que en la segunda parte se aborda su papel como herramienta clave y materia prima fundamental para el desarrollo de la sociedad en general y para la consecución de los propios objetivos en particular. Para ello, se explora cuáles son los conjuntos de datos que podrían contar con mayor potencial en cada caso, mostrando algunos ejemplos prácticos, nacionales y a nivel europeo, en varios objetivos de desarrollo concretos.

Si quieres saber más sobre el contenido de este informe, puedes ver la entrevista a su autor.

A continuación, puedes descargar el informe completo, su versión accesible, el resumen ejecutivo y una presentación-resumen.

calendar icon