Aplicación

Precioil.es es una plataforma web en la que es posible consultar información sobre las estaciones de servicio situadas en España y sus precios actuales.  

A través de un buscador, es posible localizar las gasolineras de un área determinada y seleccionar el tipo de combustible y la marca. En la información de cada una de las estaciones se encuentran además de los precios, la dirección, horario, la ubicación y otros detalles de interés, además del historial de precios de la última semana.  

Precioil.es también recoge la evolución de los precios medios por combustible en España de los últimos siete días, los datos de los precios medios diarios por marca y los precios medios por provincia. Además, cuenta con un directorio de todas las estaciones de servicio del país.  

Para su desarrollo se han utilizado datos abiertos de los precios de los carburantes en España.  

 

Las fuentes de datos abiertos son:  

calendar icon
Documentación

1. Introducción

Las visualizaciones son representaciones gráficas de datos que permiten comunicar, de manera sencilla y efectiva, la información ligada a los mismos. Las posibilidades de visualización son muy amplias, desde representaciones básicas como los gráficos de líneas, de barras o métricas relevantes, hasta visualizaciones configuradas sobre cuadros de mando interactivos.

En esta sección de “Visualizaciones paso a paso” estamos presentando periódicamente ejercicios prácticos haciendo uso de datos abiertos disponibles en  datos.gob.es u otros catálogos similares. En ellos se abordan y describen de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y los análisis que resulten pertinentes para, finalmente obtener unas conclusiones a modo de resumen de dicha información.

En cada uno de estos ejercicios prácticos, se utilizan desarrollos de código convenientemente documentados, así como herramientas de uso gratuito. Todo el material generado está disponible para su reutilización en el repositorio de GitHub de datos.gob.es.

Accede al repositorio del laboratorio de datos en Github.

Ejecuta el código de pre-procesamiento de datos sobre Google Colab.

 

2. Objetivo

El principal objetivo de este ejercicio es mostrar cómo realizar, de una forma didáctica, un análisis predictivo de series temporales partiendo de datos abiertos sobre el consumo de electricidad en la ciudad de Barcelona. Para ello realizaremos un análisis exploratorio de los datos, definiremos y validaremos el modelo predictivo, para por último generar las predicciones junto a sus gráficas y visualizaciones correspondientes.

Los análisis predictivos de series temporales son técnicas estadísticas y de aprendizaje automático que se utilizan para prever valores futuros en conjuntos de datos que se recopilan a lo largo del tiempo. Estas predicciones se basan en patrones y tendencias históricas identificadas en la serie temporal, siendo su objetivo principal anticipar cambios y eventos en función de datos pasados.

El conjunto de datos abiertos inicial consta de registros desde el año 2019 hasta el año 2022 ambos inclusive, por otra parte, las predicciones las realizaremos para el año 2023, del cual no tenemos datos reales.

Una vez realizado el análisis, podremos contestar a preguntas como las que se plantean a continuación:

  • ¿Cuál es la predicción futura de consumo eléctrico?
  • ¿Cómo de preciso ha sido el modelo con la predicción de datos ya conocidos?
  • ¿Qué días tendrán un consumo máximo y mínimo según las predicciones futuras?
  • ¿Qué meses tendrán un consumo medio máximo y mínimo según las predicciones futuras?

Estas y otras muchas preguntas pueden ser resueltas mediante las visualizaciones obtenidas en el análisis que mostrarán la información de una forma ordenada y sencilla de interpretar.

 

3. Recursos

3.1. Conjuntos de datos

Los conjuntos de datos abiertos utilizados contienen información sobre el consumo eléctrico en la ciudad de Barcelona en los últimos años. La información que aportan es el consumo en (MWh) desglosados por día, sector económico, código postal y tramo horario.

Estos conjuntos de datos abiertos son publicados por el Ayuntamiento de Barcelona en el catálogo de datos.gob.es, mediante ficheros que recogen los registros de forma anual. Cabe destacar que el publicador actualiza estos conjuntos de datos con nuevos registros con frecuencia, por lo que hemos utilizado solamente los datos proporcionados desde el 2019 hasta el 2022 ambos inclusive.

Estos conjuntos de datos también se encuentran disponibles para su descarga en el siguiente repositorio de Github

 

3.2. Herramientas

Para la realización del análisis se ha utilizado el lenguaje de programación Python escrito sobre un Notebook de Jupyter alojado en el servicio en la nube de Google Colab.

"Google Colab" o, también llamado Google Colaboratory, es un servicio en la nube de Google Research que permite programar, ejecutar y compartir código escrito en Python o R sobre un Jupyter Notebook desde tu navegador, por lo que no requiere configuración. Este servicio es gratuito.

Para la creación de las visualizaciones interactivas se ha usado la herramienta Looker Studio.

"Looker Studio", antiguamente conocido como Google Data Studio, es una herramienta online que permite realizar visualizaciones interactivas que pueden insertarse en sitios web o exportarse como archivos.

Si quieres conocer más sobre herramientas que puedan ayudarte en el tratamiento y la visualización de datos, puedes recurrir al informe "Herramientas de procesado y visualización de datos".

 

 

4. Análisis predictivo de series temporales

El análisis predictivo de series temporales es una técnica que utiliza datos históricos para predecir valores futuros de una variable que cambia con el tiempo. Las series temporales son datos que se recopilan en intervalos regulares, como días, semanas, meses o años. No es el objetivo de este ejercicio explicar en detalle las características de las series temporales, ya que nos centramos en explicar brevemente el modelo de predicción. No obstante, si quieres saber más al respecto, puedes consultar el siguiente manual.

Este tipo de análisis se basa en el supuesto de que los valores futuros de una variable estarán correlacionados con los valores históricos. Utilizando técnicas estadísticas y de aprendizaje automático, se pueden identificar patrones en los datos históricos y utilizarlos para predecir valores futuros.

El análisis predictivo realizado en el ejercicio ha sido dividido en cinco fases; preparación de los datos, análisis exploratorio de los datos, entrenamiento del modelo, validación del modelo y predicción de valores futuros), las cuales se explicarán en los próximos apartados.

Los procesos que te describimos a continuación los encontrarás desarrollados y comentados en el siguiente Notebook ejecutable desde Google Colab junto al código fuente que está disponible en nuestra cuenta de Github.  

Es aconsejable ir ejecutando el Notebook con el código a la vez que se realiza la lectura del post, ya que ambos recursos didácticos son complementarios en las futuras explicaciones

 

4.1 Preparación de los datos

Este apartado podrás encontrarlo en el punto 1 del Notebook.

En este apartado se importan los conjuntos de datos abiertos descritos en los puntos anteriores que utilizaremos en el ejercicio, prestando especial atención a su obtención y a la validación de su contenido, asegurándonos que se encuentran en el formato adecuado y consistente para su procesamiento y que no contienen errores que puedan condicionar los pasos futuros.

 

4.2 Análisis exploratorio de los datos (EDA)

Este apartado podrás encontrarlo en el punto 2 del Notebook.

En este apartado realizaremos un análisis exploratorio de los datos (EDA), con el fin de interpretar adecuadamente los datos de origen, detectar anomalías, datos ausentes, errores u outliers que pudieran afectar a la calidad de los procesos posteriores y resultados.

A continuación, en la siguiente visualización interactiva, podrás inspeccionar la tabla de datos con los valores de consumo históricos generada en el punto anterior pudiendo filtrar por periodo temporal concreto. De esta forma podemos comprender, de una forma visual, la principal información de la serie de datos.

Una vez inspeccionada la visualización interactiva de la serie temporal, habrás observado diversos valores que potencialmente podrían ser considerados como outliers, como se muestra en la siguiente figura. También podemos calcular de forma numérica estos outliers, como se muestra en el notebook.

Figura 1. Outliers de la serie temporal con datos históricos
 

Una vez evaluados los outliers, para este ejercicio se ha decidido modificar únicamente el registrado en la fecha "2022-12-05". Para ello se sustituirá el valor por la media del registrado el día anterior y el día siguiente.

La razón de no eliminar el resto de outliers es debido a que son valores registrados en días consecutivos, por lo que se presupone que son valores correctos afectados por variables externas que se escapan del alcance del ejercicio. Una vez solucionado el problema detectado con los outliers, esta será la serie temporal de datos que utilizaremos en los siguientes apartados.

Figura 2. Serie temporal de datos históricos una vez tratados los outliers

 

Si quieres conocer más sobre estos procesos puedes recurrir a la Guía Práctica de Introducción al Análisis Exploratorio de Datos.

 

4.3 Entrenamiento del modelo

Este apartado podrás encontrarlo en el punto 3 del Notebook.

En primer lugar, creamos dentro de la tabla de datos los atributos temporales (año, mes, día de la semana y trimestre). Estos atributos son variables categóricas que ayudan a garantizar que el modelo sea capaz de capturar con precisión las características y patrones únicos de estas variables. Mediante las siguientes visualizaciones de diagramas de cajas, podemos ver su relevancia dentro de los valores de la serie temporal.

 

Figura 3. Diagramas de cajas de los atributos temporales generados

 

Podemos observar ciertos patrones en las gráficas anteriores como los siguientes:

  • Los días laborales (lunes a viernes) presentan un mayor consumo que los fines de semana.
  • El año que valores de consumo más bajos presenta es el 2020, esto entendemos que se debe a la reducción de actividad servicios e industrial durante la pandemia.
  • El mes que mayor consumo presenta es julio, lo cual es entendible debido al uso de aparatos de aire acondicionado.
  • El segundo trimestre es el que presenta valores más bajos de consumo, destacando abril como el mes con valores más bajos.

A continuación, dividimos la tabla de datos en set de entrenamiento y en set de validación.  El set de entrenamiento se utiliza para entrenar el modelo, es decir, el modelo aprende a predecir el valor de la variable objetivo a partir de dicho set, mientras que el set de validación se utiliza para evaluar el rendimiento del modelo, es decir, el modelo se evalúa con los datos de dicho set para determinar su capacidad para predecir los nuevos valores.

Esta división de los datos es importante para evitar el sobreajuste siendo la proporción típica de los datos que se utilizan para el set de entrenamiento de un 70 % y el set de validación del 30% aproximadamente. Para este ejercicio hemos decidido generar el set de entrenamiento con los datos comprendidos entre el "01-01-2019" hasta el "01-10-2021", y el set de validación con los comprendidos entre el "01-10-2021" y el "31-12-2022" como podemos apreciar en la siguiente gráfica.

Figura 4. Serie temporal de datos históricos dividida en set de entrenamiento y set de validación

 

Para este tipo de ejercicio, tenemos que utilizar algún algoritmo de regresión. Existen diversos modelos y librerías que pueden utilizarse para predicción de series temporales. En este ejercicio utilizaremos el modelo “Gradient Boosting”, modelo de regresión supervisado que se trata de un algoritmo de aprendizaje automático utilizado para predecir un valor continúo basándose en el entrenamiento de un conjunto de datos que contienen valores conocidos para la variable objetivo (en nuestro ejemplo la variable “valor”) y los valores de las variables independientes (en nuestro ejercicio los atributos temporales).

Está basado en árboles de decisión y utiliza una técnica llamada "boosting" para mejorar la precisión del modelo siendo conocido por su eficiencia y capacidad para manejar una variedad de problemas de regresión y clasificación.

Sus principales ventajas son el alto grado de precisión, su robustez y flexibilidad, mientras que alguna de sus desventajas son la sensibilidad a valores atípicos y que requiere una optimización cuidadosa de los parámetros.

Utilizaremos el modelo de regresión supervisado ofrecido en la librería XGBBoost, el cuál puede ajustarse con los siguientes parámetros:

  • n_estimators: parámetro que afecta al rendimiento del modelo indicando el número de árboles utilizados. Un mayor número de árboles generalmente resulta un modelo más preciso, pero también puede llevar más tiempo de entrenamiento.
  • early_stopping_rounds: parámetro que controla el número de rondas de entrenamiento que se ejecutarán antes de que el modelo se detenga si el rendimiento en el conjunto de validación no mejora.
  • learning_rate: controla la velocidad de aprendizaje del modelo. Un valor más alto hará que el modelo aprenda más rápido, pero puede provocar un sobreajuste.
  • max_depth: controla la profundidad máxima de los árboles en el bosque. Un valor más alto puede proporcionar un modelo más preciso, pero también puede provocar un sobreajuste.
  • min_child_weight: controla el peso mínimo de una hoja. Un valor más alto puede ayudar a prevenir el sobreajuste.
  • gamma: controla la cantidad de reducción de la pérdida esperada que se necesita para dividir un nodo. Un valor más alto puede ayudar a prevenir el sobreajuste.
  • colsample_bytree: controla la proporción de las características que se utilizan para construir cada árbol. Un valor más alto puede ayudar a prevenir el sobreajuste.
  • subsample: controla la proporción de los datos que se utilizan para construir cada árbol. Un valor más alto puede ayudar a prevenir el sobreajuste.

Estos parámetros se pueden ajustar para mejorar el rendimiento del modelo en un conjunto de datos específico. Se recomienda experimentar con diferentes valores de estos parámetros para encontrar el valor que proporciona el mejor rendimiento en tu conjunto de datos.

Por último, mediante una gráfica de barras observaremos de forma visual la importancia de cada uno de los atributos durante el entrenamiento del modelo. Se puede utilizar para identificar los atributos más importantes en un conjunto de datos, lo que puede ser útil para la interpretación del modelo y la selección de características.

Figura 5. Gráfica de barras con importancia de los atributos temporales

4.4 Entrenamiento del modelo

Este apartado podrás encontrarlo en el punto 4 del Notebook.

Una vez entrenado el modelo, evaluaremos cómo de preciso es para los valores conocidos del set de validación.

Podemos evaluar de forma visual el modelo ploteando la serie temporal con los valores conocidos junto a las predicciones realizadas para el set de validación como se muestra en la siguiente figura.

Figura 6. Serie temporal con los datos del set de validación junto a los de la predicción 

 

También podemos evaluar de forma numérica la precisión del modelo mediante distintas métricas. En este ejercicio hemos optado por utilizar la métrica del error porcentual absoluto medio (MAPE), el cuál ha sido de un 6,58%. La precisión del modelo se considera alta o baja dependiendo del contexto y de las expectativas en dicho modelo, generalmente un MAPE se considera bajo cuando es inferior al 5%, mientras que se considera alto cuando es superior al 10%. En este ejercicio, el resultado de la validación del modelo puede ser considerado un valor aceptable.

Si quieres consultar otro tipo de métricas para evaluar la precisión de modelos aplicados a series temporales, puedes consultar el siguiente enlace.

 

4.5 Predicciones valores futuros

Este apartado podrás encontrarlo en el punto 5 del Notebook.

Una vez generado el modelo y evaluado su rendimiento MAPE = 6,58 %, pasamos a aplicar dicho modelo al total de datos conocidos, con la finalidad de predecir los valores de consumo eléctrico no conocidos del 2023.

En primer lugar, volvemos a entrenar el modelo con los valores conocidos hasta finales del 2022, sin dividir en set de entrenamiento y validación. Por último, calculamos los valores futuros para el año 2023.

Figura 7. Serie temporal con los datos históricos y la predicción para el 2023

 

En la siguiente visualización interactiva puedes observar los valores predichos para el año 2023 junto a sus principales métricas, pudiendo filtrar por periodo temporal.

 

Mejorar los resultados de los modelos predictivos de series temporales es un objetivo importante en la ciencia de datos y el análisis de datos. Varias estrategias que pueden ayudar a mejorar la precisión del modelo del ejercicio son el uso de variables exógenas, la utilización de más datos históricos o generación de datos sintéticos, optimización de los parámetros, …

Debido al carácter divulgativo de este ejercicio y para favorecer el entendimiento de los lectores menos especializados, nos hemos propuesto explicar de una forma lo más sencilla y didáctica posible el ejercicio. Posiblemente se te ocurrirán muchas formas de optimizar el modelo predictivo para lograr mejores resultados, ¡Te animamos a que lo hagas!

 

5. Conclusiones ejercicio

Una vez realizado el ejercicio, podemos apreciar distintas conclusiones como las siguientes:

  • Los valores máximos para las predicciones de consumo en el 2023 se dan en la última quincena de julio superando valores de 22.500.000 MWh
  • El mes con un mayor consumo según las predicciones del 2023 será julio, mientras que el mes con un menor consumo medio será noviembre, existiendo una diferencia porcentual entre ambos del 25,24%
  • La predicción de consumo medio diario para el 2023 es de 17.259.844 MWh, un 1,46% inferior a la registrada entre los años 2019 y 2022.

Esperemos que este ejercicio te haya resultado útil para el aprendizaje de algunas técnicas habituales en el estudio y análisis de datos abiertos. Volveremos para mostraros nuevas reutilizaciones. ¡Hasta pronto!

calendar icon
Aplicación

Esta aplicación es una herramienta que presenta en tiempo real los costes de la electricidad en España para la Tarifa Regulada PVPC (Precio Voluntario al Pequeño Consumidor). El objetivo es que cualquier usuario pueda comprobar las horas con los costes más bajos de luz para así poder ahorrar en su factura de electricidad.  

Se ofrecen diferentes gráficas del precio de la luz hora a hora, así como datos útiles para los usuarios obtenidos de la API abierta de ESIOS (Red Eléctrica de España). Todos estos gráficos y datos muestran información acerca de las fluctuaciones en el precio de la electricidad en España. 

El usuario puede conocer fácilmente a qué hora es más barata la luz en cada momento y el precio exacto, así como una estimación de los precios del día siguiente a partir de las 20:30 de la tarde del día anterior.  

Las fuentes de datos abiertos son:  

calendar icon
Blog

Aspectos tan relevantes de nuestra sociedad como la sostenibilidad medioambiental, la mitigación del cambio climático o la seguridad energética han motivado que la transición energética adquiera un papel muy relevante en el día a día de naciones, organismos privados y públicos, e incluso en nuestras vidas cotidianas como ciudadanos del mundo. La transición energética hace referencia a la transformación de nuestras formas de producción y consumo energético persiguiendo la menor dependencia de combustibles fósiles mediante fuentes de bajas emisiones o sin emisiones de carbono, como son las fuentes renovables.

Las medidas necesarias para conseguir una verdadera transición son de gran calado y, por tanto, complejas. En este proceso, las iniciativas de datos abiertos  pueden contribuir enormemente facilitando la concienciación de la población, mejorando la estandarización de métricas y mecanismos para medir el impacto de medidas tomadas para mitigar el cambio climático a nivel mundial, promoviendo la transparencia de gobiernos y empresas en cuanto a reducción de emisiones de CO2, o aumentando la participación ciudadana y científica para la creación de nuevas soluciones digitales, así como el avance del conocimiento y la innovación. 

¿Qué iniciativas están sirviendo de guía? 

La mejor forma de comprender cómo el open data nos ayuda a percibir los efectos de las elevadas emisiones de CO2 así como el impacto de las diferentes medidas adoptadas por todo tipo de actores en favor de la transición energética es mediante la observación de ejemplos reales.

El Energy Institute (EI), entidad dedicada precisamente a la aceleración de la transición energética, publica anualmente su revisión estadística de la energía mundial, la cual incluye en su última versión hasta 80 conjuntos de datos, algunos de los cuales se remontan hasta el año 1965, que describen el comportamiento de diferentes fuentes de energía, así como el uso de minerales clave en la transición hacia la sostenibilidad. Utilizando su propia herramienta de reporting online para representar aquellas variables que queremos analizar, podemos observar cómo, a pesar del crecimiento exponencial de generación de energía renovable en los últimos años (figura 1), sigue habiendo una tendencia creciente en emisiones de CO2 (figura 2), aunque no tan drástica como en la primera década de los 2000.

 

Figura 1: Evolución de la generación renovable mundial en TWh

Fuente: Energy Institute Statistical Review 2023

 

Figura 2: Evolución de las emisiones de CO2 mundiales en MTCO2

Fuente: Energy Institute Statistical Review 2023

Otra entidad internacional impulsora de la transición energética que ofrece un interesante catálogo de datos es la International Energy Agency (IEA). En este caso podemos encontrar más de 70 conjuntos de datos, no todos ellos abiertos sin subscripción, que incluyen tanto datos energéticos históricos como proyecciones futuras para poder alcanzar los objetivos Net Zero 2050. Podemos observar a continuación un ejemplo de estos datos extraído de su librería de visualizaciones gráficas, en particular, la evolución esperada de la generación energética para alcanzar los objetivos Net Zero en 2050. En la figura 3 podemos examinar cómo, para alcanzar estos objetivos, deben ocurrir principalmente dos procesos simultáneos: reducir la energía total demandada anualmente y evolucionar progresivamente a fuentes de generación con menor volumen de emisiones de CO2.

Figura 3: Generación energética 2020-2050 para alcanzar los objetivos de emisiones Net Zero en Exajulios

Fuente: IEA, Total energy supply by source in the Net Zero Scenario, 2022-2050, IEA, Paris, IEA. Licence: CC BY 4.0

Para analizar en mayor detalle cómo deben suceder estos dos procesos para alcanzar los objetivos Net Zero, IEA nos ofrece otra visualización muy relevante (figura 4). En ella, podemos observar cómo para alcanzar la reducción de la energía total demandada anualmente, es necesario avanzar aceleradamente en la década 2025-2035, gracias a medidas como electrificación, mejoras técnicas en la eficiencia de sistemas energéticos o reducción de la demanda. De esta manera, debe alcanzarse una reducción cercana a los 100EJs anuales para el año 2035, que luego debe mantenerse a lo largo del resto del período analizado. Para tratar de entender el calado de estas medidas y tomando como referencia el consumo eléctrico medio de los hogares españoles, unos 3.500kWh/año, la reducción anual deseada equivaldría a evitar el consumo de unos 7.937.000.000 hogares o, de otra manera, a evitar en un año el consumo eléctrico que todos los hogares españoles realizarían durante 418 años. 

Respecto a la transición hacia fuentes de menor volumen de emisiones, podemos observar en esta figura cómo la expectativa es que la energía solar sea la líder en crecimiento, por delante de la eólica, mientras que el unabated coal (energía procedente de la quema de carbón sin utilizar sistemas de captura de CO2) sea la fuente cuyo uso más se espera reducir.

Figura 4: Cambios en la generación energética 2020-2050 para alcanzar los objetivos de emisiones Net Zero en Exajulios

Fuente: IEA, Changes in total energy supply by source in the Net Zero Scenario, 2022–2050, IEA, Paris, IEA. Licence: CC BY 4.0

Otras iniciativas de datos abiertos interesantes desde el punto de vista de la transición energética son los catálogos de la Comisión Europea (más de 1,5 millones de conjuntos de datos) y del Gobierno de España a través de datos.gob.es (más de 70 mil conjuntos de datos). Ambos aportan conjuntos de datos abiertos en temáticas como medioambiente, energía o transporte

En ambos portales, podemos encontrar información muy variada, como consumos energéticos de ciudades y empresas, proyectos autorizados para la construcción de instalaciones de generación renovable o evolución de precios de hidrocarburos. 

Por último, destaca la iniciativa REData, de Red Eléctrica Española (REE), que ofrece un área de datos con un amplio abanico de información relacionada con el sistema eléctrico español. Entre otras, información relativa a la generación eléctrica, a los mercados o al comportamiento diario del sistema.

 

Figura 5: Secciones de información provista desde REData

Fuente: El sistema eléctrico: Guía de uso de REData, noviembre 2022. Red Eléctrica Española. 

Así mismo, la web ofrece un visualizador interactivo para la consulta y descarga de datos, como se muestra a continuación para la generación eléctrica, además de un interfaz programático (API – Application Programming Interface) para la consulta del repositorio de datos facilitado desde esta entidad.

Figura 6: Plataforma REData de REE

Fuente: https://www.ree.es/es/datos/aldia

 

¿Qué conclusiones podemos extraer de este movimiento? 

Como hemos podido observar, la enorme preocupación en torno a la transición energética ha motivado a múltiples organismos de diferente naturaleza a poner a disposición de otros organismos y de la propia ciudadanía datos de manera abierta para su análisis y explotación. Entidades tan variadas como el Energy Institute, la International Energy Agency, la Comisión Europea, el Gobierno de España o Red Eléctrica Española publican a través de sus portales de datos información muy valiosa en busca de una mayor transparencia y concienciación. 

En este breve artículo hemos podido examinar cómo estos datos han sido de gran ayuda para comprender mejor la evolución histórica de las emisiones de CO2, la potencia eólica instalada o las expectativas de demanda energética para alcanzar los objetivos Net Zero. Los datos abiertos son una muy buena herramienta para mejorar la comprensión de la necesidad y calado de la transición energética, así como del avance de las medidas que progresivamente están siendo tomadas por múltiples entidades en todo el mundo, y esperamos ver cada vez un mayor número de iniciativas que sigan esta línea.   


Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

Los datos abiertos son una herramienta útil para tomar decisiones informadas que incentiven el éxito de un proceso y mejorar su eficacia. Desde una visión sectorial, los datos abiertos aportan información relevante sobre el sector legal, el educativo o el de la salud. Todos ellos, junto a otros muchos ámbitos, emplean fuentes abiertas para medir el cumplimiento de una mejora o desarrollar herramientas que faciliten el trabajo a los profesionales.  

Los beneficios del uso de los datos abiertos son amplios y su variedad va de la mano de la innovación tecnológica: cada día surgen más oportunidades para emplear datos abiertos en el desarrollo de soluciones innovadoras. Ejemplo de ello puede ser el desarrollo urbanístico alineado con los valores de sostenibilidad que defiende la Organización de las Naciones Unidas (ONU).  

Las ciudades ocupan el 3% de la superficie terrestre; sin embargo, emiten el 70% de las emisiones de carbono y consumen más del 60% de los recursos de todo el mundo, según la ONU. En 2023, más de la mitad de la población mundial vive en ciudades y se prevé que esta cifra siga creciendo. En 2030 se estima que más de 5.000 millones de personas vivirían en ciudades, es decir, más del 60% de la población de todo el mundo.  

A pesar de la tendencia, las infraestructuras y los barrios no cumplen con las condiciones adecuadas de desarrollo sostenible y el objetivo es “Lograr que las ciudades y los asentamientos humanos sean inclusivos, seguros y sostenibles”, tal y como se reconoce en el ODS número 11. La planificación y gestión adecuada de los recursos urbanos son cuestiones de peso a la hora de crear y mantener comunidades basadas en la sostenibilidad. En este contexto, los datos abiertos juegan un importante papel para medir el cumplimiento de este ODS y así alcanzar la meta de ciudades sostenibles.  

En definitiva, los datos abiertos se constituyen como una herramienta fundamental para el fortalecimiento y progreso del desarrollo sostenible de las ciudades. 

En esta infografía, hemos recogido casos de uso que emplean conjuntos de datos abiertos para monitorizar y/o mejorar la eficiencia energética, el transporte y la movilidad urbana, la calidad del aire y el nivel de ruido. Cuestiones que contribuyen al buen funcionamiento de los centros urbanos. 

Haz clic en la infografía para verla en tamaño real  


Versión accesible en Word

calendar icon
Aplicación

Portal web con diversos cuadros de mandos interactivos de acceso libre dedicado a la gobernanza climática. 

La aplicación agrupa ocho conjuntos de datos del portal de datos del Gobierno de Canarias, MITECO, ITC, ISTAC y GRAFCAN:

1. Inventario de emisiones

2. Huella de carbono

3. Contaminantes emitidos a la atmósfera

4. Incendios forestales

5. Proyecciones climáticas

6. PIMA

7. Producción de energía en Canarias

8. Producción neta de electricidad

calendar icon
Aplicación

Urban3r es una aplicación que permite visualizar diferentes indicadores sobre el estado actual de la edificación, los datos de demanda energética de los edificios residenciales en su estado actual y tras someterlos a una rehabilitación energética, así como los costes estimados de estas intervenciones. 

Para facilitar la toma de decisiones a escala urbana, la herramienta permite filtrar por temáticas de estudio específicas y consultar los datos individualmente a escala de edificio. A este nivel hay que tener en cuenta que se trata de una primera aproximación orientativa.  

Para las personas registradas, la herramienta dispone de un sistema de descarga de datos en formato CSV y GeoPackage de aquellos municipios de España de los que dispone de información. Los municipios de los que no tiene información, pueden ser procesados automáticamente mediante la subida del fichero urbano en formato CAT disponible en la Sede Electrónica del Catastro. 

La información relacionada con la rehabilitación energética de los edificios procede de una aplicación a escala de referencia catastral de los datos elaborados en el marco de la ERESEE 2020 (Estrategia a largo plazo para la rehabilitación energética en el sector de la edificación en España). 

En definitiva, es una plataforma de datos abiertos para impulsar la regeneración urbana en España que utiliza los conjuntos de datos de la Sede Electrónica del Catastro y permite la descarga de los datos por municipio en formato CSV. 

 

calendar icon
Aplicación

Gasolineras App es un proyecto personal motivado por el incremento del precio del combustible en la primavera de 2022. Su función principal es mostrar en tiempo real el precio del combustible de cualquier gasolinera española. La aplicación es totalmente gratuita y no contiene publicidad, lo que mejora su rendimiento y usabilidad.

Los precios de los combustibles y los datos de las estaciones de servicio son obtenidos en tiempo real a través del servicio REST del Geoportal del Ministerio para la Transición Ecológica y el Reto Demográfico.

No es necesario el registro, ni recaba ningún dato de usuario, ni siquiera cuando se da permiso para usar la geolocalización.

Se puede consultar Gasolineras App desde cualquier navegador compatible. En aquellos dispositivos que tienen soporte para PWA (Progressive web app), como es el caso de Chrome, se puede instalar la aplicación como tal en el dispositivo y acceder a ella sin tener que abrir el navegador web.

El proyecto sigue en evolución y recibirá actualizaciones que añadirán mas funcionalidad.

calendar icon
Aplicación

'Apaga Luz' es un proyecto web diseñado para mostrar el precio de la tarifa de la luz en tiempo real. Además, ofrece a sus usuarios una tabla para poder consultar la tarifa de luz por hora con los precios del día. A partir de la noche se visualiza otra tabla con los precios por hora de la luz del día siguiente.
Esta aplicación web cuenta también con un apartado específico dedicado a la visualización de datos y gráficas, cuyos datos han sido extraídos de la API de ESIOS. Estas gráficas ofrecen información de interés relacionada con el precio de la luz a través de la comparativa de la evolución de los datos desde abril de 2014 hasta la actualidad.

calendar icon
Noticia

Los datos relacionados con el medio ambiente representan una fuente extraordinaria de valor en la lucha contra el cambio climático, la deforestación y la degradación del medio ambiente, amenazas existenciales a la que se enfrentan Europa y el resto del mundo. Así se reconoce en el llamado Pacto Verde Europeo, la hoja de ruta aprobada por la Comisión Europea el pasado mes de diciembre, y que se retoma ahora con más fuerza al incidir en las claves de la estrategia económica que se consideran prioritarias poner en marcha en la UE para salir de la crisis ligada a la pandemia de la Covid-19. En esta misma línea, el presidente de la comisión de Medio Ambiente del Parlamento Europeo, Pascal Canfin, promueve el manifiesto 'Recuperación verde. Reiniciar y reimpulsar nuestras economías por un futuro sostenible'. Este manifiesto está suscrito hasta la fecha por 270 miembros, entre los que se encuentran políticos, empresas, ONG o sindicatos y que defiende una salida sostenible a la crisis del coronavirus.

El Pacto Verde refiere cómo los datos accesibles e interoperables, combinados con la infraestructura digital (superordenadores, nubes, redes ultrarrápidas) y las soluciones de inteligencia artificial, facilitan las decisiones basadas en datos contrastados y amplían la capacidad de comprender y abordar los retos medioambientales teniendo en cuenta ámbitos de actuación clave como: las redes energéticas, la agricultura de precisión, la movilidad y el transporte, los edificios inteligentes, los espacios de datos ecológicos o el poder de los datos.

Ambitos actuación pacto verde

Este interés en los datos relacionados con el medio ambiente y en la innovación en torno a ellos, queda también claramente reflejada en la Estrategia Europea de Datos. El texto establece la necesidad de creación de diez ecosistemas dirigidos a favorecer la creación nuevos productos y servicios basados en datos más accesibles, uno de los cuales se desarrollará bajo la etiqueta: Datos relativos al Pacto Verde Europeo, y que tiene como finalidad utilizar el considerable potencial que presentan este insumo para apoyar las acciones prioritarias del mencionado Pacto.

La importancia del uso de estos datos para atajar el cambio climático, promover la economía circular, alcanzar la contaminación cero, proteger la biodiversidad y luchar contra la deforestación, entre otros aspectos, son las principales razones por la que los datos de este ámbito se recogen en la Directiva (UE) 2019/1024, de 20 de junio de 2019 como sustrato de alto valor para la dinamizador de servicios innovadores, como pieza clave en la combinación con otros conjuntos de datos.

Añadido a todo ello está el valor que más concretamente tienen los datos abiertos de este sector. En el estudio que hace pública la Comisión sobre este mismo año sobre el Impacto económico de los datos abierto se considera el medio ambiente como uno de los grandes beneficiarios en el uso de datos. Según el mencionado informe, el uso de datos supone para el medio ambiente un ahorro equivalente a 5,8 toneladas de petróleo del consumo de energía en los hogares, un aumento en 353 horas adicionales de teravatios en energía solar gracias al uso eficiente de paneles solares en tejados y un apoyo en el cumplimiento en Europa de los objetivos de desarrollo sostenible (ODS) gracias al incremento en un 32% del uso de energías renovables en el consumo global de energía en 2030.

Las razones mencionadas, así como las últimas investigaciones sobre la ecología de las enfermedades que sugieren cómo el cambio climático, la pérdida de biodiversidad y la deforestación con factores coadyuvantes en la gestación de pandemias, nos llevan a considerar los datos del sector medioambiental como un sustrato clave sobre el que relanzar la economía europea apoyándonos en sectores que pueden brindar soluciones a la crisis climática.

calendar icon