Los datos geoespaciales han impulsado mejoras en diversos sectores y la energía no es la excepción. Estos datos nos permiten conocer mejor nuestro entorno para promover la sostenibilidad, la innovación y la toma de decisiones informadas.
Uno de los principales proveedores de datos abiertos geoespaciales es Copernicus, el programa de observación de la Tierra de la Unión Europea. A través de una red de satélites llamados Sentinel y datos de fuentes terrestres, marítimas y aéreas, Copernicus proporciona información geoespacial accesible de manera gratuita a través de diversas plataformas.
Aunque los datos de Copernicus son de gran utilidad en múltiples áreas, como la lucha contra el cambio climático, la planificación urbana o la agricultura, en este artículo nos vamos a centrar en su rol para impulsar la sostenibilidad y eficiencia energética. La disponibilidad de datos abiertos de alta calidad fomenta la innovación en este sector promoviendo el desarrollo de nuevas herramientas y aplicaciones que mejoran la gestión y el uso de la energía. A continuación mostramos algunos ejemplos.
Predicción climática para mejorar la producción
Los datos geoespaciales proporcionan información detallada sobre las condiciones meteorológicas, la calidad del aire y otros factores, fundamentales para comprender y predecir fenómenos ambientales, como tormentas o sequías, que afectan a la producción y distribución de energía.
Un ejemplo es este proyecto que ofrece previsiones de viento de alta resolución para dar respuesta a los sectores del petróleo y el gas, la aviación, el transporte marítimo y la defensa. Utiliza datos procedentes de observaciones por satélite como de modelos numéricos, incluyendo información sobre las corrientes oceánicas, las olas y la temperatura superficial del mar procedentes del “Servicio Marino de Copernicus”. Gracias a su granularidad puede ofrecer un sistema de previsión meteorológica preciso a una escala muy local, lo que permite conocer el comportamiento de fenómenos meteorológicos y climáticos extremos con un mayor nivel de exactitud.
Optimización de recursos
Los datos proporcionados por Copernicus también permiten identificar las mejores ubicaciones para la instalación de centros de generación energética, como parques solares y eólicos, al facilitar el análisis de factores como la radiación solar y la velocidad del viento. Además, ayudan a monitorear la eficiencia de estas instalaciones, asegurando que estén operando al máximo de su capacidad.
En este sentido,se ha desarrollado un proyecto para encontrar el mejor emplazamiento para un sistema flotante combinado de energía eólica y undimotriz (es decir, basada en el movimiento de las olas). Al obtener ambas energías con una sola plataforma, esta solución permite ahorrar espacio y reducir el impacto en el terreno, a la vez que supone una mejora de la eficiencia. El viento y las olas llegan en momentos diferentes a la plataforma, por lo que capturar ambos elementos ayuda a reducir la variabilidad y suaviza la producción total de electricidad. Gracias a los datos de Copernicus (obtenidos del servicio Atlántico -Vizcaya Ibérica Irlanda- Reanálisis de olas oceánicas), la empresa proveedora de esta situación pudo obtener componentes separados de olas de viento y oleaje, lo que permitió una comprensión más completa de la direccionalidad de ambos elementos. Este trabajo condujo a la selección de la Plataforma de Energía Marina de Vizcaya (BiMEP) para el despliegue del dispositivo.
Otro ejemplo es Mon Toit Solaire, un sistema integrado de ayuda a la decisión basado en Internet para el desarrollo de la generación de energía fotovoltaica en tejados. Esta herramienta simula y calcula el potencial energético de un proyecto fotovoltaico y proporciona a los usuarios información técnica y financiera fiable. Utiliza datos de radiación solar producidos por el “Servicio de vigilancia de la atmósfera de Copernicus”, junto con datos topográficos urbanos tridimensionales y simulaciones de incentivos fiscales, costes y precios de la energía, lo que permite calcular el rendimiento de la inversión.
Monitorización Ambiental y evaluación de impacto
La información geoespacial permite mejorar el monitoreo ambiental y realizar evaluaciones de impacto precisas en el sector energético. Estos datos permiten a las empresas energéticas identificar riesgos ambientales asociados a sus operaciones, diseñar estrategias para mitigar su impacto y optimizar sus procesos hacia una mayor sostenibilidad. Además, apoyan el cumplimiento de normativas ambientales al facilitar reportes basados en datos objetivos, fomentando un desarrollo energético más responsable y respetuoso con el medio ambiente.
Entre los retos que plantea la conservación de la biodiversidad de los océanos, el ruido submarino de origen humano se reconoce como una grave amenaza y está regulado a nivel europeo. Con el fin de evaluar el impacto en la vida marina de los parques eólicos a lo largo de la costa sur de Francia, este proyecto utiliza mapas de sonido estadísticos de alta resolución, que proporcionan una visión detallada de los procesos costeros, con una frecuencia temporal horaria y una alta resolución espacial de hasta 1,8 km. En concreto, utilizan información procedente de los servicios de “análisis y previsión de la física del mar Mediterráneo” y “Viento y tensión en la superficie del mar por hora en el océano mundial”.
Gestión de emergencias y desastres medioambientales
En situaciones de desastre o eventos climáticos extremos, los datos geoespaciales pueden ayudar a evaluar rápidamente los daños y coordinar las respuestas de emergencia de manera más eficiente.
También pueden prevenir cómo se van a comportar los vertidos. Esta es el objetivo del Instituto de Investigación Marina de la Universidad de Klaipeda, que ha desarrollado un sistema de vigilancia y previsión de episodios de contaminación química y microbiológica mediante un modelo hidrodinámico operativo 3D de alta resolución. Para ellos utilizan el “Análisis y previsiones físicas del Mar Báltico” de Copernicus. El modelo ofrece previsiones en tiempo real y a cinco días vista de las corrientes de agua, abordando los retos que plantean las aguas poco profundas y las zonas portuarias. Su objetivo es ayudar a gestionar incidentes de contaminación, sobre todo en regiones propensas a ella, como puertos y terminales petrolíferas.
Estos ejemplos ponen de manifiesto la utilidad de los datos geoespaciales, especialmente aquellos proporcionados por programas como Copernicus. El hecho de que empresas e instituciones puedan acceder libremente a estos datos está revolucionando el sector energético, contribuyendo a un sistema más eficiente, sostenible y resiliente.
Tupreciodeluz.com ofrece información diaria sobre el precio de la luz, mostrando el precio más barato del día, también el precio medio de las últimas 24 horas, así como la franja horaria más cara. El objetivo es permitir a los consumidores adheridos a la tarifa del mercado regulado (PVPC) modular su consumo para poder ahorrar en su factura eléctrica.
La web también cuenta con un asistente de inteligencia artificial para el asesoramiento energético, y las medidas para promover la eficiencia y el consumo responsable de energía.
Adicionalmente, los consumidores pueden utilizar un dimensionador solar para conocer la viabilidad de la instalación de energía solar en su vivienda o negocio.
Además, la web dispone de un blog en el que se publican las noticias mas relevantes para el consumidor de forma resumida y amena.
Un gemelo digital es una representación virtual e interactiva de un objeto, sistema o proceso del mundo real. Hablamos, por ejemplo, de una réplica digital de una fábrica, una ciudad o incluso un cuerpo humano. Estos modelos virtuales permiten simular, analizar y predecir el comportamiento del elemento original, lo que es clave para la optimización y el mantenimiento en tiempo real.
Debido a sus funcionalidades, los gemelos digitales se están utilizando en diversos sectores como la salud, el transporte o la agricultura. En este artículo, repasamos las ventajas que aporta su uso y mostramos dos ejemplos relacionados con los datos abiertos.
Ventajas de los gemelos digitales
Los gemelos digitales utilizan fuentes de datos reales del entorno, obtenidos a través de sensores y plataformas abiertas, entre otros. Gracias a ello, los gemelos digitales se actualizan en tiempo real para reflejar la realidad, lo que aporta una serie de ventajas:
- Aumento del rendimiento: una de las principales diferencias con las simulaciones tradicionales es que los gemelos digitales utilizan datos en tiempo real para su modelización, lo que permite tomar decisiones más acertadas para optimizar el rendimiento de equipos y sistemas según las necesidades de cada momento.
- Mejora de la planificación: utilizando tecnologías basadas en inteligencia artificial (IA) y aprendizaje automático, el gemelo digital puede analizar problemas de rendimiento o realizar simulaciones virtuales de «qué pasaría si». De esta forma, se pueden predecir fallos y problemas antes de que ocurran, lo que permite un mantenimiento proactivo.
- Reducción de costes: la mejora en la gestión de datos gracias a un gemelo digital genera beneficios equivalentes al 25% del gasto total en infraestructuras. Además, al evitar fallos costosos y optimizar procesos, se pueden reducir significativamente los costes operativos. También permiten monitorear y controlar sistemas en remoto, desde cualquier lugar, mejorando la eficiencia al centralizar las operaciones.
- Personalización y flexibilidad: al crear modelos virtuales detallados de productos o procesos, las organizaciones pueden adaptar rápidamente sus operaciones para satisfacer las demandas cambiantes del entorno y las preferencias individuales de los clientes / ciudadanos. Por ejemplo, en la fabricación, los gemelos digitales permiten la producción personalizada en masa, ajustando las líneas de producción en tiempo real para crear productos únicos según las especificaciones del cliente. Por otro lado, en el ámbito de la salud, los gemelos digitales pueden modelar el cuerpo humano para personalizar tratamientos médicos, mejorando así la eficacia y reduciendo los efectos secundarios.
- Impulso de la experimentación e innovación: los gemelos digitales proporcionan un entorno seguro y controlado para probar nuevas ideas y soluciones, sin los riesgos y costes asociados a los experimentos físicos. Entre otras cuestiones, permiten experimentar con grandes objetos o proyectos que, por su tamaño, no suelen prestarse a la experimentación en la vida real.
- Mejora de la sostenibilidad: al permitir la simulación y el análisis detallado de procesos y sistemas, las organizaciones pueden identificar áreas de ineficiencia y desperdicio, optimizando así el uso de recursos. Por ejemplo, los gemelos digitales pueden modelar el consumo y la producción de energía en tiempo real, permitiendo ajustes precisos que reducen el consumo y las emisiones de carbono.
Ejemplos de gemelos digitales en España
A continuación, se muestran tres ejemplos que ponen de manifiesto estas ventajas.
Proyecto GeDIA: inteligencia artificial para predecir los cambios en los territorios
GeDIA es una herramienta para la planificación estratégica de ciudades inteligentes, que permite realiza simulaciones de escenarios. Para ellos utiliza modelos de inteligencia artificial basados en fuentes de datos y herramientas ya existentes en el territorio.
El alcance de la herramienta es muy amplio, pero sus creadores destacan dos casos de uso:
- Necesidades de infraestructuras futuras: la plataforma realiza análisis detallados considerando las tendencias, gracias a los modelos de inteligencia artificial. De esta forma, se pueden realizar proyecciones de crecimiento y planificar las necesidades de infraestructuras y servicios, como energía y agua, en áreas específicas de un territorio, garantizando su disponibilidad.
- Crecimiento y turismo: GeDIA también se utiliza para estudiar y analizar el crecimiento urbano y turístico en zonas concretas. La herramienta identifica patrones de gentrificación y evalúa su impacto en la población local, utilizando datos censales. De esta forma se pueden comprender mejor los cambios demográficos y su impacto, como las necesidades de vivienda, y tomar decisiones que faciliten el crecimiento equitativo y sostenible.
Esta iniciativa cuenta con la participación de diversas empresas y la Universidad de Málaga (UMA), así como el respaldo económico de Red.es y la Unión Europea.
Gemelo digital del Mar menor: datos para cuidar el medio ambiente
El Mar Menor, la laguna salada de la Región de Murcia, ha sufrido graves problemas ecológicos en los últimos años, influenciados por la presión agrícola, el turismo y la urbanización.
Para conocer mejor las causas y valorar posibles soluciones, TRAGSATEC, una entidad de protección ambiental de propiedad estatal, desarrolló un gemelo digital. Para ello mapeó un área circundante de más de 1.600 kilómetros cuadrados, conocida como la Región del Campo de Cartagena. En total se obtuvieron 51.000 imágenes nadirales, 200.000 imágenes oblicuas y más de cuatro terabytes de datos LiDAR.
Gracias a este gemelo digital, TRAGSATEC ha podido simular diversos escenarios de inundaciones y el impacto que tendría instalar elementos de contención u obstáculos, como un muro, que redirigieran el flujo del agua. También han podido estudiar la distancia entre el terreno y el agua subterránea, para determinar el impacto de la filtración de fertilizantes, entre otras cuestiones.
Retos y camino hacia el futuro
Estos son solo dos ejemplos, pero ponen de manifiesto el potencial de una tecnología cada vez más popular. No obstante, para que su implementación sea aun mayor es necesario hacer frente a algunos retos, como los costes iniciales, tanto en tecnología como en capacitación, o la seguridad, al aumentar la superficie de ataque. Otro de los retos a destacar son los problemas de interoperabilidad que surgen cuando las distintas administraciones públicas establecen gemelos digitales y espacios de datos locales. Para profundizar en esta problemática, la Comisión Europea ha publicado una guía que ayuda a identificar los principales retos organizativos y culturales de interoperabilidad, ofreciendo buenas prácticas para solventarlos.
En resumen, los gemelos digitales ofrecen numerosas ventajas, como la mejora del rendimiento o la reducción de costes. Estos beneficios están impulsando su adopción en diversas industrias y es probable que, a medida que se superen los retos actuales, los gemelos digitales se conviertan en una herramienta esencial para optimizar procesos y mejorar la eficiencia operativa en un mundo cada vez más digitalizado.
1. Introducción
En la era de la información, la inteligencia artificial ha demostrado ser una herramienta invaluable para una variedad de aplicaciones. Una de las manifestaciones más increíbles de esta tecnología es GPT (Generative Pre-trained Transformer), desarrollado por OpenAI. GPT es un modelo de lenguaje natural que puede entender y generar texto, ofreciendo respuestas coherentes y contextualmente relevantes. Con la reciente introducción de Chat GPT-4, las capacidades de este modelo se han ampliado aún más, permitiendo una mayor personalización y adaptabilidad a diferentes temáticas.
En este post, te mostraremos cómo configurar y personalizar un asistente especializado en minerales críticos utilizando GPT-4 y fuentes de datos abiertas. Como ya mostramos en previas publicaciones, los minerales críticos son fundamentales para numerosas industrias, incluyendo la tecnología, la energía y la defensa, debido a sus propiedades únicas y su importancia estratégica. Sin embargo, la información sobre estos materiales puede ser compleja y dispersa, lo que hace que un asistente especializado sea particularmente útil.
El objetivo de este post es guiarte paso a paso desde la configuración inicial hasta la implementación de un asistente GPT que pueda ayudarte a resolver dudas y proporcionar información valiosa sobre minerales críticos en tu día a día. Además, exploraremos cómo personalizar aspectos del asistente, como el tono y el estilo de las respuestas, para que se adapte perfectamente a tus necesidades. Al final de este recorrido, tendrás una herramienta potente y personalizada que transformará la manera en que accedes y utilizas la información en abierto sobre minerales críticos.
Accede al repositorio del laboratorio de datos en Github.
En este vídeo, el autor te explica que vas a encontrar tanto en el Github como en Google Colab.
2. Contexto
La transición hacia un futuro sostenible no solo implica cambios en las fuentes de energía, sino también en los recursos materiales que utilizamos. El éxito de sectores como baterías de almacenamiento de energía, aerogeneradores, paneles solares, electrolizadores, drones, robots, redes de transmisión de datos, dispositivos electrónicos o satélites espaciales, depende enormemente del acceso a las materias primas críticas para su desarrollo. Entendemos que un mineral es crítico cuando se cumplen los siguientes factores:
- Sus reservas mundiales son escasas
- No existen materiales alternativos que puedan ejercer su función (sus propiedades son únicas o muy singulares)
- Son materiales indispensables para sectores económicos clave de futuro, y/o su cadena de suministro es de elevado riesgo
Puedes aprender más sobre los minerales críticos en el post mencionado anteriormente.
3. Objetivo
Este ejercicio se centra en mostrar al lector cómo personalizar un modelo GPT especializado para un caso de uso concreto. Adoptaremos para ello el enfoque “aprender haciendo”, de tal forma que el lector pueda comprender cómo configurar y ajustar el modelo para resolver un problema real y relevante, como el asesoramiento experto en minerales críticos. Este enfoque práctico no solo mejora la comprensión de las técnicas de personalización de modelos de lenguaje, sino que también prepara a los lectores para aplicar estos conocimientos en la resolución de problemas reales, ofreciendo una experiencia de aprendizaje rica y directamente aplicable a sus propios proyectos.
El asistente GPT especializado en minerales críticos estará diseñado para convertirse en una herramienta esencial para profesionales, investigadores y estudiantes. Su objetivo principal será facilitar el acceso a información precisa y actualizada sobre estos materiales, apoyar la toma de decisiones estratégicas y promover la educación en este campo. A continuación, se detallan los objetivos específicos que buscamos alcanzar con este asistente:
- Proporcionar información precisa y actualizada:
- El asistente debe ofrecer información detallada y precisa sobre diversos minerales críticos, incluyendo su composición, propiedades, usos industriales y disponibilidad.
- Mantenerse actualizado con las últimas investigaciones y tendencias del mercado en el ámbito de los minerales críticos.
- Asistir en la toma de decisiones:
- Proporcionar datos y análisis que puedan ayudar en la toma de decisiones estratégicas en la industria y la investigación sobre minerales críticos.
- Ofrecer comparativas y evaluaciones de diferentes minerales en función de su rendimiento, coste y disponibilidad.
- Promover la educación y la concienciación en torno a esta temática:
- Actuar como una herramienta educativa para estudiantes, investigadores y profesionales, ayudando a mejorar su conocimiento sobre los minerales críticos.
- Aumentar la conciencia sobre la importancia de estos materiales y los desafíos relacionados con su suministro y sostenibilidad.
4. Recursos
Para configurar y personalizar nuestro asistente GPT especializado en minerales críticos, es esencial disponer de una serie de recursos que faciliten la implementación y aseguren la precisión y relevancia de las respuestas del modelo. En este apartado, detallaremos los recursos necesarios que incluyen tanto las herramientas tecnológicas como las fuentes de información que serán integradas en la base de conocimiento del asistente.
Herramientas y Tecnologías
Las herramientas y tecnologías clave para desarrollar este ejercicio son:
- Cuenta de OpenAI: necesaria para acceder a la plataforma y utilizar el modelo GPT-4. En este post, utilizaremos la suscripción Plus de ChatGPT para mostrarte cómo crear y publicar un GPT personalizado. No obstante, puedes desarrollar este ejercicio de forma similar utilizando una cuenta gratuita de OpenAI y realizando el mismo conjunto de instrucciones a través de una conversación de ChatGPT estándar.
- Microsoft Excel: hemos diseñado este ejercicio de forma que cualquier persona sin conocimientos técnicos pueda desarrollarlo de principio a fin. Únicamente nos apoyaremos en herramientas ofimáticas como Microsoft Excel para realizar algunas adecuaciones de los datos descargados.
De forma complementaria, utilizaremos otro conjunto de herramientas que nos permitirán automatizar algunas acciones sin ser estrictamente necesaria su utilización:
- Google Colab: es un entorno de Python Notebooks que se ejecuta en la nube, permitiendo a los usuarios escribir y ejecutar código Python directamente en el navegador. Google Colab es especialmente útil para el aprendizaje automático, el análisis de datos y la experimentación con modelos de lenguaje, ofreciendo acceso gratuito a potentes recursos de computación y facilitando la colaboración y el intercambio de proyectos.
- Markmap: es una herramienta que visualiza mapas mentales de Markdown en tiempo real. Los usuarios escriben ideas en Markdown y la herramienta las renderiza como un mapa mental interactivo en el navegador. Markmap es útil para la planificación de proyectos, la toma de notas y la organización de información compleja visualmente. Facilita la comprensión y el intercambio de ideas en equipos y presentaciones.
Fuentes de Información
- Raw Materials Information System (RMIS): sistema de información sobre materias primas mantenido por el Joint Research Center de la Unión Europea. Proporciona datos detallados y actualizados sobre la disponibilidad, producción y consumo de materias primas en Europa.
- Catálogo de informes y datos de la Agencia Internacional de la Energía (IEA en sus siglas en inglés): ofrece un amplio catálogo de informes y datos relacionados con la energía, incluyendo estadísticas sobre producción, consumo y reservas de minerales energéticos y críticos.
- Base de datos de minerales del Instituto Geológico y Minero Español (BDMIN): contiene información detallada sobre los minerales y depósitos minerales en España, útil para obtener datos específicos sobre la producción y reservas de minerales críticos en el país.
Con estos recursos, estarás bien equipado para desarrollar un asistente GPT especializado que pueda proporcionar respuestas precisas y relevantes sobre minerales críticos, facilitando la toma de decisiones informadas en este campo.
5. Desarrollo del ejercicio
5.1. Construcción de la base de conocimiento
Para que nuestro asistente GPT especializado en minerales críticos sea verdaderamente útil y preciso, es esencial construir una base de conocimiento sólida y estructurada. Esta base de conocimiento será el conjunto de datos e información que el asistente utilizará para responder a las consultas. La calidad y relevancia de esta información determinarán la eficacia del asistente en proporcionar respuestas precisas y útiles.
Búsqueda de Fuentes de Datos
Comenzamos con la recopilación de fuentes de información que nutrirán nuestra base de conocimiento. No todas las fuentes de información son igualmente fiables. Es fundamental evaluar la calidad de las fuentes identificadas, asegurando que:
- La información esté actualizada: la relevancia de los datos puede cambiar con rapidez, especialmente en campos dinámicos como el de los minerales críticos.
- La fuente sea confiable y reconocida: es necesario utilizar fuentes de instituciones reconocidas y respetadas en el ámbito académico y profesional.
- Los datos sean completos y accesibles: es crucial que los datos sean detallados y que estén accesibles para su integración en nuestro asistente.
En nuestro caso, desarrollamos una búsqueda online en diferentes plataformas y repositorios de información tratando de seleccionar información perteneciente a diversas entidades reconocidas:
- Centros de investigación y universidades:
- Publican estudios y reportes detallados sobre la investigación y desarrollo de minerales críticos.
- Ejemplo: RMIS del Joint Research Center de la Unión Europea.
- Instituciones gubernamentales y organismos internacionales:
- Estas entidades suelen proporcionar datos exhaustivos y actualizados sobre la disponibilidad y el uso de minerales críticos.
- Ejemplo: Agencia Internacional de la Energía (IEA).
- Bases de datos especializadas:
- Contienen datos técnicos y específicos sobre depósitos y producción de minerales críticos.
- Ejemplo: Base de datos de Minerales del Instituto Geológico y Minero español (BDMIN).
Selección y preparación de la información
Nos centraremos ahora en la selección y preparación de la información existente en estas fuentes para asegurar que nuestro asistente GPT pueda acceder a datos precisos y útiles.
RMIS del Joint Research Center de la Unión Europea:
- Información seleccionada:
Seleccionamos el informe “Supply chain analysis and material demand forecast in strategic technologies and sectors in the EU – A foresight study”. Se trata de un análisis de la cadena de suministro y la demanda de minerales en tecnologías y sectores estratégicos de la UE. Presenta un estudio detallado de las cadenas de suministro de materias primas críticas y pronostica la demanda de minerales hasta 2050.
- Preparación necesaria:
El formato del documento, PDF, permite la ingesta directa de la información por parte de nuestro asistente. No obstante, como se observa en la Figura 1, existe una tabla especialmente relevante en sus páginas 238-240 donde se analiza, para cada mineral, su riesgo de suministro, tipología (estratégico, crítico o no crítico) y las tecnologías clave que lo emplean. Decidimos, por ello, extraer esta tabla a un formato estructurado (CSV), de tal forma que dispongamos de dos piezas de información que pasarán a formar parte de nuestra base de conocimiento.

Figura 1: Tabla de minerales contenida en el PDF de JRC
Para extraer de forma programática los datos contenidos en esta tabla y transformarlos en un formato más fácilmente procesable, como CSV (comma separated values o valores separados por comas), utilizaremos un script de Python que podemos utilizar a través de la plataforma Google Colab (Figura 2).

Figura 2: Script Python para la extracción de datos del PDF de JRC desarrollado en plataforma Google Colab.
A modo de resumen, este script:
- Se apoya en la librería de código abierto PyPDF2, capaz de interpretar información contenida en ficheros PDF.
- Primero, extrae en formato texto (cadena de caracteres) el contenido de las páginas del PDF donde se encuentra la tabla de minerales eliminando todo el contenido que no se corresponde con la propia tabla.
- Posteriormente, recorre, línea a línea, la cadena de caracteres convirtiendo los valores en columnas de una tabla de datos. Sabremos que un mineral es utilizado en una tecnología clave si en la columna correspondiente de dicho mineral encontramos un número 1 (en caso contrario contendrá un 0).
- Por último, exporta dicha tabla a un fichero CSV para su posterior utilización.
Agencia Internacional de la Energía (IEA):
- Información seleccionada:
Seleccionamos el informe “Global Critical Minerals Outlook 2024”. Este proporciona una visión general de los desarrollos industriales en 2023 y principios de 2024, y ofrece perspectivas a medio y largo plazo para la demanda y oferta de minerales clave para la transición energética. También evalúa los riesgos para la fiabilidad, sostenibilidad y diversidad de las cadenas de suministro de minerales críticos.
- Preparación necesaria:
El formato del documento, PDF, nos permite la ingesta directa de la información por parte de nuestro asistente virtual. No realizaremos en este caso ninguna adecuación de la información seleccionada.
Base de Datos de Minerales del Instituto Geológico y Minero Español (BDMIN)
- Información seleccionada:
En este caso, utilizamos el formulario para seleccionar los datos existentes en esta base de datos en cuanto a indicios y yacimientos del ámbito de la metalogenia, en particular seleccionamos aquellos con contenido de Litio.

Figura 3: Selección de conjunto de datos en BDMIN.
- Preparación necesaria:
Observamos cómo la herramienta web nos permite la visualización online y también la exportación de estos datos en varios formatos. Seleccionamos, por tanto, todos los datos a exportar y haciendo clic en esta opción, descargamos un fichero Excel con la información deseada.

Figura 4: Herramienta de visualización y descarga en BDMIN

Figura 5: Datos descargados BDMIN.
Todos los archivos que componen nuestra base de conocimiento se encuentran GitHub del proyecto, de tal forma que aquel lector que lo desee pueda saltarse la fase de descarga y preparación de la información.
5.2. Configuración y personalización del GPT para minerales críticos
Cuando hablamos de "crear un GPT," en realidad nos estamos refiriendo a la configuración y personalización de un modelo de lenguaje basado en GPT (Generative Pre-trained Transformer) para adaptarlo a un caso de uso específico. En este contexto, no estamos creando el modelo desde cero, sino ajustando cómo el modelo preexistente (como GPT-4 de OpenAI) interactúa y responde dentro de un dominio específico, en este caso, sobre minerales críticos.
En primer lugar, accedemos a la aplicación a través de nuestro navegador y, en caso de no tener una cuenta, seguimos el proceso de registro y login en la plataforma ChatGPT. Como indicamos con anterioridad, para realizar la creación de un GPT paso a paso será necesario disponer de una cuenta Plus. No obstante, aquellos lectores que no dispongan de dicha cuenta, podrán trabajar con una cuenta gratuita interactuando con ChatGPT a través de una conversación estándar.

Figura 6: Página de inicio de sesión y registro de ChatGPT.
Una vez iniciada la sesión, seleccionamos la opción "Explorar GPT", y posteriormente hacemos clic en "Crear" para comenzar el proceso de creación de nuestro GPT.

Figura 7: Creación de nuevo GPT.
En pantalla se nos mostrará la pantalla dividida de creación de un nuevo GPT: a la izquierda podremos conversar con el sistema para indicarle las características que debe tener nuestro GPT, mientras que a la izquierda podremos interactuar con nuestro GPT para validar que su comportamiento es el adecuado según vayamos avanzando en el proceso de configuración.

Figura 8: Pantalla de creación de nuevo GPT.
En el GitHub de este proyecto, podemos encontrar todos los prompts o instrucciones que utilizaremos para configurar y personalizar nuestro GPT y que deberemos introducir de forma secuencial en la pestaña "Crear", situada en la pestaña izquierda de nuestras pantallas, para completar los pasos que se detallan a continuación.
Los pasos que vamos a seguir para la creación del GPT son:
- En primer lugar, le indicaremos el objetivo y las consideraciones básicas a nuestro GPT para que pueda entender su modo de empleo.

Figura 9: Instrucciones básicas de nuevo GPT.
2. Posteriormente crearemos un nombre y una imagen que representen a nuestro GPT y lo hagan fácilmente identificable. En nuestro caso, lo denominaremos MateriaGuru.

Figura 10: Selección de nombre para nuevo GPT.

Figura 11: Creación de imagen para GPT.
3. A continuación, construiremos la base de conocimiento a partir de la información anteriormente seleccionada y preparada para nutrir los conocimientos de nuestro GPT.


Figura 12: Carga de información a la base de conocimiento de nuevo GPT.
4. Ahora, podemos personalizar aspectos conversacionales como su tono, el nivel de complejidad técnica de sus repuesta o si esperamos respuestas escuetas o elaboradas.
5. Por último, desde la pestaña "Configurar", podemos indicar los iniciadores de conversación deseados para que los usuarios que interactúen con nuestro GPT tengan algunas ideas para empezar la conversación de forma predefinida.

Figura 13: Pestaña Configurar GPT.
En la Figura 13 podemos también observar el resultado definitivo de nuestro entrenamiento, donde aparecen elementos clave como su imagen, nombre, instrucciones, iniciadores de conversación o documentos que forma parte de su base de conocimiento.
5.3. Validación y publicación de GPT
Antes de dar por bueno a nuestro nuevo asistente basado en GPT, procederemos a realizar una breve validación de su correcta configuración y aprendizaje respecto a la temática en torno a la que le hemos entrenado. Para ello, preparamos una batería de preguntas que le realizaremos para comprobar que responde de forma adecuada ante un escenario real de utilización.
| # | Pregunta | Respuesta |
|---|---|---|
| 1 | ¿Qué minerales críticos han experimentado una caída significativa en los precios en 2023? | Los precios de los minerales para baterías vieron particularmente grandes caídas con los precios del litio cayendo un 75% y los precios del cobalto níquel y grafito cayendo entre un 30% y un 45%. |
| 2 | ¿Qué porcentaje de la capacidad solar fotovoltaica (PV) mundial fue añadido por China en 2023? | China representó el 62% del aumento en la capacidad solar fotovoltaica global en 2023. |
| 3 | ¿Cuál es el escenario que proyecta que las ventas de autos eléctricos (EV) alcanzarán el 65% en 2030? | El escenario de emisiones netas cero (NZE) para 2050 proyecta que las ventas de autos eléctricos alcanzarán el 65% en 2030. |
| 4 | ¿Cuál fue el crecimiento de la demanda de litio en 2023? | La demanda de litio aumentó en un 30% en 2023. |
| 5 | ¿Qué país fue el mayor mercado de autos eléctricos en 2023? | China fue el mayor mercado de autos eléctricos en 2023 con 8.1 millones de ventas de autos eléctricos representando el 60% del total global. |
| 6 | ¿Cuál es el principal riesgo asociado con la concentración de mercado en la cadena de suministro de grafito para baterías? | Más del 90% del grafito de grado batería y el 77% de las tierras raras refinadas en 2030 se originan en China lo que representa un riesgo significativo para la concentración del mercado. |
| 7 | ¿Qué proporción de la capacidad mundial de producción de celdas de batería estaba en China en 2023? | China poseía el 85% de la capacidad de producción de celdas de batería en 2023. |
| 8 | ¿Cuánto aumentó la inversión en minería de minerales críticos en 2023? | La inversión en minería de minerales críticos creció un 10% en 2023. |
| 9 | ¿Qué porcentaje de la capacidad de almacenamiento de baterías en 2023 estaba compuesto por baterías de fosfato de hierro y litio (LFP)? | En 2023, las baterías LFP constituían aproximadamente el 80% del mercado total de almacenamiento de baterías. |
| 10 | ¿Cuál es el pronóstico para la demanda de cobre en un escenario de emisiones netas cero (NZE) para 2040? | En el escenario de emisiones netas cero (NZE) para 2040 se espera que la demanda de cobre tenga el mayor aumento en términos de volumen de producción. |
Figura 14: Tabla con batería de preguntas para la validación de nuestro GPT.
Valiéndonos de la parte de previsualización, situada a la derecha de nuestras pantallas, lanzamos la batería de preguntas y validamos que las respuestas se corresponden con aquellas esperadas.

Figura 15: Validación de respuestas GPT.
Por último, hacemos clic en el botón "Crear" para finalizar el proceso. Podremos seleccionar entre diferentes alternativas para restringir su utilización por parte de otros usuarios.

Figura 16: Publicación de nuestro GPT.
6. Escenarios de uso
En este apartado mostramos varios escenarios en los que podremos sacar partido a MateriaGuru en nuestro día a día. En el GitHub del proyecto podremos encontrar los prompts utilizados para replicar cada uno de ellos.
6.1. Consulta de información de minerales críticos
El escenario más típico de utilización de este tipo de GPTs es la asistencia para resolución de dudas relacionadas con la temática en cuestión, en este caso, los minerales críticos. A modo de ejemplo, hemos preparado una batería de cuestiones que el lector podrá plantear al GPT creado para comprender en mayor detalle la relevancia y situación actual de un material crítico como es el grafito a partir de los informes provistos a nuestro GPT.
Figura 17: Resolución de dudas de minerales críticos.
También podemos plantearle preguntas concretas sobre la información tabulada provista respecto a los yacimientos e indicios existentes en el territorio español.

Figura 18: Reservas de litio en Extremadura.
6.2. Representación de visualizaciones de datos cuantitativos
Otro escenario común, es la necesidad de consultar información cuantitativa y realizar representaciones visuales para su mejor entendimiento. En este escenario, podemos observar cómo MateriaGuru es capaz de generar una visualización interactiva de la producción de grafito en toneladas de los principales países productores.

Figura 19: Generación de visualización interactiva con nuestro GPT.
6.3. Generación de mapas mentales para facilitar la comprensión
Por último, en línea con la búsqueda de alternativas para un mejor acceso y comprensión del conocimiento existente en nuestro GPT, plantearemos a MateriaGuru la construcción de un mapa mental que nos permita entender de una forma visual conceptos clave de los minerales críticos. Para ello, utilizamos la notación abierta Markmap (Markdown Mindmap), que nos permite definir mapas mentales utilizando notación markdown.

Figura 20: Generación de mapas mentales desde nuetro GPT.
Deberemos copiar el código generado e introducirlo en un visualizador de markmap para poder generar el mapa mental deseado. Facilitamos aquí una versión de este código generada por MateriaGuru.

Figura 21: Visualización de mapas mentales.
7. Resultados y conclusiones
En el ejercicio de construcción de un asistente experto utilizando GPT-4, hemos logrado crear un modelo especializado en minerales críticos. Este asistente proporciona información detallada y actualizada sobre minerales críticos, apoyando la toma de decisiones estratégicas y promoviendo la educación en este campo. Primero recopilamos información de fuentes confiables como el RMIS, la Agencia Internacional de la Energía (IEA), y el Instituto Geológico y Minero Español (BDMIN). Posteriormente, procesamos y estructuramos los datos adecuadamente para su integración en el modelo. Las validaciones demostraron que el asistente responde de manera precisa a preguntas relevantes del dominio, facilitando el acceso a su información.
De esta forma, el desarrollo del asistente especializado en minerales críticos ha demostrado ser una solución efectiva para centralizar y facilitar el acceso a información compleja y dispersa.
La utilización de herramientas como Google Colab y Markmap ha permitido una mejor organización y visualización de los datos, aumentando la eficiencia en la gestión del conocimiento. Este enfoque no solo mejora la comprensión y el uso de la información sobre minerales críticos, sino que también prepara a los usuarios para aplicar estos conocimientos en contextos reales.
La experiencia práctica adquirida en este ejercicio es directamente aplicable a otros proyectos que requieran la personalización de modelos de lenguaje para casos de uso específicos.
8. ¿Quieres realizar el ejercicio?
Si quieres replicar este ejercicio, accede a este repositorio donde encontrarás más información (las prompt utilizadas, el código generado por MateriaGuru, etc.)
Además, recuerda que tienes a tu disposición más ejercicios en el apartado sección de “Visualizaciones paso a paso”.
Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El Centro Nacional de Información Geográfica publica los datos geoespaciales abiertos del Sistema Cartográfico Nacional, del Instituto Geográfico Nacional y de otros organismos a través de aplicaciones web y aplicaciones para móvil para facilitar el acceso y la consulta de los datos geográficos a los ciudadanos.
Los datos geoespaciales se publican a través de servicios web y API para su reutilización, por lo que en el caso de los conjuntos de datos de alto valor como los nombres geográficos, hidrografía o las direcciones tal y como establece la UE, ya están puestos a disposición de la ciudadanía antes de junio de 2024 ya que están asociados a grandes beneficios para la sociedad, el medio ambiente y la economía.
Pero en las aplicaciones que a continuación se enumeran, los datos geográficos se visualizan y se consultan a través de servicios web, por lo que para la descarga de los datos, es posible utilizar directamente los servicios web y API, a través de una plataforma accesible para cualquier usuario con una amplia gama de información geográfica, que abarca desde mapas topográficos hasta imágenes satelitales.
Pero no solo los datos se pueden reutilizar, también el software de las aplicaciones es reutilizable, como, por ejemplo, el visualizador del Potencial de Energía Solar de Edificios que se basa en una API de visualizador, llamada API-CNIG y que permite utilizar la misma herramienta para las diferentes temáticas.
Algunos ejemplos de las aplicaciones son:

Potencial de Energía Solar de Edificios
Ofrece la capacidad fotovoltaica de un edificio según su ubicación y características. Además, ofrece la media a lo largo del año y una malla puntual para identificar cuál sería la mejor localización de las placas solares.
Nomenclátor Geográfico Nacional
Es un buscador de topónimos que recoge las denominaciones, oficiales o normalizadas por los correspondientes organismos competentes referenciadas geográficamente.
Calculadora unificada de direcciones postales
Es un conversor que permite conocer las coordenadas geográficas (latitud y longitud en WGS84) de las direcciones postales de un lugar, y viceversa. En ambos casos, el fichero de entrada es un fichero en formato CSV, admitiendo tanto coordenadas como direcciones postales.
Mapas de España Básicos
Facilita la conexión a los servicios del IGN y al centro de descargas del CNIG para obtener mapas y rutas. Con esta aplicación móvil podrás recorrer las rutas de los Parques Nacionales o las etapas del Camino de Santiago. Permite planificar excursiones utilizando mapas, navegar y realizar recorridos guiados, sin necesidad de tener conexión a internet previa descarga de datos.
Mapa a la carta
Permite crear un mapa a medida usando las series impresas del Mapa Topográfico Nacional a escalas 1:25.000 y 1:50.000. Ofrece la posibilidad de definir su área, incorporar contenidos, personalizar la portada, obtener un fichero pdf e incluso adquirir copias en papel vía correo postal.
IGN Terremotos
Permite la recepción y visualización de todos los eventos sísmicos de España y alrededores. Ofrece la distancia al epicentro del evento sísmico y parámetros epicentrales, así como la geolocalización de la posición del usuario y del epicentro.
Mapas de España
Es un visualizador móvil gratuito ideal para senderismo, ciclismo, correr, esquiar, etc., que utiliza como cartografía de fondo los servicios del Instituto Geográfico Nacional y otro conjunto de servicios de otros Ministerios, como por ejemplo la información Catastral de las parcelas proporcionada por la Dirección General de Catastro.
Camino de Santiago
Incluye información de naturaleza cultural y práctica de cada una de las etapas (albergues, monumentos, etc.), así como una completa Guía del Peregrino que detalla lo que debes conocer antes de comenzar a realizar alguno de los Caminos. Esta aplicación se basa en el software de ESRI.
Parques Nacionales
Muestra información sobre la historia, fauna, flora y excursiones de los Parques Nacionales de España. Incluye cientos de puntos de interés como centros de información, alojamientos, miradores, refugios e incluso rutas para recorrer los parques indicando su duración o dificultad. La app está disponible para su descarga en Android e iOS. Esta aplicación se basa en el software de ESRI.
GeoSapiens IGN
Presenta mapas interactivos, de uso libre y gratuito, para estudiar la geografía física y política de España y el mundo. Consta de diferentes juegos relativos a toda España o por comunidades autónomas, el mundo completo y por continente.
Además de las aplicaciones desarrolladas por el CNIG, que también se presentan en este vídeo, existen muchas otras soluciones digitales realizadas por terceros que reutilizan datos abiertos geoespaciales para ofrecer un servicio a la sociedad. Por ejemplo, en la lista de aplicaciones reutilizadoras de datos.gob.es puedes encontrar desde un mapa que muestra los incendios que se encuentran activos en España en tiempo real hasta una app que señala dónde están las plazas de aparcamiento para personas con movilidad reducida de cada localidad.
En definitiva, cualquier persona puede hacer uso de los datos geográficos abiertos del Sistema Cartográfico Nacional, del Instituto Geográfico Nacional y de otros organismos publicados por el CNIG ampliando así las ventajas que ofrece la disponibilidad de datos abiertos geográficos. ¿Conoces alguna otra aplicación fruto de la reutilización de datos abiertos? Nos la puedes enviar a dinamizacion@datos.gob.es
El impulso de la eficiencia y sostenibilidad energética es una de las prioridades de la Unión Europea y de España, como refleja el Pacto Verde Europeo. La disponibilidad de datos abiertos relacionados con la producción, distribución y consumo energético permite a gobiernos, empresas y ciudadanos acceder a información esencial para abordar los desafíos del cambio climático y promover un futuro más sostenible.
En este post, exploramos ejemplos de casos de uso que muestran el impacto de los datos abiertos en el panorama energético, así como fuentes de interés donde localizar datos de calidad sobre la materia.
Casos de uso de datos abiertos en el sector energético
79.600 millones de euros. Ese es el ahorro anual estimado gracias a los datos abiertos en el sector energético dentro de la Unión Europea, de acuerdo con el informe “El impacto económico de los datos abiertos: oportunidades de creación de valor en Europa (2020)”. Esto es posible gracias a múltiples proyectos y aplicaciones basadas en datos abiertos que afectan a diversas áreas.
-
Planificación de recursos más eficiente
El acceso a datos abiertos sobre los recursos energéticos disponibles permite identificar las áreas más adecuadas para desarrollar proyectos, asegurando que se maximice el uso de los recursos naturales disponibles. Por ejemplo, en el mar Báltico, se están ampliando las infraestructuras de gas natural para dar respuesta a las crecientes necesidades de la región. Aprovechando los datos avanzados de Copernicus junto a sus propios servicios de vigilancia y predicción (que incluyen datos relativos al viento, las olas, el nivel del agua del mar, las corrientes, el hielo marino, etc.), los gobiernos estonio y finlandés pudieron llevar a cabo una planificación más eficiente para la instalación de una nueva planta.
Asimismo, el Instituto Geográfico Nacional ha puesto a disposición de los usuarios un visor para conocer la incidencia del sol y determinar la mejor ubicación de placas solares. Gracias a este visor se pueden analizar diferentes ubicaciones y orientaciones para identificar la posición que maximiza la captación de energía solar.
-
Consumo más responsable y eficiente
Los datos abiertos también incluyen información sobre el uso y rendimiento de diferentes energías. La Junta de Castilla y León, por ejemplo, cuenta con un dataHub que recoge información de más de 1.500 centros de consumo. Este cuadro de mando permite visualizar el análisis desagregado por tipo de energía (electricidad, gas, gasoil) y por localización geográfica (centros educativos, centros de salud, oficinas administrativas, hospitales, etc.). Gracias a ello pueden comparar el consumo entre los edificios que gestionan y tomar decisiones en pro de la eficiencia, lo cual ha supuesto un ahorro de 2M€ anuales desde 2015 únicamente en el coste fijo de electricidad.
Por su parte el visor Urban3r permite visualizar diferentes indicadores sobre el estado actual de la edificación, los datos de demanda energética de los edificios residenciales en su estado actual y tras someterlos a una rehabilitación energética, así como los costes estimados de estas intervenciones, facilitando la toma de decisiones.
En el mercado encontramos soluciones comerciales también dirigidas a este fin, como Opower, una herramienta que utiliza inteligencia artificial para ofrecer información personalizada a cada cliente, identificando y sugiriendo la sustitución de sistemas ineficientes de calefacción y refrigeración. Otro ejemplo es uplight, que realiza análisis de eficiencia energética para edificios comerciales, empresas de servicios públicos y entidades gubernamentales con recomendaciones operativas y de modernización de instalaciones para reducir el consumo. Estos ejemplos ponen de manifiesto la oportunidad de negocio que supone este nicho de mercado.
-
Posibilidad de elegir proveedores más económicos
Los datos abiertos proporcionan información detallada sobre las tarifas y precios de diferentes proveedores energéticos. Esta transparencia permite a los consumidores comparar fácilmente las ofertas y elegir la opción que mejor se ajusta a sus necesidades. Es el caso de las aplicaciones para elegir gasolineras, como Mejorgasolinera.com o Precioil.es, que ofrecen información detallada sobre las gasolineras del país y permiten filtrar por marcas, localización o carretera y ordenar por precio y distancia. También encontramos soluciones similares para el mercado de la luz, como Tarifaluzhora.
La Comisión Nacional de los Mercados y la Competencia (CNMC) también cuenta con un Comparador de Ofertas de Energía (CNMC), que permite consultar ofertas de gas y electricidad.
-
Transparencia, rendición de cuentas y minimización de daños
La publicación de datos abiertos no solo permite a los ciudadanos y organizaciones acceder a información detallada sobre la producción, distribución y consumo de energía. También aumenta la transparencia en la gestión de recursos y promueve la rendición de cuentas por parte de las empresas energéticas y los gobiernos.
Con ese fin nació OpenOil, que busca disminuir la opacidad de la industria petrolera y, con ello, aumentar la responsabilidad de las empresas del sector. Proporciona un marco de datos abiertos para la gestión de los recursos naturales a nivel supranacional, así como servicios de consultoría y formación para la creación de mecanismos y procesos de gestión de los recursos naturales.
Por su parte, con el fin de minimizar el impacto que generan los vertidos de petróleo en los océanos, el Consejo Superior de Investigaciones Científicas (CSIC), en colaboración con Digital Earth Solutions (DES), han desarrollado un software único capaz de predecir en pocos minutos y con gran precisión la evolución geográfica de cualquier marea negra, pronosticando su trayectoria futura en el océano o estudiando su movimiento hacia atrás en el tiempo para encontrar su origen.
¿Dónde puedo encontrar datos sobre energía?
Si estás pensando en desarrollar una solución de este tipo, estás de suerte, porque en la red hay disponible una gran cantidad de datos abiertos sobre energía.
Si buscas datos de España, además de datos.gob.es, puedes visitar las siguientes páginas web:
- Instituto para la Diversificación y Ahorro de la Energía (IDAE). IDAE ofrece estadísticas y balances energéticos sectorizados tanto de energía primaria como final, en miles de toneladas equivalentes de petróleo (ktep). En total, se detallan 69 tipos de energía y 128 flujos energéticos y/o sectores. Los datos actualmente disponibles abarcan la serie histórica desde 1990 a 2022.
- Red Eléctrica de España. REData es el espacio web de Red eléctrica donde podemos encontrar series estadísticas nacionales relativas al sistema eléctrico español, actualizados mes a mes. En este espacio también se puede acceder a información sobre la demanda, generación, balance, intercambio, transporte y mercados eléctricos, cuyos datos están disponibles a través de una API REST. Según la naturaleza del conjunto de datos, podemos encontrar datos que se actualizan anual, trimestral o incluso diariament. Otra herramienta de utilidad de Red Eléctrica es ESIOS, con datos actualizados de generación, consumo, mercado, precios, etc.
- Comisión Nacional de los Mercados y la Competencia (CNMC): El portal de datos abiertos CNMC Data proporciona acceso directo a datos e indicadores relativos a los mercados energéticos que supervisa la CNMC: electricidad, gas natural y productos petrolíferos. Podemos encontrar estadísticas sobre los precios del mercado, el número de usuarios beneficiados con el bono social o los porcentajes que supone la energía renovable en el cómputo total, entre otros valores. Los datos se actualizan periódicamente, de forma mensual, trimestral o anual.
También hay disponible una gran cantidad de información a nivel mundial:
- Unión Europea. En la página web sobre la política energética de la UE, encontramos distintos datos y análisis que abarcan desde la evolución del precio del petróleo en los distintos países miembro hasta posibles escenarios del mercado energético para 2030 y 2050, entre otros muchos. Además, la Dirección General de Energía de la Comisión Europea elabora cada dos años fichas de datos estadísticos sobre energía, basados en datos de Eurostat y del seguimiento de los gases de efecto invernadero que lleva a cabo la UE. Los datos se muestran divididos por países, lo cual permite realizar comparaciones fácilmente. También está disponible la base de datos ENSPRESO, que se centra en los sectores eólico, solar y de biomasa.
- Agencia Internacional de la Energía (IEA, en sus siglas en inglés). IEA es una organización internacional creada en 1974 por la Organización para la Cooperación y el Desarrollo Económico (OCDE) con el fin de garantizar el abastecimiento energético. Aunque algunos de los datasets ofrecidos son de pago, en su web también se puede encontrar información en abierto que se puede descargar bajo registro.
- Otros países: A nivel internacional, podemos encontrar portales detallados por países, como el de Estados Unidos Open Energy Data Initiative (OEDI) o Reino Unido.
Estos son solo algunos ejemplos de soluciones y fuentes de datos que ponen de manifiesto el impacto que puede tener la apertura de datos energéticos en nuestro entorno, tanto a nivel de ahorro de costes como de impulso de la eficiencia. Te invitamos a compartir otras soluciones y portales de datos abiertos en comentarios.
La huella de carbono es un indicador fundamental para comprender el impacto ambiental de nuestras acciones. Mide la cantidad de emisiones de gases de efecto invernadero que se lanzan a la atmósfera fruto de las actividades humanas, entre las que destaca la quema de combustibles fósiles como el petróleo, el gas natural y el carbón. Estos gases, entre los que se encuentran el dióxido de carbono (CO2), el metano (CH4) y el óxido nitroso (N2O), contribuyen al calentamiento global al retener el calor en la atmósfera de la Tierra.
Son muchas las acciones que se llevan a cabo desde distintos organismos para tratar de reducir la huella de carbono. Entre ellas, las incluidas en el Pacto Verde Europeo o los Objetivos de desarrollo Sostenible. Pero este es un campo en el que cada pequeña acción cuenta y, como ciudadanos, también podemos contribuir a esta meta a través de pequeños cambios en nuestro estilo de vida.
Además, se trata de un campo donde los datos abiertos pueden tener un gran impacto. En concreto, en el informe “El impacto económico de los datos abiertos: oportunidades de creación de valor en Europa (2020)” se resalta como, gracias a los datos abiertos, se ha podido llevar a cabo un ahorro del equivalente a 5,8 millones de toneladas de petróleo cada año en la Unión europea, al impulsar otras energías más verdes. Esto supone, además, un ahorro de 79.600 millones de euros de costes en las facturas de energía.
En este artículo se repasan algunas soluciones que nos ayudan a medir nuestra huella de carbono para tomar conciencia de la situación, así como fuentes de datos abiertos de utilidad.
Calculadoras para conocer tu huella de carbono
La Unión Europea cuenta con una aplicación web donde cada persona puede analizar el ciclo de vida de los productos y la energía que se consume en cinco áreas concretas (alimentación, movilidad, vivienda, electrodomésticos y bienes del hogar), en base a 16 indicadores de impacto ambiental. El usuario introduce ciertos datos, como el gasto energético que realiza o los detalles de su vehículo, y la solución calcula el nivel de impacto. La web también ofrece recomendaciones para mejorar los patrones de consumo. Para su elaboración se han usado datos de Ecoinvent y Agrifoot-print, así como diferentes informes públicos detallados en su metodología..
La ONU también lanzó una solución similar, pero centrada en los bienes de consumo. Permite crear cadenas de valor de productos trazando un mapa de los materiales, procesos y transportes que se han utilizado para su fabricación y distribución, mediante una combinación de datos de actividad específicos de las empresas y datos secundarios. Los factores de emisión y conjuntos de datos para materiales y procesos provienen de una combinación de fuentes de datos como Ecoinvent, el Instituto Sueco de Medio Ambiente, DEFRA (Departamento de Medio Ambiente, Alimentación y Asuntos Rurales de Reino Unido), documentos académicos, etc. La calculadora también está vinculada a la Plataforma para la compensación de la huella de carbono de las Naciones Unidas. Esto permite a los usuarios de la aplicación tomar medidas climáticas inmediatas al contribuir a proyectos ecológicos.de las Naciones Unidas.
Si miramos a nuestro país, en España, el Ministerio para la Transición Ecológica y el Reto Demográfico cuenta con diversas herramientas para facilitar el cálculo de la huella de carbono dirigidas a distintos públicos: organizaciones, ayuntamientos y explotaciones agrícolas. En ellas se tienen en cuenta tanto las emisiones directas, como las indirectas procedentes del consumo de electricidad. Entre otras fuentes de datos, utiliza información del Inventario nacional de Gases de Efecto Invernadero. También ofrece una estimación de las absorciones de dióxido de carbono que genera un proyecto de reducción de emisiones.
Otra herramienta vinculada a este ministerio es ComidaAPrueba, puesta en marcha por la Fundación Vida Sostenible y dirigida a conocer la sostenibilidad de la alimentación de los ciudadanos. La aplicación móvil, disponible tanto para iOs como para Android, permite calcular la huella ambiental de nuestras comidas para que tomemos consciencia del impacto de nuestras acciones. También propone recetas saludables que nos ayudan a reducir el desperdicio alimentario.
Pero no todas las acciones que se desarrollan de este tipo están impulsadas por organismos públicos u asociaciones sin ánimo de lucro. La lucha contra el deterioro de nuestro medio ambiente también es un nicho de mercado que ofrece oportunidades empresariales. Empresas privadas también ofrecen soluciones para calcular la huella de carbono, como climate Hero, la cual de basa en múltiples fuentes de datos.
Fuentes de datos para nutrir las calculadoras de huella de carbono
Como hemos visto, para realizar estos cálculos, estas soluciones necesitan basarse en datos que les permitan calcular la relación entre determinados hábitos de consumo y las emisiones generadas. Para ello, recurren a diversas fuentes de datos, muchas de las cuales son abiertas. En España, por ejemplo, encontramos:
- Instituto Nacional de Estadística (INE). El INE ofrece datos de emisiones a la atmósfera por ramas de actividad, así como de los hogares. Se puede filtrar por tipo de gas y conocer su equivalencia en miles de toneladas de CO2. También ofrece datos de la evolución histórica de la consecución de los objetivos de reducción de huella de carbono, que se realizan a partir de los Inventarios Nacionales de Emisiones a la Atmósfera, elaborados por el Ministerio para la Transición Ecológica y el Reto Demográfico.
- Comunidades Autónomas. Diversos gobiernos autonómicos realizan inventarios de las emisiones contaminantes emitidas a la atmósfera. Es el caso del País Vasco o la Comunidad de Madrid. Algunas regiones también publican en abiertos datos de previsiones, como Canarias, que ofrece proyecciones del cambio climático en el turismo o en la situación de sequía.
Otros servicios de datos internacionales a considerar son:
- EarthData. Este servicio proporciona acceso completo y abierto a la colección de datos científicos de la Tierra de la NASA para comprender y proteger nuestro planeta. En este espacio ofrece enlaces a datos de uso común sobre gases de efecto invernadero, incluyendo dióxido de carbono, metano, óxido nitroso, ozono, clorofluorocarbonos y vapor de agua, así como a información sobre su impacto medioambiental.
- Eurostat. La Oficina estadística de la Comisión Europea publica regularmente estimaciones de las emisiones trimestrales de gases de efecto invernadero de la Unión Europea, desglosadas por actividad económica. Las estimaciones abarcan todos los trimestres desde 2010 hasta la actualidad.
- Life Cycle Assessment (LCA). Esta plataforma es la base de conocimientos de la Unión Europea en materia de producción y consumo sostenibles. Ofrece un inventario del ciclo de vida de los productos para el análisis de las cadenas de suministro. Para su realización se utilizan datos procedentes de asociaciones empresariales y otras fuentes relacionadas con vectores energéticos, transporte y gestión de residuos.
- Our World in Data. Uno de los conjuntos de datos más utilizados de este portal contiene información sobre emisiones de CO2 y gases de efecto invernadero a través de métricas clave. Para su elaboración, se han utilizado distintas fuentes de datos primarias como la agencia de información energética de Estados Unidos o The Global Carbon Project. Todos los datos en bruto y los scripts utilizados se encuentran disponibles en su repositorio de GitHub.
Estos repositorios son solo una muestra, pero existen muchas más fuentes de las que extraer datos de valor que nos ayuden a tomar conciencia de la situación climática en la que vivimos y del impacto que nuestras pequeñas acciones del día a día tienen sobre nuestro planeta. Reducir nuestra huella de carbono es crucial para preservar nuestro entorno y garantizar un futuro sostenible. Y solo juntos conseguiremos alcanzar los objetivos fijados.
La transición energética es también una transición de materias primas. Cuando nos imaginamos un futuro sostenible, lo concebimos fundado en una serie de sectores estratégicos como son los de las energías renovables o la movilidad eléctrica. De igual forma, nos imaginamos un futuro conectado y digital, donde nuevas innovaciones y modelos de negocio relacionados con la cuarta revolución industrial nos permiten resolver retos globales como la escasez de alimento o el acceso a la educación. En definitiva, nos centramos en tecnologías que nos ayudan a mejorar nuestra calidad de vida.
¿Por qué son importantes los minerales críticos?
Estos sectores dependen de una serie de tecnologías clave, como las baterías de almacenamiento energético, los aerogeneradores, las placas solares, los electrolizadores, los drones, los robots, las redes de transmisión de datos, los dispositivos electrónicos o satélites espaciales. Unas tecnologías que en los últimos años han experimentado una gran evolución tecnológica y un enorme crecimiento en su demanda a nivel mundial. Si analizamos las previsiones de desarrollo a 2030, podemos esperar crecimientos anuales de al menos dos dígitos para muchas de ellas, como se observa en la figura 1.

Figura 1: Crecimiento esperado hasta 2030 de algunas de las tecnologías clave para sectores estratégicos. Fuente: McKinsey (imagen 1, imagen 2, imagen 3)
Ahora bien, como puede observarse en la figura 2, muchas de estas tecnologías de futuro tienen una gran dependencia de un conjunto de materias primas críticas necesarias para su desarrollo. El indio y el galio son claves para la fabricación de iluminación LED de bajo consumo, el silicio es indispensable para la fabricación de microchips y semiconductores, y el grupo de metales del platino (como iridio, paladio, platino rodio o rutenio) son utilizados en catalizadores para electrolizadores de hidrógeno.

Figura 2: Representación semicuantitativa de flujos de materias primas hacia las quince tecnologías clave y cinco sectores estratégicos. Fuente: JRC Study.
Así pues, ¿cuándo entenderemos que un material sea crítico? Existen varios factores que nos permiten determinar si una materia prima pasa a ser considerada como crítica:
- Sus reservas mundiales son escasas
- No existen materiales alternativos que puedan ejercer su función (sus propiedades son únicas o muy singulares)
- Son materiales indispensables para sectores económicos clave de futuro, y/o su cadena de suministro es de elevado riesgo
Según las propias palabras de Margrethe Vestager, vicepresidenta ejecutiva de la Comisión Europea, “sin un suministro seguro y sostenible de materias primas críticas, no habrá una transición verde (sostenible) e industrial”.
Investigación de fuentes de datos de minerales críticos
Para poder conocer con detalle la situación de estos minerales en Europa, necesitamos localizar datos de calidad. Una tarea para la que tendremos que acudir a diversas fuentes.
En primer lugar, acudimos al portal europeo de datos abiertos. Desde su buscador, en una primera iteración, observamos que existen más de 46.000 conjuntos de datos ante la consulta “materias primas críticas” (figura 3).

Figura 3: Primera búsqueda de materias primas críticas en el portal de datos europeo
Tras un primer análisis de las categorías de datos disponibles, ajustamos los filtros hasta reducir los conjuntos de datos de interés a 190 (figura 4). Nos llaman especial atención los datos publicados por el JRC (European Comission Joint Research Center) y, en particular, el conjunto de datos titulado Materias primas críticas (CRM), evaluación de 2020.

Figura 4: Segunda búsqueda de materias primas críticas en el portal de datos europeo
Este conjunto de datos contiene un enlace directo a un portal web, el RMIS (Raw Material Information System), que es en realidad la base de conocimiento de referencia en torno a materias primas de la Comisión Europea a través de la cual podemos acceder a datos y análisis muy relevantes.

Figura 5: RMIS – base de conocimiento de la Comisión Europea para materias primas
A través del RMIS, encontramos una publicación muy interesante para cualquier estudio sobre la materia. Aunque esta publicación se encuentra en formato PDF, nos permite acceder al listado de materiales estratégicos, críticos y no críticos identificados por la Comisión Europea indicando su nivel de criticidad y su uso en diferentes tecnologías clave como se muestra en la figura 6.

Figura 6: Tabla de materias primas estratégicas, críticas y no críticas utilizadas diferentes tecnologías clave contenida en el fichero PDF. Fuente: Supply chain analysis and material demand forecast in strategic technologies and sectors in the EU – A foresight study, JRC 2023.
Continuando nuestra exploración, en este caso en busca de datos sobre reservas minerales en el continente europeo, encontramos la plataforma European Gelological Data Infrastructure (EDGI), la cual dispone de un amplio catálogo con más de 5.700 conjuntos de datos y servicios geológicos. En nuestro caso, tras realizar una búsqueda en su catálogo de datos, seleccionamos tres conjuntos de datos que contienen información interesante en cuanto a hallazgos de minerales críticos de litio, cobalto y grafito (figura 7).

Figura 7: Búsqueda de conjuntos de datos en el catálogo de EDGI
Desde el visualizador de EDGI, podemos ver el contenido de estos tres datasets antes de descargarlo en formato GeoJSON (figura 8). Los tres conjuntos de datos han sido originados desde el proyecto FRAME (Forecasting And Assessing Europe’s Strategic Raw Materials Needs), en el cual participan múltiples entidades europeas entre las que encontramos al Instituto Geológico y Minero de España (IGME).

Figura 8: Consulta de conjuntos de datos seleccionados a través de plataforma de visualización EDGI. Fuente: Map of cobalt occurrences in Europe, Map of graphite occurrences in Europe, Map of lithium occurrences in Europe, proyecto FRAME.
En último lugar, acudimos al portal de datos de la International Energy Agency (IEA) (figura 9). En este caso, encontramos, entre sus más de 70 conjuntos de datos, uno directamente relacionado con nuestro ámbito de investigación, titulado Critical Minerals Demand Dataset, el cual procedemos a descargar para su posterior análisis en formato excel.

Figura 9: Captura del portal de datos de la International Energy Agency (IEA)
Tras esta búsqueda, hemos localizado algunos datos de interés que nos pueden servir a la hora de realizar diversos análisis
Aunque este ejercicio se ha realizado bajo la temática de minerales críticos, los portales de datos abiertos europeos proporcionan una gran cantidad de información y conjuntos de datos diversos sobre multitud de áreas de interés que nos pueden ayudar a comprender los retos a afrontar como sociedad, desde la transición energética a la lucha contra la pobreza o el despilfarro de alimentos. Unos datos que permitirán realizar análisis encaminados a tomar mejores decisiones para avanzar hacia un futuro más próspero y sostenible.
Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El concepto de datos de alto valor (High-Value datasets) fue introducido por el Parlamento Europeo y el Consejo de la Unión Europea hace 4 años, en la Directiva (UE) 2019/1024. En ella se definían como una serie de conjuntos de datos con un gran potencial para generar “beneficios para la sociedad, el medio ambiente y la economía”. Por ello, los estados miembro debían impulsar su apertura de manera gratuita, en formatos legibles por máquinas, a través de APIs, en forma de descarga masiva y descritos de forma exhaustiva mediante metadatos.
De manera inicial, la directiva proponía en su anexo seis categorías temáticas a considerar como de alto valor: datos geoespaciales, observación de la tierra y medioambientales, meteorológicos, estadísticos, registros empresariales y datos sobre redes de transporte. Estas categorías fueron detalladas posteriormente en un reglamento de ejecución publicado en diciembre de 2022. Además, para facilitar su apertura, en junio de 2023 se editó un documento con pautas sobre cómo usar DCAT-AP para su publicación.
Nuevas categorías de datos a considerar de alto valor
Estas categorías iniciales siempre estuvieron abiertas a su ampliación. En este sentido, la Comisión Europea acaba de publicar el informe “Identification of data themes for the extensions of public sector High-Value Datasets” donde se incluyen siete nuevas categorías que se estudia considerar como datos de alto valor
-
Pérdida climática: Hace referencia a los datos relacionados con los enfoques y acciones necesarios para evitar, minimizar y abordar los daños asociados al cambio climático. Ejemplos de conjuntos de datos de esta categoría son las pérdidas económicas y no económicas derivadas de los fenómenos meteorológicos extremos o los cambios de evolución lenta, como el aumento del nivel del mar o la desertificación. También incluye datos relacionados con los sistemas de alerta temprana ante desastres naturales, la repercusión de las medidas de mitigación o datos de investigación sobre la atribución de fenómenos extremos al cambio climático.
-
Energía: Esta categoría incluye estadísticas completas sobre la producción, transporte, comercio y consumo final de fuentes de energía primarias y secundarias, tanto renovables como no renovables. Algunos ejemplos de conjuntos de datos a considerar son los indicadores de precios y consumo o la información sobre seguridad energética.
-
Finanzas: Se trata de información sobre la situación de las empresas privadas y las administraciones públicas, que puede utilizarse para evaluar el rendimiento empresarial o la sostenibilidad económica, así como para definir estrategias de gasto e inversión. Incluye conjuntos de datos sobre registros de empresas, estados financieros, fusiones y adquisiciones, así como informes financieros anuales.
-
Gobierno y administración pública: Esta temática incluye aquellos datos que los servicios y empresas públicas recopilan para informar y mejorar la acción de gobierno y la administración de una unidad territorial específica, ya sea un estado, una región o un municipio. Incluye datos relativos al gobierno (por ejemplo, actas de reuniones), los ciudadanos (censos o registro en los servicios públicos) y las infraestructuras gubernamentales. Estos datos se reutilizan posteriormente para fundamentar la elaboración de políticas, prestar servicios públicos, optimizar los recursos y la asignación presupuestaria, así como proporcionar información procesable y transparente a ciudadanos y empresas.
-
Salud: Este concepto identifica los conjuntos de datos que cubren el bienestar físico, y mental de la población, haciendo referencia tanto a aspectos objetivos como subjetivos de la salud de las personas. También incluye indicadores clave sobre el funcionamiento de los sistemas de asistencia sanitaria y la seguridad en el trabajo. Algunos ejemplos son los datos relativos a la Covid-19, la equidad sanitaria o el listado de servicios prestados por los centros sanitarios.
-
Justicia y asuntos jurídicos: Identifica conjuntos de datos que permiten reforzar la capacidad de respuesta, la rendición de cuentas y la interoperabilidad de los sistemas judiciales de la UE, cubriendo ámbitos como la aplicación de la justicia, el sistema jurídico o la seguridad pública, es decir, aquella que garantiza la protección de los ciudadanos. Los conjuntos de datos sobre justicia y asuntos jurídicos incluyen documentación de jurisprudencia nacional o internacional, decisiones de tribunales y fiscales generales, así como actos jurídicos y su contenido.
-
Datos lingüísticos: Hace referencia a expresiones escritas u orales que están en la base de la inteligencia artificial, el procesamiento del lenguaje natural y el desarrollo de servicios relacionados. La Comisión ofrece una definición bastante amplia de esta categoría de datos, todos ellos agrupados bajo la denominación de "datos lingüísticos multimodales". Pueden incluir repositorios de colecciones de textos, corpus de lenguas habladas, recursos de audio, o grabaciones de vídeo.

Para realizar esta selección, los autores del informe llevaron a cabo una investigación documental, así como consultas a administraciones públicas, expertos en datos y empresas privadas mediante una serie de talleres y encuestas. Además de esta evaluación, el equipo del estudio cartografió y analizó el ecosistema normativo en torno a cada categoría, así como las iniciativas políticas relacionadas con su armonización y puesta en común, especialmente en relación con la creación de Espacios Comunes Europeos de Datos.
Potencial para las PYMEs y las plataformas digitales
Además de definir estas categorías, el estudio también ofrece una estimación de alto nivel sobre el impacto de las nuevas categorías en las pequeñas y medianas empresas, así como en las grandes plataformas digitales. Una de las conclusiones del estudio es que la relación coste-beneficio de la apertura de datos es similar en todos los nuevos temas, destacando especialmente aquellos relativos a las categorías "Finanzas" y "Gobierno y administración pública".
Basándose en los conjuntos de datos disponibles públicamente, también se realizó una estimación del grado de madurez actual de los datos pertenecientes a las nuevas categorías, según su cobertura territorial y su grado de apertura (teniendo en cuenta si estaban abiertos en formatos leíbles por máquinas, con metadatos adecuados, etc.). Para maximizar la relación coste-beneficio global, el estudio sugiere seleccionar para cada categoría temática una aproximación distinta: en base a su nivel de madurez, se recomienda indicar un mayor o menor número de criterios obligatorios para su publicación, asegurándose así el evitar solapamientos entre los nuevos temas y con los datos de alto valor ya existentes.
Puedes leer el estudio completo en este enlace.