Blog

La huella de carbono es un indicador fundamental para comprender el impacto ambiental de nuestras acciones. Mide la cantidad de emisiones de gases de efecto invernadero que se lanzan a la atmósfera fruto de las actividades humanas, entre las que destaca la quema de combustibles fósiles como el petróleo, el gas natural y el carbón. Estos gases, entre los que se encuentran el dióxido de carbono (CO2), el metano (CH4) y el óxido nitroso (N2O), contribuyen al calentamiento global al retener el calor en la atmósfera de la Tierra.

Son muchas las acciones que se llevan a cabo desde distintos organismos para tratar de reducir la huella de carbono. Entre ellas, las incluidas en el Pacto Verde Europeo o los Objetivos de desarrollo Sostenible. Pero este es un campo en el que cada pequeña acción cuenta y, como ciudadanos, también podemos contribuir a esta meta a través de pequeños cambios en nuestro estilo de vida.

Además, se trata de un campo donde los datos abiertos pueden tener un gran impacto. En concreto, en el informe “El impacto económico de los datos abiertos: oportunidades de creación de valor en Europa (2020)” se resalta como, gracias a los datos abiertos, se ha podido llevar a cabo un ahorro del equivalente a 5,8 millones de toneladas de petróleo cada año en la Unión europea, al impulsar otras energías más verdes. Esto supone, además, un ahorro de 79.600 millones de euros de costes en las facturas de energía.

En este artículo se repasan algunas soluciones que nos ayudan a medir nuestra huella de carbono para tomar conciencia de la situación, así como fuentes de datos abiertos de utilidad.

Calculadoras para conocer tu huella de carbono

La Unión Europea cuenta con una aplicación web donde cada persona puede analizar el ciclo de vida de los productos y la energía que se consume en cinco áreas concretas (alimentación, movilidad, vivienda, electrodomésticos y bienes del hogar), en base a 16 indicadores de impacto ambiental. El usuario introduce ciertos datos, como el gasto energético que realiza o los detalles de su vehículo, y la solución calcula el nivel de impacto. La web también ofrece recomendaciones para mejorar los patrones de consumo. Para su elaboración se han usado datos de Ecoinvent y Agrifoot-print, así como diferentes informes públicos detallados en su metodología..

La ONU también lanzó una solución similar, pero centrada en los bienes de consumo. Permite crear cadenas de valor de productos trazando un mapa de los materiales, procesos y transportes que se han utilizado para su fabricación y distribución, mediante una combinación de datos de actividad específicos de las empresas y datos secundarios. Los factores de emisión y conjuntos de datos para materiales y procesos provienen de una combinación de fuentes de datos como Ecoinvent, el Instituto Sueco de Medio Ambiente, DEFRA (Departamento de Medio Ambiente, Alimentación y Asuntos Rurales de Reino Unido), documentos académicos, etc. La calculadora también está vinculada a la Plataforma para la compensación de la huella de carbono de las Naciones Unidas. Esto permite a los usuarios de la aplicación tomar medidas climáticas inmediatas al contribuir a proyectos ecológicos.de las Naciones Unidas.

Si miramos a nuestro país, en España, el Ministerio para la Transición Ecológica y el Reto Demográfico cuenta con diversas herramientas para facilitar el cálculo de la huella de carbono dirigidas a distintos públicos: organizaciones, ayuntamientos y explotaciones agrícolas. En ellas se tienen en cuenta tanto las emisiones directas, como las indirectas procedentes del consumo de electricidad. Entre otras fuentes de datos, utiliza información del Inventario nacional de Gases de Efecto Invernadero. También ofrece una estimación de las absorciones de dióxido de carbono que genera un proyecto de reducción de emisiones.

Otra herramienta vinculada a este ministerio es ComidaAPrueba, puesta en marcha por la Fundación Vida Sostenible y dirigida a conocer la sostenibilidad de la alimentación de los ciudadanos. La aplicación móvil, disponible tanto para iOs como para Android, permite calcular la huella ambiental de nuestras comidas para que tomemos consciencia del impacto de nuestras acciones. También propone recetas saludables que nos ayudan a reducir el desperdicio alimentario.

Pero no todas las acciones que se desarrollan de este tipo están impulsadas por organismos públicos u asociaciones sin ánimo de lucro. La lucha contra el deterioro de nuestro medio ambiente también es un nicho de mercado que ofrece oportunidades empresariales. Empresas privadas también ofrecen soluciones para calcular la huella de carbono, como climate Hero, la cual de basa en múltiples fuentes de datos.

Fuentes de datos para nutrir las calculadoras de huella de carbono

Como hemos visto, para realizar estos cálculos, estas soluciones necesitan basarse en datos que les permitan calcular la relación entre determinados hábitos de consumo y las emisiones generadas. Para ello, recurren a diversas fuentes de datos, muchas de las cuales son abiertas. En España, por ejemplo, encontramos:

Otros servicios de datos internacionales a considerar son:

  • EarthData. Este servicio proporciona acceso completo y abierto a la colección de datos científicos de la Tierra de la NASA para comprender y proteger nuestro planeta. En este espacio ofrece enlaces a datos de uso común sobre gases de efecto invernadero, incluyendo dióxido de carbono, metano, óxido nitroso, ozono, clorofluorocarbonos y vapor de agua, así como a información sobre su impacto medioambiental.
  • Eurostat. La Oficina estadística de la Comisión Europea publica regularmente estimaciones de las emisiones trimestrales de gases de efecto invernadero de la Unión Europea, desglosadas por actividad económica. Las estimaciones abarcan todos los trimestres desde 2010 hasta la actualidad.
  • Life Cycle Assessment (LCA). Esta plataforma es la base de conocimientos de la Unión Europea en materia de producción y consumo sostenibles. Ofrece un inventario del ciclo de vida de los productos para el análisis de las cadenas de suministro. Para su realización se utilizan datos procedentes de asociaciones empresariales y otras fuentes relacionadas con vectores energéticos, transporte y gestión de residuos.
  • Our World in Data. Uno de los conjuntos de datos más utilizados de este portal contiene información sobre emisiones de CO2 y gases de efecto invernadero a través de métricas clave. Para su elaboración, se han utilizado distintas fuentes de datos primarias como la agencia de información energética de Estados Unidos o The Global Carbon Project. Todos los datos en bruto y los scripts utilizados se encuentran disponibles en su repositorio de GitHub.

Estos repositorios son solo una muestra, pero existen muchas más fuentes de las que extraer datos de valor que nos ayuden a tomar conciencia de la situación climática en la que vivimos y del impacto que nuestras pequeñas acciones del día a día tienen sobre nuestro planeta. Reducir nuestra huella de carbono es crucial para preservar nuestro entorno y garantizar un futuro sostenible. Y solo juntos conseguiremos alcanzar los objetivos fijados.

calendar icon
Noticia

El avance imparable de las TIC en las ciudades y territorios rurales, y el contexto social, económico y cultural que lo sustenta, exige habilidades y competencias que nos posicionan de manera ventajosa ante nuevos escenarios y entornos de innovación territorial. En este contexto, la Diputación Provincial de Badajoz ha sabido adaptarse y adelantarse a las circunstancias, y a partir del año 2018 puso en marcha la iniciativa “Badajoz Es Más – Smart Provincia”.

¿Qué es “Badajoz Es Más"?

El proyecto “Badajoz Es Más” es una iniciativa llevada a cabo por la Diputación Provincial de Badajoz cuyo objetivo es conseguir unos servicios más eficientes, mejorar la calidad de vida de sus ciudadanos y fomentar el emprendimiento y la innovación a través de las tecnologías y el gobierno del dato en una región integrada por 135 municipios. Se busca una transformación digital del territorio, que favorezcan la creación de oportunidades de negocio, de mejora social y de asentamiento de la población.

Tradicionalmente, los proyectos de “Smart Cities” han puesto sus esfuerzos en las ciudades, renovación de centros históricos, etc. Sin embargo, “Badajoz Es Más” está centrado en la transformación de las zonas rurales, los pueblos inteligentes y sus ciudadanos, poniendo el foco en los retos rurales como la despoblación de los municipios rurales, la brecha digital, la retención de talento o la dispersión de los servicios. Se quiere evitar los “silos” aislados y transformar estos retos en oportunidades mediante la mejora de la gestión de la información, a través de la explotación de los datos de una manera productiva y eficiente.

El ciudadano, en el Centro

El proyecto “Badajoz es Más” persigue llevar a cabo la transformación digital del territorio poniendo a disposición de los municipios, empresas y ciudadanos las nuevas tecnologías del IoT, Big Data, Inteligencia Artificial, etc. A continuación, se exponen las líneas maestras del proyecto.

Plataforma Provincial de Gestión Inteligente de Servicios Públicos.

Es el componente nuclear de la iniciativa, ya que permite la integración de la información de cualquier dispositivo IoT, sistema de información o fuente de datos en un único lugar para su almacenamiento, visualización y análisis.  En concreto, se recopilan datos de diversas fuentes: los diversos sensores de las soluciones inteligentes implantadas en la región, los servicios web y las aplicaciones, la información ofrecida por ciudadanos y redes sociales.

Toda la información se recolecta en una Plataforma horizontal y abierta, basada en el estándar de código abierto FIWARE, una iniciativa promovida por la Comisión Europea que aporta la capacidad de homogeneizar los datos (FIWARE Data Model) y favorecer su interoperabilidad. Construido siguiendo las directrices marcadas por AENOR (UNE 178104), cuenta con un módulo central Orion Context Broker (OCB) que permite administrar todo el ciclo de vida de la información. De esta forma, ofrece la capacidad de monitorizar y gestionar de forma centralizada un conjunto ampliable de servicios públicos a través de cuadros de mando internos.

La  plataforma es “multientidad”, es decir permite proveer de información, conocimiento y servicios tanto a la propia Diputación Provincial como a su Municipios asociados (también conocidos como “Pueblos Inteligentes”). La visualización de los diferentes modelos de explotación de información procesados en los distintos niveles de la Plataforma se realiza sobre distintos cuadros de mando, que pueden dar servicio a un municipio o localidad concreta solo mostrando sus datos y servicios, o también disponer de una visión global de todos los servicios y datos a nivel de la Diputación de Badajoz.

Parte de la información recopilada en la plataforma se pone, también, a disposición de terceros a través de diversos canales:

  • Portal de datos abiertos. Aquellos datos recopilados susceptibles de ser abiertos a terceros para su reutilización, se comparten a través de su portal de datos abiertos. En él podemos encontrar información tan diversa como datos en tiempo real sobre las playas de la región con bandera azul (se monitoriza la calidad del aire, del agua,la contaminación sonora, el aforo, etc.) o el flujo del tráfico, lo cual permite predecir los atascos.
  • Portal para los ciudadanos Provincia Digital Badajoz. Este portal ofrece información sobre las soluciones implementadas actualmente en la provincia y sus datos en tiempo real de una forma amigable, con una experiencia de usuario sencilla que permite a aquellas personas sin conocimientos técnicos acceder conocer los proyectos desarrollados.

La siguiente gráfica muestra el ciclo de la información, desde su recolección, paso por la plataforma y distribución a los distintos canales. Todo ello bajo un fuerte gobierno del dato.

Servicios Públicos eficientes

Además de la implantación y puesta en marcha de la Plataforma Provincial de Gestión Inteligente de Servicios Públicos, este proyecto ya ha integrado distintos servicios o “verticales” existentes para:

  • Comenzar a implantar estos nuevos servicios en la provincia y ser el ejemplo y la “punta de lanza” de esta transformación tecnológica.
  • Mostrar los beneficios de la implantación de estas tecnologías para realizar una labor divulgativa y demostrativa con el ánimo de causar el impacto suficiente como para que de manera gradual los demás Ayuntamientos y organizaciones se vayan sumando a la iniciativa.

Actualmente se cuenta con más de 40 empresas enviando datos a la Plataforma Provincial, más de 60 fuentes de datos integradas, más de 800 dispositivos conectados, más del 500 transacciones por minuto… Cabe destacar que se trabaja para que los nuevos pliegos que se presentan lleven asociados una cláusula para que los datos provenientes de los diversos trabajos financiados con dinero público se viertan también a la plataforma.

La idea es poder realizar una gestión estandarizada, de tal forma que la solución que se ha implantado en un municipio sirva también para otro. De esta forma no solo se mejora la eficiencia, sino que también se pueden comparar los resultados entre municipios. Puede visualizar algunos de los servicios ya implantados en la Provincia, así que como sus Cuadros de Mando construidos desde la Plataforma Provincial en este vídeo.

Ecosistema de Innovación

Para conseguir que la iniciativa llegue su público objetivo, la Diputación Provincial de Badajoz ha desarrollado un ecosistema de innovación que sirve de punto de encuentro entre:

  • Ciudadanos, que demandan estos servicios.
  • Emprendedores y entidades educativas, que tienen interés en estas tecnologías.
  • Empresas, que tienen la capacidad de implantar estas soluciones.
  • Entidades públicas, que pueden poner en marcha este tipo de proyectos.

Se trata de facilitar y proveer las herramientas, conocimientos y asesoramiento necesario para que los proyectos que surjan de este encuentro puedan llevarse a cabo.

Este ecosistema tiene como elemento central un centro de innovación físico denominado FIWARE Space. FIWARE Space lleva a cabo labores como la organización de eventos para la divulgación de las tecnologías y conceptos Smart entre empresas y ciudadanos, talleres demostrativos y formativos, Hackathones con universidades y centros de estudio, etc. También cuenta con un Showroom para la exposición de soluciones, realiza Retos dotados económicamente y tiene presencia en congresos nacionales e internacionales.

Además, llevan a cabo labores de mentorización a empresas y entras entidades. En total, cerca de 40 empresas han  sido mentorizadas por FIWARE Space, llegando a lanzar sus propias soluciones en varias ocasiones al Market de FIWARE, o proponiendo los modelos de datos generados como estándares para todo el ecosistema mundial. A estas empresas se les ofrece un servicio gratuito para que adquieran los conocimientos necesarios para trabajar de forma estandarizada, generando datos uniformes al resto de la región, y para conectar sus soluciones a la plataforma, ayudándoles y asesorándoles en los retos que puedan surgir.

Una de las claves de FIWARE Space es su carácter abierto, habiendo firmado multitud de acuerdos de colaboración y convenios con entidades tanto locales, como internacionales. Por ejemplo, se está trabajando en la normalización de modelos de datos avanzados para el turismo con el Instituto de Ciudades del Futuro (Argentina). Para aquellos que quieran más información, puede seguir la actividad de su centro a través de su blog semanal.

Próximos pasos: convergencia con Espacios de Datos y Gaia-X

Fruto del carácter colaborativo y abierto del proyecto, el concepto Espacio de Datos encaja perfectamente en la filosofía de “Badajoz es Más”. La Diputación de Badajoz cuentan actualmente con multitud de verticales con información interesante para su compartición (y futura explotación) de datos de forma confiable, soberana y segura. Como Entidad Pública, la comparación y obtención de otras fuentes de datos enriquecerá en gran medida al proyecto, aportando una visión externa imprescindible para su crecimiento. Gaia-X es la propuesta para la creación de una infraestructura de datos para Europa, y es el estándar hacía el que está convergiendo actualmente el proyecto “Badajoz es Más”, fruto de su colaboración con el hub Gaia-X España.

calendar icon
Noticia

El Observatorio de Casos de Uso (Use Case Observatory, en inglés) es una iniciativa liderada por data.europa.eu, el Portal Europeo de Datos Abiertos. Se trata de un proyecto de investigación sobre el impacto económico, gubernamental, social y medioambiental de los datos abiertos. El proyecto se prolongará durante tres años, desde 2022 hasta 2025, en los que el Portal Europeo de Datos realizará el seguimiento de 30 casos de reutilización de datos abiertos e irá publicando conclusiones en entregas periódicas.  

En 2022 hizo un primer informe y ahora, en abril de 2024, ha presentado el volumen 2 del análisis exploratorio en torno al uso de los datos abiertos. En esta segunda entrega, analiza trece de los casos de uso iniciales que permanece en estudio, tres de ellos españoles, y expone, a modo de conclusiones, los siguientes puntos: 

  • El documento subraya en primer lugar el alto potencial de la reutilización de datos abiertos.
  • Destaca que muchas organizaciones y aplicaciones deben su propia existencia a los datos abiertos. 
  • Asimismo, señala la necesidad de liberar de forma más amplia, el impacto potencial de los datos abiertos en la economía, la sociedad y el medio ambiente. 
  • Para lograr el punto anterior, señala el apoyo continuo a la comunidad de reutilización como crucial para identificar oportunidades de crecimiento financiero.  

 Los tres casos españoles: UniversiDATA-Lab, Tangible Data y Planttes 

Para seleccionar los casos de uso, el Observatorio realizó un inventario basado en tres fuentes: los ejemplos recogidos en los estudios de madurez que realiza cada año el portal europeo, las soluciones participantes en el EU Datathon y los ejemplos de reutilización disponibles en el repositorio de casos de uso de data.europa.eu. Solo se tuvieron en cuenta aquellos proyectos desarrollados en Europa, intentando mantener un equilibrio entre los distintos países.  

Además, se destacaron aquellos proyectos que hubiesen obtenido algún premio o que estuviesen alineados con las prioridades de la Comisión Europea para 2019 a 2024. Para finalizar la selección, desde data.europa.eu se realizaron entrevistas con representantes de los casos de uso que cumplían los requisitos y que estaban interesados en participar en el proyecto. 

En esta segunda ocasión, el nuevo informe reseña un proyecto del área de impacto económico, tres del ámbito gubernamental, seis del área social y cuatro medioambientales

Tanto en el primer volumen como en este, destaca tres casos españoles: UniversiDATA-Lab y Tangible Data, del ámbito social y Planttes, en la categoría de medioambiente. 

UniversiDATA-Lab, la unión de seis universidades en torno a los datos abiertos 

En el caso de UniversiDATA-Lab está enfocado en la educación superior. Es un portal público para el análisis avanzado y automático de los conjuntos de datos publicados por las seis universidades españolas que forman parte del portal UniversiDATA: la Universidad Autónoma de Madrid (UAM), la Universidad Carlos III de Madrid, la Universidad Complutense de Madrid (UCM), la Universidad de Huelva, la Universidad de Valladolid (UVa) y la Universidad Juan Carlos I.  

El objetivo de UniversiDATA-Lab es transformar los análisis estáticos de la sección del portal en resultados dinámicos. El informe del Observatorio señala que este proyecto “fomenta el uso de recursos compartidos” entre los distintos centros universitarios. También destaca como impacto reseñable la puesta en marcha de aplicaciones web dinámicas que leen en tiempo real el catálogo de UniversiDATA, obtienen todos los datos disponibles y realizan análisis de datos en línea. 

Respecto al informe anterior, elogia su “esfuerzo considerable para convertir datos intrincados en información de fácil manejo”, además de señalar que este proyecto proporciona documentación detallada para ayudar a los usuarios a comprender la naturaleza de los datos analizados. 

Tangible Data, haciendo comprensibles los datos espaciales 

En el caso de Tangible Data, se trata de un proyecto que transforma los datos de su contexto digital a un contexto físico mediante la creación de esculturas de datos en el espacio público. Estas esculturas de datos ayudan a las personas que carecen de ciertas competencias digitales a comprenderlos. Para ello, utiliza como fuentes de datos los de organismos internacionales (por ejemplo, NASA, Banco Mundial) y otras plataformas similares. 

En este segundo volumen destacan su evolución “significativa, ya que desde el pasado año el proyecto ha pasado de realizar pruebas de producto mínimo viable a la entrega de proyectos integrales. Esto les ha permitido explorar oportunidades comerciales y educativas, como exposiciones, talleres, etc., tal y como se extrapola de las entrevistas realizadas. Además, los cuatro procesos clave (diseño, creación, entrega y medición) se han estandarizado y han hecho que el proyecto sea globalmente accesible y rápidamente desplegable. 

Planttes, iniciativa medioambiental que se cuela en el Observatorio 

El tercer ejemplo español, Planttes, es una aplicación de ciencia ciudadana que informa a los usuarios sobre qué plantas están en flor y si esto puede afectar a las personas alérgicas al polen. Utiliza los datos abiertos del Punto de información sobre aerobiología (PIA-UAB), entre otros, que complementa con datos que aportan los usuarios para crear mapas personalizados. 

De este proyecto, el Observatorio señala que, aprovechando la participación de la comunidad y la tecnología, “la iniciativa ha logrado avances significativos en la comprensión y mitigación del impacto de las alergias al polen con el compromiso de fomentar la concienciación y la educación en los años venideros 

Respecto al trabajo desarrollado, señala que Planttes ha evolucionado pasando de ser una aplicación móvil a una aplicación web con el fin de mejorar la accesibilidad. El objetivo de esta transición es facilitar a los usuarios el uso de la plataforma sin las limitaciones de las aplicaciones móviles.  

El Observatorio de Casos de Uso entregará su tercer volumen en el año 2025. Su razón de ser se enmarca más allá de analizar y reseñar los logros alcanzados y los retos presentes. Al tratarse de un proyecto continuo durante tres años, permitirá extrapolar ideas concretas para mejorar las metodologías de evaluación del impacto de los datos abiertos. 

calendar icon
Documentación

1. Introducción

Las visualizaciones son representaciones gráficas de datos que permiten comunicar, de manera sencilla y efectiva, la información ligada a los mismos. Las posibilidades de visualización son muy amplias, desde representaciones básicas como los gráficos de líneas, de barras o métricas relevantes, hasta visualizaciones configuradas sobre cuadros de mando interactivos.

En esta sección de “Visualizaciones paso a paso” estamos presentando periódicamente ejercicios prácticos haciendo uso de datos abiertos disponibles en  datos.gob.es u otros catálogos similares. En ellos se abordan y describen de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y los análisis pertinentes para, finalmente obtener unas conclusiones a modo de resumen de dicha información.

En cada ejercicio práctico se utilizan desarrollos de código documentados y herramientas de uso gratuito. Todo el material generado está disponible para su reutilización en el repositorio de GitHub de datos.gob.es.

En este ejercicio concreto, exploraremos la actual situación de la penetración de los vehículos eléctricos en España y las perspectivas de futuro de esta tecnología disruptiva en el transporte.

Accede al repositorio del laboratorio de datos en Github.

Ejecuta el código de pre-procesamiento de datos sobre Google Colab.

En este vídeo, el autor te explica que vas a encontrar tanto en el Github como en Google Colab.

2. Contexto: ¿Por qué es importante el vehículo eléctrico?

La transición hacia una movilidad más sostenible se ha convertido en una prioridad global, situando al vehículo eléctrico (VE) en el centro de numerosas discusiones sobre el futuro del transporte. En España, esta tendencia hacia la electrificación del parque automovilístico no solo responde a un creciente interés por parte de los consumidores en tecnologías más limpias y eficientes, sino también a un marco regulatorio y de incentivos diseñado para acelerar la adopción de estos vehículos. Con una creciente oferta de modelos eléctricos disponibles en el mercado, los vehículos eléctricos representan una pieza clave en la estrategia del país para reducir las emisiones de gases de efecto invernadero, mejorar la calidad del aire en las ciudades y fomentar la innovación tecnológica en el sector automotriz.

Sin embargo, la penetración de los vehículos eléctricos en el mercado español enfrenta una serie de desafíos, desde la infraestructura de carga hasta la percepción y el conocimiento del consumidor sobre estos vehículos. La expansión de la red de carga, junto con las políticas de apoyo y los incentivos fiscales, son fundamentales para superar las barreras existentes y estimular la demanda. A medida que España avanza hacia sus objetivos de sostenibilidad y transición energética, el análisis de la evolución del mercado de vehículos eléctricos se convierte en una herramienta esencial para entender el progreso realizado y los obstáculos que aún deben superarse.

3. Objetivo

Este ejercicio se centra en mostrar al lector técnicas para el tratamiento, visualización y análisis avanzado de datos abiertos mediante Python. Adoptaremos para ello el enfoque “aprender haciendo”, de tal forma que el lector pueda comprender la utilización de estas herramientas en el contexto de la resolución de un reto real y de actualidad como es el estudio de la penetración del VE en España. Este enfoque práctico no solo mejora la comprensión de las herramientas de ciencia de datos, sino que también prepara a los lectores para aplicar estos conocimientos en la resolución de problemas reales, ofreciendo una experiencia de aprendizaje rica y directamente aplicable a sus propios proyectos.

Las preguntas a las que trataremos de dar respuesta a través de nuestro análisis son:

  1. ¿Qué marcas de vehículos lideraron el mercado en 2023?
  2. ¿Qué modelos de vehículos fueron los más vendidos en el 2023?
  3. ¿Qué cuota de mercado absorbieron los vehículos eléctricos en el 2023?
  4. ¿Qué modelos de vehículos eléctricos fueron los más vendidos en el 2023?
  5. ¿Cómo han evolucionado las matriculaciones de vehículos a lo largo del tiempo?
  6. ¿Observamos algún tipo de tendencia respecto a la matriculación de vehículos eléctricos?
  7. ¿Cómo esperamos que evolucionen las matriculaciones de vehículos eléctricos el próximo año?
  8. ¿Cuál es la reducción de emisiones de CO2 que podemos esperar gracias a las matriculaciones obtenidas durante el próximo año?

4. Recursos

Para completar el desarrollo de este ejercicio requeriremos el uso de dos categorías de recursos: Herramientas Analíticas y Conjuntos de Datos.

4.1. Conjunto de datos

Para completar este ejercicio utilizaremos un conjunto de datos provisto por la Dirección General de Tráfico (DGT) a través de su portal estadístico, también disponible desde el catálogo Nacional de Datos Abiertos (datos.gob.es). El portal estadístico de la DGT es una plataforma en línea destinada a ofrecer acceso público a una amplia gama de datos y estadísticas relacionadas con el tráfico y la seguridad vial. Este portal incluye información sobre accidentes de tráfico, infracciones, matriculaciones de vehículos, permisos de conducción y otros datos relevantes que pueden ser útiles para investigadores, profesionales del sector y el público en general.

En nuestro caso, utilizaremos su conjunto de datos de matriculaciones de vehículos en España disponibles vía:

Aunque durante el desarrollo del ejercicio mostraremos al lector los mecanismos necesarios para su descarga y procesamiento, incluimos en el repositorio de GitHub asociado los datos preprocesados*, de tal forma que el lector pueda proceder directamente al análisis de los mismos en el caso de que lo desee.

*Los datos utilizados en este ejercicio fueron descargados el 04 de marzo de 2024. La licencia aplicable a este conjunto de datos puede encontrarse en https://datos.gob.es/avisolegal.

4.2. Herramientas analíticas

  • Lenguaje de programación: Python – es un lenguaje de programación ampliamente utilizado en análisis de datos debido a su versatilidad y a la amplia gama de bibliotecas disponibles. Estas herramientas permiten a los usuarios limpiar, analizar y visualizar grandes conjuntos de datos de manera eficiente, lo que hace de Python una elección popular entre los científicos de datos y analistas.
  • Plataforma: Jupyter Notebooks – es una aplicación web que permite crear y compartir documentos que contienen código vivo, ecuaciones, visualizaciones y texto narrativo. Se utiliza ampliamente para la ciencia de datos, análisis de datos, aprendizaje automático y educación interactiva en programación.
  • Principales librerías y módulos:
    • Manipulación de datos: Pandas – es una librería de código abierto que proporciona estructuras de datos de alto rendimiento y fáciles de usar, así como herramientas de análisis de datos.
    • Visualización de datos:
      • Matplotlib: es una librería para crear visualizaciones estáticas, animadas e interactivas en Python.
      • Seaborn: es una librería basada en Matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.
    • Estadística y algoritmia:
      • Statsmodels: es una librería que proporciona clases y funciones para la estimación de muchos modelos estadísticos diferentes, así como para realizar pruebas y exploración de datos estadísticos.
      • Pmdarima: es una librería especializada en la modelización automática de series temporales, facilitando la identificación, el ajuste y la validación de modelos para pronósticos complejos.

5. Desarrollo del ejercicio

Es aconsejable ir ejecutando el Notebook con el código a la vez que se realiza la lectura del post, ya que ambos recursos didácticos son complementarios en las futuras explicaciones

 

El ejercicio propuesto se divide en cuatro fases principales.

5.1 Configuración inicial

Este apartado podrás encontrarlo en el punto 1 del Notebook.

En este breve primer apartado, configuraremos nuestro Jupyter Notebook y nuestro entorno de trabajo para poder trabajar con el conjunto de datos seleccionado. Importaremos las librerías Python necesarias y crearemos algunos directorios donde almacenaremos los datos descargados.

5.2 Preparación de datos

Este apartado podrás encontrarlo en el punto 2 del Notebook.

Todo análisis de datos requiere una fase de acceso y tratamiento de los mismos hasta obtener los datos adecuados en el formato deseado. En esta fase, descargaremos los datos del portal estadístico y los transformaremos al formato Apache Parquet antes de proceder a su análisis.

Aquellos usuarios que quieran profundizar en esta tarea, tienen a su disposición la Guía Práctica de Introducción al Análisis Exploratorio de Datos.

5.3 Análisis de datos

Este apartado podrás encontrarlo en el punto 3 del Notebook.

5.3.1 Análisis descriptivo

En esta tercera fase, comenzaremos nuestro análisis de datos. Para ello, responderemos las primeras preguntas apoyándonos en herramientas de visualización de datos que además nos permitirán familiarizarnos con los mismos. Mostramos a continuación algunos ejemplos del análisis:

  • Top 10 Vehículos matriculados en el 2023: En esta visualización representamos los diez modelos de vehículos con mayor número de matriculaciones durante el año 2023, indicando además el tipo de combustión de estos. Las principales conclusiones son:
    • Los únicos vehículos de fabricación europea que aparecen en el Top 10 son el Arona y el Ibiza de la marca española SEAT. El resto son asiáticos.
    • Nueve de los diez vehículos están propulsados por Gasolina.
    • El único vehículo del Top 10 con un tipo de propulsión diferente es el DACIA Sandero GLP (Gas Licuado de Petróleo).

Gráfica que muestra el Top10 de vehículos matriculados en 2023. Son, por este orden: Arona, Toyota Corolla, MG ZS, Toyota C-HR, Sportage, Ibiza, Nissan Qashqai, Sandero, tucson, Toyota Yaris Cross. Todos son de gasolina, excepto el Sandero que es Gas Licuado de Petróleo.

Figura 1. Gráfica "Top 10 Vehículos matriculados en el 2023"

  • Cuota de mercado por tipo de propulsión: En esta visualización representamos el porcentaje de vehículos matriculado por cada tipo de propulsión (vehículos de gasolina, diésel, eléctricos u otros). Vemos cómo la inmensa mayoría del mercado (>70%) la absorbieron vehículos de gasolina, siendo los diésel la segunda opción, y como los vehículos eléctricos alcanzaron el 5.5%.

Gráfico que muestra los vehículos vendidos en 2023 por tipo de propulsión: gasolina (71,3%), Diesel (20,5%), Eléctrico (5,5%), otros (2,7%).

Figura 2. Gráfica "Cuota de mercado por tipo de propulsión".

  • Evolución histórica de las matriculaciones: Esta visualización representa la evolución de las matriculaciones de vehículos en el tiempo. En ella se muestra el número de matriculaciones mensual entre enero de 2015 y diciembre de 2023 distinguiendo entre los tipos de propulsión de los vehículos matriculados.Podemos observar varios aspectos interesantes en este gráfico:
    • Apreciamos un comportamiento estacional anual, es decir, observamos patrones o variaciones que se repiten a intervalos regulares de tiempo. Vemos cómo recurrentemente en junio/julio aparecen altos niveles de matriculación mientras que en agosto/septiembre decrecen drásticamente. Esto es muy relevante, pues el análisis de series temporales con factor estacional tiene ciertas particularidades.
    • Es muy notable también la enorme caída de matriculaciones producida durante los primeros meses del COVID.
    • Vemos también como los niveles de matriculación post-covid son inferiores a los previos.
    • Por último, podemos observar cómo entre los años 2015 y 2023 la matriculación de vehículos eléctricos va creciendo paulatinamente.

Gráfico que muestra el número de matriculaciones mensual entre enero de 2015 y diciembre de 2023 distinguiendo entre los tipos de propulsión de los vehículos matriculados.

Figura 3. Gráfica "Matriculaciones de vehículos por tipo de propulsión".

  • Tendencia en la matriculación de vehículos eléctricos: Analizamos ahora por separado la evolución de vehículos eléctricos y no eléctricos utilizando mapas de calor como herramienta visual. Podemos observar comportamientos muy diferenciados entre ambos gráficos. Observamos cómo el vehículo eléctrico presenta una tendencia de incremento de matriculaciones año a año y, a pesar de suponer el COVID un parón en la matriculación de vehículos, los años posteriores han mantenido la tendencia creciente.

Gráfica que muestra la tendencia  en la matriculación de vehículos eléctricos a través de un mapa de calor. Se observa cómo van creciendo dichas matriculaciones.

Figura 4. Gráfica "Tendencia en la matriculación de vehículos convencionales vs eléctricos".

5.3.2. Analítica predictiva

Para dar respuesta a la última de las preguntas de forma objetiva, utilizaremos modelos predictivos que nos permitan realizar estimaciones respecto a la evolución del vehículo eléctrico en España. Como podemos observar, el modelo construido nos propone una continuación del crecimiento en las matriculaciones esperadas a lo largo del año serán de 70.000, alcanzando valores cercanos a las 8.000 matriculaciones solo en el mes de diciembre del 2024.

Gráfica que muestra el crecimiento futuro, según la estimación de nuestro modelo, de matriculaciones de vehículos eléctricos".

Figura 5. Gráfica "Predicción de matriculaciones de vehículos electricos".

5. Conclusiones del ejercicio

Como conclusión del ejercicio, podremos observar gracias a las técnicas de análisis empleadas como el vehículo eléctrico está penetrando cada vez a mayor velocidad en el parque móvil español aunque aún se encuentre a una distancia grande de otras alternativas como el Diésel o la Gasolina, por ahora liderado por el fabricante Tesla. Veremos en los próximos años si el ritmo crece al nivel necesario para alcanzar los objetivos de sostenibilidad fijados y si Tesla sigue siendo líder a pesar de la fuerte entrada de competidores asiáticos.

6. ¿Quieres realizar el ejercicio?

Si quieres conocer más sobre el Vehículo Eléctrico y poner a prueba tus capacidades analíticas, accede a este repositorio de código donde podrás desarrollar este ejercicio paso a paso.

Además, recuerda que tienes a tu disposición más ejercicios en el apartado sección de “Visualizaciones paso a paso”.


Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato.Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

En la era digital, los datos se han convertido en una herramienta invaluable en casi todos los ámbitos de la sociedad, y el mundo del deporte no es una excepción. La disponibilidad de datos relacionados con este campo puede tener un impacto positivo en la promoción de la salud y el bienestar, así como en la mejora del rendimiento físico tanto de los deportistas como de los ciudadanos en general. Además, sus beneficios también quedan patentes en el ámbito económico, ya que estos datos pueden servir para dar a conocer la oferta deportiva o generar nuevos servicios, entre otras cuestiones.

A continuación, te mostramos tres ejemplos de su impacto.

Promoción de un estilo de vida activo y saludable

La disponibilidad de información pública puede inspirar a los ciudadanos a participar en actividades físicas y deportivas, ya que, por un lado, proporciona ejemplos de sus ventajas para la salud, y por otro, facilita el acceso a oportunidades que se adapten a sus preferencias y necesidades individuales.

Un ejemplo de las posibilidades de los datos abiertos en este campo lo encontramos en el proyecto OpenActive. Se trata de una iniciativa lanzada en 2016 por el Open Data Institute (ODI) junto a Sport England, organismo público dirigido a impulsar la actividad física de todos los habitantes de Inglaterra. OpenActive permite a los proveedores de actividades deportivas publicar datos abiertos normalizados, en base a un estándar desarrollado por el ODI para garantizar su calidad, interoperabilidad y fiabilidad. Estos datos han permitido desarrollar herramientas para facilitar la búsqueda y reserva de actividades, ayudando así a luchar contra la inactividad física de los ciudadanos. De acuerdo con una evaluación de impacto externa, este proyecto podría haber ayudado a evitar hasta 110 muertes prematuras, ahorrar hasta 3 millones de libras en costes sanitarios y generar un aumento de hasta 20 millones de libras en productividad al año. Además, ha supuesto un gran impacto económico para los operadores que participan compartiendo sus datos al incrementar sus clientes y con ello sus beneficios.

Optimización del trabajo físico

Los datos proporcionan a los equipos, entrenadores y deportistas acceso a una gran cantidad de información sobre las competiciones y su desempeño, permitiéndoles realizar un análisis detallado y encontrar formas de mejorar el rendimiento. Esto incluye datos sobre estadísticas de juego, salud, etc.

En este sentido, la Agencia Nacional Francesa del Deporte, junto con el Instituto Nacional del Deporte, la Experiencia y el Rendimiento (INSEP) y la Dirección General de Deportes, han desarrollado Sport Data Hub - FFS. El proyecto nació en 2020 con la idea de impulsar el rendimiento individual y colectivo del deporte francés de cara a los Juegos Olímpicos de País 2024. Consiste en la creación de una herramienta colaborativa para todos los implicados en el movimiento deportivo (federaciones, atletas, entrenadores, equipos técnicos, instituciones e investigadores) donde compartir datos que permita realizar análisis comparativos agregados a nivel nacional e internacional.

Investigaciones para conocer el impacto de los datos en areas como la salud o la economía

Los datos relacionados con la actividad física también pueden utilizarse en la investigación científica para analizar los efectos del ejercicio en la salud y ayudar a prevenir lesiones o enfermedades. Asimismo, nos pueden ayudar a conocer el impacto económico de las actividades deportivas.

Como ejemplo, la Comisión europea lanzó en 2021 el informe Mapping of sport statistics and data in the EU, con datos relativos al impacto económico y social del deporte, tanto a nivel de la Unión Europea como de los países miembros, entre 2012 y 2021. El estudio identifica fuentes de datos disponibles y recopila datos cuantitativos y cualitativos. Estos datos se utilizan para elaborar una serie de indicadores del impacto del deporte en la economía y la sociedad, incluyendo una sección entera centrada en la salud.

Este tipo de estudios puede servir a los organismos públicos para elaborar políticas de impulso de estas actividades y que doten a la ciudadanía de servicios y recursos relacionados con el deporte y adaptados sus necesidades concretas. Una medida que podría ayudar a prevenir enfermedades con el consiguiente ahorro en gastos sanitarios.

¿Dónde localizar datos abiertos relacionados con el deporte?

Para poder llevar a cabo estos proyectos, es necesario contar con fuentes de datos fiables. En datos.gob.es se pueden encontrar diversos conjuntos de datos sobre la materia. La mayoría de ellos han sido publicados por administraciones locales y hacen referencia a instalaciones y equipamientos deportivos, así como a eventos de esta naturaleza.

Dentro del Catálogo Nacional, también destaca DEPORTEData, una base de datos del Ministerio de Educación, Formación Profesional y Deportes para el almacenamiento y difusión de resultados estadísticos del ámbito deportivo. A través de su web ofrecen magnitudes estructuradas en dos grandes bloques:

  • Estimaciones de carácter transversal sobre el empleo y empresas, el gasto realizado por los hogares y por la administración pública, la enseñanza, el comercio exterior y el turismo, todas ellas vinculadas al deporte.
  • Información de carácter específico del sector, entre la que se incluyen indicadores relativos al deporte federado, la formación de entrenadores, el control del dopaje, los hábitos deportivos, las instalaciones y espacios, así como los campeonatos universitarios y en edad escolar.

A nivel de Europa, podemos visitar el Portal europeo de datos abiertos (data.europa.eu), con más de 40.000 conjuntos de datos sobre deporte, o Eurostat. Y si queremos profundizar en el comportamiento de la ciudadanía, podemos acudir al Eurobarometro sobre deporte y actividad física, cuyos datos también se encuentran en data.europa.eu. De manera similar, a nivel mundial, la Organización Mundial de la Salud ofrece conjuntos de datos sobre los efectos de la falta de actividad física.

En conclusión, es necesario promover la apertura de datos de calidad, actualizados y fiables sobre deporte. Una información con un gran impacto no solo para la sociedad, sino también para la economía, y que puede ayudarnos a mejorar la forma en que participamos, competimos y disfrutamos del deporte.

calendar icon
Noticia

Entre el 2 de abril y el 16 de mayo se podrán presentar solicitudes en la sede electrónica del Ministerio para la Transformación Digital y de la Función Pública, para concurrir a la convocatoria de ayudas para la transformación digital de sectores productivos estratégicos. La Orden TDF/1461/2023, del 29 de diciembre, modificada por la Orden TDF/294/2024, regula ayudas por un total de 150 millones de euros para la creación de demostradores y casos de uso, como parte de una iniciativa más general de espacios de datos sectoriales, promovida por la Secretaría de Estado de Digitalización e Inteligencia Artificial y enmarcada en el Plan de Recuperación, Transformación y Resiliencia (PRTR). El objetivo es financiar el desarrollo de espacios de datos y el fomento de la innovación disruptiva en sectores estratégicos de la economía, acorde con las líneas estratégicas recogidas en la Agenda España Digital 2026.

Líneas, sectores y beneficiarios

La convocatoria actual incluye líneas de financiación para proyectos de desarrollo experimental en dos áreas de actuación complementarias: la creación de centros demostradores (desarrollo de plataformas tecnológicas de espacios de datos); y el fomento de casos de uso concretos de dichos espacios. Esta convocatoria se dirige a todos los sectores salvo al de turismo ya que este cuenta con una convocatoria propia. Podrán obtener la condición de beneficiarios las entidades únicas con personalidad jurídica propia, domicilio fi­scal en la Unión Europea, y establecimiento o sucursal ubicado en España. En el caso de la línea destinada a centros demostradores deberán además tener carácter asociativo o representativo de las cadenas de valor de los sectores productivos en ámbitos territoriales, o con dominios científicos o tecnológicos.

Infografías-resumen

Las siguientes infografías muestra la información clave sobre esta convocatoria de ayudas:

Infografía "Todo lo que necesitas saber: Programa Espacio de Datos Sectoriales"Infografía "Explorando el objetivo: Programa Espacio de Datos Sectoriales"

 

¿Quieres más información?

calendar icon
Blog

Los datos abiertos ofrecen información de interés sobre el estado y evolución de diferentes sectores, entre ellos, el empleo. Los datos de empleo suelen incluir estadísticas sobre la población activa e información sobre los empleados, así como datos económicos, demográficos o relacionados con prestaciones, entrevistas, salarios, vacantes, etc.  

Gracias a esta información podemos tener una visión clara de la salud económica de un país y del bienestar de sus ciudadanos, fomentando la toma de decisiones informadas. Además, también pueden servir de base para la creación de soluciones innovadoras que ayuden en diversas tareas.  

En este artículo repasaremos algunas fuentes de las que obtener datos abiertos de calidad de empleo, así como ejemplos de uso para mostrar los potenciales beneficios de su reutilización. 

¿Dónde localizar datos de empleo? 

En datos.gob.es hay disponible una gran cantidad de conjuntos de datos sobre empleo, destacando como publicador a nivel nacional el Instituto Nacional de Estadística (INE). Gracias a los datos del INE podemos conocer los ocupados por sector de actividad, tipos de estudios o jornada, así como los motivos para tener jornada parcial. Los datos proporcionados por esta entidad también nos permiten conocer la situación laboral de las personas con discapacidad o por sexo.  

Otras fuentes de datos donde localizar información de interés es el Servicio Público de Empleo Estatal (sepe.es), donde podemos encontrar datos estadísticos sobre demandantes de empleo, puestos de trabajo y colocaciones, desde mayo de 2005 hasta la actualidad. A ello hay que sumar los organismos autonómicos, muchos de los cuales han puesto en marcha su propio portal de datos abiertos de empleo. Es el caso de la Junta de Andalucía

Si estamos interesados en realizar una comparación entre países, también podemos acudir a los datos de la OCDE, Eurostat o el Banco Mundial

Todos estos datos pueden ser de gran interés para: 

  • Los responsables políticos, para comprender mejor la dinámica del mercado laboral y reaccionar ante ella. 
  • Los empleadores, para optimizar sus actividades de contratación. 
  • Los demandantes de empleo, para tomar mejores decisiones profesionales. 
  • Los centros de educación y formación, para adaptar los planes de estudios a las necesidades del mercado laboral. 

Casos de uso de datos abiertos en el sector empleo 

Tan relevante es contar con fuentes de datos abiertos de empleo como saber interpretar la información que ofrecen sobre el sector. Es aquí donde entran los reutilizadores que aprovechan esta materia prima para crear productos de datos que permitan dar respuesta a distintas necesidades. Veamos algunos ejemplos: 

  • Toma de decisiones e implantación de políticas activas. Las políticas activas de empleo son herramientas que los gobiernos utilizan para intervenir directamente en el mercado laboral, a través de capacitación, orientación, incentivos a la contratación, etc. Para ello, necesitan conocer las tendencias y necesidades del mercado. Esto ha llevado a numerosos organismos públicos a poner en marcha observatorios, como el del SEPE o el Principado de Asturias. También encontramos observatorios específicos por áreas como el de Igualdad y Empleo. A nivel europeo, destaca la propuesta de Eurostat:  establecer requisitos para crear un sistema paneuropeo de elaboración de estadísticas oficiales y análisis políticos específicos usando para ello datos abiertos relativos a ofertas de empleo online. Este proyecto se ha llevado a cabo utilizando la plataforma BDTI. Pero este campo no está limitado al sector público, sino que otros actores también pueden presentar sus propuestas. Es el caso de Iseak, entidad sin ánimo de lucro que impulsa un centro de investigación y transferencia en economía. Entre otras cuestiones, en Iseak buscan dar respuesta a preguntas como ¿provoca la subida del salario mínimo una destrucción del empleo? o ¿por qué existe una brecha de género en el mercado? 
  • Rendición de cuentas. Toda esta información no es solo útil para los organismos públicos, sino también para la ciudadanía, a la hora de valorar si las políticas de empleo de sus gobernantes están funcionando. Por ello, muchos gobiernos ponen estos datos a disposición de los ciudadanos a través de visualizaciones sencillas de comprender, como Castilla y León. Asimismo, en este campo tiene un papel protagonista el periodismo de datos, con piezas que acercan la información al gran público como estos ejemplos, relativos a los salarios o el nivel de desempleo por zonas. Si quieres saber cómo realizar este tipo de visualizaciones, te los explicamos en este ejercicio paso a paso que caracteriza la demanda de empleo y contratación registrada en España.
  • Impulso de oportunidades laborales. Para acercar los datos de interés a los ciudadanos que se encuentran en búsqueda activa o de nuevas oportunidades laborales, existen herramientas, como esta app de convocatorias de empleo público o de ayudas, basadas en datos abiertos. También hay ayuntamientos que crean soluciones para impulsar el empleo y la economía en su localidad como la  APP Paterna Empléate. Estas apps suponen una forma de consumo de datos mucho más sencilla y amigable que los tradicionales portales de búsqueda de empleo. Un paso más allá ha ido la Diputación de Barcelona. Con su Buscador de Información y Documentación Oficial (CIDO).Esta herramienta utiliza IA aplicada a los datos abiertos para, entre otras finalidades, ofrecer servicios personalizados para individuos, empresas y sectores rurales, así como acceso a convocatorias de empleo. La información que ofrece procede tanto de tablones de anuncios, como del Perfil del contratante y diversas páginas webs municipales. 
  • Desarrollo de soluciones avanzadas. Los datos de empleo también se pueden utilizar para potenciar una amplia variedad de casos de uso de aprendizaje automático. Un ejemplo es esta plataforma estadunidense para el análisis financiero que proporciona datos e información a inversores y empresas. Para ello utiliza datos de tasas de desempleo de EE.UU, combinado con otros como códigos postales, datos demográficos o datos meteorológicos.

En definitiva, gracias a este tipo de datos nos solo podemos conocer más sobre la situación laboral de nuestro entorno, sino también alimentar soluciones que ayuden a impulsar la economía o que faciliten el acceso a oportunidades laborales. Se trata, por tanto, de una categoría de datos cuya publicación deben impulsar organismos públicos de todos los niveles. 

calendar icon
Noticia

El año llega a su fin y es un buen momento para repasar algunas de las cuestiones que ha marcado el ecosistema de los datos abiertos y la compartición de datos en España, una comunidad que sigue creciendo y construyendo alianzas para el desarrollo de tecnologías innovadoras. Una sinergia que sienta las bases para afrontar un futuro interconectado, digital y lleno de posibilidades.  

A pocos días del 2024, realizamos un balance de noticias, eventos y formaciones de interés que han marcado el año que dejamos atrás. En esta recopilación repasamos algunos avances regulatorios, nuevos portales y proyectos impulsados por el sector público, así como diversos recursos didácticos y documentación de referencia que nos ha dejado 2023. 

Regulación jurídica para el desarrollo de entornos colaborativos 

Durante este año, en datos.gob.es nos hemos hecho eco de noticias relevantes en el sector de los datos abiertos y la compartición de datos. Todas ellas han contribuido a consolidar el contexto adecuado para la interoperabilidad y el impulso del valor de los datos en nuestra sociedad. Realizamos a continuación un repaso de los anuncios más relevantes: 

  • A principios de año la Comisión Europea publicó una primera lista de conjuntos de datos de alto valor que, por la información que atesoran, son de gran valor para la economía, el medio ambiente y la sociedad. Por este motivo, los estados miembros deberán ponerlos a disposición de la ciudadanía antes de verano de 2024. En esta primera lista de categorías se incluye: datos geoespaciales, de observación de la tierra y medioambiente, meteorológicos, estadísticos, de empresas y de movilidad. Por otro lado, a finales de 2023, el mismo organismo hizo una propuesta para ampliar la lista de categorías de conjuntos de datos a considerar de alto valor, añadiendo otras siete propuestas de categorías que se podrían incluir a futuro: pérdida climática, energía, financiero, administración pública y gobierno, salud, justicia y lenguaje. 

  • En el primer trimestre del año, se modificó la Ley 37/2007 sobre reutilización de la información del sector público a la luz de la última Directiva europea de datos abiertos. Ahora, las administraciones públicas deberán cumplir, entre otros, dos requisitos esenciales: incidir en la publicación de datos de alto valor mediante APIs y designar una unidad responsable de información que vele por la correcta apertura de los datos. Estas medidas pretenden estar alineadas con las exigencias de competitividad e innovación que suscitan tecnologías como la IA y con el rol clave que juegan los datos a la hora de configurar espacios de datos. 

  • La publicación de las especificaciones UNE sobre datos ha sido otro hito en materia de estandarización que ha marcado 2023. El volumen de datos no deja de crecer y son necesarios mecanismos que aseguren su adecuado uso y explotación. Para ello, existen: 

  • Otro avance reseñable ha sido la aprobación de la redacción consolidada del Reglamento europeo de Datos (Data Act) que busca proporcionar normas armonizadas para un acceso justo a los datos y su utilización. La estructura jurídica que impulsará la economía del dato en la UE ya es una realidad. El Data Act y el Data Governance Act también aprobado en 2023 contribuirán al desarrollo de un Mercado Único Digital Europeo. 

  • En octubre de 2023 la futura Ley de Europa Interoperable (Interoperable Europe Act) entró en la etapa legislativa final tras obtener el visto bueno de los estados miembros. El objetivo de Interoperable Europe Act es reforzar la interoperabilidad entre las administraciones del sector público en la UE y crear servicios públicos digitales centrados en los ciudadanos y las empresas. 

Avances en el ecosistema de datos abiertos en España 

En este último año han sido muchos los organismos públicos que han apostado por la apertura de sus datos en formatos adecuados para la reutilización, muchos de ellos centrados en temáticas concretas, como la meteorología. Algunos ejemplos son: 

Por otro lado, muchas instituciones que ya publicaban datos abiertos han ido ampliando durante todo el año su catálogo de conjuntos de datos. Es el caso del Instituto Canario de Estadística (ISTAC) que ha implantado diferentes mejoras como la ampliación de su catálogo de datos abiertos semánticos para conseguir una mejor compartición de datos y metadatos. 

En esta línea, también se han firmado más convenios para fomentar la apertura y compartición de datos, así como la adquisición de capacidades relacionadas. Por ejemplo, con universidades: 

Soluciones disruptivas que usan datos abiertos  

La combinación ganadora entre datos abiertos y tecnología ha impulsado el desarrollo de múltiples iniciativas de interés fruto del esfuerzo de las administraciones públicas, como, por ejemplo: 

Durante 2023, las Administraciones Públicas no solo han puesto en marcha proyectos tecnológicos, sino que también han impulsado el emprendimiento alrededor de los datos abiertos con actividades como el concurso de Datos Abiertos de Castilla y León. Un evento en el que se premiaron proyectos desarrollados con datos abiertos como productos o servicios, ideas, trabajos de periodismo de datos y recursos didácticos. 

Formaciones y eventos para estar al día de las tendencias 

Los materiales didácticos sobre datos abiertos y tecnologías relacionadas no ha hecho más que crecer en este 2023. Destacamos algunos recursos gratuitos y virtuales que están disponibles: 

Además, son muchas las actividades que se han llevado a cabo en 2023 para impulsar la cultura del dato. No obstante, si te perdiste alguna, puedes volver a ver las grabaciones online de las siguientes:  

  • En marzo se retrasmitió la Conferencia Europea sobre Datos y Semántica, en la que se presentaron tendencias sobre datos multilingües. 

  • En septiembre se llevó a cabo el II Encuentro Nacional de Datos Abiertos bajo el lema “Llamada urgente a la acción por el medio ambiente”.  El evento continuó la tradición iniciada en 2022 en Barcelona, consolidándose como uno de los principales encuentros en España en el ámbito de la reutilización de datos del sector público y presentando materiales formativos de interés para la comunidad. 

  • En octubre se organizó en Madrid la conferencia sobre interoperabilidad de referencia a nivel europeo: SEMIC 2023, Europa interoperable en la época de la IA.  

Informes y otros documentos de referencia publicados en 2023 

Una vez hemos repasado las noticias, iniciativas, formaciones y eventos, queremos destacar un compendio de conocimiento extenso como es el conjunto de informes en profundidad que se han publicado en 2023 sobre el sector de los datos abiertos y las tecnologías innovadoras. Algunos reseñables son: 

  • La Asociación Multisectorial de la Información (ASEDIE) presentó en abril de 2023 su 11ª edición del Informe del Sector Infomediario en el que repasa la salud de las empresas que trabajan con datos, un sector con potencial de crecimiento. Aquí puedes leer las principales conclusiones

  • A partir de octubre de 2023 España copresidió el Comité de Dirección de la Alianza para el Gobierno Abierto (OGP), una labor que ha implicado impulsar las iniciativas de la OGP y liderar las áreas temáticas de gobierno abierto. Esta organización presentó en 2023 su informe global de la Alianza para el Gobierno Abierto, un documento que pone en valor buenas prácticas como la publicación de grandes volúmenes de datos abiertos por parte de los países europeos. Además, también identifica distintas áreas de mejora como la publicación de más datos de alto valor (HDV) en formatos reutilizables e interoperables.  

  • La Organización por la Economía Cooperativa y el Desarrollo (OECD) ha publicado en noviembre de 2023 un informe sobre principios de la administración pública en el que destacó, entre otros, la digitalización como herramienta para tomar decisiones basadas en datos y aplicar procesos eficaces y eficientes. 

  • Durante este año, la Comisión Europea publicó un informe sobre la integración de los espacios de datos en la estrategia europea de datos. Firmado por expertos y expertas en la materia, este documento establece las bases para implementar los dataspaces europeos. 

  • Por otro lado, el grupo de trabajo de datos abiertos de la Red de Entidades Locales por la Transparencia y la Participación Ciudadana y la Federación Española de Municipios y Provincias presentaron un listado de los 80 conjuntos de datos a publicar para seguir completando las guías publicadas en años anteriores. Lo puedes consultar aquí. 

Estos son solo algunos ejemplos de lo que ha dado de sí el ecosistema de datos abiertos en el último año. Si quieres compartir con datos.gob.es alguna otra novedad, déjanos un comentario o mándanos un email a dinamizacion@datos.gob.es 

calendar icon
Blog

En estos momentos nos encontramos en medio de una carrera sin precedentes por dominar las innovaciones en Inteligencia Artificial. Durante el último año, la estrella ha sido la Inteligencia Artificial Generativa (GenAI), es decir, aquella capaz de generar contenido original y creativo como imágenes, texto o música. Pero los avances no dejan de sucederse, y últimamente comienzan a llegar noticias en las que se sugiere que la utopía de la Inteligencia Artificial General (AGI) podría no estar tan lejos como pensábamos. Estamos hablando de máquinas capaces de comprender, aprender y realizar tareas intelectuales con resultados similares al cerebro humano. 

Sea esto cierto o simplemente una predicción muy optimista, consecuencia de los asombrosos avances conseguido en un espacio muy corto de tiempo, lo cierto es que la Inteligencia Artificial parece ya capaz de revolucionar prácticamente todas las facetas de nuestra sociedad a partir de la cada vez mayor cantidad de datos que se utilizan para su entrenamiento

Y es que si, como argumentaba Andrew Ng ya en 2017, la inteligencia artificial es la nueva electricidad, los datos abiertos serían el combustible que alimenta su motor, al menos en un buen número de aplicaciones cuya fuente principal y más valiosa es la información pública que se encuentra accesible para ser reutilizada. En este artículo vamos a repasar un campo en el que previsiblemente veremos grandes avances en los próximos años gracias a la combinación de inteligencia artificial y datos abiertos: la creación artística. 

Creación Generativa basada en Datos Culturales Abiertos 

La capacidad de la inteligencia artificial para generar nuevos contenidos podría llevarnos a una nueva revolución en la creación artística, impulsada por el acceso a datos culturales abiertos y a una nueva generación de artistas capaces de aprovechar estos avances para crear nuevas formas de pintura, música o literatura, trascendiendo barreras culturales y temporales. 

Música 

El mundo de la música, con su diversidad de estilos y tradiciones, representa un campo lleno de posibilidades para la aplicación de la inteligencia artificial generativa. Los conjuntos de datos abiertos en este ámbito incluyen grabaciones de música folclórica, clásica, moderna y experimental de todo el mundo y de todas las épocas, partituras digitalizadas, e incluso información sobre teorías musicales documentadas. Desde el archi-conocido MusicBrainz, la enciclopedia de la música abierta, hasta conjuntos de datos que abren los propios dominadores de la industria del streaming como Spotify o proyectos como Open Music Europe, son algunos ejemplos de recursos que están en la base del progreso en esta área. A partir del análisis de todos estos datos, los modelos de inteligencia artificial pueden identificar patrones y estilos únicos de diferentes culturas y épocas, fusionándolos para crear composiciones musicales inéditas con herramientas y modelos como MuseNet de OpenAI o Music LM de Google

Literatura y pintura 

En el ámbito de la literatura, la Inteligencia artificial también tiene potencial para hacer más productiva no solo la creación de contenidos en internet, sino para producir formas más elaboradas y complejas de contar historias. El acceso a bibliotecas digitales que albergan obras literarias desde la antigüedad hasta el momento actual hará posible explorar y experimentar con estilos literarios, temas y arquetipos de narración de diversas culturas a lo largo de la historia, con el fin de crear nuevas obras en colaboración con la propia creatividad humana. Incluso se podrá generar una literatura de carácter más personalizado a los gustos de grupos de lectores más minoritarios. La disponibilidad de datos abiertos como el Proyecto Guttemberg con más de 70.000 libros o los catálogos digitales abiertos de museos e instituciones que han publicado manuscritos, periódicos y otros recursos escritos producidos por la humanidad, son un recurso de gran valor para alimentar el aprendizaje de la inteligencia artificial.  

Los recursos de la Digital Public Library of America (DPLA) en Estados Unidos o de Europeana en la Unión Europea son sólo algunos ejemplos. Estos catálogos no sólo incluyen texto escrito, sino que incluyen también vastas colecciones de obras de arte visuales, digitalizadas a partir de las colecciones de museos e instituciones, que en muchos casos ni tan siquiera pueden admirarse porque las organizaciones que las conservan no disponen de espacio suficiente para exponerlas al público. Los algoritmos de inteligencia artificial, al analizar estas obras, descubren patrones y aprenden sobre técnicas, estilos y temas artísticos de diferentes culturas y períodos históricos. Esto posibilita que herramientas como DALL-E2 o Midjourney puedan crear obras visuales a partir de unas sencillas instrucciones de texto con estética de pintura renacentista, impresionista o una mezcla de ambas. 

Sin embargo, estas fascinantes posibilidades están acompañadas de una controversia aún no resuelta acerca de los derechos de autor que está siendo debatida en los ámbitos académicos, legales y jurídicos y que plantea nuevos desafíos en la definición de autoría y propiedad intelectual. Por una parte, está la cuestión sobre la propiedad de los derechos sobre las creaciones producidas por inteligencia artificial. Y por otra parte encontramos el uso de conjuntos de datos que contienen obras sujetas a derechos de propiedad intelectual y que se han utilizado en el entrenamiento de los modelos sin el consentimiento de los autores. En ambas cuestiones existen numerosas disputas judiciales en todo el mundo y solicitudes de retirada explícita de contenido de los principales conjuntos de datos de entrenamiento.

En definitiva, nos encontramos ante un campo donde el avance de la inteligencia artificial parece imparable, pero habrá que tener muy presente no solo las oportunidades, sino también los riesgos que supone.  


Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

IATE, acrónimo en inglés de Interactive Terminology for Europe (Terminología Interactiva para Europa), es una base de datos dinámica diseñada para respaldar la redacción multilingüe de textos de la Unión Europea. Su objetivo es proporcionar datos relevantes, confiables y de fácil acceso con un valor añadido distintivo en comparación con otras fuentes de información léxica como pueden ser archivos electrónicos, memorias de traducción o internet. 

Esta herramienta es de interés para las instituciones de la UE que la utilizan desde 2004 y para cualquier persona, como profesionales de la lengua o del mundo académico, administraciones públicas, empresas o público en general Este proyecto, puesto en marcha en 1999 por el Centro de Traducción, está disponible para cualquier organización o persona que necesite redactar, traducir o interpretar un texto sobre la UE.  

Origen y usabilidad de la plataforma 

IATE se creó en 2004 mediante la fusión de diferentes bases de datos terminológicas de la UE. Para su creación se importaron a IATE las bases de datos originales de Eurodicautom, TIS, Euterpe, Euroterms y CDCTERM. Este proceso originó una gran cantidad de entradas duplicadas, lo que tiene como consecuencia que muchos conceptos estén cubiertos por varias entradas en lugar de una sola. Para solucionar este problema, se constituyó un grupo de trabajo de limpieza que desde 2015 se encarga de organizar análisis e iniciativas de limpieza de datos para consolidar entradas duplicadas en una sola entrada. Esto explica por qué las estadísticas sobre el número de entradas y términos muestran una tendencia a la baja, ya que se eliminan y actualizan más contenidos de los que se crean. 

Además de poder realizar consultas, existe la posibilidad de descargar sus ficheros de datos junto con la herramienta de extracción IATExtract que permite generar exportaciones filtradas.  

Esta base terminológica interinstitucional fue inicialmente diseñada para gestionar y normalizar la terminología de las agencias de la UE. No obstante, posteriormente, también se empezó a utilizar como herramienta de apoyo en la redacción multilingüe de los textos de la UE, hasta llegar a convertirse en la actualidad en un sistema complejo y dinámico de gestión terminológica. Aunque su principal objetivo es facilitar la labor de los traductores que trabajan para la UE, también es de gran utilidadl para el público en general. .  

IATE lleva a disposición del público desde 2007, y reúne los recursos terminológicos de todos los servicios de traducción de la UE. El Centro de Traducción gestiona los aspectos técnicos del proyecto en nombre de los socios que participan en él: el Parlamento Europeo (EP), el Consejo de la Unión Europea (Consilium), la Comisión Europea (COM), el Tribunal de Justicia (CJUE), el Banco Central Europeo (ECB), el Tribunal de Cuentas Europeo (ECA), el Comité Económico y Social Europeo (EESC/CoR), el Comité Europeo de las Regiones (EESC/CoR), el Banco Europeo de Inversiones (EIB) y el Centro de Traducción de los Órganos de la Unión Europea (CdT). 

La estructura de datos de IATE se basa en un enfoque orientado a conceptos, lo que significa que cada entrada corresponde a un concepto (los términos se agrupan por su significado), y cada concepto idealmente debería estar cubierto por una sola entrada. Cada entrada de IATE se divide en tres niveles: 

  • Nivel independiente del idioma (LIL) 

  • Nivel de idioma (LL) 

  • Nivel de término (TL) Para obtener más información, consulte la Sección 3 ('Visión general de la estructura') a continuación. 

Fuente de referencia para profesionales y útil para el público en general  

En IATE se reflejan las necesidades de los traductores de la Unión Europea, por lo que puede cubrirse cualquier ámbito que haya aparecido o pueda aparecer en los textos de las publicaciones del entorno de la UE, sus agencias y organismos. La crisis financiera, el medio ambiente, la pesca y la migración son ámbitos en los que se ha trabajado de forma intensa durante los últimos años. Para conseguir el mejor resultado, IATE utiliza el tesauro EuroVoc como sistema de clasificación de campos temáticos. 

Como ya hemos señalado, esta base de datos puede ser utilizada por cualquier persona que esté buscando el término adecuado sobre la Unión Europea. IATE permite explorar en campos diferentes al del término consultado y filtrar los dominios en todos los ámbitos y descriptores de EuroVoc. Las tecnologías utilizadas hacen que los resultados obtenidos tengan una gran precisión, mostrándose como una lista enriquecida que incluye además una clara distinción entre las coincidencias exactas y difusas del término.  

La versión pública de IATE incluye las lenguas oficiales de la Unión Europea, que se definen en el Reglamento n.º 1 de 1958. . Además, se efectúa una alimentación sistemática a través de proyectos anticipativos: si se sabe que va a tratarse en textos de la UE un tema determinado, se crean o mejoran las fichas que guardan relación con ese tema para que, cuando lleguen los textos, los traductores dispongan ya en IATE de la terminología precisada. 

Cómo utilizar IATE 

Para realizar una búsqueda en IATE simplemente se debe escribir una palabra clave o parte del nombre de una colección. Se pueden definir más filtros para su búsqueda, como institución, tipo o fecha de creación. Una vez que se ha realizado la búsqueda, se selecciona una colección y al menos una lengua de visualización. 

Para descargar subconjuntos de datos de IATE es necesario estar registrado, una opción totalmente gratuita que permite además de la descarga, almacenar algunas preferencias de usuario. La descarga es también un proceso sencillo y se puede realizar en formato csv o tbx.  

El archivo de descarga de IATE, a cuya información se puede también acceder de otras formas, contiene los siguientes campos:  

  • Nivel independiente de la lengua:  

  • Número de ficha: el identificador único de cada concepto. 

  • Campo temático: los conceptos están vinculados a ámbitos de conocimiento en los que se utilizan. La estructura conceptual se organiza en torno a veintiún campos temáticos con diversos subcampos. Hay que señalar que los conceptos pueden estar vinculados a más de un campo temático.  

  • Nivel de la lengua:  

  • Nivel del término 

  • Término: concepto de la ficha.  

  • Tipo de término. Pueden ser: términos, abreviatura, frase, fórmula o fórmula corta. 

  • Código de fiabilidad. IATE utiliza cuatro códigos para indicar la fiabilidad de los términos: sin comprobar, mínima, fiable o muy fiable.  

  • Evaluación. Cuando se almacenan varios términos en una lengua, se pueden asignar evaluaciones específicas del siguiente modo: preferible, admisible, desechado, obsoleto y propuesto.  

Una base de datos terminológica en continua actualización 

La base de datos IATE es un documento en permanente crecimiento, abierto a la participación ciudadana, de forma que cualquier persona puede contribuir a su crecimiento proponiendo nuevas terminologías para añadir a fichas existentes, o para crear fichas nuevas: puede enviar su propuesta a iate@cdt.europa.eu, o bien utilizar el enlace ‘Observaciones’ que aparece en la parte inferior derecha de la ficha del término buscado. Se puede facilitar cuanta información pertinente se desee para justificar la fiabilidad del término propuesto, o plantear un nuevo término a incluir. Un terminólogo de la lengua en cuestión estudiará cada propuesta ciudadana y valorará su incorporación al IATE. 

En agosto de 2023, la IATE anunciaba la disponibilidad de la versión 2.30.0 de este sistema de datos, añadiendo nuevos campos en su plataforma y la mejora de funciones, como la exportación de archivos enriquecidos para optimizar el filtrado de datos. Como hemos visto, esta base de datos terminológica interinstitucional de la UE seguirá evolucionando de manera continua para satisfacer las necesidades de los traductores de la UE y los usuarios de IATE en general. 

Otro aspecto importante es que esta base de datos sirve para el desarrollo de herramientas de traducción asistida por ordenador (TAO), lo que contribuye a garantizar la calidad de los trabajos de traducción de los servicios de traducción de la UE. Los resultados de la labor de terminología de los traductores se almacenan en IATE y éstos, a su vez, utilizan esta base de datos para realizar búsquedas interactivas y para alimentar bases de datos terminológicas específicas para un ámbito o documento que utilizan en sus herramientas TAO. 

IATE, con más de 7 millones de términos en más de 700.000 entradas, es una referencia en el ámbito de la terminología y está considerada como la mayor base de datos terminológica multilingüe del mundo. Cada año se realizan en IATE más de 55 millones de consultas desde más de 200 países, lo que da buena cuenta de su utilidad.  

calendar icon