Blog

España, como parte de la Unión Europea, está comprometida con la implementación de las directivas europeas sobre datos abiertos y reutilización de la información del sector público. Esto incluye la adopción de iniciativas como el Reglamento de Implementación (UE) 2023/138, emitido por la Comisión Europea, que define directrices específicas para las entidades gubernamentales con respecto a la disponibilidad de conjuntos de datos de alto valor (High value datasets en inglés o HVD) . Estos datos se categorizan en temáticas previamente detalladas en discusiones anteriores: Geoespacial, Observación de la Tierra y Medio Ambiente, Meteorología, Estadística, Sociedades y Propiedades de Sociedades, y Movilidad. En este artículo nos centraremos en el último grupo mencionado.

La categoría de Movilidad engloba colecciones de datos que caen bajo el dominio de la "Redes de Transporte", como se demarca en el Anexo I de la Directiva 2007/2/CE del Parlamento Europeo y del Consejo, de 14 de marzo de 2007, por la que se establece una infraestructura de información espacial en la Comunidad Europea (INSPIRE). En concreto, esta Directiva hace referencia a que se deben poner a disposición de los usuarios los conjuntos de datos relativos a redes de carreteras, ferrocarril, transporte aéreo y vías navegables, con sus correspondientes infraestructuras, las conexiones entre redes diferentes y la red transeuropea de transporte, según la definición de la Decisión no 1692/96/CE del Parlamento Europeo y del Consejo, de 23 de julio de 1996, sobre las orientaciones comunitarias para el desarrollo de la red transeuropea de transporte.

Además, se incluyen los conjuntos de datos tal como se describe en la Directiva 2005/44/CE del Parlamento Europeo y del Consejo, de 7 de septiembre de 2005, relativa a los servicios de información fluvial (SIF) armonizados en las vías navegables interiores de la Comunidad. Esta Directiva establece un marco armonizado para la creación de una red transeuropea de información fluvial (RIS, por sus siglas en inglés). El objetivo principal de la Directiva es mejorar el tráfico y el transporte fluvial y se aplican a los canales, ríos, lagos y puertos capaces de albergar buques de entre 1.000 y 1.500 toneladas. Estos conjuntos de datos incluyen:

Conjunto de datos Conjuntos de datos sobre vías navegables interiores
Datos estáticos
  • Características de los canales navegables
  • Obstrucciones de larga duración en el canal navegable y fiabilidad
  • Gastos de infraestructura de las vías navegables
  • Otras limitaciones físicas en las vías navegables
  • Horarios programados de esclusas y puentes
  • Localización y características de puertos y puntos de transbordo
  • Lista de ayudas a la navegación y señales de tráfico
  • Normas y recomendaciones de navegación
Datos dinámicos
  • Batimetría de los canales de navegación
  • Obstrucciones temporales en el canal
  • Niveles de agua actuales y futuros en los indicadores
  • Estado de los ríos, canales, esclusas y puentes
  • Restricciones causadas por inundaciones y hielo
  • Cambios a corto plazo de los horarios de esclusas y puentes
  • Cambios a corto plazo de las ayudas a la navegación
Cartas electrónicas y de navegación interior (ENC Fluvial según la norma SIVCE Fluvial)
  • Ejes de vías navegables con indicación de los kilómetros
  • Enlaces a los ficheros XML externos con tiempos de funcionamiento de estructuras restrictivas
  • Localización de puertos y puntos de transbordo
  • Datos de referencia para los indicadores del nivel del agua pertinentes para la navegación
  • Margen de la vía navegable al nivel medio de agua
  • Construcción litoral
  • Contornos de esclusas y presas
  • Límites de la vía navegable/canal de navegación
  • Peligros aislados en la vía navegable/en el canal de navegación bajo y sobre el agua
  • Medios auxiliares oficiales (por ejemplo, boyas, balizas, luces, carteles)

Figura 1: Tabla con los conjuntos de datos de alto valor relativos a la Directiva 2005/44/CE para la creación de una red transeuropea de información fluvial.

Para que todos podamos aprovechar al máximo la información disponible, el Reglamento define algunas reglas básicas sobre cómo se comparten estos datos:

  • Uso libre y fácil. Los datos tienen que estar listos para usarse y compartirse con todos y para cualquier fin reconociendo y citando la fuente de los datos, tal como prescribe la licencia tipo Creative Commons BY 4.0.
  • Fácil de leer y usar. Se presentarán de una manera que tanto las personas como las computadoras puedan entenderlos fácilmente y estará todo explicado en público.
  • Acceso directo y sencillo. Habrá maneras especiales (llamadas APIs) que permiten a los programas acceder a los datos automáticamente. Además, el usuario podrá alternativamente descargar mucha información de una vez.
  • Siempre al día. Es importante que los datos estén actualizados, así que existirá el acceso a la versión más reciente. Pero si el usuario necesita acceder a los datos previos, también se podrá ver las versiones anteriores.
  • Detallados y precisos. Los datos se compartirán con tanto detalle como sea posible, hasta un nivel muy fino de precisión, de manera que se cubra todo el territorio al combinarse.
  • Información sobre la información. Habrá "información sobre la información" (metadatos) que contará todo sobre los datos. Los elementos de metadatos contendrán como mínimo los recogidos en el anexo del Reglamento (CE) nº 1205/2008 de la Comisión, de 3 de diciembre de 2008.
  • Entendible y ordenado: Se explicará bien cómo están organizados los datos y qué significa todo, de manera que sea fácil de entender para todos (estructura y semántica).
  • Lenguaje común. Los datos usarán vocabularios, listas controladas y categorías que sean reconocidos y aceptados a nivel europeo o mundial.

¿En España quién es el responsable de la creacion y mantenimiento de los datos de movilidad?

En España, la responsabilidad de la creación y mantenimiento de los datos de movilidad recae generalmente en distintas entidades gubernamentales, dependiendo del tipo de movilidad y del ámbito territorial:

  • Nivel nacional. El Ministerio de Transportes y Movilidad Sostenible es el organismo principal encargado de la movilidad en cuanto a infraestructuras y transportes a nivel nacional. Este incluiría datos sobre carreteras, ferrocarriles, transporte aéreo y marítimo.
  • Nivel autonómico y local. Las comunidades autónomas y los ayuntamientos también desempeñan un papel importante en la movilidad urbana y regional. Se encargan de la movilidad urbana, el transporte público y las vías públicas, dentro de sus respectivas jurisdicciones.
  • Entidades públicas empresariales. Hay entidades como ADIF (acrónimo de Administrador de Infraestructuras Ferroviarias), AENA (acrónimo de Aeropuertos Españoles y Navegación Aérea), Puertos del Estado y otras que gestionan datos específicos relacionados con su campo de acción en el transporte ferroviario, aéreo y marítimo, respectivamente.

En España, el Ministerio de Transportes y Movilidad Sostenible, en colaboración con las comunidades autónomas, juega un rol clave en proporcionar acceso a una amplia gama de datos de movilidad. En conformidad con INSPIRE y LISIGE (la Ley 14/2010 de 5 de julio sobre las infraestructuras y los servicios de información geográfica en España, que transpone la Directiva INSPIRE), ofrece recursos como el Geoportal de la Infraestructura de Datos Espaciales de España (IDEE), donde la ciudadanía y los profesionales pueden acceder a datos y servicios geográficos, especialmente en lo referente a movilidad.

¿Cumple España con el Reglamento de los HVD de movilidad?

Para resolver esta pregunta nos tenemos que ir al el Geoportal de INSPIRE que es donde se encuentra disponible la información oficial clasificada como conjuntos de datos de alto valor en Europa. En concreto en la categoría de movilidad.

Captura del portal Inspire relativa a los datos de alto valor de movilidad

Figura 2: Captura del Geoportal Inspire.

A abril de 2024 España tiene publicado en el Geoportal de INSPIRE la siguiente información:

  • Zonas de servicio portuarias de España. Las zonas de servicio portuarias de los puertos de interés general del Estado, incluyen la información cartográfica y alfanumérica de la zona de servicio terrestre y de la zona I y II de aguas. El Sistema Portuario español de titularidad estatal está integrado por 46 puertos de interés general, gestionados por 28 Autoridades Portuarias.
  • Redes de Transporte de España. La Red de Transporte de la Información Geográfica de Referencia del Sistema Cartográfico Nacional de España, es una red tridimensional de cobertura nacional, definida y publicada en conformidad con la Directiva INSPIRE, que contempla cinco modos de transporte: red viaria, raíl, vías navegables, aéreo y cable, junto con sus respectivas conexiones intermodales y las infraestructuras asociadas a cada modo. Dicha información tiene la geometría lineal de los viales y la puntual de los portales y puntos kilométricos.
  • Red de Transporte Ferroviario de ADIF de España. Conjunto de datos geográficos de carácter público sobre la adaptación de la Tramificación Común de ADIF a la normativa INSPIRE (Redes de Transporte Anexo I).

La publicación de estos conjuntos de datos de alto valor responde positivamente a la pregunta de si España cumple con el reglamento de HVD, y supone un logro que refleja el compromiso continuo de nuestro país con la transparencia y el acceso a datos de movilidad.

El esfuerzo conjunto entre el Ministerio de Transportes, Movilidad y Agenda Urbana, el Sistema Cartográfico Nacional y las Comunidades Autónomas y las Entidades Públicas Empresariales subraya la importancia de un enfoque colaborativo para la gestión de la información de movilidad.

La disponibilidad de estos datos destaca el compromiso de España en publicar datos de alto valor y subraya la importancia de mejorar continuamente el acceso a la información para optimizar la navegación interior y los datos de movilidad.


Contenido elaborado por Mayte Toscano, Senior Consultant en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Documentación

1. Introducción

Las visualizaciones son representaciones gráficas de datos que permiten comunicar, de manera sencilla y efectiva, la información ligada a los mismos. Las posibilidades de visualización son muy amplias, desde representaciones básicas como los gráficos de líneas, de barras o métricas relevantes, hasta visualizaciones configuradas sobre cuadros de mando interactivos.

En esta sección de “Visualizaciones paso a paso” estamos presentando periódicamente ejercicios prácticos haciendo uso de datos abiertos disponibles en  datos.gob.es u otros catálogos similares. En ellos se abordan y describen de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y los análisis pertinentes para, finalmente obtener unas conclusiones a modo de resumen de dicha información.

En cada ejercicio práctico se utilizan desarrollos de código documentados y herramientas de uso gratuito. Todo el material generado está disponible para su reutilización en el repositorio de GitHub de datos.gob.es.

En este ejercicio concreto, exploraremos la actual situación de la penetración de los vehículos eléctricos en España y las perspectivas de futuro de esta tecnología disruptiva en el transporte.

Accede al repositorio del laboratorio de datos en Github.

Ejecuta el código de pre-procesamiento de datos sobre Google Colab.

En este vídeo, el autor te explica que vas a encontrar tanto en el Github como en Google Colab.

2. Contexto: ¿Por qué es importante el vehículo eléctrico?

La transición hacia una movilidad más sostenible se ha convertido en una prioridad global, situando al vehículo eléctrico (VE) en el centro de numerosas discusiones sobre el futuro del transporte. En España, esta tendencia hacia la electrificación del parque automovilístico no solo responde a un creciente interés por parte de los consumidores en tecnologías más limpias y eficientes, sino también a un marco regulatorio y de incentivos diseñado para acelerar la adopción de estos vehículos. Con una creciente oferta de modelos eléctricos disponibles en el mercado, los vehículos eléctricos representan una pieza clave en la estrategia del país para reducir las emisiones de gases de efecto invernadero, mejorar la calidad del aire en las ciudades y fomentar la innovación tecnológica en el sector automotriz.

Sin embargo, la penetración de los vehículos eléctricos en el mercado español enfrenta una serie de desafíos, desde la infraestructura de carga hasta la percepción y el conocimiento del consumidor sobre estos vehículos. La expansión de la red de carga, junto con las políticas de apoyo y los incentivos fiscales, son fundamentales para superar las barreras existentes y estimular la demanda. A medida que España avanza hacia sus objetivos de sostenibilidad y transición energética, el análisis de la evolución del mercado de vehículos eléctricos se convierte en una herramienta esencial para entender el progreso realizado y los obstáculos que aún deben superarse.

3. Objetivo

Este ejercicio se centra en mostrar al lector técnicas para el tratamiento, visualización y análisis avanzado de datos abiertos mediante Python. Adoptaremos para ello el enfoque “aprender haciendo”, de tal forma que el lector pueda comprender la utilización de estas herramientas en el contexto de la resolución de un reto real y de actualidad como es el estudio de la penetración del VE en España. Este enfoque práctico no solo mejora la comprensión de las herramientas de ciencia de datos, sino que también prepara a los lectores para aplicar estos conocimientos en la resolución de problemas reales, ofreciendo una experiencia de aprendizaje rica y directamente aplicable a sus propios proyectos.

Las preguntas a las que trataremos de dar respuesta a través de nuestro análisis son:

  1. ¿Qué marcas de vehículos lideraron el mercado en 2023?
  2. ¿Qué modelos de vehículos fueron los más vendidos en el 2023?
  3. ¿Qué cuota de mercado absorbieron los vehículos eléctricos en el 2023?
  4. ¿Qué modelos de vehículos eléctricos fueron los más vendidos en el 2023?
  5. ¿Cómo han evolucionado las matriculaciones de vehículos a lo largo del tiempo?
  6. ¿Observamos algún tipo de tendencia respecto a la matriculación de vehículos eléctricos?
  7. ¿Cómo esperamos que evolucionen las matriculaciones de vehículos eléctricos el próximo año?
  8. ¿Cuál es la reducción de emisiones de CO2 que podemos esperar gracias a las matriculaciones obtenidas durante el próximo año?

4. Recursos

Para completar el desarrollo de este ejercicio requeriremos el uso de dos categorías de recursos: Herramientas Analíticas y Conjuntos de Datos.

4.1. Conjunto de datos

Para completar este ejercicio utilizaremos un conjunto de datos provisto por la Dirección General de Tráfico (DGT) a través de su portal estadístico, también disponible desde el catálogo Nacional de Datos Abiertos (datos.gob.es). El portal estadístico de la DGT es una plataforma en línea destinada a ofrecer acceso público a una amplia gama de datos y estadísticas relacionadas con el tráfico y la seguridad vial. Este portal incluye información sobre accidentes de tráfico, infracciones, matriculaciones de vehículos, permisos de conducción y otros datos relevantes que pueden ser útiles para investigadores, profesionales del sector y el público en general.

En nuestro caso, utilizaremos su conjunto de datos de matriculaciones de vehículos en España disponibles vía:

Aunque durante el desarrollo del ejercicio mostraremos al lector los mecanismos necesarios para su descarga y procesamiento, incluimos en el repositorio de GitHub asociado los datos preprocesados*, de tal forma que el lector pueda proceder directamente al análisis de los mismos en el caso de que lo desee.

*Los datos utilizados en este ejercicio fueron descargados el 04 de marzo de 2024. La licencia aplicable a este conjunto de datos puede encontrarse en https://datos.gob.es/avisolegal.

4.2. Herramientas analíticas

  • Lenguaje de programación: Python – es un lenguaje de programación ampliamente utilizado en análisis de datos debido a su versatilidad y a la amplia gama de bibliotecas disponibles. Estas herramientas permiten a los usuarios limpiar, analizar y visualizar grandes conjuntos de datos de manera eficiente, lo que hace de Python una elección popular entre los científicos de datos y analistas.
  • Plataforma: Jupyter Notebooks – es una aplicación web que permite crear y compartir documentos que contienen código vivo, ecuaciones, visualizaciones y texto narrativo. Se utiliza ampliamente para la ciencia de datos, análisis de datos, aprendizaje automático y educación interactiva en programación.
  • Principales librerías y módulos:
    • Manipulación de datos: Pandas – es una librería de código abierto que proporciona estructuras de datos de alto rendimiento y fáciles de usar, así como herramientas de análisis de datos.
    • Visualización de datos:
      • Matplotlib: es una librería para crear visualizaciones estáticas, animadas e interactivas en Python.
      • Seaborn: es una librería basada en Matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.
    • Estadística y algoritmia:
      • Statsmodels: es una librería que proporciona clases y funciones para la estimación de muchos modelos estadísticos diferentes, así como para realizar pruebas y exploración de datos estadísticos.
      • Pmdarima: es una librería especializada en la modelización automática de series temporales, facilitando la identificación, el ajuste y la validación de modelos para pronósticos complejos.

5. Desarrollo del ejercicio

Es aconsejable ir ejecutando el Notebook con el código a la vez que se realiza la lectura del post, ya que ambos recursos didácticos son complementarios en las futuras explicaciones

 

El ejercicio propuesto se divide en cuatro fases principales.

5.1 Configuración inicial

Este apartado podrás encontrarlo en el punto 1 del Notebook.

En este breve primer apartado, configuraremos nuestro Jupyter Notebook y nuestro entorno de trabajo para poder trabajar con el conjunto de datos seleccionado. Importaremos las librerías Python necesarias y crearemos algunos directorios donde almacenaremos los datos descargados.

5.2 Preparación de datos

Este apartado podrás encontrarlo en el punto 2 del Notebook.

Todo análisis de datos requiere una fase de acceso y tratamiento de los mismos hasta obtener los datos adecuados en el formato deseado. En esta fase, descargaremos los datos del portal estadístico y los transformaremos al formato Apache Parquet antes de proceder a su análisis.

Aquellos usuarios que quieran profundizar en esta tarea, tienen a su disposición la Guía Práctica de Introducción al Análisis Exploratorio de Datos.

5.3 Análisis de datos

Este apartado podrás encontrarlo en el punto 3 del Notebook.

5.3.1 Análisis descriptivo

En esta tercera fase, comenzaremos nuestro análisis de datos. Para ello, responderemos las primeras preguntas apoyándonos en herramientas de visualización de datos que además nos permitirán familiarizarnos con los mismos. Mostramos a continuación algunos ejemplos del análisis:

  • Top 10 Vehículos matriculados en el 2023: En esta visualización representamos los diez modelos de vehículos con mayor número de matriculaciones durante el año 2023, indicando además el tipo de combustión de estos. Las principales conclusiones son:
    • Los únicos vehículos de fabricación europea que aparecen en el Top 10 son el Arona y el Ibiza de la marca española SEAT. El resto son asiáticos.
    • Nueve de los diez vehículos están propulsados por Gasolina.
    • El único vehículo del Top 10 con un tipo de propulsión diferente es el DACIA Sandero GLP (Gas Licuado de Petróleo).

Gráfica que muestra el Top10 de vehículos matriculados en 2023. Son, por este orden: Arona, Toyota Corolla, MG ZS, Toyota C-HR, Sportage, Ibiza, Nissan Qashqai, Sandero, tucson, Toyota Yaris Cross. Todos son de gasolina, excepto el Sandero que es Gas Licuado de Petróleo.

Figura 1. Gráfica "Top 10 Vehículos matriculados en el 2023"

  • Cuota de mercado por tipo de propulsión: En esta visualización representamos el porcentaje de vehículos matriculado por cada tipo de propulsión (vehículos de gasolina, diésel, eléctricos u otros). Vemos cómo la inmensa mayoría del mercado (>70%) la absorbieron vehículos de gasolina, siendo los diésel la segunda opción, y como los vehículos eléctricos alcanzaron el 5.5%.

Gráfico que muestra los vehículos vendidos en 2023 por tipo de propulsión: gasolina (71,3%), Diesel (20,5%), Eléctrico (5,5%), otros (2,7%).

Figura 2. Gráfica "Cuota de mercado por tipo de propulsión".

  • Evolución histórica de las matriculaciones: Esta visualización representa la evolución de las matriculaciones de vehículos en el tiempo. En ella se muestra el número de matriculaciones mensual entre enero de 2015 y diciembre de 2023 distinguiendo entre los tipos de propulsión de los vehículos matriculados.Podemos observar varios aspectos interesantes en este gráfico:
    • Apreciamos un comportamiento estacional anual, es decir, observamos patrones o variaciones que se repiten a intervalos regulares de tiempo. Vemos cómo recurrentemente en junio/julio aparecen altos niveles de matriculación mientras que en agosto/septiembre decrecen drásticamente. Esto es muy relevante, pues el análisis de series temporales con factor estacional tiene ciertas particularidades.
    • Es muy notable también la enorme caída de matriculaciones producida durante los primeros meses del COVID.
    • Vemos también como los niveles de matriculación post-covid son inferiores a los previos.
    • Por último, podemos observar cómo entre los años 2015 y 2023 la matriculación de vehículos eléctricos va creciendo paulatinamente.

Gráfico que muestra el número de matriculaciones mensual entre enero de 2015 y diciembre de 2023 distinguiendo entre los tipos de propulsión de los vehículos matriculados.

Figura 3. Gráfica "Matriculaciones de vehículos por tipo de propulsión".

  • Tendencia en la matriculación de vehículos eléctricos: Analizamos ahora por separado la evolución de vehículos eléctricos y no eléctricos utilizando mapas de calor como herramienta visual. Podemos observar comportamientos muy diferenciados entre ambos gráficos. Observamos cómo el vehículo eléctrico presenta una tendencia de incremento de matriculaciones año a año y, a pesar de suponer el COVID un parón en la matriculación de vehículos, los años posteriores han mantenido la tendencia creciente.

Gráfica que muestra la tendencia  en la matriculación de vehículos eléctricos a través de un mapa de calor. Se observa cómo van creciendo dichas matriculaciones.

Figura 4. Gráfica "Tendencia en la matriculación de vehículos convencionales vs eléctricos".

5.3.2. Analítica predictiva

Para dar respuesta a la última de las preguntas de forma objetiva, utilizaremos modelos predictivos que nos permitan realizar estimaciones respecto a la evolución del vehículo eléctrico en España. Como podemos observar, el modelo construido nos propone una continuación del crecimiento en las matriculaciones esperadas a lo largo del año serán de 70.000, alcanzando valores cercanos a las 8.000 matriculaciones solo en el mes de diciembre del 2024.

Gráfica que muestra el crecimiento futuro, según la estimación de nuestro modelo, de matriculaciones de vehículos eléctricos".

Figura 5. Gráfica "Predicción de matriculaciones de vehículos electricos".

5. Conclusiones del ejercicio

Como conclusión del ejercicio, podremos observar gracias a las técnicas de análisis empleadas como el vehículo eléctrico está penetrando cada vez a mayor velocidad en el parque móvil español aunque aún se encuentre a una distancia grande de otras alternativas como el Diésel o la Gasolina, por ahora liderado por el fabricante Tesla. Veremos en los próximos años si el ritmo crece al nivel necesario para alcanzar los objetivos de sostenibilidad fijados y si Tesla sigue siendo líder a pesar de la fuerte entrada de competidores asiáticos.

6. ¿Quieres realizar el ejercicio?

Si quieres conocer más sobre el Vehículo Eléctrico y poner a prueba tus capacidades analíticas, accede a este repositorio de código donde podrás desarrollar este ejercicio paso a paso.

Además, recuerda que tienes a tu disposición más ejercicios en el apartado sección de “Visualizaciones paso a paso”.


Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato.Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Noticia

El Consejo de Ministros aprobó en febrero de este año el Proyecto de Ley (PL) de Movilidad Sostenible, una apuesta por un sistema de transporte digital e innovador en el que los datos abiertos de movilidad tendrán un papel fundamental.

La norma, además de regular soluciones innovadoras como el transporte a demanda, los coches compartidos o el uso temporal de vehículos, fomentará la promoción de los datos abiertos de administraciones, gestores de infraestructura y operadores públicos y privados. Todo ello, tal y como se puntualiza en el Capítulo III título V del Proyecto de Ley “reportará enormes beneficios a la ciudadanía, por ejemplo, para la nueva movilidad y su contribución al Pacto Verde Europeo”.

Este Proyecto de Ley está alineado con la Estrategia Europea de Datos, que tiene entre sus objetivos crear un mercado único de datos que garantice la competitividad global y la soberanía de los datos de Europa a través de la creación de espacios de datos europeos comunes en nueve sectores estratégicos. En concreto, se prevé la creación y desarrollo de un espacio común europeo de datos relativos a la movilidad para situar a Europa en la vanguardia del desarrollo de un sistema de transportes inteligente, incluidos los automóviles conectados y otros modos de transporte. En esta línea, la Comisión Europea presentó su Estrategia de movilidad sostenible e inteligente, que incluye una acción dedicada a la innovación, datos e inteligencia artificial para una movilidad más inteligente. Siguiendo la estela europea, España ha lanzado este Proyecto de Ley de Movilidad Sostenible.

En este post analizamos las ventajas que el uso de los datos abiertos puede ofrecer al sector, aquellas obligaciones que marca el PL y que afectarán a los datos, y los próximos pasos para constituir el Espacio de Datos Integrado de Movilidad.

Ventajas del uso de datos abiertos sobre movilidad sostenible

El Ministerio de Transporte y Movilidad Sostenible en el apartado web creado para la Ley, identifica algunos beneficios que el acceso y uso de los datos abiertos de transporte y movilidad pueden ofrecer tanto al entramado empresarial como a las administraciones públicas y el conjunto de la ciudadanía en general:

  • Favorecer el desarrollo de aplicaciones que permitan a los ciudadanos la adopción de decisiones sobre la planificación de sus viajes y durante el desarrollo de estos.
  • Mejorar las condiciones de prestación de los servicios y de la experiencia durante el viaje.
  • Incentivar la investigación, crear nuevos desarrollos y negocios a partir de los datos generados en el ecosistema del transporte y la movilidad.
  • Posibilitar que las administraciones públicas tengan un mayor conocimiento del sistema de transportes y movilidad para mejorar así la definición de las políticas públicas y la gestión del sistema.
  • Impulsar el uso de estos datos para otros fines de interés público que puedan surgir.

Ventajas del uso de datos abiertos sobre movilidad sostenible

Asegurar el acceso a datos abiertos de movilidad

Para hacer buen uso de estos datos y aprovechar así todas las ventajas que ofrecen, el Proyecto de Ley determina una estrategia que garantiza la disponibilidad de datos abiertos en el ámbito del transporte y la movilidad. Esta estrategia afecta a:

  •  las empresas de transporte y los gestores de infraestructuras, que deben impulsar la digitalización y proporcionar parte importante de los datos, con unas características y funcionalidades específicas.
  • las administraciones y entidades públicas ya estaban obligados a garantizar la apertura de sus datos desde el diseño, así como su reutilización en base a la ya existe.

En resumen, se respetan las pautas de reutilización que ya define la Ley 37/2007 para el sector pública y además se recoge la necesidad de regular el acceso a esta información y el modo de utilización de estos datos por parte de terceros, es decir, empresas del sector.

Espacio de Datos Integrado de Movilidad

Acorde a la Estrategia Europea de Datos que mencionábamos al inicio del post, el PL determina la obligatoriedad de crear el Espacio de Datos Integrado de Movilidad (EDIM) bajo la dirección del Ministerio de Transportes y Movilidad Sostenible, en coordinación con la Secretaría de Estado de Digitalización e Inteligencia Artificial. En el EDIM compartirán sus datos las ya mencionadas empresas de transporte, los gestores de infraestructuras y las administraciones, algo que permitirá optimizar la toma de decisiones de todos los actores a la hora de planificar la ejecución de nuevas infraestructuras y la puesta en marcha de nuevos servicios. 

El Proyecto de Ley define algunas características del Espacio de Datos Integrado de Movilidad como la estructura modular, que incluirá información de manera sistemática de distintas áreas de movilidad urbana, metropolitana e interurbana, tanto de personas como de mercancías.

En concreto, el EDIM, según el artículo 14, recogería datos “en soporte digital de forma gratuita, no discriminatoria y actualizada” sobre:

  • Oferta y demanda de los diferentes modos de transporte y movilidad, información sobre los servicios de transporte público y servicios de movilidad competencia de las administraciones
  • Situación financiera y costes de prestación de los servicios de todos los modos de transporte público, inversiones en infraestructuras de transporte, inventario de infraestructuras y terminales de transporte, condiciones y grado de accesibilidad.
  • Otros datos que se acuerden en la Conferencia Sectorial de Transportes.

En el  se identifican ejemplos de este tipo de datos e información sobre la responsabilidad de su suministro, formato, frecuencia de actualización y otras características.

Tal y como refiere el PL, los datos y la información gestionada por el EDIM aportarán una visión integrada para analizar y facilitar la gestión de la movilidad, mejorando el diseño de soluciones sostenibles y eficientes, y la transparencia en el diseño de las políticas públicas de transportes y movilidad. Además, la Ley promoverá la creación de un sandbox o entorno de pruebas que sirva de incubadora para proyectos innovadores sobre movilidad. El resultado de las pruebas permitirá tanto al promotor como a la administración adquirir un aprendizaje observando el mercado en un entorno controlado.

Punto de Acceso Nacional de Transporte Bimodal

Por otro lado, el Proyecto de Ley también contempla la creación de un Punto de Acceso Nacional de Transporte Bimodal que recogerá la información comunicada al Ministerio de Transportes y Movilidad Sostenible en el marco de la acción prioritaria “Suministro de servicios de información sobre desplazamientos multimodales en toda la Unión” de la Directiva 2010/40/UE que hace referencia al transporte de mercancías y/o personas en más un medio de transporte.

Esta información será de acceso libre y gratuito y servirá también para nutrir al EDIM en el área relativa a la caracterización de transporte y movilidad de personas, así como al Catálogo nacional de Información Pública mantenido por la Administración General del Estado.

El Proyecto de Ley define que la prestación de servicios a la ciudadanía en los que se utilicen datos sobre transporte y movilidad del Punto de Acceso Nacional de Transporte Multimodal deberá hacerse de forma justa, neutra, imparcial, no discriminatoria y transparente. Y añade que el Ministerio de Transportes y Movilidad Sostenible propondrá unas reglas de uso de dichos datos en un plazo de 12 meses tras la entrada en vigor de esta Ley.

El Proyecto de Ley de Movilidad Sostenible está actualmente en trámite parlamentario, ya que se ha remitido a las Cortes para su tramitación urgente y aprobación en 2024.

calendar icon
Aplicación

Esta aplicación muestra la ubicación de las estaciones de recargas para vehículos eléctricos dentro de la Comunidad de Castilla y León. El usuario puede seleccionar la provincia de su interés y acceder a la información de las estaciones disponibles. Para cada estación se proporciona diversa información, como su situación, la empresa proveedora, el número de estaciones de carga y los conectores disponibles. 

Además, dentro de la app el usuario también puede encontrar información sobre los programas de incentivos a la movilidad eléctrica, como el Plan MOVES III

Los datos geográficos de dichos cargadores se han obtenido de los servidores de la plataforma pública de Datos Abiertos de Castilla y León. 

calendar icon
Aplicación

La aplicación ofrece a los usuarios información en tiempo real del estado del aparcamiento: plazas libres y plazas ocupadas. Mediante un plano del aparcamiento, el usuario podrá visualizar directamente el estado de ocupación de cada una de las plazas (libre u ocupada) y del aparcamiento completo (número de plazas libres y plazas ocupadas). Igualmente, muestra la opción de consultar la ruta de acceso al aparcamiento desde la posición del usuario. Otro de los tipos de datos que ofrece son las tarifas vigentes de utilización del aparcamiento. 

Los datos que utiliza la aplicación para mostrar información, como puede ser el conjunto de datos sobre sensores del parking, se encuentran disponibles en el portal de transparencia del Ayuntamiento de Villanueva de la Serena. 

calendar icon
Documentación

1. Introducción

Las visualizaciones son representaciones gráficas de datos que permiten comunicar de manera sencilla y efectiva la información ligada a los mismos. Las posibilidades de visualización son muy amplias, desde representaciones básicas, como los gráficos de líneas, de barras o de sectores, hasta visualizaciones configuradas sobre cuadros de mando interactivos.  

En esta sección de “Visualizaciones paso a paso” estamos presentando periódicamente ejercicios prácticos de visualizaciones de datos abiertos disponibles en  datos.gob.es u otros catálogos similares. En ellos se abordan y describen de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y los análisis que resulten pertinentes para, finalmente, posibilitar la creación de visualizaciones interactivas que nos permitan obtener unas conclusiones finales a modo de resumen de dicha información. En cada uno de estos ejercicios prácticos, se utilizan sencillos desarrollos de código convenientemente documentados, así como herramientas de uso gratuito. Todo el material generado está disponible para su reutilización en el repositorio Laboratorio de datos de GitHub. 

A continuación, y como complemento a la explicación que encontrarás seguidamente, puedes acceder al código que utilizaremos en el ejercicio y que iremos explicando y desarrollando en los siguientes apartados de este post.

Accede al repositorio del laboratorio de datos en Github.

Ejecuta el código de pre-procesamiento de datos sobre Google Colab.

Volver al inicio

 

2. Objetivo

El objetivo principal de este ejercicio es mostrar cómo realizar un análisis de redes o de grafos partiendo de datos abiertos sobre viajes en bicicleta de alquiler en la ciudad de Madrid. Para ello, realizaremos un preprocesamiento de los datos con la finalidad de obtener las tablas que utilizaremos a continuación en la herramienta generadora de la visualización, con la que crearemos las visualizaciones del grafo. 

Los análisis de redes son métodos y herramientas para el estudio y la interpretación de las relaciones y conexiones entre entidades o nodos interconectados de una red, pudiendo ser estas entidades personas, sitios, productos, u organizaciones, entre otros. Los análisis de redes buscan descubrir patrones, identificar comunidades, analizar la influencia y determinar la importancia de los nodos dentro de la red. Esto se logra mediante el uso de algoritmos y técnicas específicas para extraer información significativa de los datos de red. 

Una vez analizados los datos mediante esta visualización, podremos contestar a preguntas como las que se plantean a continuación:  

  • ¿Cuál es la estación de la red con mayor tráfico de entrada y de salida? 
  • ¿Cuáles son las rutas entre estaciones más frecuentes? 
  • ¿Cuál es el número medio de conexiones entre estaciones para cada una de ellas? 
  • ¿Cuáles son las estaciones más interconectadas dentro de la red? 

Volver al inicio

 

3. Recursos

3.1. Conjuntos de datos

Los conjuntos de datos abiertos utilizados contienen información sobre los viajes en bicicleta de préstamo realizados en la ciudad de Madrid. La información que aportan se trata de la estación de origen y de destino, el tiempo del trayecto, la hora del trayecto, el identificador de la bicicleta, …

Estos conjuntos de datos abiertos son publicados por el Ayuntamiento de Madrid, mediante ficheros que recogen los registros de forma mensual.

Estos conjuntos de datos también se encuentran disponibles para su descarga en el siguiente repositorio de Github

Volver al inicio

3.2. Herramientas

Para la realización de las tareas de preprocesado de los datos se ha utilizado el lenguaje de programación Python escrito sobre un Notebook de Jupyter alojado en el servicio en la nube de Google Colab.

"Google Colab" o, también llamado Google Colaboratory, es un servicio en la nube de Google Research que permite programar, ejecutar y compartir código escrito en Python o R sobre un Jupyter Notebook desde tu navegador, por lo que no requiere configuración. Este servicio es gratuito.

Para la creación de la visualización interactiva se ha usado la herramienta Gephi

"Gephi" es una herramienta de visualización y análisis de redes. Permite representar y explorar relaciones entre elementos, como nodos y enlaces, con el fin de entender la estructura y patrones de la red. El programa precisa descarga y es gratuito.

Si quieres conocer más sobre herramientas que puedan ayudarte en el tratamiento y la visualización de datos, puedes recurrir al informe "Herramientas de procesado y visualización de datos".

Volver al inicio

 

4. Tratamiento o preparación de datos

Los procesos que te describimos a continuación los encontrarás comentados en el Notebook que también podrás ejecutar desde Google Colab.

Debido al alto volumen de viajes registrados en los conjuntos de datos, definimos los siguientes puntos de partida a la hora de analizarlos:

  • Analizaremos la hora del día con mayor tráfico de viajes
  • Analizaremos las estaciones con un mayor volumen de viajes

Antes de lanzarnos a analizar y construir una visualización efectiva, debemos realizar un tratamiento previo de los datos, prestando especial atención a su obtención y a la validación de su contenido, asegurándonos que se encuentran en el formato adecuado y consistente para su procesamiento y que no contienen errores.

Como primer paso del proceso, es necesario realizar un análisis exploratorio de los datos (EDA), con el fin de interpretar adecuadamente los datos de partida, detectar anomalías, datos ausentes o errores que pudieran afectar a la calidad de los procesos posteriores y resultados. Si quieres conocer más sobre este proceso puedes recurrir a la Guía Práctica de Introducción al Análisis Exploratorio de Datos.

El siguiente paso es generar la tabla de datos preprocesada que usaremos para alimentar la herramienta de análisis de redes (Gephi) que de forma visual nos ayudará a comprender la información. Para ello modificaremos, filtraremos y uniremos los datos según nuestras necesidades.

Los pasos que se siguen en este preprocesamiento de los datos, explicados en este Notebook de Google Colab, son los siguientes:

  1. Instalación de librerías y carga de los conjuntos de datos
  2. Análisis exploratorio de los datos (EDA)
  3. Generación de tablas preprocesadas

Podrás reproducir este análisis con el código fuente que está disponible en nuestra cuenta de GitHub. La forma de proporcionar el código es a través de un documento realizado sobre un Jupyter Notebook que, una vez cargado en el entorno de desarrollo, podrás ejecutar o modificar de manera sencilla.

Debido al carácter divulgativo de este post y para favorecer el entendimiento de los lectores no especializados, el código no pretende ser el más eficiente sino facilitar su comprensión, por lo que posiblemente se te ocurrirán muchas formas de optimizar el código propuesto para lograr fines similares. ¡Te animamos a que lo hagas!

Volver al inicio

 

5. Análisis de la red

5.1. Definición de la red

La red analizada se encuentra formada por los viajes entre distintas estaciones de bicicletas en la ciudad de Madrid, teniendo como principal información de cada uno de los viajes registrados la estación de origen (denominada como “source”) y la estación de destino (denominada como “target”). 

La red está formada por 253 nodos (estaciones) y 3012 aristas (interacciones entre las estaciones). Se trata de un grafo dirigido, debido a que las interacciones son bidireccionales y ponderado, debido a que cada arista entre los nodos tiene asociado un valor numérico denominado "peso" que en este caso corresponde al número de viajes realizados entre ambas estaciones.

5.2. Carga de la tabla preprocesada en Gephi

Mediante la opción “importar hoja de cálculo” de la pestaña archivo, importamos en formato CSV la tabla de datos previamente preprocesada. Gephi detectará que tipo de datos se están cargando, por lo que utilizaremos los parámetros predefinidos por defecto.

Figura 1. Carga de datos en Gephi
 
 

5.3. Opciones de visualización de la red

5.3.1 Ventana de distribución

En primer lugar, aplicamos en la ventana de distribución, el algoritmo Force Atlas 2. Este algoritmo utiliza la técnica de repulsión de nodos en función del grado de conexión de tal forma que los nodos escasamente conectados se separan respecto a los que tiene una mayor fuerza de atracción entre sí.

Para evitar que los componentes conexos queden fuera de la vista principal, fijamos el valor del parámetro "Gravedad en Puesta a punto" a un valor de 10 y para evitar que los nodos queden amontonados, marcamos la opción “Disuadir Hubs” y “Evitar el solapamiento”.

Figura 2. Ventana distribución - algoritmo Force Atlas 2
 

Dentro de la ventana de distribución, también aplicamos el algoritmo de Expansión con la finalidad de que los nodos no se encuentren tan juntos entre sí mismos.

Figura 3. Ventana distribución - algoritmo de Expansión

5.3.2 Ventana de apariencia

A continuación, en la ventana de apariencia, modificamos los nodos y sus etiquetas para que su tamaño no sea igualitario, sino que dependa del valor del grado de cada nodo (nodos con un mayor grado, mayor tamaño visual). También modificaremos el color de los nodos para que los de mayor tamaño sean de un color más llamativo que los de menor tamaño. En la misma ventana de apariencia modificamos las aristas, en este caso hemos optado por un color unitario para todas ellas, ya que por defecto el tamaño va acorde al peso de cada una de ellas.

Un mayor grado en uno de los nodos implica un mayor número de estaciones conectadas con dicho nodo, mientras que un mayor peso de las aristas implica un mayor número de viajes para cada conexión.

Figura 4. Ventana apariencia

5.3.3 Ventana de grafo

Por último, en la zona inferior de la interfaz de la ventana de grafo, tenemos diversas opciones como activar/desactivar el botón para mostrar las etiquetas de los distintos nodos, adecuar el tamaño de las aristas con la finalizad de hacer más limpia la visualización, modificar el tipo de letra de las etiquetas, …

Figura 5. Opciones ventana de grafo
 

A continuación, podemos ver la visualización del grafo que representa la red una vez aplicadas las opciones de visualización mencionadas en los puntos anteriores.

Figura 6. Visualización del grafo

 

Activando la opción de visualizar etiquetas y colocando el cursor sobre uno de los nodos, se mostrarán los enlaces que corresponden al nodo y el resto de los nodos que están vinculados al elegido mediante dichos enlaces.

A continuación, podemos visualizar los nodos y enlaces relativos a la estación de bicicletas “Fernando el Católico". En la visualización se distinguen con facilidad los nodos que poseen un mayor número de conexiones, ya que aparecen con un mayor tamaño y colores más llamativos, como por ejemplo "Plaza de la Cebada" o "Quevedo".

Figura 7. Visualización grafo para la estación "Fernando el Católico"
 

5.4 Principales medidas de red

Junto a la visualización del grafo, las siguientes medidas nos aportan la principal información de la red analizada. Estas medias, que son las métricas habituales cuando se realiza analítica de redes, podremos calcularlas en la ventana de estadísticas.

Figura 8. Ventana estadísticas

 

  • Nodos (N): son los distintos elementos individuales que componen una red, representando entidades diversas. En este caso las distintas estaciones de bicicletas. Su valor en la red es de 243
  • Enlaces (L): son las conexiones que existen entre los nodos de una red. Los enlaces representan las relaciones o interacciones entre los elementos individuales (nodos) que componen la red. Su valor en la red es de 3014
  • Número máximo de enlaces (Lmax): es el máximo posible de enlaces en la red. Se calcula mediante la siguiente fórmula Lmax= N(N-1)/2. Su valor en la red es de 31878
  • Grado medio (k): es una medida estadística para cuantificar la conectividad promedio de los nodos de la red. Se calcula promediando los grados de todos los nodos de la red. Su valor en la red es de 23,8
  • Densidad de la red (d): indica la proporción de conexiones existentes entre los nodos de la red con respecto al total de conexiones posibles. Su valor en la red es de 0,047
  • Diámetro (dmax ): es la distancia de grafo más larga entre dos nodos cualquiera de la res, es decir, cómo de lejos están los 2 nodos más alejados. Su valor en la red es de 7
  • Distancia media (d): es la distancia de grafo media promedio entre los nodos de la red. Su valor en la red es de 2,68
  • Coeficiente medio de clustering (C): Índica cómo los nodos están incrustados entre sus nodos vecinos. El valor medio da una indicación general de la agrupación en la red. Su valor en la red es de 0,208
  • Componente conexo: grupo de nodos que están directa o indirectamente conectados entre sí, pero no están conectados con los nodos fuera de ese grupo. Su valor en la red es de 24

 

5.5 Interpretación de los resultados

La probabilidad de grados sigue de forma aproximada una distribución de larga cola, donde podemos observar que existen unas pocas estaciones que interactúan con un gran número de ellas mientras que la mayoría interactúa con un número bajo de estaciones.

El grado medio es de 23,8 lo que indica que cada estación interacciona de media con cerca de otras 24 estaciones (entrada y salida).

En el siguiente gráfico podemos observar que, aunque tengamos nodos con grados considerados como altos (80, 90, 100, …), se observa que el 25% de los nodos tienen grados iguales o inferiores a 8, mientras que el 75% de los nodos tienen grados inferiores o iguales a 32.

Figura 9. Gráfico de dIstribución de grados
 

La gráfica anterior se puede desglosar en las dos siguientes correspondientes al grado medio de entrada y de salida (ya que la red es direccional). Vemos que ambas tienen distribuciones de larga cola similares, siendo su grado medio el mismo de 11,9.

Su principal diferencia es que la gráfica correspondiente al grado medio de entrada tiene una mediana de 7 mientras que la de salida es de 9, lo que significa que existe una mayoría de nodos con grados más bajos en los de entrada que los de salida.

Figura 10. Gráficos distribución de grados de entrada y salida
 
 
 

El valor del grado medio con pesos es de 346,07 lo cual nos indica la media de viajes totales de entrada y salida de cada estación.

Figura 11. Gráfico distribución de grados con pesos
 

La densidad de red de 0,047 es considerada una densidad baja indicando que la red es dispersa, es decir, contiene pocas interacciones entre distintas estaciones en relación con las posibles. Esto se considera lógico debido a que las conexiones entre estaciones estarán limitadas a ciertas zonas debido a la dificultad de llegar a estaciones que se encuentra a largas distancias.

El coeficiente medio de clustering es de 0,208 significando que la interacción de dos estaciones con una tercera no implica necesariamente la interacción entre sí, es decir, no implica necesariamente transitividad, por lo que la probabilidad de interconexión de esas dos estaciones mediante la intervención de una tercera es baja.

Por último, la red presenta 24 componentes conexos, siendo 2 de ellos componentes conexos débiles y 22 componentes conexos fuertes.

 

5.6 Análisis de centralidad

Un análisis de centralidad se refiere a la evaluación de la importancia de los nodos en una red utilizando diferentes medidas. La centralidad es un concepto fundamental en el análisis de redes y se utiliza para identificar nodos clave o influyentes dentro de una red. Para realizar esta tarea se parte de las métricas calculadas en la ventana de estadísticas.

  • La medida de centralidad de grado indica que cuanto más alto es el grado de un nodo, más importante es. Las cinco estaciones con valores más elevados son: 1º Plaza de la Cebada, 2º Plaza de Lavapiés, 3º Fernando el Católico, 4º Quevedo, 5º Segovia 45.

Figura 12. Visualización grafo centralidad de grado
 
  • La media de centralidad de cercanía indica que cuanto más alto sea el valor de cercanía de un nodo, más central es, ya que puede alcanzar cualquier otro nodo de la red con el menor esfuerzo posible. Las cinco estaciones que valores más elevados poseen son: 1º Fernando el Católico 2º General Pardiñas, 3º Plaza de la Cebada, 4º Plaza de Lavapiés, 5º Puerta de Madrid.

Figura 13. Distribución medida centralidad de cercanía

 

Figura 14. Visualización grafo centralidad de cercanía
 
  • La medida de centralidad de intermediación indica que cuanto mayor sea la medida de intermediación de un nodo, más importante es dado que está presente en más rutas de interacción entre nodos que el resto de los nodos de la red. Las cinco estaciones que valores más elevados poseen son: 1º Fernando el Católico, 2º Plaza de Lavapiés, 3º Plaza de la Cebada, 4º Puerta de Madrid, 5º Quevedo.

Figura 15. Gráfico distribución medida centralidad de intermediación
 
FIgura 16. Visualización grafo centralidad de intermediación
 

Con la herramienta Gephi se pueden calcular gran cantidad de métricas y parámetros que no se reflejan en este estudio ,como por ejemplo, la medida de vector propio o distribucción de centralidad "eigenvector". 

 

5.7 Filtros

Mediante la ventana de filtrado, podemos seleccionar ciertos parámetros que simplifiquen las visualizaciones con la finalidad de mostrar información relevante del análisis de redes de una forma más clara visualmente.

Figura 17. Ventana de filtrado

A continuación, mostraremos varios filtrados realizados:

  • Filtrado de rango (grado), en el que se muestran los nodos con un rango superior a 50, suponiendo un 13,44% (34 nodos) y un 15,41% (464 aristas)

Figura 18. Visualización grafo filtrado de rango (grado)
 
  • Filtrado de aristas (peso de la arista), en el que se muestran las aristas con un peso superior a 100, suponiendo un 0,7% (20 aristas)

Figura 19. VIsualización grafo filtrado de arista (peso)

 

Dentro de la ventana de filtros, existen muchas otras opciones de filtrado sobre atributos, rangos, tamaños de particiones, las aristas, … con los que puedes probar a realizar nuevas visualizaciones para extraer información del grafo. Si quieres conocer más sobre el uso de Gephi, puedes consultar los siguientes cursos y formaciones sobre la herramienta.

 

6. Conclusiones del ejercicio

Una vez realizado el ejercicio, podemos apreciar las siguientes conclusiones:

  • Las tres estaciones más interconectadas con otras estaciones son Plaza de la Cebada (133), Plaza de Lavapiés (126) y Fernando el Católico (114).
  • La estación que tiene un mayor número de conexiones de entrada es la Plaza de la Cebada (78), mientras que la que tiene un mayor número de conexiones de salida es la Plaza de Lavapiés con el mismo número que Fernando el Católico (57)
  • Las tres estaciones con un mayor número de viajes totales son Plaza de la Cebada (4524), Plaza de Lavapiés (4237) y Fernando el Católico (3526).
  • Existen 20 rutas con más de 100 viajes. Siendo las 3 rutas con un mayor número de ellos: Puerta de Toledo – Plaza Conde Suchil (141), Quintana Fuente del Berro – Quintana (137), Camino Vinateros – Miguel Moya (134).
  • Teniendo en cuenta el número de conexiones entre estaciones y de viajes, las estaciones de mayor importancia dentro de la red son: Plaza la Cebada, Plaza de Lavapiés y Fernando el Católico.

Esperemos que esta visualización paso a paso te haya resultado útil para el aprendizaje de algunas técnicas muy habituales en el tratamiento y representación de datos abiertos. Volveremos para mostraros nuevas reutilizaciones. ¡Hasta pronto!

calendar icon
Blog

Los datos abiertos son una herramienta útil para tomar decisiones informadas que incentiven el éxito de un proceso y mejorar su eficacia. Desde una visión sectorial, los datos abiertos aportan información relevante sobre el sector legal, el educativo o el de la salud. Todos ellos, junto a otros muchos ámbitos, emplean fuentes abiertas para medir el cumplimiento de una mejora o desarrollar herramientas que faciliten el trabajo a los profesionales.  

Los beneficios del uso de los datos abiertos son amplios y su variedad va de la mano de la innovación tecnológica: cada día surgen más oportunidades para emplear datos abiertos en el desarrollo de soluciones innovadoras. Ejemplo de ello puede ser el desarrollo urbanístico alineado con los valores de sostenibilidad que defiende la Organización de las Naciones Unidas (ONU).  

Las ciudades ocupan el 3% de la superficie terrestre; sin embargo, emiten el 70% de las emisiones de carbono y consumen más del 60% de los recursos de todo el mundo, según la ONU. En 2023, más de la mitad de la población mundial vive en ciudades y se prevé que esta cifra siga creciendo. En 2030 se estima que más de 5.000 millones de personas vivirían en ciudades, es decir, más del 60% de la población de todo el mundo.  

A pesar de la tendencia, las infraestructuras y los barrios no cumplen con las condiciones adecuadas de desarrollo sostenible y el objetivo es “Lograr que las ciudades y los asentamientos humanos sean inclusivos, seguros y sostenibles”, tal y como se reconoce en el ODS número 11. La planificación y gestión adecuada de los recursos urbanos son cuestiones de peso a la hora de crear y mantener comunidades basadas en la sostenibilidad. En este contexto, los datos abiertos juegan un importante papel para medir el cumplimiento de este ODS y así alcanzar la meta de ciudades sostenibles.  

En definitiva, los datos abiertos se constituyen como una herramienta fundamental para el fortalecimiento y progreso del desarrollo sostenible de las ciudades. 

En esta infografía, hemos recogido casos de uso que emplean conjuntos de datos abiertos para monitorizar y/o mejorar la eficiencia energética, el transporte y la movilidad urbana, la calidad del aire y el nivel de ruido. Cuestiones que contribuyen al buen funcionamiento de los centros urbanos. 

Haz clic en la infografía para verla en tamaño real  


Versión accesible en Word

calendar icon
Noticia

El pasado 13 de marzo se celebró una jornada del Grupo de Trabajo de Movilidad del Hub Gaia-X España, donde se abordaron los principales retos del sector en lo referente a proyectos sobre la compartición y explotación de datos. La sesión, que se desarrolló en la Escuela Técnica Superior de Ingenieros de Caminos, Canales y Puertos de la Universidad Politécnica de Madrid, permitió a los asistentes conocer de primera mano los principales retos del sector, así como algunos de los proyectos de datos punteros de la industria de la movilidad. El evento fue también un punto de encuentro en el que se compartieron ideas y reflexiones entre los actores clave del sector.

La jornada comenzó con la presentación del Ministerio de Transportes, Movilidad y Agenda Urbana, intervención que  destacó la gran importancia del Punto de Acceso Nacional de Transporte Multimodal, un proyecto de ámbito europeo, que permite concentrar toda la información de la oferta de transporte de viajeros del país en un único punto nacional, con el objetivo de proporcionar los cimientos para impulsar el desarrollo de los servicios de movilidad del futuro.

A continuación, la Oficina del Dato de la Secretaría de Estado de Inteligencia Artificial (SEDIA) aportó la visión del modelo de desarrollo de Espacios de Datos y los principios de diseño de dichos espacios alineados con los valores europeos. Se destacó la importancia de las redes de negocio en base a ecosistemas de datos, el carácter intersectorial de la industria de la Movilidad y el importante papel de los datos abiertos en los espacios de datos del sector.

Seguidamente, se presentaron casos de uso por parte de Vicomtech, Amadeus, i2CAT y el Ayuntamiento de Alcobendas, que permitieron conocer de primera mano algunos ejemplos de uso de tecnología para proyectos de compartición de datos (tanto de espacios de datos como de data lakes, o lagos de datos).

Finalmente, se presentó un estudio inicial de la Fundación i2CAT, FACTUAL Consulting y EIT Urban Mobility sobre los componentes básicos de los futuros espacios de datos de movilidad en España. El estudio, que puede descargarse aquí en español, aborda el potencial de los espacios de datos de movilidad para el mercado español. Aunque se centra en España, recoge un enfoque sobre la investigación tanto nacional como internacional , enmarcado en el contexto europeo para establer estándares, el desarrollo de los componentes técnicos que habilitan los espacios de datos, los primeros proyectos faro y el abordaje de desafíos comunes para cumplir hitos en materia de movilidad sostenible en Europa.

Las presentaciones utilizadas en la sesión están disponibles en este enlace.

 

calendar icon
Noticia

Actualizado: 21/03/2024

En enero de 2023, la Comisión Europea publicó un listado de conjuntos de datos de alto valor que los organismos del sector público deberían poner a disposición de la ciudadanía en un plazo máximo de 16 meses. El principal objetivo de establecer la lista de conjuntos de datos de alto valor es garantizar que los datos públicos de mayor potencial socioeconómico se pongan a disposición para su reutilización con una restricción jurídica y técnica mínima, y sin coste alguno. Dentro de estos conjuntos de datos del sector público, algunos como los meteorológicos o los relativos a la calidad del aire, resultan especialmente interesantes para desarrolladores y creadores de servicios como aplicaciones o páginas webs, que reportan valor añadido e importantes beneficios para la sociedad, el medioambiente o la economía.

La publicación del Reglamento se acompañó de unas preguntas frecuentes para ayudar a los organismos públicos a entender el beneficio de los HVDS (High Value Datasets) en la sociedad y la economía, así como para explicar algunos aspectos sobre la obligatoriedad y las ayudas para la publicación.

En línea con esta propuesta, la Vicepresidenta Ejecutiva para una Europa adaptada a la era digital, Margrethe Vestager, declaró lo siguiente en la nota de prensa lanzada por la Comisión Europea:

“Poner a disposición del público conjuntos de datos de gran valor beneficiará tanto a la economía como a la sociedad, por ejemplo, ayudando a combatir el cambio climático, reduciendo la contaminación atmosférica urbana y mejorando las infraestructuras de transporte. Se trata de un paso práctico hacia el éxito de la Década Digital y la construcción de un futuro digital más próspero”.

De forma paralela, Thierry Breton, Comisario de Mercado Interior, quiso añadir también las siguientes palabras a colación del anuncio del listado de los datos de alto valor: “Los datos son una piedra angular de nuestra competitividad industrial en la UE. Con la nueva lista de conjuntos de datos de alto valor estamos desbloqueando una gran cantidad de datos públicos en beneficio de todos. Las nuevas empresas y las pymes podrán utilizar estos para desarrollar nuevos productos y soluciones innovadoras que mejoren la vida de los ciudadanos de la UE y de todo el mundo”.

Seis categorías para aglutinar los nuevos conjuntos de datos de alto valor

De este modo, el reglamento se crea al amparo de la Directiva Europea de Datos Abiertos, que define seis categorías para diferenciar los nuevos conjuntos de datos de alto valor solicitados:

  • Geoespaciales
  • De observación de la Tierra y medioambiente
  • Meteorológicos
  • Estadísticos
  • De empresas
  • De movilidad

No obstante, tal y como recoge la nota de prensa de la Comisión Europea, esta gama temática podría ampliarse posteriormente en función de la evolución de la tecnología y el mercado. Así, los conjuntos de datos estarán disponibles en formato legible por máquina, a través de una interfaz de programación de aplicaciones (API) y, si fuera relevante, también con opción de descarga masiva.

Además, la reutilización de conjuntos de datos como los de movilidad o geolocalización de edificios puede ampliar las oportunidades de negocio disponibles para sectores como la logística o el transporte. De forma paralela, los datos de observación meteorológica, de radar, de calidad del aire o de contaminación del suelo también pueden apoyar la investigación y la innovación digital, así como la elaboración de políticas en la lucha contra el cambio climático.

En definitiva, una mayor disponibilidad de datos y, en especial de alto valor, tiene la capacidad de impulsar el espíritu empresarial ya que estos conjuntos de datos pueden ser un recurso importante para que las pymes desarrollen nuevos productos y servicios digitales, lo que a su vez también puede atraer nuevos inversores.

Descubre más en esta infografía:

Infografía-resumen sobre los datos de alto valor

Accede a la versión accesible en dos páginas.

calendar icon
Documentación

Este informe recoge varias temáticas relevantes para la comunidad europea de datos geoespaciales.

Por un lado, el capítulo dedicado a la "modernización INSPIRE y avance hacia los datos abiertos" trata la evaluación realizada por la Comisión Europea de la directiva INSPIRE y cómo ésta debe avanzar en un futuro próximo. Entre otras conclusiones, determina la oportunidad de simplificación técnica para favorecer una mayor interoperabilidad, además de la necesaria convergencia con la Directiva 2019/1024 sobre datos abiertos, incidiendo en la importancia de puesta a disposición de datos de alto valor (HVDs). En este sentido, el informe incluye una valoración sobre qué temas de datos Inspire son considerados HVDs.

La segunda temática gira en torno al "papel de la información geoespacial para las ciudades inteligentes", donde los datos completos, actualizados y con referencia geoespacial, son considerados un activo fundamental en los proyectos de ciudades inteligentes.

En tercer lugar, el informe recoge un avance de situación sobre determinados aspectos clave analizados en un informe anterior (2021),  relacionados, entre otras cuestiones relevantes, con la disponibilidad de OGC API endpoints o el descubrimiento de servicios de streaming de datos procedentes de las APIs de SensorThings.

Por último, el documento, a modo de conclusión, detalla hoja de ruta de potencial interés para el portal de datos europeo de cara a seguir avanzando para mejorar la disponibilidad de información geoespacial.

Este informe se encuentra disponible en el siguiente enlace: "Tendencias geoespaciales 2022: Oportunidades para data.europa.eu a partir de las tendencias emergentes en la comunidad geoespacial"

calendar icon