En este pódcast hablamos de los datos de transporte y movilidad, un tema muy presente en nuestro día a día. Cada vez que consultamos una aplicación para saber cuánto tardará un autobús, estamos aprovechando los datos abiertos ligados al transporte. De la misma forma, cuando una administración realiza una planificación urbanística u optimiza flujos de tráfico, hace uso de datos de movilidad.
Para profundizar en los retos y oportunidades que hay detrás de la apertura de este tipo de datos por parte de las administraciones públicas españolas, contamos con dos invitadas de excepción:
- Tania Gullón Muñoz-Repiso, directora de la División de Estudios y Tecnología del Transporte del Ministerio de Transportes y Movilidad Sostenible. ¡Bienvenida, Tania!
- Alicia González Jiménez, subdirectora adjunta en la Subdirección General de Cartografía y Observación del Territorio del Instituto Geográfico Nacional. ¡Bienvenida, Alicia!
Resumen de la entrevista
-
Tanto el IGN como el Ministerio generan gran cantidad de datos relacionados con el transporte. De todos ellos, ¿nos podéis indicar qué datos y servicios se ponen a disposición de la ciudadanía como datos abiertos?
Alicia González: Por parte del Instituto Geográfico Nacional diría que todo, todo lo que producimos está a disposición de los usuarios, porque desde finales de 2015 la política de difusión que adoptó la Dirección General del Instituto Geográfico Nacional, a través del Organismo Autónomo Centro Nacional de Información Geográfica (CNIG), que es por donde se distribuyen todos los productos y servicios, es una política de datos abiertos, de forma que todo se distribuye bajo la licencia CCC BY 4.0, que ampara el uso libre y gratuito. Simplemente hay que hacer una atribución, una mención del origen de los datos. Entonces estamos hablando, en general, no solamente de transporte, sino de todo tipo de datos, de más de 100 productos que suponen más de dos millones y medio de ficheros que los usuarios demandan cada vez más. De hecho, en 2024 hemos llegado a tener hasta 20 millones de ficheros descargados, o sea que es muy demandada. Y concretamente en materia de redes de transporte, el conjunto fundamental de datos es la Información Geográfica de Referencia de Redes de Transportes (IGR-RT). Se trata de un conjunto de datos geoespacial multimodal que está compuesto por cinco redes de transporte que están continuas por todo el territorio nacional y además interconectadas. En concreto, contempla:
1. La red viaria que se compone de toda la red de carreteras, independientemente de su titular y que discurre por todo el territorio. Son más de 300 mil kilómetros de carretera que están además conectados a todos los callejeros, a la red viaria urbana de todos los núcleos de población. Es decir, tenemos un grafo viario que vertebra todo el territorio, , además de tener conectados los caminos que luego posteriormente se distribuyen y se difunden en el Mapa Topográfico Nacional.
2. La segunda red de mayor relevancia es la red de transporte por raíl. Contempla todos los datos de transporte ferroviario y además también de metro, tranvía y otros tipos de modos por rail.
3 y 4. En el ámbito marítimo y aéreo, las redes ya se limitan a lo que son las infraestructuras, de forma que contiene todos los puertos de la costa española y todas las infraestructuras de aeródromos, aeropuertos, helipuertos en la parte de aéreo.
5. Y por último, la última red, que es mucho más modesta, son datos de carácter residual: el transporte por cable.
Está todo interconectado mediante relaciones de intermodalidad. Es un conjunto de datos que se genera a partir de fuentes oficiales. No podemos incorporar cualquier dato, tienen que ser siempre datos oficiales y se genera en el marco de cooperación del Sistema Cartográfico Nacional.
Al ser un conjunto de datos que es conforme con la Directiva INSPIRE tanto en su definición como en la forma por la que se difunde a través de servicios web estándar, también ha sido clasificado como un conjunto de datos de alto valor en la categoría de movilidad, conforme al Reglamento de ejecución de los datos de alto valor. Es un conjunto bastante importante y normalizado.
¿Cómo se puede localizar y acceder? Precisamente, al ser estándar, está catalogado en el catálogo de la IDE (Infraestructura de Datos espaciales), gracias a la descripción estándar de sus metadatos. También se puede localizar a través del catálogo oficial de datos y servicios INSPIRE (Servicios de Publicación de Información) o está accesible a través de portales tan relevantes como el portal de datos abiertos.
Una vez que lo tenemos localizado, ¿cómo puede acceder el usuario? ¿Cómo puede ver los datos? Hay varias vías. La más sencilla: consultar su visualizador. Ahí se muestran todos los datos y hay ciertas herramientas de consulta para facilitar su uso. Y después, por supuesto, a través del centro de descargas del CNIG. Ahí publicamos todos los datos de todas las redes y tiene gran demanda. Y luego la última vía es consultar los servicios web estándar que generamos, servicios de visualización y de descargas de distintas tecnologías. O sea que es un conjunto de datos que está a disposición de los usuarios para su reutilización.
Tania Gullón: En el Ministerio también compartimos muchos datos en abierto. A mí me gustaría, para no alargarnos mucho, comentar en especial cuatro grandes conjuntos de datos:
1. El primero sería el OTLE, el Observatorio del Transporte y la Logística en España, que es una iniciativa del Ministerio de Transportes, cuyo objetivo principal es proporcionar una visión global e integral de la situación del transporte y la logística en España. Se organiza en siete bloques: movilidad, socioeconomía, infraestructura, seguridad, sostenibilidad, transporte metropolitano y logística. Estos no son datos georreferenciados, sino que son datos estadísticos. El Observatorio pone a disposición del público datos, gráficos, mapas, indicadores y, no solo eso, sino que también ofrece informes anuales, monográficos, jornadas, etcétera. Y también de los observatorios que tenemos transfronterizos, que se hacen de forma colaborativa con Portugal y con Francia.
2. El segundo conjunto de datos que quiero mencionar es el NAP, el Punto de Acceso Nacional de Transporte Multimodal, que es una plataforma digital oficial gestionada por el Ministerio de Transportes, pero que se elabora de forma colaborativa entre las diferentes administraciones. Su objetivo es centralizar y publicar toda la información digitalizada sobre la oferta de transportes de viajeros en el territorio nacional de todos los modos de transporte. ¿Qué tenemos aquí? Todos los horarios, servicios, rutas, paradas de todos los servicios de transporte, del transporte por carretera, de los autobuses urbanos, interurbanos, rurales, discrecionales a demanda. Hay 116 conjuntos de datos. El de transporte ferroviario, los horarios de todos esos trenes, sus paradas, etcétera. También del transporte marítimo y del transporte aéreo. Y estos datos se van actualizando permanentemente en tiempo real. A día de hoy disponemos solo de los datos estáticos en formato GTFS (General Transit Feed Specification), también reutilizables y en un formato estándar útiles para el desarrollo posterior de aplicaciones de movilidad por los reutilizadores. Y aunque inicialmente este NAP se centró en datos estáticos, como esas rutas, horarios y paradas, se está avanzando hacia la incorporación también de datos dinámicos. De hecho, en diciembre ya tenemos además una obligación por una normativa europea que nos obliga a tener esos datos en tiempo real para, al final, mejorar toda esa planificación de transportes y la experiencia de usuario.
3. El tercer conjunto de datos es Hermes. Es el sistema de información geográfico de la red de transportes de interés general. ¿Cuál es su objetivo? Ofrecer una visión integral, en este caso georreferenciada. Aquí quiero hacer referencia a lo que ha comentado mi compañera Alicia, para que veáis cómo todos vamos colaborando unos con otros. No inventamos nada, sino que todo está proyectado sobre esos ejes de los viales, por ejemplo, de RT, la información geográfica de referencia de la red de transporte. Y lo que se hace es añadir todos esos parámetros técnicos, como un valor añadido para tener un sistema de información completo, integral, multimodal, de carreteras, ferrocarriles, puertos, aeropuertos, terminales ferroviarias y también vías navegables. Es un GIS (Sistema de Información Geográfica), con lo cual permite todo ese análisis, no solo descarga, consulta, con esos servicios web que ponemos al servicio de la ciudadanía en abierto, también en un catálogo de datos abiertos hecho con CKAN, que luego comentaré. Bueno, al final son más de 300 parámetros consultables. ¿De qué estamos hablando? Sobre cada tramo de carretera, se conoce la intensidad media de tráfico, la velocidad media, la capacidad de las infraestructuras, actuaciones planificadas también -no solo la red en servicio, sino también la red planificada, las actuaciones que tiene previstas hacer el Ministerio-, las titularidades de la vía, las longitudes, velocidades, accidentes... bueno, muchísimos parámetros, modos de acceso, proyectos cofinanciados, temas de combustibles alternativos, la red transeuropea de transportes, etcétera. Ese es el tercero de los conjuntos de datos.
4. El cuarto conjunto quizá es el más voluminoso porque son 16 GB al día. Es el proyecto que le llamamos Big Data Movilidad. Este proyecto es una iniciativa pionera que utiliza tecnologías Big Data y de inteligencia artificial para analizar en profundidad los patrones de movilidad en el país se basa principalmente en el análisis de los registros anonimizados de telefonía móvil de la población para obtener información detallada sobre todos los desplazamientos de las personas no individualizados, sino agregados a nivel de distrito censal. Desde 2020 se realiza un estudio diario de movilidad y se dan todos estos datos en abierto. Eso es la movilidad por horas, por origen / destino que nos permite monitorizar y evaluar la demanda de transportes para planificar mejoras en esas infraestructuras y servicios. Además, como se dan los datos en abierto, se puede utilizar para cualquier fin, para fines turísticos, para investigaciones…
-
¿Cómo se generan y recopilan estos datos? ¿A qué retos hay que hacer frente en este proceso y cómo los solventáis?
Alicia González: Concretamente, en el ámbito de los productos que se generan tecnológicamente en entornos de sistema de información geográfica y bases de datos geoespaciales, al final se trata de proyectos en los que la base fundamental es la captura de datos y la integración de fuentes de referencia existentes. Cuando vemos que el titular tiene un dato, ese es el que hay que integrar. De una forma resumida, en los trabajos técnicos principales, se podrían identificar:
- Por un lado, la captura, es decir, cuando queremos almacenar un objeto geográfico hay que digitalizarlo, dibujarlo. ¿Sobre dónde? Sobre una base métrica adecuada como son las ortofotografías aéreas del Plan Nacional de Ortofotografía Aérea (PNOA), que también es otro conjunto de datos que está disponible y abierto. Bueno, nosotros cuando tenemos, por ejemplo, que dibujar o digitalizar una carretera, vamos trazándolo sobre esa imagen aérea que nos proporciona PNOA.
- Una vez que tenemos capturada esa componente geométrica, hay que dotarle de una atribución y no vale cualquier dato, tienen que ser fuentes oficiales. Entonces, tenemos que localizar quién es el titular de esa infraestructura o quién es el proveedor del dato oficial para detectar cuáles son los atributos, la caracterización que queremos darle a esa información, que en principio era solamente geométrica. Para eso hay que hacer una serie de procesos de validación de la fuente, detectar que no tiene incidencias y unos procesos que llamamos de integración, que son bastante complejos para garantizar que el resultado cumple lo que queremos.
- Y, por último, una fase fundamental en todos estos proyectos es el aseguramiento de la calidad geométrica y semántica. Es decir, hay que desarrollar y ejecutar una serie de controles de calidad que permitan validar el producto, el resultado final de esa integración y confirmar que cumple con los requisitos indicados en la especificación de producto.
En cuanto a retos, un desafío fundamental es la gobernanza de los datos, es decir, el resultado que se genera se alimenta de ciertas fuentes, pero al final se crea el resultado. Luego hay que definir bien el rol de cada proveedor que después quizá posteriormente sea usuario. Otro desafío en todo este proceso es la localización de proveedores de datos. A veces el responsable de esa infraestructura o del objeto que queramos almacenar en base de datos no publica la información de una forma estandarizada o es difícilmente localizable porque no está en un catálogo. A veces es complicado localizar la fuente oficial que necesitas para completar la información geográfica. Y ya mirando un poco al usuario, yo resaltaría que otro reto es el identificar, el tener la agilidad para identificar de una forma flexible y rápida los casos de uso que van cambiando con los usuarios, que nos van demandando, porque al final se trata de continuar siendo relevantes para la sociedad. Por finalizar, y porque el Instituto Geográfico es un entorno científico técnico y esta parte nos afecta mucho, otro desafío es la transformación digital, es decir, estamos trabajando en proyectos tecnológicos, luego tenemos que tener también bastante capacidad de gestión del cambio y adaptarnos a las nuevas tecnologías.
Tania Gullón: Respecto a cómo se generan y recopilan los datos y los retos que enfrentamos, por ejemplo, el NAP, del Punto de Acceso Nacional de Transporte multimodal, es una generación colaborativa, es decir, aquí los datos provienen de las propias comunidades autónomas, de los consorcios y de las empresas de transporte. El reto es que hay muchas comunidades autónomas que todavía no están digitalizadas, son muchas empresas… La digitalización del sector va lenta -va, pero va lenta-. Al final hay datos incompletos, datos duplicados. No está todavía bien definida la gobernanza. Nos pasa que, imaginaros, la empresa ALSA sube todos sus autobuses, pero tiene autobuses en todas las comunidades autónomas. Y si a la vez la comunidad autónoma sube sus datos, esos datos están duplicados. Es tan sencillo como eso. Es verdad que estamos empezando y todavía no está bien definida esa gobernanza, para que no sobren datos. Antes faltaban y ahora casi sobran.
En Hermes, el sistema de información geográfico, lo que se hace, como he dicho, es proyectarlo sobre la información de las redes de transporte, que es la oficial que ha comentado Alicia, y se integran datos de los diferentes gestores y administradores de infraestructuras, como son Adif, Puertos del Estado, AENA, la Dirección General de Carreteras, ENAIRE, etcétera. ¿Cuál es el principal reto - si tuviera que destacar, porque de esto nos podemos tirar hablando una hora-? Nos ha costado mucho, llevamos siete años con este proyecto y ha costado mucho porque, primero, la gente no se lo creía. No creían que iba a funcionar y no colaboraban. Al final todo esto es llamar a la puerta de Adif, de AENA y cambiar esa conciencia en la que los datos no pueden estar en un cajón, sino que hay que ponerlos todos al servicio del bien común. Y yo creo que eso es lo que nos ha costado un poco más. Además, está el tema de la gobernanza, que ya lo ha comentado Alicia. Vas a pedir un dato y en la propia organización no saben bien quién es el propietario de ese dato, porque quizá el dato de tráfico lo manejan diferentes departamentos. ¿Y quién es el propietario? Todo esto es muy importante.
Hemos de decir que justo Hermes ha sido el gran impulsor de las oficinas del Dato, de la oficina del Dato de Adif. Al final se han ido dando cuenta de que lo que necesitaban era poner orden en su casa, igual que en la casa de todos y en el Ministerio también, que se necesitan oficinas del Dato.
En el proyecto Big Data, ¿cómo se generan los datos? En este caso es completamente diferente. Es un proyecto pionero, más de nuevas tecnologías, en el que los datos se generan a partir de los registros anonimizados de telefonía móvil. Entonces, mediante la reconstrucción de toda esa gran cantidad de datos de Big Data, de los registros que hay en cada antena de España, con inteligencia artificial y con una serie de algoritmos, se reconstruyen y se hacen esas matrices. Luego, esos datos de esa muestra – al final tenemos una muestra de un 30 % de la población, de más de 13 millones de líneas móviles- se extrapola con datos abiertos del INE. Y luego, ¿qué hacemos también? Se calibra con fuentes externas, es decir, con fuentes de referencia cierta, como puede ser el billetaje de AENA, de los vuelos, los datos de Renfe, etc. Vamos calibrando ese modelo para poder generar esas matrices con calidad. Los retos: que es muy experimental. Para que os hagáis una idea, somos el único país que tiene todos estos datos. Entonces hemos ido abriendo brecha y aprendiendo por el camino. La dificultad es, otra vez, los datos. Esos datos para calibrar, nos cuesta Dios y ayuda encontrarlos y que nos los den con una periodicidad determinada y demás, porque esto va en tiempo real y necesitamos permanentemente ese flujo de datos. También la adaptación al usuario, que lo ha dicho Alicia. Nos debemos adaptar a lo que va demandando la sociedad y los reutilizadores de este Big Data. E irnos acompasando también, como ha dicho Alicia, a la tecnología, que no es lo mismo el dato de telefonía que hay ahora que el que había hace dos años. Y el gran reto del control de calidad. Pero bueno, aquí yo creo que le voy a dejar a Alicia, que es la súper experta, que nos explique qué mecanismos existen para garantizar que los datos sean fiables y actualizados y comparables. Y luego yo os doy mi visión, si te parece.
Alicia González: ¿Cómo se puede garantizar la fiabilidad, actualización y comparación? La fiabilidad no sé si se puede garantizar, pero creo que puede haber un par de indicadores que son especialmente relevantes. Uno, es el grado de conformidad de un conjunto de datos a la normativa que le atañe. En el ámbito de la información geográfica, la forma de trabajar es siempre normalizada, es decir, hay una familia de ISO 19100 de Información Geográfica/Geomática o la propia Directiva INSPIRE, que condiciona mucho la forma de trabajar y de publicar los datos. Y también, mirando en la administración pública, creo que el marchamo de oficialidad también debería de ser un garante de fiabilidad. Es decir, nosotros cuando tratamos los datos debemos hacerlo de una forma homogénea y sin sesgos, mientras que quizá, a lo mejor, una empresa privada pueda estar condicionada por ellos. Creo que esos dos parámetros son importantes, que pueden indicar fiabilidad.
En cuanto a grado de actualización y comparación de los datos, creo que esa información el usuario la deduce de los metadatos. Los metadatos al final son la carta de presentación de los conjuntos de datos. Entonces, si un conjunto de datos está correctamente y de forma veraz metadatado y además está hecho conforme a perfiles estándar -igual en el ámbito GEO, pues hablamos del perfil INPIRE o GeoDCAT-AP- , si distintos conjuntos de datos están definidos en sus metadatos conforme a estos perfiles normalizados, es mucho más fácil ver si son comparables y el usuario puede determinar y decidir si finalmente satisface sus requisitos de actualización y de comparabilidad con otro conjunto de datos.
Tania Gullón: Totalmente Alicia. Y si me permites complementar, nosotros, por ejemplo, en el Big Data hemos estado siempre muy empeñados en medir la calidad -más justo cuando son nuevas tecnologías que, al principio, la gente no se fiaba de qué resultados salen de todo esto-. Siempre intentando medir esta calidad - que, en este caso, es muy difícil porque son grandes conjuntos de datos-, desde el principio empezamos a diseñar unos procesos que tardan. Tarda siete horas el proceso de control de calidad diario de los datos, pero es verdad que al principio teníamos que detectar si se había caído alguna antena, si había ocurrido alguna cosa… Entonces hacemos un control con parámetros estadísticos y demás de consistencia interna y lo que detectamos aquí son las anomalías. Lo que estamos viendo es que el 90 % de las anomalías que salen son anomalías reales de movilidad. O sea, no ocurren errores en los datos, sino que son anomalías: ha habido una manifestación o ha habido un partido de fútbol. Son temas que distorsionan la movilidad. O ha habido una tormenta o una lluvia o cualquier cosa de estas. Y es importante no solo controlar esa calidad y ver si hay anomalías, sino que también creemos que es muy importante publicar esos criterios de calidad: el cómo estamos midiendo la calidad y sobre todo los resultados. Diariamente no solo damos el dato, sino que damos este metadato, que dice Alicia, de calidad, de cómo era la muestra ese día, de esos valores que se han obtenido de anomalías. Esto se da también en abierto: no solo el dato, sino el metadato. Y luego también publicamos las anomalías y el porqué de esos errores. Cuando se encuentran errores decimos “vale, es que ha habido una anomalía porque en el pueblo - no sé qué imaginaros, es toda España – del Casar era la fiesta de la torta del Casar”. Y ya está, se ha encontrado la anomalía y se publica.
¿Y cómo se mide otro parámetro de calidad: la exactitud temática? En este caso, comparando con fuentes de referencia cierta. Sabemos que la evolución respecto a sí mismo ya está muy controlada con esa consistencia lógica interna, pero también hay que compararlo con lo que ocurre en el mundo real. Lo hablaba antes con Alicia, decíamos “los datos son fiables, pero ¿cuál es la realidad de la movilidad? ¿Quién la conoce?” Al final tenemos algunas pistas, como en los billetajes de cuántos se han subido a los autobuses. Si tenemos ese dato, tenemos una pista, pero de la gente que va andando y de la gente que coge su coche y demás ¿cuál es la realidad? Es muy difícil tener un punto de comparación, pero sí que comparamos con todos los datos de AENA, de Renfe, de las concesiones de autobuses y se pasan todos esos controles para determinar cuánto nos desviamos de esa realidad que podemos conocer.
-
Todos estos datos sirven de base para desarrollar aplicaciones y soluciones, pero también son fundamentales a la hora de tomar decisiones y acelerar la implementación de los ejes centrales, por ejemplo, de la Estrategia de Movilidad Segura, Sostenible y Conectada o del Proyecto de Ley de Movilidad Sostenible. ¿Cómo se usan estos datos para tomar estas decisiones reales?
Tania Gullón: Si me permites, primero quiero hacer una introducción a esta estrategia y a la Ley en torno al dato para los que no lo conozcan. Uno de los ejes, el eje 5 de la Estrategia de Movilidad Segura Sostenible y Conectada 2030 del Ministerio es el de “Movilidad inteligente”. Y justo está centrado en esto y tiene como objetivo principal impulsar la digitalización, innovación y el uso de tecnologías avanzadas para mejorar esa eficiencia, sostenibilidad y experiencia de usuario en el sistema de transportes de España. Y justo una de las medidas de ese eje es la “facilitación de la Movilidad como Servicio (Mobility as a Service), Datos Abiertos y Nuevas Tecnologías”. O sea que justo aquí es donde se enmarcan todos estos proyectos que estamos comentando. De hecho, una submedida es impulsar la publicación de datos abiertos de movilidad, otra es el realizar análisis de flujos de movilidad y otra de las medidas, la última, es la creación de un espacio de datos integrado de movilidad. Me gustaría destacar -y aquí ya entronco con ese Proyecto de Ley que esperemos que pronto lo veamos aprobado- que la Ley, en el artículo 89 regula el Punto de Acceso Nacional, que también vemos cómo está metido en este instrumento legislativo. Y luego la Ley establece un instrumento digital clave para el Sistema Nacional de Movilidad Sostenible: fijaros la importancia que se la da al dato que en una ley de movilidad se ponga por escrito que este espacio de datos integrado de movilidad es un instrumento digital clave. Este espacio de datos es un ecosistema de compartición de datos confiable, materializado como la infraestructura digital gestionada por el Ministerio de Transportes y en coordinación con la SEDIA (la Secretaría de Estado de Digitalización e Inteligencia Artificial), cuyo objetivo es centralizar y estructurar la información sobre movilidad generada por administraciones públicas, operadores de transporte, gestores de infraestructuras, etc. y garantizar ese acceso abierto a todos estos datos para todas las administraciones bajo condiciones reglamentarias.
Alicia González: Yo en este caso quiero decir que cualquier toma de decisiones objetiva, por supuesto, se tiene que hacer a partir de datos que, como decíamos antes, tienen que ser fiables, actualizados y comparables. En este sentido, indicar que el IGN, el soporte fundamental que ofrece al Ministerio para el despliegue de la Estrategia de Movilidad Segura, Sostenible y Conectada, es la provisión de datos de servicios y análisis complejos de información geoespacial. Muchos de ellos, por supuesto, sobre el conjunto de datos que venimos hablando de redes de transporte.
En este sentido, mencionar como ejemplo los mapas de accesibilidad con los que contribuimos al eje 1 de la estrategia “Movilidad para todos”, en el que, a través de la Mesa de Movilidad Rural, se solicitó al IGN si podíamos generar unos mapas que representaran el coste en tiempo y en distancia que le cuesta a cualquier ciudadano, viviendo en cualquier núcleo de población, acceder a la infraestructura de transporte más cercana, empezando por red viaria. Es decir, cuánto le cuesta a un usuario en esfuerzo, tiempo y distancia, acceder desde su casa a la autopista o autovía más cercana y luego, por extensión, a cualquier carretera de la red básica. Hicimos ese análisis - por lo que decía que esta red vertebra todo el territorio, es continua - y esos resultados finalmente los publicamos vía web. Son datos también abiertos, cualquier usuario los puede consultar y, además, también los ofrecemos no solamente de forma numérica, sino representado en distintos tipos de mapas. Al final, esa visibilización geolocalizada del resultado aporta un valor fundamental y facilita, por supuesto, la toma de decisiones estratégicas en materia de planificación de infraestructuras.
Otro ejemplo a destacar que es posible gracias a la disponibilidad de datos abiertos, es el cálculo de indicadores de seguimiento de los Objetivos de Desarrollo Sostenible de la Agenda 2030. Actualmente, en colaboración con el Instituto Nacional de Estadística, estamos trabajando en el cálculo de varios de ellos, incluyendo uno asociado directamente a Transportes, que trata de hacer el seguimiento del objetivo 11, que es el de lograr que las ciudades sean más inclusivas, seguras, resilientes y sostenibles.
-
Hablando de esta toma de decisiones basada en datos, también existe cooperación a nivel de generación y reutilización de datos entre distintas administraciones públicas. ¿Nos podéis contar algún ejemplo de proyecto?
Tania Gullón: Yo te contesto también eso a la toma de decisiones basada en datos que antes me he ido por las ramas con el tema de la Ley. También se puede decir que todos esos datos de Big Data, Hermes y todo lo que hemos comentado están favoreciendo ese cambio del Ministerio y de las organizaciones hacia organizaciones basadas en datos, que significa que las decisiones se basan en ese análisis de datos objetivos. Cuando preguntas así por un ejemplo, es que tengo tantos que no sabría qué contarte. En el caso de los datos Big Data, se están utilizando para la planificación de infraestructuras desde hace unos años. Antes se hacía con encuestas y se dimensionaba porque ¿cuántos carriles pongo en una carretera? O algo muy básico, ¿cuánta frecuencia necesitamos en un tren? Pues eso, como no tengas datos de cuál va a ser la demanda, no puedes planificarlo. Esto se hace con los datos de Big Data, no solo el Ministerio sino, como están en abierto, los usan todas las administraciones, todos los ayuntamientos y todos los gestores de infraestructuras. Conocer las necesidades de movilidad de la población nos permite adecuar nuestras infraestructuras y nuestros servicios a esas necesidades reales. Por ejemplo, ahora se están estudiando los servicios de cercanías en Galicia. O imaginaros el soterramiento de la A-5. También se utilizan para emergencias, que no lo hemos comentado, pero también están siendo clave. Siempre nos damos cuenta de que cuando hay una emergencia, de repente todo el mundo piensa “datos, ¿dónde hay datos?, ¿dónde están los datos abiertos?”, pues han sido fundamentales. Os puedo contar, en el caso de la Dana, que es quizá el más reciente se quedaron gravemente afectadas varias líneas de tren de cercanías, se destrozaron las vías, y el 99 % de los vehículos de las personas que vivían en Paiporta, en Torrent, en toda la zona afectada, se quedaron inutilizados. Y el 1 % era porque no estaba en la zona de la Dana en ese momento. Entonces había que restablecer la movilidad cuanto antes, pues gracias a estos datos abiertos en una semana había unos autobuses haciendo unos servicios alternativos de transporte que se habían planificado con los datos de Big Data. O sea que fijaros el impacto sobre la población.
Hablando de emergencias, este proyecto nació justo por una emergencia, por el COVID. O sea, el estudio, este Big Data, nació en 2020 porque desde Presidencia de Gobierno se nos encargó monitorizar esa movilidad diariamente y darla en abierto. Y aquí enlazo con esa colaboración entre administraciones, organizaciones, empresas, universidades. Porque fijaros, estos datos de movilidad alimentaban los modelos epidemiológicos. Aquí trabajamos con el Instituto Carlos III, con el Barcelona Supercomputing Center, con estos institutos y centros de investigación que estaban empezando a dimensionar las camas de los hospitales para la segunda ola. Cuando todavía estábamos en la primera ola, no sabíamos ni lo que era una ola y ya nos estaban diciendo “ojo, porque va a haber una segunda ola, y con estos datos de movilidad y demás vamos a poder dimensionar cuántas camas se van a necesitar, según también el modelo epidemiológico”. Fijaos la reutilización tan importante. Estos datos, por ejemplo, de Big Data sabemos que los están utilizando miles de empresas, administraciones, centros de investigación, investigadores de todo el mundo. Además, nos llegan consultas de Alemania, de todos los países, porque en España yo somos un poco pioneros en esto de dar todos los datos en abierto. Estamos ahí creando escuela y no solo para transporte, sino para temas de turismo también, por ejemplo.
Alicia González: Nosotros, en el ámbito de la información geográfica, a nivel de cooperación, tenemos un instrumento específico que es el Sistema Cartográfico Nacional, que directamente promueve la coordinación en la actuación de las distintas administraciones en materia de información geográfica. No sabemos trabajar de otra forma que no sea cooperando. Y un ejemplo claro es el mismo conjunto del que venimos hablando: el conjunto de información geográfica de referencia de redes de transporte es el resultado de esta cooperación. Es decir, a nivel nacional lo impulsa y promueve el Instituto Geográfico, pero en su actualización, en su producción también participan agencias cartográficas autonómicas con diferente rango de colaboración. Incluso se llega a alcanzar el máximo de hacer coproducción de datos de ciertos subconjuntos en determinadas zonas. Además, una de las características de este producto es que se genera a partir de datos oficiales de otras fuentes. Es decir, ahí ya hay colaboración sí o sí. Hay cooperación porque hay una integración de datos, porque al final hay que rellenarlo con los datos oficiales. Y de partida, a lo mejor son datos que facilita INE, el Catastro, las propias agencias cartográficas, los callejeros locales… Pero, una vez que se ha conformado el resultado, como comentaba antes, el resultado tiene un valor añadido que es de interés para el propio proveedor original. Por ejemplo, este conjunto de datos se reutiliza internamente, en la casa, en el IGN: cualquier producto o servicio que precise de información de transporte se alimenta de este conjunto de datos. Ahí hay una reutilización interna, pero, además, en el ámbito de las administraciones públicas, en todos los niveles. En la estatal, pues, por ejemplo, en el Catastro, una vez que se ha generado el resultado, les es de interés para estudios de análisis de la delimitación del dominio público asociado a las infraestructuras, por ejemplo. O el propio Ministerio, como comentaba antes Tania. Hermes se generó a partir de un tratamiento de datos de RT, de los datos de redes de transporte. La Dirección General de Carreteras utiliza redes de transporte en su gestión interna para hacerse un mapa de tráfico, su gestión de catálogo, etcétera. Y en las propias comunidades autónomas, igualmente el resultado que se genera les es de utilidad en las agencias cartográficas o incluso a nivel local. Luego hay una reutilización cíclica continua, como tiene que ser, al final todo es dinero público y tiene que reutilizarse al máximo posible. Y en el ámbito privado, también se reutiliza y se generan servicios de valor añadido a partir de estos datos que se facilitan en múltiples casos de uso. Por no extenderme, simplemente eso: participamos facilitando datos sobre los que se generan servicios de valor añadido.
-
Y ya para terminar, podréis recapitular brevemente alguna idea que resalte el impacto en la vida cotidiana y el potencial comercial de estos datos para para los reutilizadores.
Alicia González: Muy brevemente, yo creo que el impacto fundamental en la vida cotidiana es que la distribución de datos abiertos ha permitido democratizar el acceso a los datos a todo el mundo, a empresas, pero también a ciudadanos; y, sobre todo, creo que ha sido fundamental en el ámbito académico, en el que seguramente, actualmente, es más fácil desarrollar ciertas investigaciones que en otros tiempos era más complejo. Y otro impacto en la vida cotidiana es la transparencia institucional que ello implica. Y en cuanto al potencial comercial de reutilizadores, reitero la idea anterior: la disponibilidad de datos impulsa la innovación y el incremento de soluciones de valor añadido. En este sentido, mirando una de las conclusiones del informe que se realizó en 2024 por ASEDIE; la Asociación de Empresas Infomediarias, sobre el impacto que tenían los datos geoespaciales que publica el CNIG en el sector privado, hubo un par de conclusiones bastante importantes. Una de ellas decía que cada vez que se libera un nuevo conjunto de datos se incentiva a los reutilizadores a generar soluciones de valor añadido y, además, les permite focalizar sus esfuerzos en ese desarrollo de innovación y no tanto en la captura del dato. Y también de ese informe se desprendía que desde la adopción de la política de datos abiertos que mencioné al principio, que se adoptó en 2015 por parte del IGN, el 75 % de las empresas encuestadas respondió que había podido ampliar de forma muy significativa el catálogo de productos y servicios basados en estos datos que son abiertos. Luego, yo creo que el impacto finalmente es enriquecedor para toda la sociedad.
Tania Gullón: yo suscribo todas las palabras de Alicia, totalmente de acuerdo. Y además, que los pequeños operadores de transporte y los ayuntamientos con menos recursos tengan a su disposición todos estos datos abiertos y gratuitos de calidad y el acceso a las herramientas digitales que les permitan competir en igualdad de condiciones. En el caso de las empresas o ayuntamientos, imaginaros poder planificar sus transportes y ser más eficientes. No solo les ahorra dinero, sino que ganan al final en el servicio al ciudadano. Y desde luego, el hecho de que en el sector público se tome las decisiones basadas en datos y se fomente ese ecosistema de compartición de datos, favoreciendo el desarrollo de aplicaciones de movilidad, por ejemplo, tiene un impacto directo en la vida cotidiana de las personas. O también el tema de las ayudas al transporte: el que se estudie con esos datos de demanda el impacto de las ayudas al transporte con datos de accesibilidad y demás. Se estudia quiénes son los más vulnerables y al final, ¿qué hace? Pues que las políticas sean cada vez más justas y esto, obviamente impacta en el ciudadano. Que las decisiones sobre cómo invertir el dinero de todos, de nuestros impuestos, el cómo invertirlo en infraestructuras o en ayudas o en servicios, se base en datos objetivos y no en intuiciones, sino en datos reales. Esto es lo más importante.