Blog

Los datos abiertos pueden transformar cómo interactuamos con nuestras ciudades, ofreciendo oportunidades para mejorar la calidad de vida. Cuando se ponen a disposición del público, permiten el desarrollo de aplicaciones innovadoras y herramientas que abordan desafíos urbanos, desde la accesibilidad hasta la seguridad vial y la participación.

La información en tiempo real puede tener impactos positivos en la ciudadanía. Por ejemplo, aplicaciones que utilizan datos abiertos pueden sugerir las rutas más eficientes, considerando factores como el tráfico y las obras en curso; la información sobre la accesibilidad de espacios públicos puede mejorar la movilidad de personas con discapacidades; los datos sobre rutas ciclistas o peatonales animan a optar por modos de transporte más ecológicos y sanos, y el acceso a datos urbanos puede empoderar a la ciudadanía para participar en la toma de decisiones sobre su ciudad. En otras palabras, el empleo ciudadano de datos abiertos no solo mejora la eficiencia de la ciudad y sus servicios, sino que también promueve una ciudad más inclusiva, sostenible y participativa.

Para ilustrar estas ideas, en este artículo se abordan mapas para “navegar” ciudades, realizados con datos abiertos. Es decir, se muestran iniciativas que mejoran la relación de la ciudadanía con su entorno urbano desde diferentes aspectos como la accesibilidad, la seguridad escolar o la participación ciudadana. El primer proyecto es Mapcesible, que permite a usuarios y usuarias mapear y evaluar la accesibilidad de diferentes lugares en España. El segundo, Eskola BideApp, una aplicación móvil diseñada para apoyar los caminos escolares seguros. Y finalmente, unos mapas que fomentan la transparencia y la participación ciudadana en la gestión urbana. El primero identifica la contaminación acústica, el segundo ubica los servicios disponibles en varias áreas que se encuentran a un máximo de 15 minutos y el tercero visualiza los bancos que hay en la ciudad. Estos mapas utilizan diversas fuentes de datos públicos para ofrecer una visión detallada de diferentes aspectos de la vida urbana.

La primera iniciativa es un proyecto de una gran fundación, la segunda, una propuesta colaborativa y local, y la tercera, un proyecto personal. Aunque parten de planteamientos muy diferentes, las tres tienen en común el uso de datos públicos y abiertos y la vocación de ayudar a entender y vivir la ciudad. La variedad de orígenes de estos proyectos indica que el uso de datos públicos y abiertos no está limitado a grandes organizaciones.

A continuación, realizamos un resumen de cada proyecto, seguido de una comparación y una reflexión sobre el empleo de datos públicos y abiertos en entornos urbanos.

Mapcesible, mapa para personas con movilidad reducida

Mapcesible se lanzó en 2019 para evaluar la accesibilidad de diversos espacios como comercios, aseos públicos, estacionamientos, alojamientos, restaurantes, espacios culturales y entornos naturales.

Figura 1. Mapcesible. Fuente: https://mapcesible.fundaciontelefonica.com/intro

Este proyecto cuenta con el apoyo de organizaciones como la ONG Confederación Española de Personas con Discapacidad Física y Orgánica (COCEMFE) y la empresa ILUNION. Actualmente cuenta con más de 40.000 espacios accesibles evaluados y miles de usuarios y usuarias.

Figura 2. Mapcesible. Fuente: https://mapcesible.fundaciontelefonica.com/filters

Mapcesible utiliza datos abiertos como parte de su funcionamiento. Específicamente, la aplicación incorpora catorce conjuntos de datos de organismos oficiales, incluyendo del Ministerio de Agricultura y Medioambiente, ayuntamientos de diferentes ciudades (incluidos Madrid y Barcelona) y de los gobiernos autonómicos. Estos datos abiertos se combinan con la información aportada por las personas usuarias de la aplicación, que pueden mapear y evaluar la accesibilidad de los lugares que visitan. Esta combinación de datos oficiales y colaboración ciudadana permite a Mapcesible proporcionar información actualizada y detallada sobre la accesibilidad de diversos espacios en toda España, beneficiando así a las personas con movilidad reducida.

Eskola BideAPP, aplicación para definir trayectos escolares seguros

Eskola BideAPP es una aplicación desarrollada por Montera34 –un equipo que se dedica a la visualización de datos y el desarrollo de proyectos colaborativos— en alianza con la Asociación Solasgune para apoyar los caminos escolares. Eskola BideAPP ha servido para garantizar que los niños y las niñas puedan acceder a sus escuelas de manera segura y eficiente. El proyecto usa sobre todo datos públicos del callejero de OpenStreetMap, por ejemplo, datos geográficos y cartográficos de calles, aceras, cruces, así como datos recabados durante el proceso de creación de rutas seguras para que los niños y las niñas vayan andando a sus colegios con el objetivo de promover su autonomía y la movilidad sostenible.

La aplicación ofrece un panel de control interactivo para visualizar los datos recopilados, la generación de mapas en papel para sesiones con el alumnado, y la creación de informes para técnicos municipales. Utiliza tecnologías como QGIS (un sistema de información geográfica de software libre y de código abierto) y un entorno de desarrollo para el lenguaje de programación R, dedicado a la computación estadística y gráficos.

El proyecto se divide en tres etapas principales:

  1. Recolección de datos mediante cuestionarios en las aulas.
  2. Análisis y discusión de resultados con los niños para co-diseñar rutas personalizadas.
  3. Prueba de las rutas diseñadas.

Figura 3. Eskola BideaAPP. Foto de Julián Maguna (Solasgune). Fuente: https://montera34.com/project/eskola-bideapp/

Pablo Rey, uno de los promotores de Montera34 junto con Alfonso Sánchez, informa para este artículo de que Eskola BideAPP, desde 2019, se ha usado en ocho municipios, incluidos Derio, Erandio, Galdakao, Gatika, Plentzia, Leioa, Sopela y Bilbao. Sin embargo, ahora mismo sólo está operativa en los dos últimos mencionados. “La idea es implementarla en Portugalete a principios de 2025”, añade.

Merece la pena recordar los mapas de Montera34 que mostraban el “efecto” AirBnB en San Sebastián y en otras ciudades, y los análisis de datos y mapas publicados durante la epidemia de COVID-19, que también visualizaban datos públicos. Además, Montera34 ha usado datos públicos para analizar la abstención, segregación escolar, contratos menores o poner los datos abiertos a disposición del público. Para este último proyecto, Montera34 ha comenzado por las ordenanzas del ayuntamiento de Bilbao y las actas de sus plenos, de manera que no solo estén disponibles en un documento PDF sino en forma de datos abiertos y accesibles.

Mapas de Madrid sobre contaminación acústica, servicios y ubicación de bancos

Abel Vázquez Montoro ha realizado diversos mapas con datos abiertos que resultan muy interesantes, por ejemplo, el elaborado con datos del Mapa Estratégico de Ruido (MER) ofrecido por el Ayuntamiento de Madrid y datos del catastro. El mapa muestra el ruido que afecta a cada edificio, fachada y planta en Madrid.

Figura 4. Mapas del ruido en Madrid. Fuente: https://madb.netlify.app/

Este mapa se organiza como un dashboard con tres secciones: datos generales de la zona visible en el mapa, mapa dinámico en 2D y 3D con opciones configurables e información detallada de edificios específicos. Se trata de una plataforma abierta, gratuita y de uso no comercial que usa software libre y de código abierto como GitLab — una plataforma web de gestión de repositorios Git— y QGIS. El mapa permite evaluar el cumplimiento de las normativas de ruido y el impacto en la calidad de vida, ya que también calcula el riesgo para la salud asociado a los niveles de ruido, utilizando la proporción de riesgo atribuible (RA%).

15-minCity es otro mapa interactivo que visualiza el concepto de la "ciudad de 15 minutos" aplicado a diferentes áreas urbanas; es decir, calcula cuán accesibles son diferentes servicios dentro de un radio de 15 minutos a pie o en bicicleta desde cualquier punto de la ciudad seleccionada.

Figura 5. 15-minCity. Fuente: https://whatif.sonycsl.it/15mincity/15min.php?idcity=9166

Por último, "Dónde sentarse en Madrid" es otro mapa interactivo que expone la ubicación de bancos y otros lugares para sentarse en espacios públicos de Madrid, destacando las diferencias entre barrios ricos (generalmente con más asientos públicos) y pobres (con menos). Este mapa utiliza la herramienta para creación de mapas, Felt, para visualizar y compartir información geoespacial de forma accesible. El mapa presenta diferentes tipos de asientos, incluyendo bancos tradicionales, asientos individuales, gradas y otros tipos de estructuras para sentarse.

Figura 6. Dónde sentarse en Madrid. Fuente: https://felt.com/map/Donde-sentarse-en-Madrid-TJx8NGCpRICRuiAR3R1WKC?loc=40.39689,-3.66392,13.97z

Sus mapas visualizan datos públicos de información demográfica (por ejemplo, datos poblacionales distribuidos por edades, género y nacionalidades), información urbanística sobre el uso del suelo, edificaciones y espacios públicos, datos socioeconómicos (por ejemplo, renta, empleo y otros indicadores económicos de los diferentes distritos y barrios), datos medioambientales, incluyendo calidad del aire, zonas verdes y otros aspectos relacionados, y datos sobre la movilidad.

¿Qué tienen en común?

Nombre Promotor/a Tipo de datos usados  Afán de lucro Usuarios/as Características
Mapcesible Fundación Telefónica. Combina datos generados por usuarios/as y datos públicos (14 conjuntos de datos abiertos de organismos oficiales) Sin ánimo de lucro.         Más de 5.000 App colaborativa, disponible en iOS y Android, más de 40.000 puntos accesibles mapeados.
Eskola BideAPP Montera34 y Asociación Solasgune. Combina datos generados por usuarios/as y públicos (cuestionarios en aulas) y algunos datos abiertos.  Sin ánimo de lucro.                4.185 Enfocada en rutas escolares seguras, usa QGIS y R para procesamiento de datos
Mapa Estratégico de Ruido (MER) Ayuntamiento de Madrid. Datos geográficos y de zona visible en 2D y 3D Sin ánimo de lucro.  No existen cifras públicas Permite evaluar el cumplimiento de las normativas de ruido y el impacto en la calidad de vida, ya que también calcula el riesgo para la salud asociado
15 min-City Sony GSL Servicios y datos geográficos. Sin ánimo de lucro.   No existen cifras públicas Mapa interactivo que visualiza el concepto de la "ciudad de 15 minutos" aplicado a diferentes áreas urbanas
MAdB "Dónde sentarse en Madrid" Particular Datos públicos (demográficos, electorales, urbanísticos, socioeconómicos, etc.) Sin ánimo de lucro.  No existen cifras públicas Mapas interactivos de Madrid

Figura 7. Tabla comparativa de las soluciones  

Estos proyectos comparten el enfoque de emplear datos abiertos para mejorar el acceso a los servicios urbanos, aunque difieren en sus objetivos específicos y en la forma de recopilar y presentar la información. Mapcesible, Eskola BideApp, MAdB y "Dónde sentarse en Madrid" tienen un gran valor.

Por un lado, Mapcesible ofrece información unificada y actualizada que permite a personas con discapacidad moverse por la ciudad y acceder a los servicios. Eskola BideApp involucra a la comunidad en el diseño y testeo de rutas seguras para ir caminando al colegio; esto no solo mejora la seguridad vial, sino que también empodera a los y las más jóvenes para que sean agentes activos en la planificación urbana. Entretanto, 15-min city, MER y los mapas desarrollados por Vázquez Montoro visualizan datos complejos sobre Madrid de manera que la ciudadanía pueden entender mejor cómo funciona su ciudad y cómo se toman las decisiones que les afectan.

En su conjunto, el valor de estos proyectos radica en su capacidad para crear una cultura de datos, enseñando a valorar, interpretar y utilizar la información para mejorar las comunidades.


Contenido elaborado por Miren Gutiérrez, Doctora e investigadora en la Universidad de Deusto, experta en activismo de datos, justicia de datos, alfabetización de datos y desinformación de género. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor

calendar icon
Entrevista

En este episodio vamos a profundizar en la importancia de tres de las categorías de conjuntos de datos de alto valor relacionadas entre sí. Se trata de los datos de observación de la Tierra y el medio ambiente, los datos geoespaciales y los datos de movilidad. Para hablarnos de ellas, hemos entrevistado a dos expertos en la materia:

  • Paloma Abad Power, Subdirectora adjunta del Centro Nacional de Información Geográfica (CNIG).
  • Rafael Martínez Cebolla, geógrafo del Gobierno de Aragón.

Con ellos hemos explorado cómo estos conjuntos de datos de alto valor están transformando nuestro entorno, contribuyendo al desarrollo sostenible y a la innovación tecnológica.

Escuchar el pódcast completo

Resumen de la entrevista

1. ¿Qué son los datos de alto valor y por qué son importantes?

Paloma Abad Power: Según la normativa, estos conjuntos de datos de alto valor son los que garantizan un mayor potencial socioeconómico y para ello deben ser fáciles de encontrar, es decir, deben ser accesibles, interoperables y utilizables. ¿Y qué es lo que significa esto? Pues que los conjuntos de datos deben tener sus descripciones, es decir, los metadatos en línea, que informen de las estadísticas y de sus propiedades, y que se puedan descargar o utilizar de forma fácil.

En muchos casos, estos datos suelen ser datos de referencia, es decir, datos que sirven para generar otro tipo de datos, como los datos temáticos, o pueden generar valor añadido.

Rafael Martínez Cebolla: Se podrían definir como aquellos conjuntos de datos que representan fenómenos que sirven para la toma de una decisión, para cualquier política pública o para cualquier acción que pueda emprender una persona física o jurídica.

En ese sentido, hay ya unas directivas, que ya no son tan recientes, como la Directiva del Marco del Agua o la Directiva INSPIRE, que motivaban esa necesidad de disponer datos compartidos bajo unos estándares que posibiliten el desarrollo sostenible de nuestra sociedad.

2. Estos datos de alto valor vienen marcados por una Directiva europea y un Reglamento de ejecución en el que se dictaban seis categorías de conjuntos de datos de alto valor. En esta ocasión nos vamos a centrar en tres de ellas: los datos de observación de la Tierra y el medio ambiente, los datos geoespaciales y los datos de movilidad. ¿Qué tienen en común estas tres categorías de datos y qué conjuntos de datos concretos abarcan?

Paloma Abad Power: En mi opinión estos datos tienen en común la componente geográfica, es decir, son datos ubicados sobre la Tierra y, por tanto, sirven para solucionar problemas de diferente naturaleza y vinculados a la sociedad.

Así, por ejemplo, tenemos, con una cobertura nacional, el Plan Nacional de Ortofotografía Aérea (PNOA), que son las imágenes aéreas, el Sistema de Información de Ocupación del Suelo (SIOSE), las parcelas catastrales, las líneas límite, los nombres geográficos, las carreteras, las direcciones postales, los lugares protegidos - que pueden ser tanto de tipo ambiental, como también los castillos, es decir, patrimonio histórico-, etc. Y estas categorías abarcan casi todos los temas definidos por los anexos de la directiva INSPIRE.

Rafael Martínez Cebolla: Hay que saber distinguir qué es información geográfica pura, con una referencia geográfica directa, frente a otro tipo de fenómenos que tienen referencias geográficas de tipo indirecto. En este mundo actual, el 90% de la información puede ser ubicada, ya sea de manera directa o indirecta. Hoy más que nunca, el tag geográfico es obligatorio para cualquier corporación que quiera implantar una determinada actividad, ya sea social, cultural, ambiental o económica: la implantación de energías renovables, dónde voy a ir a comer hoy, etc. Estos conjuntos de datos de alto valor potencian esas referencias geográficas, sobre todo de tipo indirecto, que nos sirven para tomar una decisión.

3. ¿Cuáles son los organismos que publican estos conjuntos de datos de alto valor? En otras palabras, ¿dónde podría un usuario localizar conjuntos de datos de estas categorías?

Paloma Abad Power: Es necesario destacar el papel del Sistema Cartográfico Nacional, que es un modelo de actuación donde participan las organizaciones de la AGE (Administración General del Estado) y las comunidades autónomas. Está coordinando la coproducción de muchos productos únicos, financiados por estas organizaciones.

Estos productos se publican a través de servicios web interoperables. Los publica, en este caso, el Centro Nacional de Información Geográfica (CNIG), quien también se encarga de muchos de los metadatos de estos productos.

Se podrían localizar a través de los catálogos de la IDEE (Infraestructura de Datos Espaciales de España) o el Catálogo Oficial de Datos y Servicios INSPIRE, que también, a su vez, está en datos.gob.es y en el European Data Portal.

¿Y quién puede publicar? Todos los organismos que tengan un mandato legal sobre un producto y ese producto esté clasificado dentro del Reglamento. Ejemplos: todos los organismos cartográficos de las Comunidades Autónomas, la Dirección General de Catastro, Patrimonio Histórico, el Instituto Nacional de Estadística, el Instituto Geológico y Minero (IGME), el Instituto Hidrográfico de la Marina, el Ministerio de Agricultura, Pesca y Alimentación (MAPA), el Ministerio para la Transición Ecológica y el Reto Demográfico, etc. Son multitud de organismos y muchos de ellos, como he comentado, participan en el Sistema Cartográfico Nacional. Dan los datos y se genera un único servicio para el ciudadano.

Rafael Martínez Cebolla: El Sistema Cartográfico Nacional define muy bien el grado de competencias que asumen las administraciones. Es decir, la administración pública a todas las escalas es la que provee de datos oficiales, ayudada por la empresa privada, algunas veces, a través de la contratación pública.

La Administración General del Estado llega hasta unas escalas 1:25.000 en el caso del Instituto Geográfico Nacional (IGN) y luego el reparto competencial del resto de escalas es para las administraciones autonómicas o locales. Además, hay una serie de actores, como las confederaciones hidrográficas, los departamentos estatales o el Catastro, que tienen bajo sus competencias la obligación legal de generar estos conjuntos de datos.

Para mí es un ejemplo de cómo se ha de repartir, aunque es cierto que luego hay que engranar muy bien, a través de organismos colegiados, para que la producción cartografía esté bien incardinada.

Paloma Abad Power: También se hacen proyectos colaborativos, como, por ejemplo, un mapa ciudadano, técnicamente conocido como mapa X, Y, Z, que consiste en capturar la cartografía de todas las organizaciones a nivel nacional y local. Es decir, desde escalas pequeñas 1:1.000.000 o 1:50.000.000, hasta escalas muy grandes, como 1:1000, para proporcionar al ciudadano un único mapa multiescala y que se pueda servir a través de servicios web interoperables y normalizados.

4. ¿Tenéis algún otro ejemplo de aplicación directa de este tipo de datos?

Rafael Martínez Cebolla:  Un ejemplo claro lo vimos con la pandemia, con los datos de movilidad que publicó el Instituto Nacional de Estadística. Fueron unos datos muy útiles para la administración, para la toma de decisiones, y con los que tenemos que aprender mucho más para la gestión de futuras pandemias y crisis, también de tipo económico. Nos tienen que servir para aprender y desarrollar nuestros sistemas de alerta temprana.

Yo creo que ahí está la línea de trabajo: datos que sean útiles para la ciudadanía en general. Por eso digo que la movilidad ha sido un ejemplo claro, porque era el propio ciudadano quien estaba informando a la administración sobre cómo se estaba moviendo.

Paloma Abad Power: Yo voy a aportar algún dato. Por ejemplo, según las estadísticas de los servicios del Sistema Cartográfico Nacional, el dato más demandado son las imágenes aéreas y los modelos digitales del terreno. En 2022 eran 8 millones de peticiones y en 2023 pasaron a 19 millones de peticiones, solamente en el caso de las ortoimágenes.

Rafael Martínez Cebolla: Me gustaría añadir que ese aumento también es porque se están haciendo bien las cosas. Por un lado, se mejoran los sistemas de descubrimiento. Mi sensación general es que proyectos de ejemplos exitosos hay muchos, tanto de la propia administración como de empresas que necesitan esa información base para generar sus productos.

Había una aplicación que se generó muy rápidamente con la desescalada - ibas a una página web y te decía hasta donde llegaba a tu término municipal-, porque la gente quería salir y andar. Este ejemplo surge de datos espaciales que se han salido de la administración pública. Yo creo que ahí radica la importancia de ejemplos exitosos, que salen de personas que ven una necesidad imperiosa.

5. ¿Y cómo se incentiva esa reutilización?

Rafael Martínez Cebolla: Yo tengo un sinfín de ejemplos. La incentivación pasa también por la promoción y el marketing, cosa que algunas veces nos ha fallado desde la administración pública. Tú te ciñes a unas competencias y parece que con que lo pongas en un sitio web ya vale. Y no es solo eso.

Nosotros estamos incentivando la reutilización de dos maneras. Por un lado, interna, en la propia administración, enseñándoles que la información geográfica sirve para la planificación y evaluación de las políticas públicas. Y os pongo el ejemplo de Atlas de Salud Pública del Gobierno Aragón, que fue premiado en el año antes de la pandemia por una sociedad ibérica de epidemiología. Para ellos fue útil para saber cómo era la salud del aragonés y qué medidas de prevención tenían que tomar.

En cuanto a los incentivos externos, en el caso del Instituto Geográfico de Aragón, se vio que el perfil que entraba al geoportal era muy técnico. Los formatos que se utilizaban eran también muy técnicos, con lo cual no se llegaba a la ciudadanía en general. Para solucionarlo se promocionaron portales como la IDE didáctica, un portal para enseñar geografía, que llega a cualquier ciudadano que quiera aprender sobre el territorio aragonés.

Paloma Abad Power: Me gustaría resaltar el beneficio económico que esto supone, como se mostró, por ejemplo, en el estudio económico que realizó el Centro Nacional de Información Gráfica con la Universidad de Leuven para medir el beneficio económico de la Infraestructura de Datos Espaciales de España. Se midió el beneficio que suponía que las empresas privadas utilizasen los servicios gratuitos y libres, en vez de utilizar, por ejemplo, Google Maps u otras fuentes que no son abiertas.

Rafael Martínez Cebolla: Para lo bueno y para lo malo, porque la calidad del dato oficial algunas veces nos gustaría que fuera mejor. Tanto Paloma, en la Administración General del Estado, como yo, en la administración autonómica, algunas veces sabemos que hay datos oficiales donde hay que invertir más dinero para que la calidad del dato sea mejor y pueda ser reutilizable.

Pero sí que es cierto que esos estudios son clave para saber en qué dimensión se mueven los conjuntos de datos de alto valor. Es decir, el tener estudios que informen del beneficio real que supone tener una infraestructura de datos espaciales a nivel estado o a nivel autonómico para mí es clave para dos cosas: para que el ciudadano entienda su importancia y, sobre todo, para que el político que llega cada N años entienda la evolución que han tenido estas plataformas y la revolución relativa a la información geoespacial que hemos vivido en los últimos 20 años.

6. También el Instituto Geográfico de Aragón ha realizado un informe sobre las ventajas de la reutilización de este tipo de datos, ¿verdad?

Rafael Martínez Cebolla: Sí, se publicó a comienzos de este año. Llevamos haciendo este informe desde hace tres o cuatro años de forma interna, porque sabíamos que íbamos a dar el salto hacia una infraestructura de conocimiento espacial y queríamos ver el impacto de implantar un grafo de conocimiento dentro de la infraestructura de datos. El Instituto Geográfico de Aragón ha hecho un esfuerzo en estos últimos años para analizar el beneficio económico que reporta el disponer de esta infraestructura para el ciudadano en sí, no para la propia administración. Es decir, cuánto dinero se ahorra el ciudadano aragonés en sus impuestos por tener esta infraestructura. Hoy sabemos que disponer de una plataforma de información geográfica ahorra aproximadamente 2 millones de euros al año a la ciudadanía aragonesa.

A mí me gustaría ver el informe del próximo enero o febrero, porque creo que el salto va a ser importante. El grafo de conocimiento se implantó en abril del año pasado y ese gap se va a notar en el año que estamos viviendo. Hemos notado un aumento considerable de peticiones, tanto a nivel de visualización como de descarga.

Básicamente de un año al otro, hemos casi duplicado tanto el número de accesos como de descargas. Esto afecta a la componente tecnológica: la tienes que volver a rediseñar. Te está descubriendo más gente, está accediendo más gente a tus datos y, por tanto, tienes que, dedicarle más inversión a la componente tecnológica, porque está siendo el cuello de botella.

7. ¿Cuáles creeis que son los retos que se afrontarán en los próximos años?

Paloma Abad Power: En mi opinión, el primer reto es conocer al usuario para darle un mejor servicio. El usuario técnico, los universitarios, los usuarios de la calle, etc. Estamos pensando en hacer una encuesta cuando el usuario vaya a utilizar nuestra información geográfica. Pero claro, ese tipo de encuestas a veces frena el uso de la información geográfica. Ese es el gran reto: conocer al usuario para hacer servicios más amigables, aplicaciones, etc. Saber llegar a lo que quiere y dárselo mejor.

También hay otro reto a nivel técnico. Cuando empezaron las infraestructuras espaciales el nivel técnico era muy elevado, tenías que saber lo que era un servicio de visualización, los metadatos, conocer los parámetros, etc. Esto hay que eliminarlo, que el usuario simplemente diga yo quiero, por ejemplo, consultar y visualizar la longitud del río Ebro, de forma más amigable. O por ejemplo la palabra LiDAR, que era el modelo digital italiano con una alta precisión. Todos estos vocablos hay que hacérselos mucho más amigables al usuario.

Rafael Martínez Cebolla: Sobre todo, que sean descubiertos. Mi percepción es que hay que seguir potenciando el descubrimiento de los datos espaciales sin necesidad de explicarle al usuario no avezado, o incluso a unos técnicos, que tenemos que tener un dato, un metadato, un servicio…. No, no. Básicamente es que desde los buscadores generalistas se pueda encontrar los conjuntos de datos de alto valor sin necesidad de saber que existe una cosa que se llama infraestructura de datos espaciales.

Se trata de publicar los datos bajo unos estándares amigables, bajo unas versiones accesibles y, sobre todo, publicarlos en direcciones URIs permanentes, que no vayan a cambiar. Es decir, que el dato vaya mejorando en calidad, pero no vaya a cambiar nunca.

Y sobre todo, desde el punto de vista técnico, tanto las infraestructuras de datos espaciales y los geoportales como las infraestructuras de conocimiento tenemos que conseguir que los nodos de información de alto valor se relacionan entre sí desde el punto semántico y geográfico. Entiendo que los grafos de conocimiento van a ayudar en este sentido. Es decir, la movilidad tiene que tener relación con la observación del territorio, con los datos de salud pública o con los datos estadísticos, que también tienen componente geográfico. Esa relación semántica geográfica para mí es clave.

Suscríbete a nuestro perfil de Soundcloud para estar al día de nuestros pódcasts

Clips de la entrevista

Clip 1. ¿Qué son los datos de alto valor y por qué son importantes?

Clip 2. ¿Dónde puede un usuario localizar datos geográficos?

 

Clip 3. ¿Cómo se está incentivando la reutilización de datos con componente geográfica?

calendar icon
Blog

El Reglamento de ejecución (UE) 2023/138 de la Comisión Europea establece pautas claras para los organismos públicos en la disponibilidad de conjuntos de datos de alto valor en un plazo de 16 meses. Estos conjuntos de datos de alto valor (High value datasets o HVD) se agrupan en los siguientes temas, los cuales ya se describían en este post:

 

Este artículo se centra en la categoría geoespacial, denominada Conjuntos de Datos de Alto Valor Geoespacial (HVDG).

Para todos los HVDG se deberá aplicar lo indicado en la Directiva 2007/2/CE del Parlamento Europeo y del Consejo, de 14 de marzo de 2007, por la que se establece una infraestructura de información espacial en la Comunidad Europea (INSPIRE), a excepción de parcelas agrícolas y de referencia, para las que se aplica el Reglamento (UE) 2021/2116 del Parlamento Europeo y del Consejo, de 2 de diciembre de 2021.

Tal y como se refleja en la tabla siguiente, el reglamento proporciona información detallada sobre los requisitos a tener en cuenta para estos HVDG, tales como escalas o granularidad y atributos de cada conjunto de datos. Estos complementan a los atributos definidos en el Reglamento Europeo (nº 1089/2010), que establece la interoperabilidad de los conjuntos y los servicios de datos espaciales.

Conjunto de datos Escala Atributos
Unidades administrativas

Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000.

De municipios a países; unidades marítimas.

  • Identificador único
  • Tipo de unidad
  • Geometría
  • Estatuto de los límites
  • Código de identificación nacional
  • Código de identificación del nivel administrativo superior
  • Denominación oficial
  • Código de país
Nombres geográficos No se aplica
  • Identificador único
  • Geometría
  • Nombre en varias lenguas (solo para países con más de una lengua oficial)
  • Tipo
Direcciones No se aplica
  • Identificador único
  • Geometría
  • Localizador de la dirección
  • Vía
  • Nombre
  • Unidades administrativas
  • Descriptor postal
  • Fecha de la última actualización
Edificios Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000
  • Identificador único
  • Geometría
  • Número de plantas
  • Tipo de uso
Parcelas catastrales Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000
  • Identificador único
  • Geometría
  • Código de unidad de la parcela
  • Referencia a la unidad administrativa del nivel administrativo más bajo
Parcelas de
referencia
Niveles de generalización disponibles con una granularidad hasta la escala de 1:5 000
  • Identificador único
  • Geometría
  • Cubierta terrestre
  • Materia orgánica
  • Elementos paisajísticos estables
  • Superficies con limitaciones naturales/específicas
Parcelas
agrícolas
Nivel de precisión equivalente a la escala 1:10 000 y a partir de 2016, a escala de 1:5 000
  • Identificador único
  • Geometría
  • Utilización de las tierras
  • Materia orgánica
  • Elemento paisajístico individual
  • Pastos permanentes

Para garantizar la accesibilidad y la reutilización de todos estos valiosos conjuntos de datos, es imperativo seguir ciertas disposiciones que faciliten su publicación. Aquí están los requisitos clave:

  • Licencia Abierta: Todos los conjuntos de datos deben estar disponibles para su reutilización bajo una licencia Creative Commons BY 4.0, o cualquier licencia abierta equivalente menos restrictiva. Esto fomenta la libertad de compartir y adaptar la información.
  • Formato Abierto y Legible por Máquina: Los datos deben presentarse en un formato abierto, legible por máquina y estar documentados públicamente. Esto asegura que la información sea fácilmente comprensible y accesible para cualquier persona o sistema automatizado.
  • Interfaces de Programación de Aplicaciones (API) y Descarga Masiva: Se deben proporcionar interfaces de programación de aplicaciones (API) para facilitar el acceso programático a los datos. Además, la descarga masiva directa de conjuntos de datos debe ser posible, permitiendo opciones flexibles para los usuarios según sus necesidades.
  • Versión Actualizada: La disponibilidad de los conjuntos de datos en su versión más actualizada es esencial. Esto garantiza que los usuarios accedan a la información más reciente, promoviendo la relevancia y la precisión de los datos.
  • Metadatos: La descripción de los datos también se cuidará de manera minuciosa mediante el uso de metadatos. Estos metadatos, como mínimo, incluirán los elementos definidos en el Reglamento (CE) nº 1205/2008 de la Comisión, de 3 de diciembre de 2008. Este reglamento ejecuta la Directiva 2007/2/CE del Parlamento Europeo y del Consejo, y establece los estándares para los metadatos asociados a los conjuntos de datos. El uso de metadatos estandarizados proporciona información adicional esencial para entender, interpretar y utilizar los conjuntos de datos de manera efectiva. Al seguir estos estándares, se facilita la interoperabilidad y la coherencia en la presentación de información, promoviendo así una comprensión más completa y precisa de los datos disponibles.

Estas disposiciones no solo promueven la transparencia y la apertura, sino que también facilitan la colaboración y el uso efectivo de la información en diversos contextos.

¿Cumple España con el Reglamento de los HVD geoespaciales?

La Directiva INSPIRE (Infrastructure for Spatial Information in Europe) determina las reglas generales para el establecimiento de una Infraestructura de Información espacial en la Comunidad Europea basada en las Infraestructuras de los Estados miembros. Aprobada por el Parlamento Europeo y el Consejo el 14 de marzo de 2007 (Directiva 2007/2/CE), entró en vigor el 25 de abril de 2007.

INSPIRE permite encontrar, compartir y utilizar con más facilidad los datos espaciales de diferentes países y en cada una de las regiones, estando los HVD disponibles en el nuevo catálogo de la Comisión de los HVD y en cada uno de los catálogos de las Infraestructuras de Datos Espaciales de las Comunidades Autónomas, así como en el Catálogo Oficial de Datos y Servicios INSPIRE de España. La información está disponible a través de una plataforma online desde la que se puede encontrar datos de distintos países.

 

 

ADVERTENCIA: En la actualidad están trabajando en este Geoportal realizando las tareas de volcado de datos, por lo tanto, puede existir alguna incongruencia temporal con los datos aportados, que se corresponden del Catalogo Oficial de Datos y Servicios INSPIRE (CODSI).

En España existe la Ley 14/2010 de 5 de julio sobre las infraestructuras y los servicios de información geográfica en España (LISIGE), que transpone la Directiva 2007/2/CE INSPIRE. Esta ley enmarca los trabajos para poner a disposición todos los datos espaciales nacionales y obliga a adaptarlos a las Guías Técnicas o Directrices recogidos por la Directiva INSPIRE, asegurando así que estos datos sean compatibles e interoperables en un contexto comunitario y transfronterizo.

La LISIGE se aplica a los datos geográficos que cumplan estas condiciones:

  • Referirse a una zona geográfica del territorio nacional, el mar territorial, la zona contigua, la plataforma continental y la zona económica exclusiva.
  • Haber sido generados por o bajo la responsabilidad de las Administraciones públicas.
  • Estar en formato electrónico.
  • Ser su producción y mantenimiento competencia de una Administración u organismo del sector público.
  • Estar dentro de los temas de los anexos I (Información Geográfica de Referencia), II (Datos Temáticos Fundamentales) o III (Datos Temáticos Generales) referidos en mencionada ley

Además, se aclara que los datos y servicios geográficos regulados por la LISIGE estarán disponibles en el Geoportal de la IDEE y en el CODSI, así como en el resto de los catálogos de las CC. AA., cuyo mantenimiento es responsabilidad del Instituto Geográfico Nacional (IGN).

Gracias a los incansables esfuerzos realizados por toda la administración española desde la publicación de la LISIGE, España ha logrado un hito notable. En la actualidad, se encuentra disponible en el Geoportal de INSPIRE una amplia gama de información clasificada como HVDG. Este logro refleja el compromiso continuo de nuestro país con la transparencia y el acceso a datos geoespaciales de alta calidad.

A enero de 2024, España tiene publicado en el Geoportal de INSPIRE y en el CODSI la siguiente información relacionada con los conjuntos de alto valor geoespacial:

  • 31 conjuntos de datos asociados a sus metadatos
  • 34 servicios de descarga (WFS, ATOM Feed, OGC Api Feature)
  • 28 servicios de visualización (WMS, WMTS)

Analizando los conjuntos de alto valor geoespaciales, vemos que según las temáticas se han publicado en la actualidad:

HVDG España Conjuntos de
datos
Servicios de
descarga
Servicios de visualización Recubre el territorio español
Unidades administrativas 5 7 7
Nombres geográficos 7 8 8
Direcciones 6 5 7
Edificios 5 3 4
Parcelas catastrales 3 3 3
Parcelas de
referencia
3 0 3
Parcelas
agrícolas
2 2 2

En la actualidad España cumple con el Reglamento de los HVDG en todas las categorías. En concreto, cumple con la legislación establecida a nivel de escala o granularidad, atributos, licencia, formato, disponibilidad de los datos en API o descarga máxima, con ser la versión más actualizada y con los metadatos.

Al realizar un análisis detallado de los conjuntos de datos publicados en el marco de los HVD, se destacan varios aspectos clave:

  • Cobertura Geográfica Integral: Se ha logrado poner a disposición al menos un conjunto de datos que abarca la totalidad del territorio español.
  • Metadatos Exhaustivos: Se han generado metadatos para todos los Conjuntos de Alto Valor Geoespacial (HVDG). Estos metadatos se encuentran publicados en el Catálogo Oficial de Datos y Servicios INSPIRE (CODSI),validados para cumplir con los estándares del Reglamento (CE) nº 1205/2008 de la Comisión.
  • Servicios de Visualización y Descarga: Todos los HVDG cuentan con servicios de visualización y de descarga. Los servicios de descarga pueden ser de descarga masiva o API de descarga y en estos momentos son WFS y ATOM y en un futuro pueden ser OGC API Feature o API Coverage.
  • Licencias y Formatos Abiertos: Todos los servicios publicados están bajo licencia Creative Commons BY 4.0, y los servicios de descarga utilizan formatos estándares y abiertos como el formato GML documentado por la norma internacional ISO 19136.
  • Cumplimiento con Modelos de Datos INSPIRE: Casi todos los conjuntos de datos cumplen con los modelos de datos INSPIRE, garantizando así la coherencia y calidad de los atributos establecidos en el reglamento de HVDG.
  • Datos Actualizados y Mantenidos: Los servicios de descarga garantizan la disponibilidad de datos en su versión más actualizada. Cada administración pública responsable de los datos se encarga del mantenimiento y la actualización de la información.

Este análisis resalta el compromiso y la eficiencia en la gestión de datos geoespaciales en España, contribuyendo a la transparencia, accesibilidad y calidad en la información proporcionada a la comunidad.

Se debe resaltar que, en España, se cumple con todos los requisitos de los HVDG. Organismos como el CNIG y el ICGC o el Gob. de Navarra, además de publicar a través de servicios WFS o ATOM, está ya trabajando en tener publicados estos conjuntos de datos con las API de OGC.

El Geoportal de INSPIRE se ha convertido en una valiosa fuente de información, gracias a la dedicación y colaboración de diversas entidades gubernamentales, entre ellas las españolas. Este avance no solo resalta el progreso en la implementación de estándares geoespaciales, sino que también fortalece la base para el desarrollo sostenible y la toma de decisiones informadas en España. ¡Un logro significativo para el país en el ámbito geoespacial!

Contenido elaborado por Mayte Toscano, Senior Consultant en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

El 8 de septiembre se celebró el webinar Geospatial trends 2023:  Opportunities for data.europa.eu,  organizado por la Data Europa Academy y centrado en las tendencias emergentes en el ámbto geoespacial. En concreto, la conferencia online abordó el concepto de GeoAI (Inteligencia Artificial Geoespacial), que consiste en la aplicación de inteligencia artificial (IA) combinada con datos geoespaciales. 

A continuación, analizaremos cuáles han sido los desarrollos tecnológicos más punteros de 2023 en este ámbito, tomando como base el conocimiento aportado por los expertos participantes en dicho webinar. 

¿Qué es el GeoAI? 

El término GeoAI hace referencia, tal y como define Kyoung-Sook Kim, copresidente del Grupo de Trabajo de GeoAI del Open Geospatial Consortium (OGC), a: “un conjunto de métodos o entidades automatizadas que utilizan datos geoespaciales para percibir, construir (automatizar) y optimizar espacios en los que los humanos, así como todo lo demás, pueden continuar de manera segura y eficiente sus actividades geográficamente referenciadas\". 

El GeoAI nos permite crear enormes oportunidades que hasta el momento no habían sido posibles como: 

  • Extraer datos geoespaciales enriquecidos con aprendizaje profundo: Permite automatizar la extracción, la clasificación y la detección de información de datos como imágenes, vídeos, nubes de puntos y texto.
  • Realizar análisis predictivos con aprendizaje automático: Habilita la creación de modelos de predicción más precisos, detección de patrones y automatización de algoritmos espaciales.
  • Mejorar la calidad, la uniformidad y la precisión de los datos: Simplifica los flujos de generación manual de datos mediante la automatización para mejorar la eficiencia y reducir los costes.
  • Acelerar el tiempo de obtención de conocimiento de la situación: Ayuda a responder más rápidamente a las necesidades medioambientales y tomar decisiones más proactivas basadas en datos en tiempo real.
  • Incorporar la inteligencia de ubicación en la toma de decisiones: Ofrece nuevas posibilidades en la toma de decisiones basadas en datos del estado actual de la zona que necesitamos gobernar o planificar.   

Aunque esta tecnología ha cobrado protagonismo a lo largo del año 2023, ya se hablaba de ella en el informe sobre tendencias geoespaciales de 2022, donde se indicaba que la incorporación de inteligencia artificial a los datos espaciales supone una gran oportunidad en el mundo de los datos abiertos y en el sector geoespacial. 

 Casos de uso de GeoIA 

El potencial de esta tecnología emergente quedó de manifiesto durante la conferencia Geospatial trends 2023. La sesión fue moderada por Inmaculada Farfan Velasco, quien trabaja como project manager en la Oficina de Publicaciones de la Unión Europea y está involucrada en la iniciativa de datos de la UE.  

Durante el webinar, las empresas del sector GIS Con terra y 52ºNorth compartieron varios ejemplos prácticos para responder a la pregunta ¿Cuáles son las tendencias actuales en materia de datos geoespaciales?  Todos los casos de usos presentados a tal fin tienen algo en común: el uso de GeoAI. 

Los ejemplos presentados por parte de Con terra fueron:

  • KINoPro: Un proyecto de investigación que utiliza GeoAI para predecir la actividad de la polilla \"black arches\" y su impacto en los abetos de los bosques alemanes. Se analiza una amplia gama de datos, desde la temperatura hasta la humedad del suelo, para prever la aparición de estas plagas y tomar medidas preventivas.
  • Anomalía en la detección de torres de telefonía: Usa una red neuronal para la detección de las causas de las anomalías que se detectan en algunas torres y que puede arrojar una errónea localización en la posición de una llamada, dato crucial en las llamadas de emergencias para localizar la zona afectada.
  • Análisis automatizado de áreas de construcción: Pretende detectar áreas de edificaciones destinadas a zonas industriales a partir del uso de datos de OpenData e imágenes satelitales. Para ello realiza dos modelos: uno de los cambios en el territorio y otro que predice si estos cambios se deben al uso de las edificaciones (uso industrial o comercial). 

Por su parte, 52ºNorth presentó los siguientes casos de usos: 

  • MariData: Busca reducir las emisiones del transporte marítimo optimizando las operaciones de los barcos de carga. Utiliza GeoAI para calcular rutas óptimas, considerando factores como la posición del barco, los datos ambientales y las regulaciones de tráfico marítimo.
  • KI:STE: Aplica tecnologías de inteligencia artificial en ciencias ambientales para obtener valor con un enfoque en la infraestructura y la gestión de datos. El proyecto KI:STE se centra en la interoperabilidad de datos, la ejecución de modelos en entornos diversos y la elaboración de distintos proyectos como son los siguientes:
    • Vida silvestre: conceptos sensibles para la vida silvestre que clasifica las imágenes de Sentinel-2 en áreas (no) protegidas
    • Emisiones biogénicas: métodos no supervisados ​​para estimar las emisiones biogénicas a partir de la observación de la Tierra.
    • Predicción de peligros: flujo de trabajo de mapeo de peligros que incorpora tanto modelos basados ​​en la física como algoritmos de aprendizaje automático basados ​​en fuentes de datos heterogéneas.
    • Extremos hidrometeorológicos: métodos Al para fusionar modelos y reanálisis/observación para la cuantificación de extremos hidrometeorológicos .
    • Variabilidad de las nubes: aprendizaje auto supervisado sobre datos de Meteosat. 

Estos proyectos resaltan la importancia del GeoAI en diversas aplicaciones, desde la predicción de eventos ambientales hasta la optimización de rutas de transporte marítimo. Todos ellos ponen de manifiesto que esta tecnología se presenta como una herramienta crucial para abordar problemas complejos en la comunidad geoespacial. 

 GeoAI no sólo representa una gran oportunidad para el sector espacial, sino que pondrá a prueba la importancia de disponer de datos abiertos que cumplan los principios FAIR. Estos principios (Encontrable, Accessible, Interoperable, Reusable) son fundamentales para los proyectos GeoAI, ya que garantizan un acceso a la información de manera transparente, eficiente y ética. Al adherirse a los principios FAIR, los conjuntos de datos se vuelven más accesibles para los investigadores y desarrolladores, alimentando la colaboración y la mejora constante de los modelos. Además, la transparencia y la capacidad de reutilizar datos abiertos contribuyen a generar confianza en los resultados obtenidos mediante proyectos de GeoAI.   

Referencias  

Video de la conferencia  https://www.youtube.com/watch?v=YYiMQOQpk8A 

 

calendar icon
Blog

La segmentación de imágenes es un método que divide una imagen digital en subgrupos (segmentos) para reducir la complejidad de esta y, así, poder facilitar su procesamiento o análisis. La finalidad de la segmentación es asignar etiquetas a píxeles para identificar objetos, personas u otros elementos en la imagen.

La segmentación de las imágenes es clave para las tecnologías y algoritmos de visión artificial, pero también se utiliza hoy en día para muchas aplicaciones como, por ejemplo, el análisis de imágenes médicas, la visión de los vehículos autónomos, el reconocimiento y la detección de rostros o el análisis de imágenes satelitales, entre otras.

Segmentar una imagen es un proceso lento y costoso, por eso en lugar de procesar la imagen completa, una práctica común es la segmentación de imágenes mediante el enfoque de desplazamiento medio. Este procedimiento emplea una ventana desplazable que atraviesa progresivamente la imagen, calculando el promedio de los valores de píxeles contenidos en dicha región.

Este cálculo se efectúa con el propósito de establecer los píxeles que han de ser incorporados a cada uno de los segmentos delineados. Conforme la ventana avanza a lo largo de la imagen, lleva a cabo de manera iterativa una recalibración del cálculo para garantizar la idoneidad de cada uno de los segmentos resultantes.

A la hora de segmentar una imagen los factores o características que se tienen en cuenta son principalmente:

  • El color:  Los diseñadores gráficos tienen la posibilidad de emplear una pantalla de tonalidad verdosa con el fin de asegurar una uniformidad cromática en el fondo de la imagen. Esta práctica posibilita la automatización de la detección y sustitución del fondo durante la etapa de postprocesamiento.
  • Bordes: La segmentación basada en bordes es una técnica que identifica los bordes de varios objetos en una imagen determinada. Estos se identifican en función de las variaciones de contraste, textura, color y saturación.
  • Contraste: Se procesa la imagen distinguiendo entre una figura oscura y un fondo claro basándose en valores de alto contraste.

Estos factores se aplican en distintas técnicas de segmentación:

  • Umbrales: Divide los píxeles en función de su intensidad en relación con un valor o umbral determinado. Este método es el más adecuado para segmentar objetos con mayor intensidad que otros objetos o fondos.
  • Regiones: Consiste en dividir una imagen en regiones con características semejantes agregando los píxeles con características similares.
  • Clústeres: Los algoritmos de agrupamiento son algoritmos de clasificación no supervisados que ayudan a identificar información oculta en las imágenes. El algoritmo divide las imágenes en grupos de píxeles con características similares, separando los elementos en grupos y agrupando elementos similares en estos grupos.
  • Cuencas hidrográficas: Se trata de un proceso que transforma las imágenes a escala de grises, tratándolas como mapas topográficos, donde el brillo de los píxeles determina la altura. Esta técnica sirve para detectar líneas que forman crestas y cuencas. marcando las áreas entre las líneas divisorias de aguas.

El aprendizaje automático y el aprendizaje profundo (Deep learning) han mejorado estas técnicas, como la segmentación de clústeres, pero también han generado nuevos enfoques de segmentación que utilizan el entrenamiento de modelos para mejorar la capacidad de los programas a la hora de identificar características importantes. La tecnología de redes neuronales profundas es especialmente efectiva para las tareas de segmentación de imágenes. 

En la actualidad encontramos distintos tipos de segmentación de imágenes, siendo las principales:

  • Segmentación Semántica: La segmentación semántica de imágenes es un proceso que permite crear regiones dentro de una imagen y atribuir significado semántico a cada una de ellas. Estos objetos o también conocidas como clases semánticas, por ejemplo: coche, autobús, persona, árbol, etc., han sido previamente definidas mediante el entrenamiento de modelos en los que se clasifican y etiquetan estos objetos. El resultado es una imagen en lo que se han clasificado los pixeles en cada objeto o clase localizado.
  • Segmentación de instancias: La segmentación de instancias combina el método de segmentación semántica (interpretando los objetos de una imagen) y la detección de objetos (al localizarlos dentro de la imagen). Como resultado de esta segmentación, se localizan los objetos, para que cada uno de ellos sea singularizado por medio de una ventana delimitadora (bounding box) y una máscara binaria, las cuales determinan qué píxeles de dicha ventana pertenecen al objeto localizado.
  • Segmentación panóptica: Es el tipo más actual de segmentación. Se trata de una combinación de segmentación semántica y de instancias. Este método sí puede determinar la identidad de cada objeto porque esta técnica de segmentación localiza y distingue los diferentes objetos o instancias y asigna dos etiquetas a cada píxel de la imagen: una etiqueta semántica y una ID de instancia. De esta forma cada objeto es único.

Ilustración 3: Ejemplo de los tipos de segmentación. Fuente Elaboracion propia

En la imagen se pueden observar los resultados de aplicar las distintas segmentaciones a una imagen satelital. La segmentación semántica devuelve una categoría por cada tipo de objeto identificado. La segmentación por instancia devuelve los objetos individualizados y la caja delimitadora y, en la segmentación panóptica, obtenemos los objetos individualizados y el contexto también diferenciado, pudiendo detectar el suelo y la región de calles.

El nuevo modelo de Meta: SAM

En abril del 2023, el departamento de investigación de Meta presentó un nuevo modelo de Inteligencia Artificial (IA) al que llamaron SAM (Segment Anything Model). Con SAM se puede realizar la segmentación de una imagen mediante tres formas:

  • Seleccionando un punto en la imagen, se buscará y distinguirá el objeto que intersecta con ese punto y se buscará todos los objetos iguales encontrados en la imagen.
  • Por ventana delimitadora o bounding box, sobre la imagen se dibuja un rectángulo y se identifican todos los objetos encontrados en esa área.
  • Por palabras, mediante una consola se escribe una palabra y SAM puede identificar los objetos que coincidan con esa palabra u orden explícita tanto en imágenes o videos, incluso si ese dato no fue incluido en su entrenamiento.

SAM es un modelo flexible que fue entrenado con el conjunto de datos más grande hasta la fecha, llamado SA-1B y que cuenta con 11 millones de imágenes y 1.1 mil millones de máscaras en segmentación. Gracias a estos datos, SAM es capaz de detectar todo tipo de objetos sin necesidad de un entrenamiento adicional.

Por ahora, el modelo SAM y el conjunto de datos SA-1B está disponible para su uso no comercial y con fines de investigación. De este modo, los usuarios que suban sus imágenes tendrán que comprometerse a utilizarlo únicamente con fines de académicos. Para probarla, ingresa a este enlace de GitHub.

En agosto del 2023, el Grupo de Análisis de Imagen y Vídeo de la Academia China de las Ciencias, lanza una actualización de su modelo llamado FastSAM que reduce considerablemente el tiempo de procesado, se consigue una velocidad de ejecución 50 veces mayor, haciendo que el modelo sea más práctico de ejecutar que el modelo SAM original. Esta aceleración la consiguen habiendo entrenado el modelo con el 2% de los datos utilizados para entrenar SAM. FastSAM tiene menos requisitos computacionales que SAM, sin dejar de alcanzar una gran precisión.

SAMGEO: la versión que permite analizar datos geoespaciales

El paquete segment-geospatial  desarrollado por Qiusheng Wu tiene como finalidad facilitar el uso de Segment Anything Model (SAM) para datos geoespaciales, para ello se he desarrollado los paquetes de Python segment-anything-py y segment-geospatial , que están disponibles en PyPI y conda-forge

El objetivo es simplificar el proceso de aprovechamiento de SAM para el análisis de datos geoespaciales al permitir que los usuarios lo logren con un mínimo esfuerzo de codificación. A partir de estas librerías, se desarrolla el plugin de QGIS Geo-SAM y se desarrolla el uso del modelo en ArcGIS Pro.

Conclusiones

En definitiva, SAM supone una gran revolución no sólo por las posibilidades que abre a la hora de editar fotografías o extraer elementos de imágenes para collages o edición de video, sino también por las oportunidades de mejora que permiten aumentar la visión por computadora, a la hora de usar lentes de realidad aumentada o cascos de realidad virtual.  

También SAM supone una revolución para la obtención de información espacial, mejorando la detención de objetos mediante imágenes satelitales y facilitando la detección de cambios en el territorio de forma rápida.


Contenido elaborado por Mayte Toscano, Senior Consultant in Tecnologías ligadas a la economía del dato.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Documentación

1. Introducción

Las visualizaciones son representaciones gráficas de datos que permiten comunicar de manera sencilla y efectiva la información ligada a los mismos. Las posibilidades de visualización son muy amplias, desde representaciones básicas, como puede ser un gráfico de líneas, barras o sectores, hasta visualizaciones configuradas sobre cuadros de mando o dashboards interactivos.  

En esta sección de “Visualizaciones paso a paso” estamos presentando periódicamente ejercicios prácticos de visualizaciones de datos abiertos disponibles en  datos.gob.es u otros catálogos similares. En ellos se abordan y describen de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y análisis que resulten pertinentes para, finalmente, la creación de visualizaciones interactivas, de las que podemos extraer información resumida en unas conclusiones finales. En cada uno de estos ejercicios prácticos, se utilizan sencillos desarrollos de código convenientemente documentados, así como herramientas de uso gratuito. Todo el material generado está disponible para su reutilización en el repositorio de GitHub.

En este ejercicio práctico, hemos realizado un sencillo desarrollo de código que está convenientemente documentado apoyandonos en herramientas de uso gratuito. 

Accede al repositorio del laboratorio de datos en Github.

Ejecuta el código de pre-procesamiento de datos sobre Google Colab.

2. Objetivo

El objetivo principal de este post es mostrar cómo generar un mapa personalizado de Google Maps mediante la herramienta "My Maps" partiendo de datos abiertos. Este tipo de mapas son altamente populares en páginas, blogs y aplicaciones del sector turístico, no obstante, la información útil proporcionada al usuario suele ser escasa.

En este ejercicio, utilizaremos el potencial de los datos abiertos para ampliar la información a mostrar en nuestro mapa y hacerlo de una forma automática. También mostraremos como realizar un enriquecimiento de los datos abiertos para añadir información de contexto que mejore significativamente la experiencia de usuario. 

Desde un punto de vista funcional, el objetivo del ejercicio es la creación de un mapa personalizado para planificar rutas turísticas por los espacios naturales de la Comunidad Autónoma de Castilla y León. Para ello se han utilizado conjuntos de datos abiertos publicados por la Junta de Castilla y León, que hemos preprocesado y adaptado a nuestras necesidades de cara a generar el mapa personalizado. 

3. Recursos

3.1. Conjuntos de datos

Los conjuntos de datos contienen distinta información turística de interés geolocalizada. Dentro del catálogo de datos abiertos de la Junta de Castilla y León, encontramos el “diccionario de entidades” (sección información adicional), documento de vital importancia, ya que nos define la terminología utilizada en los distintos conjuntos de datos. 

Estos conjuntos de datos también se encuentran disponibles en el repositorio de Github

3.2. Herramientas

Para la realización de las tareas de preprocesado de los datos se ha utilizado el lenguaje de programación Python escrito sobre un Notebook de Jupyter alojado en el servicio en la nube de Google Colab.

"Google Colab" o también llamado "Google Colaboratory", es un servicio gratuito en la nube de Google Research que permite programar, ejecutar y compartir código escrito en Python o R desde tu navegador, por lo que no requiere la instalación de ninguna herramienta o configuración.

Para la creación de la visualización interactiva se ha usado la herramienta Google My Maps.

"Google My Maps" es una herramienta online que permite crear mapas interactivos que pueden ser incrustados en sitios web o exportarse como archivos. Esta herramienta es gratuita, sencilla de usar y permite múltiples opciones de personalización.  

Si quieres conocer más sobre herramientas que puedan ayudarte en el tratamiento y la visualización de datos, puedes recurrir al informe "Herramientas de procesado y visualización de datos".

4. Tratamiento o preparación de los datos

Los procesos que te describimos a continuación los encontrarás comentados en el Notebook  que podrás ejecutar desde Google Colab.

Antes de lanzarnos a construir una visualización efectiva, debemos realizar un tratamiento previo de los datos, prestando especial atención a la obtención de los mismos y validando su contenido, asegurando que se encuentran en el formato adecuado y consistente para su procesamiento y que no contienen errores.  

Como primer paso del proceso es necesario realizar un análisis exploratorio de los datos (EDA) con el fin de interpretar adecuadamente los datos de partida, detectar anomalías, datos ausentes o errores que pudieran afectar a la calidad de los procesos posteriores y resultados. Si quieres conocer más sobre este proceso puedes recurrir a la Guía Práctica de Introducción al Análisis Exploratorio de Datos.  

El siguiente paso a dar es generar las tablas de datos preprocesados que usaremos para alimentar el mapa. Para ello, transformaremos los sistemas de coordenadas, modificaremos y filtraremos la información según nuestras necesidades. 

Los pasos que se siguen en este preprocesamiento de los datos, explicados en el Notebook, son los siguientes: 

  1. Instalación y carga de librerías
  2. Carga de los conjuntos de datos
  3. Análisis exploratorio de datos (EDA)
  4. Preprocesamiento de los conjuntos de datos​
  • Transformación de coordenadas
  • Filtrado de la información
  • Representación gráfica de los conjuntos de datos
  • Almacenamiento de las nuevas tablas de datos transformadas

Durante el preprocesado de las tablas de datos, hay que hacer un cambio de sistema de coordenadas ya que en los conjuntos de datos de origen el sistema en el que se encuentran es ESTR89 (sistema estándar que se usa en la Unión Europea), mientras que las necesitaremos en el sistema WGS84 (sistema usado por Google My Maps entre otras aplicaciones geográficas). La forma de realizar este cambio de coordenadas se encuentra explicado en el Notebook. Si quieres saber más sobre tipos y sistemas de coordenadas, puedes recurrir a la “Guía de datos espaciales” 

Una vez terminado el preprocesamiento, obtendremos las tablas de datos "recreativas_parques_naturales.csv", "alojamientos_rurales_2estrellas.csv", "refugios_parques_naturales.csv", "observatorios_parques_naturales.csv", "miradores_parques_naturales.csv", "casas_del_parque.csv", "arboles_parques_naturales.csv" las cuales incluyen campos de información genéricos y comunes como: nombre, observaciones, geoposición, … junto a campos de información específicos, los cuales se definen en detalle en el apartado 6.2 Personalización de la información a mostrar en el mapa.

Podrás reproducir este análisis, ya que el código fuente está disponible en nuestra cuenta de GitHub. La forma de proporcionar el código es a través de un documento realizado sobre un Jupyter Notebook que una vez cargado en el entorno de desarrollo podrás ejecutar o modificar de manera sencilla. Debido al carácter divulgativo de este post y para favorecer el entendimiento de los lectores no especializados, el código no pretende ser el más eficiente, sino facilitar su comprensión por lo que posiblemente se te ocurrirán muchas formas de optimizar el código propuesto para lograr fines similares. ¡Te animamos a que lo hagas! 

5. Enriquecimiento de los datos

Con la finalidad de aportar mayor información relacionada, se realiza un proceso de enriquecimiento de datos sobre el conjunto de datos “registro de alojamientos hoteleros” explicado a continuación. Con este paso vamos a lograr añadir de forma automática información complementaria que no está inicialmente incluida. Con ello, conseguiremos mejorar la experiencia del usuario durante su uso del mapa al proporcionar información de contexto relacionada con cada punto de interés. 

Para ello vamos a utilizar una herramienta útil para este tipo de tarea, OpenRefine. Esta herramienta de código abierto permite realizar múltiples acciones de preprocesamiento de datos, aunque en esta ocasión la usaremos para llevar a cabo un enriquecimiento de nuestros datos mediante la incorporación de contexto enlazando automáticamente información que reside en el popular repositorio de conocimiento Wikidata.  

Una vez instalada la herramienta en nuestro ordenador, al ejecutarse se abrirá una aplicación web en el navegador.

A continuación, se detallan los pasos a seguir. 

Paso 1

Carga del CSV en el sistema (Figura 1). En esta caso, el conjunto de datos “Registro de alojamientos hoteleros”. 

                                                                           Figura 1. Carga de archivo CSV en OpenRefine

Paso 2

Creación del proyecto a partir del CSV cargado (Figura 2). OpenRefine se gestiona mediante proyectos (cada CSV subido será un proyecto), que se guardan en el ordenador dónde se esté ejecutando OpenRefine para un posible uso posterior. En este paso debemos dar un nombre al proyecto y algunos otros datos, como el separador de columnas, aunque lo más habitual es que estos últimos ajustes se rellenen automáticamente. 

                                                                                                                             Figura 2. Creación de un proyecto en OpenRefine

Paso 3

Enlazado (o reconciliación, usando la nomenclatura de OpenRefine) con fuentes externas. OpenRefine nos permite enlazar recursos que tengamos en nuestro CSV con fuentes externas como Wikidata. Para ello se deben realizar las siguientes acciones: 

  • Identificación de las columnas a enlazar. Habitualmente este paso suele estar basado en la experiencia del analista y su conocimiento de los datos que se representan en Wikidata. Como consejo, de forma genérica se podrán reconciliar o enlazar aquellas columnas que contengan información de carácter más global o general como nombres de países, calles, distritos, etc., y no se podrán enlazar aquellas columnas como coordenadas geográficas, valores numéricos o taxonomías cerradas (tipos de calles, por ejemplo). En este ejemplo, disponemos de la columna “municipios” que contiene el nombre de los municipios españoles.
  • Comienzo de la reconciliación. (Figura 3) Comenzamos la reconciliación y seleccionamos la fuente por defecto que estará disponible: Wikidata(en). Después de hacer clic en Start Reconciling, automáticamente comenzará a buscar la clase del vocabulario de Wikidata que más se adecue basado en los valores de nuestra columna.

                                                                                                                               Figura 3. Selección de la clase que mejor representa los valores de la columna "municipio"

  • Obtención de los valores de la reconciliación. OpenRefine nos ofrece la posibilidad de mejorar el proceso de reconciliación agregando algunas características que permitan orientar el enriquecimiento de la información con mayor precisión. 

Paso 4

Generar una nueva columna con los valores reconciliados o enlazados. (Figura 4) Para ello debemos pulsar en la columna “municipio” e ir a “Edit Column → Add column based in this column”, dónde se mostrará un texto en la que tendremos que indicar el nombre de la nueva columna (en este ejemplo podría ser “wikidata”). En la caja de expresión deberemos indicar: “http://www.wikidata.org/entity/”+cell.recon.match.id y los valores aparecen como se previsualiza en la Figura.  “http://www.wikidata.org/entity/” se trata de una cadena de texto fija para representar las entidades de Wikidata, mientras el valor reconciliado de cada uno de los valores lo obtenemos a través de la instrucción cell.recon.match.id, es decir, cell.recon.match.id(“Adanero”) = Q1404668 

Mediante la operación anterior, se generará una nueva columna con dichos valores. Con el fin de comprobar que se ha realizado correctamente, haciendo clic en una de las celdas de la nueva columna, está debería conducir a una página web de Wikidata con información del valor reconciliado.  

                                                                                                                          Figura 4. Generación de nueva columna con valores reconciliados

Paso 5

El proceso lo repetimos modificando en el paso 4 el “Edit Column → Add column based in this column” por “Add columns from reconciled values” (Figura 5). De esta forma, podremos elegir la propiedad de la columna reconciliada.  

En este ejercicio hemos elegido la propiedad “image” con identificador P18 y la propiedad “population” con identificador P1082. No obstante, podríamos añadir todas las propiedades que consideremos útiles, como el número de habitantes, el listado de monumentos de interés, etc. Cabe destacar que al igual que enriquecemos los datos con Wikidata, podemos hacerlo con otros servicios de reconciliación.

                                                                                                                      Figura 5. Elección propiedad para reconciliación

 

En el caso de la propiedad “image”, debido a la visualización, queremos que el valor de las celdas tenga forma de link, por lo que hemos realizado varios ajustes. Estos ajustes han sido la generación de varias columnas según los valores reconciliados, adecuación de las columnas mediante comandos en lenguaje GREL (lenguaje propio de OpenRefine) y unión de los diferentes valores de ambas columnas. Puedes consultar estos ajustes y más técnicas para mejorar tu manejo de OpenRefine y adaptarlo a tus necesidades en el siguiente User Manual. 

6. Visualización del mapa

6.1 Generación del mapa con "Google My Maps"

Para generar el mapa personalizado mediante la herramienta My Maps, hemos seguidos los siguientes pasos: 

  • Iniciamos sesión con una cuenta Google y vamos a "Google My Maps", teniendo acceso de forma gratuita sin tener que descargar ningún tipo de software.
  • Importamos las tablas de datos preprocesados, uno por cada nueva capa que añadimos al mapa. Google My Maps permite importar archivos CSV, XLSX, KML y GPX (Figura 6), los cuales deberán tener asociada información geográfica. Para realizar este paso, primero se debe crear una capa nueva desde el menú de opciones lateral.

                                                                  Figura 6. Importación de archivos en "Google My Maps"

  • En este caso práctico, importaremos tablas de datos preprocesados que contienen una variable con la latitud y otra con la longitud. Esta información geográfica se reconocerá automáticamente. My Maps también reconoce direcciones, códigos postales, países, ...

                                                                       Figura 7. Selección columnas con valores de posición

  • Mediante la opción de editar estilo que aparece en el menú lateral izquierdo, en cada una de las capas, podemos personalizar los pines, editando el color y su forma. 

                                                                           Figura 8. Edicción de pines de posición

  • Por último, podemos elegir el mapa base que queremos visualizar en la parte inferior de la barra lateral de opciones. 

                                                                          Figura 9. Selección de mapa base

Si quieres conocer más sobre los pasos para la generación de mapas con “Google My Maps”, consulta el siguiente tutorial paso a paso. 

 

6.2 Personalización de la información a mostrar en el mapa

Durante el preprocesamiento de las tablas de datos, hemos realizado un filtrado de la información según el enfoque del ejercicio, que es la generación de un mapa para realizar rutas tusísticas por los espacios naturales de Castilla y León. A continuación, se describe la personalización de la información que hemos llevado a cabo para cada uno de los conjuntos de datos. 

  • En el conjunto de datos perteneciente a los árboles singulares de los espacios naturales, la información a mostrar para cada registro es el nombre, las observaciones, la señalización y la posición (latitud/longitud)
  • En el conjunto de datos perteneciente a las casas del parque de los espacios naturales, la información a mostrar para cada registro es el nombre, las observaciones, la señalización, el acceso, la web y la posición (latitud/longitud)
  • En el conjunto de datos perteneciente a los miradores de los espacios naturales, la información a mostrar para cada registro es el nombre, las observaciones, la señalización, el acceso y la posición (latitud/longitud)
  • En el conjunto de datos perteneciente a los observatorios de los espacios naturales, la información a mostrar para cada registro es el nombre, las observaciones, la señalización y la posición (latitud/longitud)
  • En el conjunto de datos perteneciente a los refugios de los espacios naturales, la información a mostrar para cada registro es el nombre, las observaciones, la señalización, el acceso y la posición (latitud/longitud). Dado que los refugios pueden encontrarse en estados muy diferentes y que algunos registros no ofrecen información en el campo “observaciones”, hemos decidido filtrar para que nos muestre solamente aquellos que tengan información en dicho campo.
  • En el conjunto de datos perteneciente a las áreas recreativas de los espacios naturales, la información a mostrar para cada registro es el nombre, las observaciones, la señalización, el acceso y la posición (latitud/longitud).  Hemos decidido filtrar para que nos muestre solamente aquellos que tengan información en los campos de “observaciones” y “acceso”.
  • En el conjunto de datos perteneciente a los alojamientos, la información a mostrar para cada registro es el nombre, tipo de establecimiento, categoría, municipio, web, teléfono y la posición (latitud/longitud). Hemos filtrado el “tipo” de establecimiento para que nos muestre solamente los que están categorizados como alojamientos de turismo rural y hemos filtrado para que nos muestre los que son de 2 estrellas. 

A continuación, tenemos la visualización del mapa personalizado que hemos creado. Seleccionando el icono para agrandar el mapa que aparece en la esquina superior derecha, podrás acceder su visualización en pantalla completa.

 

6.3 Funcionalidades sobre el mapa (capas, pines, rutas y vista inmersiva 3D)

En este punto, una vez creado el mapa personalizado, explicaremos diversas funcionalidades que nos ofrece "Google My Maps" durante la visualización de los datos.

  • Capas

Mediante el menú desplegable de la izquierda, podemos activar y desactivar las capas a mostrar según nuestras necesidades. 

                                                                                         Figura 10. Capas en "My Maps"

  • Pines

Pinchando en cada uno de los pines del mapa podemos acceder a la información asociada a esa posición geográfica.

                                                                                         Figura 11. Pines en "My Maps"

  • Rutas

Podemos crear una copia del mapa sobre la que añadir nuestros recorridos personalizados.  

En las opciones del menú lateral izquierdo, seleccionamos “copiar mapa”. Una vez copiado el mapa, mediante el símbolo de añadir indicaciones, situado debajo de la barra buscador, generaremos una nueva capa. A esta capa podremos indicarle dos o más puntos, junto al medio de transporte y nos creará el trazado junto a las indicaciones de trayecto. 

                                                                                             Figura 12. Rutas en "My Maps"

  • Mapa inmersivo en 3D

Mediante el símbolo de opciones que aparece en el menú lateral, podemos acceder a Google Earth, desde donde podemos realizar una exploración del mapa inmersiva en 3D, destacando el poder observar la altitud de los distintos puntos de interés. También puedes acceder mediante el siguiente enlace.

                                                                                                Figura 13. Vista inmersiva en 3D 

7. Conclusiones del ejercicio

La visualización de datos es uno de los mecanismos más potentes para explotar y analizar el significado implícito de los datos. Cabe destacar la vital importancia que los datos geográficos tienen en el sector del turismo, lo cual hemos podido comprobar en este ejercicio. 

Como resultado, hemos desarrollado un mapa interactivo con información aportada por los datos abiertos enriquecidos (Linked Data), la cual hemos personalizado según nuestros intereses

Esperemos que esta visualización paso a paso te haya resultado útil para el aprendizaje de algunas técnicas muy habituales en el tratamiento y representación de datos abiertos. Volveremos para mostraros nuevas reutilizaciones. ¡Hasta pronto! 

calendar icon
Documentación

Este informe recoge varias temáticas relevantes para la comunidad europea de datos geoespaciales.

Por un lado, el capítulo dedicado a la "modernización INSPIRE y avance hacia los datos abiertos" trata la evaluación realizada por la Comisión Europea de la directiva INSPIRE y cómo ésta debe avanzar en un futuro próximo. Entre otras conclusiones, determina la oportunidad de simplificación técnica para favorecer una mayor interoperabilidad, además de la necesaria convergencia con la Directiva 2019/1024 sobre datos abiertos, incidiendo en la importancia de puesta a disposición de datos de alto valor (HVDs). En este sentido, el informe incluye una valoración sobre qué temas de datos Inspire son considerados HVDs.

La segunda temática gira en torno al "papel de la información geoespacial para las ciudades inteligentes", donde los datos completos, actualizados y con referencia geoespacial, son considerados un activo fundamental en los proyectos de ciudades inteligentes.

En tercer lugar, el informe recoge un avance de situación sobre determinados aspectos clave analizados en un informe anterior (2021),  relacionados, entre otras cuestiones relevantes, con la disponibilidad de OGC API endpoints o el descubrimiento de servicios de streaming de datos procedentes de las APIs de SensorThings.

Por último, el documento, a modo de conclusión, detalla hoja de ruta de potencial interés para el portal de datos europeo de cara a seguir avanzando para mejorar la disponibilidad de información geoespacial.

Este informe se encuentra disponible en el siguiente enlace: "Tendencias geoespaciales 2022: Oportunidades para data.europa.eu a partir de las tendencias emergentes en la comunidad geoespacial"

calendar icon
Documentación

Este informe que publica el European Data Portal (EDP) tiene como objetivo ayudar a los usuarios de datos abiertos en el aprovechamiento del potencial de los datos generados por el programa Copernicus.

El proyecto Copernicus genera datos de alto valor obtenidos vía satélite, generando una gran cantidad de datos sobre la observación terrestre, en consonancia con el objetivo del portal Europeo de Datos de aumentar la accesibilidad y el valor de los datos abiertos.

El informe aborda las siguientes cuestiones, ¿Qué puedo hacer con los datos de Copernicus?, ¿Cómo puedo acceder a los datos? ,y ¿Qué herramientas necesito para utilizar los datos? utilizando la información que se encuentra en el Portal Europeo de Datos, catálogos especializados y examinando ejemplos prácticos de aplicaciones que usen datos de Copernicus.

Este informe se encuentra disponible en este enlace: "Copernicus data for the open data community"

calendar icon
Evento

Las XII Jornadas Ibéricas de Infraestructuras de Datos Espaciales (JIIDE) se celebrarán de manera virtual del próximo 15 al 19 de noviembre de 2021. En este evento onlineen el que participará la Iniciativa Aporta, se llevarán a cabo sesiones técnicas, talleres y mesas redondas para poner en común y dar a conocer la armonización, normalización y publicación de la información geográfica a través de las IDE. En concreto, en esta edición, se abordarán cuestiones relacionadas con la reutilización y los ecosistemas digitales. 

¿Qué son las JIIDE y a quién van dirigidas?  

Las Jornadas Ibéricas de Infraestructuras de Datos Espaciales se celebran una vez al año debido a la colaboración entre la Direção-Geral do Território  de Portugal, el Govern d'Andorra y el Centro Nacional de Información Geográfica de España. Su objetivo es dar a conocer el estado de desarrollo de las tecnologías de servicios interoperables de datos espaciales a través del intercambio de experiencias y conocimientos. 

Estas jornadas están dirigidas a profesionales de la administración pública, el sector privado y el académico que se ocupan de la información geográfica. Es decir, están abiertas a todos aquellos que usan o tienen la intención de utilizar Infraestructuras de Datos Espaciales (IDE) en el ejercicio de sus actividades. 

¿Cuál es la agenda? 

Las XII JIIDE se desarrollarán este año bajo el lema “Ecosistemas digitales e interoperabilidad” y se dividirán en cuatro jornadas (del 15 al 19 de noviembre). Cada uno de los 4 días contará con diferentes sesiones a lo largo de la jornada y todas finalizarán con un workshop o taller en el que se pondrán en práctica las temáticas analizadas. 

Aquí podrás inscribirte a los talleres y sesiones de la agenda de las XII Jornadas Ibéricas de Infraestructuras de Datos Espaciales que sean de tu interés. Para consultar el calendario completo de sesiones debes hacer clic en este enlace

Se abordarán temas como la publicación e intercambio de datos, las herramientas utilizadas o la implementación local de catálogos de datos abiertos, entre otros temas. En este último, participará la Iniciativa Aporta.

La Iniciativa Aporta en las JIIDE 

El lunes 15 de noviembre, tendrá lugar la participación de la Iniciativa Aporta en la primera sesión “Catálogo y datos abiertos”. Durante esta intervención, se abordará la “Publicación de los recursos del Catálogo Oficial de Datos y Servicios INSPIRE en datos.gob.es”. 

Durante la intervención se presentará la colaboración entre datos.gob.es y el Centro Nacional de Información Geográfica (CNIG) para la publicación de los recursos de forma automática, es decir, a través de un proceso de federación. Para conseguirlo, desde la Iniciativa Aporta hemos implementado un script que armoniza el catálogo de datos y servicios INSPIRE con los metadatos definidos en la NTI-RISP del catálogo de datos abiertos datos.gob.es.

La ponencia tendrá 3 ejes principales: 

  • Interacción IDEE / INSPIRE – APORTA: áreas de cooperación. Tras una breve presentación e introducción sobre la Iniciativa Aporta para exponer qué es y cuáles son nuestras principales funciones en el mundo de los datos abiertos, analizaremos las áreas de cooperación entre nuestra iniciativa y las IDEE, que se caracterizan por tres aspectos: regulación, difusión y cooperación. 

  • Colaboración Aporta – IDEE en la publicación. Uno de los retos a la hora de publicar los recursos del Catálogo Oficial de Datos y Servicios INSPIRE (CODSI) en datos.gob.es era el gran volumen de datos existentes. Para solucionarlo, se propuso la importación automática a nuestro portal de los 527 conjuntos de datos y servicios de información disponibles a través de un procedimiento de mapeo dividido en dos procesos: el parse lectura o proceso de análisis de metadatos INSPIRE y el proceso de serialización a metadatos NTI-RISP. 

  • Próximas actuaciones IDEE – INSPIRE.  En este punto desarrollaremos algunas de las próximas actuaciones que llevaremos a cabo en este aspecto, como el trabajo conjunto para la definición y requisitos de datos de alto valor fijados en la Directiva 2019/1024 o la inclusión de las características geoespaciales del vocabulario europeo DCAT-AP en la versión revisada de la Norma Técnica de Interoperabilidad (NTI)

Estas son solo algunas de las ideas principales que se abordaran durante las XII Jornadas Ibéricas de Infraestructuras de Datos Espaciales. Si no quieres perderte todos los detalles al respecto, te invitamos a inscribirte y participar en este interesante evento. 

calendar icon
Blog

A lo largo de la historia, los datos geoespaciales han permitido a la humanidad conocer mejor su entorno. Cuando hablamos de datos geográficos o espaciales hacemos referencia a aquellos «que implícita o explícitamente se refieren a una localización relativa a la Tierra», según establece la Norma española UNE 148004:2018. Generalmente, estos datos están accesibles en mapas, visualizadores, dispositivos móviles y otros medios ayudándonos a movernos y a gestionar el territorio de una forma más eficiente, logrando así mayores avances.

Hoy en día, los datos geoespaciales siguen siendo de especial importancia. Según un estudio del Portal de Datos abiertos Europeos, los datos geoespaciales son los segundos más reutilizados, solo por detrás de los datos estadísticos. Tanto particulares como empresas se sirven de ellos para crear herramientas que ayuden a la ciudadanía en su día a día - al elegir la ruta más adecuada para alcanzar un destino -, en situaciones de gestión – como la lucha contra un incendio- o cuando quieren desconectar a través de elementos lúdicos -como los juegos de estrategia-.

Ante esta demanda, no es de extrañar la necesidad de contar con infraestructuras que nos permitan acceder a este tipo de información de una manera armonizada e interoperable facilitando su reutilización.

¿Qué es una Infraestructura de Datos Espaciales (IDE)?

Según refleja la web del Ministerio para la Transición Ecológica y el Reto Demográfico, una Infraestructura de Datos Espaciales (IDE) «es un sistema de información integrado por un conjunto de recursos dedicados a gestionar Información Geográfica, disponibles en Internet, que cumplen una serie de condiciones de interoperabilidad, y que permiten que un usuario, utilizando un simple navegador, pueda utilizarlos y combinarlos según sus necesidades». A través de una IDE, se accede a la información geográfica en Internet mediante servicios web y se cataloga (con metadatos) para su localización o búsqueda, teniendo en cuenta para todo ello reglamentos, documentos técnicos, normas internacionales y estándares que permitan garantizar su interoperabilidad y armonización.

Se trata por tanto de un mecanismo que facilita la tarea de búsqueda y acceso a los datos geográficos de manera uniforme. Algo fundamental para impulsar su reutilización a través del desarrollo de soluciones digitales.

La infraestructura de Datos Espaciales de España (IDEE)

En España encontramos multitud de geoportales y nodos IDE a nivel estatal, autonómico y local, los cuales se centralizan a través del geoportal de la Infraestructura de Datos Espaciales de España (IDEE). Se trata de un proyecto diseñado para fusionar los datos geográficos con los que trabajan las Administraciones Públicas de España bajo el paraguas de la LISIGE y los Reglamentos de la Directiva INSPIRE (Infrastructure for Spatial Information in Europe).

Capturas IDEE

Geoportal IDEE: https://www.idee.es/

El principal objetivo de la IDEE es la publicación de la información geográfica oficial para su visualización y descarga y ofrecer la posibilidad de localizar los datos a través de sus descripciones (metadatos), de forma que los datos sean accesibles, legibles por máquina, fáciles de localizar y reutilizables. Hoy en día, su reutilización es, en general, gratuita. Para lograr este objetivo, la IDEE se basa en normas internacionales y reglamentos europeos que hace que los datos sean interoperables y accesibles a través de formatos abiertos.

El encargado de coordinar la IDEE es el Consejo Directivo de la Infraestructura de Información Geográfica de España (CODIIGE), creado por el Consejo Superior Geográfico, órgano de dirección perteneciente al Ministerio de Transportes, Movilidad y Agenda Urbana (MITMA). El CODIIGE está formado por representantes de los tres niveles de la Administración, expertos de las Comisiones del Consejo Superior Geográfico y expertos en políticas de medio ambiente.

La IDEE forma parte de la IDE Europea y publica aproximadamente unos 250 recursos en el Geoportal de la Comisión Europea clasificados por temáticas.

¿Quién participa en la IDEE?

Como hemos mencionado, la IDEE la integran las organizaciones responsables de los datos que la Comisión Europea ha clasificado, identificado y documentado a través del Reglamento 1089/2010 de la Directiva INSPIRE, como, por ejemplo:

  • Dirección General de Catastro, que publica las parcelas catastrales, los edificios y las direcciones de forma libre y gratuita a través de servicios de visualización y de descarga, lo que permite que estos datos se puedan consultar en sitios como  la Sede Electrónica del Catastro. Cabe destacar su coordinación con el Registro de la Propiedad, ahora cualquier ciudadano puede solicitar voluntariamente en una compraventa, o en cualquier momento, sin necesidad de esperar a la inscripción de un nuevo acto, la incorporación en el Registro de la Propiedad de una representación gráfica catastral.
  • MAPA y MITECO, que trabajan conjuntamente en la publicación de los datos clasificados como prioritarios por la Comisión Europea. Su publicación se materializa en su geoportal IDE.
  • Centro Nacional de Información Geográfica (CNIG), responsable del proyecto Cartociudad que recopila y publica de forma libre y gratuita las direcciones procedentes de la D. G. del Catastro, el Grupo Correos, el Instituto Nacional de Estadística, el Instituto Geográfico Nacional, las C.C. A.A. como País Vasco, Comunidad Foral de Navarra, Comunitat Valenciana, La Rioja, Illes Balears y Comunidad de Madrid, y a nivel local, el Ayuntamiento de Cáceres y la Diputación de Madrid.
  • Ministerio para la Transición Ecológica y el Reto Demográfico, con su aplicación Geoportal de Gasolineras, de búsqueda y visualización de estaciones de servicio, permite localizar las estaciones más económicas y cercanas al usuario a través del uso de datos de ubicación.

En este mapa se pueden consultar otras organizaciones y algunos de sus proyectos IDE.

Otros servicios y recursos web de la IDEE

Hace ya algún tiempo escribimos un artículo acerca de los servicios y recursos que incluía el Geoportal IDEE, y desde entonces, este geoportal se ha complementado con la reciente publicación de la Plataforma IDEE, cuyo objetivo principal es recolectar, para los desarrolladores de la comunidad geoespacial, iniciativas de desarrollo de software, facilitando de ese modo la reutilización de recursos.

En la sección de recursos del geoportal y de la plataforma de la IDEE, se siguen ofreciendo apartados que aportan valor añadido más allá de los propios conjuntos de datos, se trata de recursos publicados por diferentes administraciones, y organismos internacionales, para facilitar la toma de decisiones. A los apartados analizados en el artículo anterior, hemos de añadir como novedad una sección dedicada a Recursos abiertos sobre la COVID-19, cuya incorporación se debe a la importancia que los datos espaciales están teniendo en la gestión de esta crisis sanitaria.

La IDEE cuenta además con un blog donde se recogen cuestiones de interés para todos los usuarios interesados en los datos geográficos.

¿Quieres saber más sobre las IDE?

El ministerio de Transportes, Movilidad y Agenda Urbana ha publicado recientemente una guía sobre las  Infraestructuras de Datos Espaciales, donde se abordan los conceptos básicos, el marco legal, las tecnologías web necesarias para poner en marcha una infraestructura de este tipo, los servicios web, información sobre cómo catalogar la información geográfica (metadatos) y otros temas relacionados.

Además, si estás interesado en la publicación de datos geográficos, te animamos a leer nuestra «Guía práctica para la publicación de Datos Espaciales», donde encontrarás buenas prácticas y pautas para facilitar la publicación de datos espaciales de manera eficiente en Internet.


Contenido elaborado por el equipo de datos.gob.es.

calendar icon