Entre helados y días más largos, el verano ya está aquí. En esta época del año, la información en abierto se puede convertir en nuestra mejor aliada para planificar escapadas, conocer horarios de las zonas de baño de nuestra comunidad o incluso saber el estado del tráfico en carreteras que nos lleven a nuestro próximo destino.
Tanto si te mueves como si permaneces en casa descansando, en el portal datos.gob.es puedes encontrar una amplia variedad de datasets y aplicaciones que pueden transformar la forma de vivir y disfrutar el verano. Además, si lo que te apetece es aprovechar la época estival para formarte, también tenemos recursos para ti.
Formaciones, descanso o aventura, en este post, te ofrecemos algunos de los recursos que te pueden ser útiles este verano.
Una oportunidad para aprender: cursos y aplicaciones culturales
¿Estás pensando en dar un giro en tu carrera profesional? ¿O te gustaría mejorar en alguna disciplina? La ciencia de datos es una de las competencias más demandadas por las empresas y la inteligencia artificial cada día ofrece nuevas oportunidades para aplicarla en nuestro día a día.
Para entender bien ambas disciplinas y estar a la última en lo que respecta a su desarrollo, puedes aprovechar el verano para formarte en programación, visualización de datos o incluso IA generativa. En este post, que publicamos a principio de verano, tienes una lista de propuestas, ¡todavía estás a tiempo de apuntarte a algunas!
Si ya cuentas con algo de conocimiento, te aconsejamos revisar nuestros ejercicios paso a paso. En cada uno de ellos encontrarás el código reproducible y completamente documentado, para que puedas replicarlo a tu ritmo. En esta infografía te mostramos varios ejemplos, divididos por temáticas y nivel de dificultad. Una manera práctica de poner a prueba tus habilidades técnicas y conocer herramientas y tecnologías innovadoras.
Si en lugar de ciencia de datos, quieres aprovechar para adquirir más conocimientos culturales, también tenemos opciones para ti. En primer lugar, te recomendamos este conjunto de datos sobre la agenda cultura de eventos del País Vasco para descubrir festivales, conciertos y otras actividades culturales. Otro dataset interesante es el de oficinas de información turística en Tenerife donde te pondrán informar cómo planificar itinerarios culturales. Y esta aplicación te acompañará a recorrer Castilla y León a través de un mapa gamificado para identificar lugares turísticos de interés.
Planifica tu escapada perfecta: datasets para el turismo y las vacaciones
Algunos de los conjuntos de datos abiertos que puedes encontrar en datos.gob.es son la base para crear aplicaciones que pueden ser de gran utilidad para viajar. Hablamos, por ejemplo, del dataset de campings en Navarra que proporciona datos actualizados sobre campamentos de turismo en activo, incluyendo información sobre servicios, ubicación y capacidad. En esta misma comunidad autónoma, este dataset sobre restaurantes y cafeterías te puede ser de utilidad.
Por otro lado, este conjunto de datos sobre la oferta de alojamientos turísticos de Aragón presenta un catálogo completo de hoteles, paradores y hospederías clasificados por categoría, permitiendo a los viajeros tomar decisiones informadas según su presupuesto y preferencias.
Otro recurso interesante es el este dataset que publica Instituto Nacional de Estadística que puedes encontrar también federado en datos.gob.es sobre viajes, pernoctación duración media y gasto por viaje. Gracias a este conjunto de datos te puedes hacer una idea de cómo viaja la gente y tomarlo de referencia para planificar tu viaje.
Disfruta del agua: conjuntos de datos abiertos para actividades acuáticas
El acceso a información sobre playas y zonas de baño es fundamental para un verano seguro y placentero. El dataset de playas de Bizkaia ofrece información detallada sobre las características de cada playa, incluyendo servicios disponibles, accesibilidad y condiciones del agua. De manera similar, este dataset de las zonas de baño en la Comunidad de Madrid proporciona datos sobre espacios acuáticos seguros y controlados en la región.
Si lo que quieres es una visión más general, esta aplicación que ha desarrollado el Ministerio para la Transición Ecológica y Reto Demográfico (MITECO) con datos abiertos ofrece una visualización nacional de las playas a nivel nacional. Más recientemente, el equipo de datos de RTVE ha desarrollado este Gran Mapa de las playas de España que recoge más de 3.500 destinos con información específica.
Para los amantes de los deportes acuáticos y la navegación, los datasets de predicción de mareas tanto de Galicia como del País Vasco, ofrecen información crucial para planificar actividades en el mar. Estos datos permiten a navegantes, surfistas y pescadores optimizar sus actividades según las condiciones oceánicas.
Movilidad inteligente: datasets para viajar sin complicaciones
No es novedad que la movilidad durante estos meses es aún mayor que en el resto del año. Los datasets sobre estado del tráfico en Barcelona y el de las carreteras de Navarra proporcionan información en tiempo real que ayuda a los viajeros a evitar congestiones y planificar rutas eficientes. Esta información es especialmente valiosa durante los períodos de mayor movilidad estival, cuando las carreteras experimentan un aumento significativo del tráfico.
Las aplicaciones que informan sobre el precio de los carburantes en las distintas gasolineras españolas son de las más consultadas de nuestro portal durante todo el año, pero en verano su popularidad se dispara aún más. Son interesantes porque permiten localizar las estaciones de servicio con precios más competitivos, optimizando el presupuesto de viaje. Esta información también la puedes encontrar en datasets actualizada regularmente y es especialmente útil para viajes largos y planificación de rutas.
El futuro de los datos abiertos en turismo
La convergencia de datos abiertos, tecnología móvil e inteligencia artificial está creando nuevas oportunidades para personalizar y mejorar la experiencia turística. Los datasets y recursos disponibles en datos.gob.es no solo proporcionan información actual, sino que también sirven como base para el desarrollo de soluciones innovadoras que pueden anticipar necesidades, optimizar recursos y crear experiencias más satisfactorias para los viajeros.
Desde la planificación de rutas hasta la selección de alojamientos o la búsqueda de actividades culturales, estos datasets y aplicaciones empoderan a la ciudadanía y son un recurso útil para maximizar el disfrute de esta época del año. Este verano, antes de hacer las maletas, vale la pena explorar las posibilidades que ofrecen los datos abiertos.
La inteligencia artificial ya no es cosa del futuro: está aquí y puede convertirse en una aliada en nuestro día a día. Desde facilitarnos tareas en el trabajo, como redactar correos o resumir documentos, hasta ayudarnos a organizar un viaje, aprender un nuevo idioma o planificar nuestros menús semanales, la IA se adapta a nuestras rutinas para hacernos la vida más fácil. No hace falta ser un experto en tecnología para sacarle partido; si bien las herramientas actuales son muy accesibles, comprender sus capacidades y saber cómo formular las preguntas adecuadas maximizará su utilidad.
Sujetos pasivos y activos de la IA
Las aplicaciones de la inteligencia artificial en el día a día están transformando nuestra vida cotidiana. La IA abarca ya múltiples campos de nuestras rutinas. Los asistentes virtuales, como Siri o Alexa, se encuentran entre las herramientas más conocidas que incorporan inteligencia artificial, y se utilizan para responder preguntas, programar citas o controlar dispositivos.
Muchas personas usan a diario herramientas o aplicaciones con inteligencia artificial, aunque esta opere de forma imperceptible para al usuario y no requiera su intervención. Google Maps, por ejemplo, utiliza IA para optimizar rutas en tiempo real, predecir el estado del tráfico, sugerir caminos alternativos o estimar la hora de llegada. Spotify la aplica para personalizar las listas de reproducción o sugerir canciones, y Netflix para realizar recomendaciones y adaptar el contenido que se muestra a cada usuario.
Pero también es posible ser un usuario activo de la inteligencia artificial utilizando herramientas que interactúan directamente con los modelos. Así, podemos hacer preguntas, generar textos, resumir documentos o planificar tareas. La IA deja de ser un mecanismo oculto para convertirse en una especie de copiloto digital que nos asiste en nuestro día a día. ChatGPT, Copilot o Gemini son herramientas que nos permiten usar la IA sin necesidad de ser expertos. Esto nos facilita la automatización de tareas cotidianas, liberando tiempo para dedicarlo a otras actividades.
IA en el hogar y la vida personal
Los asistentes virtuales responden a comandos de voz y nos informan de qué hora es, el tiempo que va a hacer o nos ponen la música que queremos escuchar. Pero sus posibilidades van mucho más allá, ya que son capaces de aprender de nuestros hábitos para anticiparse a nuestras necesidades. Pueden controlar diferentes dispositivos que tenemos en el hogar de manera centralizada, como la calefacción, el aire acondicionado, las luces o los dispositivos de seguridad. También es posible configurar acciones personalizadas que se activen a través de un comando de voz. Por ejemplo, una rutina “buenos días” que encienda las luces, nos informe del pronóstico del tiempo y del estado del tráfico.
Cuando hemos perdido el manual de alguno de los electrodomésticos o aparatos electrónicos que tenemos en casa, la inteligencia artificial es una buena aliada. Enviando una foto del dispositivo, nos ayudará a interpretar las instrucciones, configurarlo o solucionar problemas básicos.
Si quieres ir más allá, la IA puede hacer por ti algunas tareas de la vida cotidiana. A través de estas herramientas podemos planificar nuestros menús semanales, indicando necesidades o preferencias, como platos aptos para celiacos o vegetarianos, preparar la lista de la compra y obtener las recetas. También nos puede ayudar a elegir entre los platos de la carta de un restaurante teniendo en cuenta nuestras preferencias y restricciones alimentarias, como alergias o intolerancias. A través de una simple foto de la carta, la IA nos ofrecerá sugerencias personalizadas.
El ejercicio físico es otro ámbito de nuestra vida personal en el que estos copilotos digitales son muy valiosos. Podemos pedirle, por ejemplo, que cree rutinas de ejercicios adaptadas a diferentes condiciones físicas, objetivos y material disponible.
La planificación de unas vacaciones es otra de las funcionalidades más interesantes de estos asistentes digitales. Si les proporcionamos un destino, un número de días, intereses e incluso presupuesto, tendremos un plan completo para nuestro próximo viaje.
Aplicaciones de la IA en los estudios
La IA está transformando profundamente la forma de estudiar, ofreciendo herramientas que personalizan el aprendizaje. Ayudar a los más pequeños de la casa en sus tareas escolares, aprender un idioma o adquirir nuevas habilidades para nuestro desarrollo profesional son solo algunas de las posibilidades.
Existen plataformas que generan contenidos personalizados en apenas unos minutos y material didáctico realizado a partir de datos abiertos que se puede utilizar tanto en el aula como en casa para repasar. Entre los universitarios o los estudiantes de secundaria y bachillerato, algunas de las opciones más populares son las aplicaciones que resumen o hacen esquemas a partir de textos más largos. Incluso es posible generar un pódcast desde un fichero, lo que nos puede ayudar a entender y familiarizarnos con un tema mientras hacemos deporte o cocinamos.
Pero también podemos crear nuestras aplicaciones para estudiar o incluso simular exámenes. Sin tener conocimientos de programación, es posible generar una aplicación para aprender las tablas de multiplicar, los verbos irregulares en inglés o lo que se nos ocurra.
Cómo usar la IA en el trabajo y las finanzas personales
En el ámbito profesional la inteligencia artificial ofrece herramientas que aumentan la productividad. De hecho, se estima que en España un 78% de los trabajadores utilizan ya herramientas de IA en el ámbito laboral. Al automatizar procesos, ahorramos tiempo para centrarnos en tareas de más valor. Estos asistentes digitales resumen documentos largos, generan informes especializados en un campo, redactan correos electrónicos o toman notas en las reuniones.
Algunas plataformas incorporan ya la transcripción de las reuniones en tiempo real, algo que puede resultar muy útil si no dominamos el idioma. Microsoft Teams, por ejemplo, ofrece a través de Copilot opciones útiles desde la pestaña “Resumen” de la propia reunión, como la transcripción, un resumen o la posibilidad de agregar notas.
El manejo de las finanzas personales ha evolucionado igualmente gracias a aplicaciones que utilizan IA, permitiendo controlar gastos y gestionar un presupuesto. Pero también podemos crear nuestro propio asesor financiero personal utilizando alguna herramienta de IA, como ChatGPT. Al proporcionarle información sobre ingresos, gastos fijos, variables y objetivos de ahorro, analiza los datos y crea planes financieros personalizados.
Prompts y creación de aplicaciones útiles para el día a día
Hemos visto las grandes posibilidades que nos brinda la inteligencia artificial como copiloto en nuestro día a día. Pero para lograr que sea un buen asistente digital, debemos saber cómo preguntarle y darle las instrucciones precisas.
Un prompt es una instrucción básica o petición que se realiza a un modelo de IA para guiarlo, con el objetivo de que nos proporcione una respuesta coherente y de calidad. Un buen prompting es la clave para sacar el máximo rendimiento de la IA. Es fundamental preguntar bien y proporcionar la información necesaria.
Para escribir prompts efectivos tenemos que ser claros, específicos y evitar ambigüedades. Debemos indicar cuál es el objetivo, es decir, qué queremos que la IA haga: resumir, traducir, generar una imagen, etc. Igualmente es clave proporcionarle el contexto, explicando a quién se dirige o por qué lo necesitamos, además de cómo esperamos que sea la respuesta. Esto puede incluir el tono del mensaje, el formato, las fuentes que se utilicen para generarla, etc.
A continuación, te dejamos algunos consejos para crear prompts efectivos:
- Utiliza frases cortas, directas y concretas. Cuanto más clara sea la petición, más precisa será la respuesta. Evita expresiones como “por favor” o “gracias”, ya que lo único que hacen es añadir ruido innecesario y consumir más recursos. Por el contrario, utiliza palabras como “debes”, “haz”, “incluye” o “enumera”. Para reforzar la petición puedes usar mayúsculas en esas palabras. Estas expresiones son especialmente útiles para afinar una primera respuesta del modelo que no cumple con tus expectativas.
- Indica el público al que se dirige. Especifica si la respuesta va dirigida a un público experto, inexperto, niños, adolescentes, adultos, etc. Cuando queremos una respuesta sencilla podemos, por ejemplo, pedirle a la IA que nos lo explique como si tuviéramos diez años.
- Usa delimitadores. Separa las instrucciones mediante algún símbolo, como unas barras (//) o comillas para que el modelo comprenda mejor la instrucción. Por ejemplo, si quieres que haga una traducción, usa delimitadores para separar la orden (“Traduce al inglés”) de la frase que debe traducir.
- Indica la función que debe adoptar el modelo. Especifica el rol que debe asumir el modelo para generar la respuesta. Indicarle si debe actuar como un experto en finanzas o en nutrición, por ejemplo, ayudará a generar respuestas más especializadas ya que adaptará tanto el contenido como el tono.
- Divide las peticiones completas en solicitudes sencillas. Si vas a hacer una petición compleja que requiere un prompt excesivamente largo, es recomendable que la desgloses en pasos más sencillos. Si necesitas explicaciones detalladas utiliza expresiones como “Piensa a paso” para que te dé una respuesta más estructurada.
- Usa ejemplos. Incluye en el prompt ejemplos de lo que buscas para guiar al modelo hacia la respuesta.
- Proporciona instrucciones en positivo. En lugar de pedir que no haga o incluya algo, expresa la petición de forma afirmativa. Por ejemplo, en vez de “No uses frases largas”, dile: “Utiliza frases breves y concisas”. Las instrucciones en positivo evitan ambigüedades y facilitan que la IA entienda lo que debe hacer. Esto sucede porque los prompts negativos suponen un esfuerzo extra para el modelo, al tener que deducir cuál es la acción contraria.
- Ofrece propinas o penalizaciones. Esto sirve para reforzar comportamientos deseados y coartar respuesta inadecuadas. Por ejemplo, “Si usas frases vagas o ambiguas, perderás 100 euros”.
- Pide que te pregunte lo que necesite. Si le indicamos que nos pida información adicional, reducimos la posibilidad de las alucinaciones, ya que estamos mejorando el contexto de nuestra petición.
- Solicita que responda como un humano. Si los textos te parecen demasiado artificiales o mecánicos, especifica en el prompt que la respuesta sea más natural o que parezca elaborada por un humano.
- Proporciona el inicio de la respuesta. Este simple truco resulta muy útil para guiar al modelo hacia la respuesta que esperamos.
- Delimita las fuentes que debe utilizar. Si acotamos el tipo de información que debe utilizar para generar la respuesta, obtendremos respuestas más afinadas. Pide, por ejemplo, que utilice solo datos posteriores a un año concreto.
- Solicita que imite un estilo. Podemos proporcionarle un ejemplo para que su respuesta sea coherente con el estilo de la referencia o pedirle que siga el estilo de un autor famoso.
Si bien es posible generar código funcional para tareas y aplicaciones sencillas sin conocimientos de programación, es importante notar que el desarrollo de soluciones más complejas o robustas a nivel profesional sigue requiriendo experiencia en programación y desarrollo de software. Para crear, por ejemplo, una aplicación que nos ayude a gestionar nuestras tareas pendientes, le pedimos a las herramientas de IA que generen el código, explicando de manera detallada qué queremos que haga, cómo esperamos que se comporte y qué aspecto debe tener. A partir de estas instrucciones, la herramienta generará el código y nos irá guiando para probarlo, modificarlo y ponerlo en marcha. Podemos preguntarle cómo y dónde ejecutarlo de manera gratuita y pedirle ayuda para realizar mejoras.
Como hemos visto, el potencial de estos asistentes digitales es enorme, pero su verdadero poder reside en gran parte en cómo nos comunicamos con ellos. Los prompts claros y bien estructurados son la clave para obtener respuestas precisas sin necesidad de ser expertos en tecnología. La IA no solo nos ayuda a automatizar tareas rutinarias, sino que amplía nuestras capacidades, permitiéndonos hacer más en menos tiempo. Estas herramientas están redefiniendo nuestro día a día, haciéndolo más eficiente y dejándonos tiempo para otras cosas. Y lo mejor de todo: ya está a nuestro alcance.
Un Destino Turístico Inteligente (DTI) se fundamenta en un modelo de gestión basado en la innovación y el uso de tecnología avanzada para optimizar la experiencia del visitante y mejorar la sostenibilidad del destino, a la vez que se fortalece la calidad de vida de los residentes. El modelo DTI se basa en una serie de indicadores que permiten analizar el estado del destino turístico, diagnosticar áreas de mejora y desarrollar planes de acción estratégicos. Este enfoque, promovido por SEGITTUR (Sociedad Estatal para la Gestión de la Innovación y las Tecnologías Turísticas) y otras entidades públicas autonómicas (por ejemplo, el modelo DTI-CV de la Comunitat Valenciana definido por INVATTUR – Instituto Valenciano de Tecnologías Turísticas), se ha consolidado como un pilar clave en la transformación digital del turismo. Este uso intensivo de tecnologías en los DTI los ha transformado en verdaderos centros generadores de datos, los cuales -combinados con fuentes externas- pueden ser utilizados para optimizar la toma de decisiones y mejorar la gestión del destino.
Procedencia de los datos en un DTI y su uso
En un DTI, los datos se generan básicamente a partir de dos ámbitos principales:
- Datos generados por visitantes o turistas: estos crean una huella digital a medida que interactúan con diferentes tecnologías. Esta huella incluye comentarios, valoraciones, imágenes, registros de gasto, ubicaciones y preferencias, que quedan reflejados en aplicaciones móviles, redes sociales o plataformas de reservas. Además, se generan datos de manera pasiva a través de sistemas de pago electrónico o de movilidad urbana, así como dispositivos de medición de afluencia, entre otros.
- Datos generados por el destino turístico: gracias a la sensorización e implementación de redes IoT (Internet of Things o Internet de las cosas), los destinos recopilan información en tiempo real sobre gestión del tráfico, consumo energético, calidad ambiental y uso de servicios (públicos o privados). Además, el destino genera datos esenciales sobre su oferta turística, tales como listados actualizados de alojamientos o establecimientos de hostelería, lugares o eventos de interés turístico y servicios complementarios.
La combinación de estas fuentes de datos en una Plataforma Inteligente de Destinos (PID) como la propuesta por SEGITTUR, permite a los DTI utilizarlos para facilitar una gestión más innovadora y orientada a la mejora de la experiencia.
Título: Ámbitos de generación de datos en un DTI

Fuente: elaboración propia
Existen numerosos ejemplos y buenas prácticas en el uso de estos datos turísticos, implementados por diversos destinos europeos, cuya descripción se documenta en el informe Study on mastering data for tourism by EU destinations. Este informe proporciona una visión detallada sobre las oportunidades que el uso de datos ofrece para mejorar la competitividad del ecosistema turístico. Además, este informe no obvia la importancia de los destinos turísticos como generadores de datos, formulando una serie de recomendaciones para las Administraciones públicas, entre las que destaca el desarrollo de un plan de gestión de datos transversal -es decir, que involucre no solo al área de turismo, sino también a otras como urbanismo y medio ambiente-, garantizando un enfoque integral. Este plan debe impulsar la disponibilidad de datos abiertos, con especial atención a aquellos relacionados con sostenibilidad, accesibilidad y oferta turística especializada.
Modelos de destino turístico inteligente y datos abiertos
En el modelo DTI de SEGITTUR (descrito recientemente en su guía práctica) se establece como requisito la creación de un portal de datos abiertos en los destinos turísticos para facilitar la publicación de datos en el lugar donde se lleva a cabo la actividad turística y su acceso en formatos reutilizables, posibilitando el desarrollo de distintos productos y servicios. No se establecen temáticas específicas, pero se resaltan datos de interés como transporte público, comercios, ofertas de empleo, agenda cultural o sensores ambientales. Resulta interesante la definición de indicadores para evaluar la calidad del portal como la conformidad con los estándares de datos abiertos, la existencia de sistemas para automatizar la publicación de datos o el número de conjuntos de datos disponibles por cada 100.000 habitantes. También se indica que se deben incorporar de manera progresiva nuevos conjuntos de datos a medida que se identifique su utilidad.
Cabe destacar que en otros modelos DTI, como el modelo DTI-CV de INVATTUR anteriormente mencionado, se propone igualmente que los destinos dispongan un portal de datos abiertos en turismo con el fin de fomentar la innovación turística.
Datos turísticos de alto valor
La Unión Europea, a través de la Directiva (UE) 2019/1024 relativa a los datos abiertos y la reutilización de la información del sector público y el Reglamento de ejecución (UE) 2023/138, ha definido conjuntos de datos de alto valor en diversas áreas, incluyendo el turismo dentro de la categoría de datos estadísticos. Se trata de datos sobre flujos turísticos en Europa:
- Pernoctaciones en establecimientos de alojamiento turístico, a nivel nacional, a nivel NUTS 2 (comunidades y ciudades autónomas), nivel NUTS 3 (provincias) y para algunas ciudades específicas.
- Llegada y salida de turistas, gasto turístico, ocupación hotelera, demanda de servicios turísticos, a nivel nacional.
Es interesante resaltar que estos y otros datos se han recogido en Dataestur, la plataforma de datos del turismo en España. Dataestur organiza sus datos en diversas categorías:
- Viajes y ocio: estadísticas sobre la llegada de turistas, valoración de atracciones, visitas a museos y gasto en actividades recreativas.
- Economía: datos sobre empleo en el sector turístico, empresas activas y gasto de los visitantes internacionales.
- Transporte: datos sobre movilidad, incluyendo tráfico aéreo, transporte en autobús y tren, carreteras y puertos.
- Alojamientos: información sobre ocupación hotelera, turismo rural, campings y viviendas turísticas, además de precios, rentabilidad y satisfacción hotelera.
- Sostenibilidad: indicadores sobre calidad del aire, agua y conservación de la naturaleza en destinos turísticos.
- Conocimiento: análisis sobre percepción del visitante, seguridad, conectividad digital, estudios e informes turísticos.
La mayoría de estos datos se recopilan a nivel provincial (NUTS 3), por lo que no se publican a nivel de destino turístico. En este sentido, la Federación Española de Municipios y Provincias (FEMP) propone 80 conjuntos de datos a publicar en abierto por la Administración local que, además, tienen en cuenta los datos de alto valor, aterrizándolos al ámbito local. De entre todos estos conjuntos de datos, se definen explícitamente los siguientes como datos dentro de la categoría de turismo: agenda cultural, alojamientos turísticos, censo de locales comerciales y de ocio, flujos turísticos, lugares de interés turístico y monumentos.
Barreras y oportunidades en la publicación de datos abiertos por parte de los DTI
Después de analizar el estado actual de la gestión de datos en el ámbito turístico, se plantean una serie de oportunidades para los destinos turísticos como generadores de datos abiertos:
- Disposición de datos para su consumo interno: los datos turísticos abarcan múltiples temáticas y se generan en diferentes departamentos dentro de la Administración local, como turismo, urbanismo, movilidad, medio ambiente o economía. Ante este escenario de diversidad de fuentes y responsables, trabajar en la publicación de datos en formatos reutilizables no solo facilita su reutilización por agentes externos, sino que también optimiza su uso dentro de la propia Administración local, permitiendo una gestión más eficiente y basada en datos.
- Fomento de la innovación en turismo: los datos abiertos procedentes de destinos turísticos son una excelente materia prima sobre la cual desarrollar productos y servicios inteligentes de valor añadido para el sector. Esto facilita la colaboración público-privada, promoviendo la creación de una industria tecnológica en torno a los destinos turísticos y los datos abiertos que generan.
- Facilitar la participación de destinos turísticos en espacios de datos: la publicación de datos abiertos permite a los entes gestores de los destinos turísticos incorporarse a espacios de datos de manera más sólida. Por una parte, disponer de datos abiertos facilita la interoperabilidad entre actores del sector. Por otra parte, iniciativas de datos abiertos turísticos incrementan la cultura del dato en los destinos turísticos, impulsando la percepción de la utilidad de una gestión turística basada en datos.
A pesar de estas claras oportunidades, existen diversas barreras que dificultan que los destinos turísticos publiquen datos en formato abierto de manera efectiva:
- Necesidad de presupuesto y recursos técnicos suficientes: la publicación de datos abiertos requiere inversiones en plataformas tecnológicas y en la capacitación de equipos especializados. Esto es más importante, si cabe, en el ámbito turístico donde los datos son heterogéneos, de una diversidad amplia de temáticas y están fragmentados, lo que requiere esfuerzos adicionales en su recopilación, estandarización y publicación coordinada.
- Predominio de pequeñas empresas en destinos turísticos: es preciso dotar de apoyo a las empresas turísticas con el fin de que puedan incorporar el uso de datos abiertos del destino, así como el desarrollo de soluciones basadas en estos datos adaptadas a las necesidades del destino.
- Desconocimiento sobre la utilidad de los datos abiertos: se corre el riesgo de que los datos abiertos sean vistos como una tendencia más que como un recurso estratégico que posibilita beneficios tangibles. En este sentido, los datos se perciben como un recurso interno en lugar de activos que pueden ser compartidos para multiplicar su valor. Falta una mayor difusión de referentes claros y ejemplos de impacto de reutilización de datos abiertos en destinos turísticos que permita profundizar en la incorporación de una cultura del dato a nivel de destino turístico.
- Dificultad en la operacionalización de estrategias de datos: los destinos turísticos han incorporado la publicación de datos abiertos en sus planes estratégicos, pero es necesario su impulso para su implementación efectiva. Una de las cuestiones clave en este sentido es el temor a la pérdida de ventaja competitiva, debido que la publicación de datos abiertos relacionados con la actividad turística de un destino podría reducir su diferenciación frente a otros. Otra preocupación se refiere a los aspectos legales y de protección de datos personales, especialmente en áreas como la movilidad y el consumo turístico.
Conclusiones: el futuro de los datos abiertos en los modelos de DTI
En relación a la gestión de datos, es necesario abordar aspectos que aún no están suficientemente desarrollados en los modelos DTI, como el intercambio de datos en el destino, en lugar de la mera compra de información; la integración transversal de datos a escala local, permitiendo el cruce de información de diferentes áreas (urbanismo, medio ambiente, turismo, etc.); la obtención de un mayor nivel de detalle en los datos, tanto en términos temporales (eventos específicos) como espaciales (zonas o puntos de interés dentro de los destinos), salvaguardando la privacidad; y el desarrollo de una estrategia efectiva de datos abiertos.
Poniendo el foco en este último punto, las estrategias de DTI deben incluir la publicación de datos abiertos. Para ello, es prioritario definir un plan de gestión de datos que permita determinar a cada destino qué datos se producen, cómo se pueden compartir y bajo qué condiciones, garantizando que la apertura de datos no afecte negativamente a la competitividad del destino ni entre en conflicto con la legislación vigente en materia de protección de datos y privacidad.
Una herramienta clave en este proceso es la definición de un catálogo, que permita organizar, priorizar y clasificar los datos disponibles (y sus metadatos) según su valor y utilidad para los diferentes actores del ecosistema turístico. Este catálogo debe permitir que los datos de los DTI cumplan los principios FAIR (Findable, Accessible, Interoperable, Reusable), facilitando su publicación en abierto o permitiendo su integración en espacios de datos (como el espacio de datos europeo de turismo desarrollado en el proyecto DeployTour). En este contexto, cada conjunto de datos identificado y catalogado debería tener dos versiones:
- Una versión abierta, accesible para cualquier usuario y en un formato reutilizable, con una licencia sin restricciones (es decir, un conjunto de datos abiertos).
- Una versión que permita acuerdos específicos para su uso en espacios de datos, donde se mantenga la soberanía y control del destino, estableciendo restricciones de acceso y condiciones de uso.
Independientemente del enfoque adoptado, todos los datos publicados deben cumplir con los principios FAIR, garantizando que sean localizables, accesibles, interoperables y reutilizables, promoviendo su aprovechamiento tanto en el sector público como privado y facilitando el desarrollo de soluciones innovadoras basadas en datos en el ámbito del turismo.
Jose Norberto Mazón, Catedrático de Lenguajes y Sistemas Informáticos de la Universidad de Alicante. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Hoy en día, la transparencia, la innovación y el desarrollo económico son claves para el progreso de las instituciones públicas. En este contexto, el Cabildo de Tenerife ha emprendido un ambicioso proyecto de datos abiertos que trasciende la mera publicación de información. El objetivo de esta estrategia es facilitar el acceso a la información, fomentar la reutilización de los datos y generar valor social y económico para la isla.
A través de su portal de datos abiertos, el Cabildo no solo promueve la transparencia y la rendición de cuentas, sino que también impulsa la innovación en áreas tan diversas como el turismo, el transporte y el medio rural.
Alcance y objetivos del proyecto
El portal de datos abiertos del Cabildo de Tenerife publica datasets de todo el sector público insular, incluyendo todos los ayuntamientos de la isla. En especial, se incluye los municipios de menos de 20.000 habitantes, tal y como se establece en la Ley 8/2015 de Cabildos Insulares. Los objetivos principales de este proyecto son:
- Potenciar la cultura interna y externa del uso del dato.
- Incrementar la transparencia y rendición de cuentas a través del dato.
- Generar riqueza en la sociedad mediante la reutilización de la información.
En esta web se pueden encontrar conjuntos de datos abiertos de turismo, transporte, cultura y ocio y medio rural, entre otros. Para ofrecer esta información el Cabildo de Tenerife se beneficia de la colaboración de diversos organismos como:
- Transportes Interurbanos de Tenerife (TITSA)
- Consejo Insular de Aguas de Tenerife (CIATF)
- Metropolitano de Tenerife
- SINPROMI (Sociedad Insular para la Promoción de las personas con discapacidad)
- ITER (Instituto Tecnológico de Energías Renovables)
- IASS (Instituto Insular de Atención Social y Sociosanitaria)
- Agrocabildo
Conjuntos de datos más descargados y significativos
Algunos de los conjuntos de datos más descargados y significativos del portal incluyen:
- Red de estaciones meteorológicas, con actualizaciones cada 10 minutos.
- Afluencia de áreas recreativas, como Punta Teno y Barranco de Masca, con información sobre el número de vehículos y personas, y los itinerarios de senderos o rutas en la isla.
- Indicadores de desarrollo económico y ocupación turística, incluyendo el número de turistas alojados por categoría y zona.
- Precios de productos hortofrutícolas en Mercatenerife.
- Matriz Origen Destino de transporte público, que muestra las relaciones entre los lugares de origen y destino de los viajes realizados en la isla.
El proyecto de datos abiertos del Cabildo tiene clara la orientación de cumplimiento de la Norma Técnica de Interoperabilidad (NTI) de Reutilización de Recursos de información y el modelo DCAT-AP, áreas en las que continúa avanzando.
Casos de uso y aplicaciones para incentivar la reutilización
Más allá de publicar conjuntos de datos abiertos, el Cabildo de Tenerife promueve activamente su uso mediante el desarrollo de casos de uso y aplicaciones. Algunos ejemplos de este trabajo son:
- Desarrollo de un plan de ordenación urbana en el municipio de Santiago del Teide mediante la reutilización de diversos conjuntos de datos.
- Proyecto de previsión de datos meteorológicos.
- Cuadros de mando sobre plazas turísticas y tráfico. En concreto:
- Sobre turismo: plazas de alojamientos turísticos por municipio y modalidad, y el índice de ocupación según el tipo de alojamiento desde 1978 hasta 2023.
- Sobre tráfico: dashboard de Power BI que muestra la intensidad media diaria de tráfico en una estación de la isla para los años 2021, 2022 y 2023.
Por otro lado, para fomentar la reutilización de los datos de su portal, el Cabildo de Tenerife organiza diversas actividades, como el I Concurso de Reutilización de Ideas, en el que se recibieron 25 propuestas. Este concurso tendrá continuidad con una segunda edición que premiará el desarrollo de aplicaciones.
Además, se realizan charlas y webinars, como el organizado en colaboración con la Cátedra de Big Data, Open Data y Blockchain de la Universidad de La Laguna sobre cómo utilizar datos abiertos de Tenerife para impulsar la innovación y que puedes volver a ver aquí.
Próximos pasos: IA y construir comunidad
Para medir el impacto de los datos abiertos, el Cabildo de Tenerife utiliza herramientas como Google Analytics que permite analizar la interacción de los usuarios con los datos disponibles. El próximo gran paso, tal y como informan desde la organización, será implementar un asistente virtual con IA generativa que permita:
- Analizar datos con lenguaje natural.
- Descubrir tendencias y correlaciones.
- Acercar la información a cualquier ciudadano.
Paralelamente, el Cabildo de Tenerife también seguirá trabajando en nuevas vías de colaboración con los municipios de la isla y otras entidades, con el objetivo de ampliar la cantidad y variedad de datos abiertos disponibles para los ciudadanos.
Desde datos.gob.es, animamos a profesionales del desarrollo y la investigación, estudiantes y ciudadanos a explorar, reutilizar y crear valor con los datos de Tenerife.
El turismo es uno de los motores económicos de España. En 2022, supuso el 11,6% del Producto Interior Bruto (PIB), superando los 155.000 millones de euros, de acuerdo con el Instituto Nacional de Estadística (INE). Una cifra que creció hasta los 188.000 millones y el 12,8% del PIB en 2023, según Exceltur, asociación de empresas del sector. Además, España es un destino muy popular entre los extranjeros, situándose en el segundo puesto mundial y creciendo: este 2024 se espera alcanzar récord de visitantes internacionales, llegando a los 95 millones.
En este contexto, la Secretaría de Estado de Turismo (SETUR), alineada con las políticas europeas, está desarrollando actuaciones que pretenden crear nuevas herramientas tecnológicas para la Red de Destinos Turísticos Inteligentes, a través de SEGITTUR (Sociedad Mercantil Estatal parala Gestión de la Innovación y las Tecnologías Turísticas), ente encargado de impulsar la innovación (I+D+i) en esta industria. Para ello trabaja tanto con el sector público como con el privado, impulsando:
- Modelos de gestión sostenible y más competitivos.
- La gestión y creación de destinos inteligentes.
- La exportación de tecnología española al resto del mundo.
Todas ellas son actividades donde los datos -y el conocimiento que se puede extraer de ellos- tienen un gran papel. En este post, vamos a repasar algunas de las acciones que SEGITTUR lleva a cabo para impulsar la compartición y apertura de datos, así como su reutilización. El objetivo es ayudar no solo a la toma de decisiones, sino también al desarrollo de productos y servicios innovadores que continúen posicionando a nuestro país en los primeros puestos del turismo mundial.
Dataestur, un portal de datos abiertos
Dataestur es un espacio web que recoge en un único entorno datos abiertos del turismo nacional. Los usuarios pueden encontrar cifras procedentes de distintas fuentes de información, públicas y privadas.
Los datos están estructurados en seis categorías:
- General: llegadas de turistas internacionales, gasto turístico, encuesta de turismo de residentes, barómetro del turismo mundial, datos de cobertura banda ancha, etc.
- Economía: ingresos por turismo, aportación al PIB, empleo turístico (demandantes de empleo, paro y contratos), etc.
- Transporte: pasajeros aéreos, capacidad aérea programada, tráfico de pasajeros por puertos, trenes y carreteras, etc.
- Alojamientos: ocupación hotelera, precio de alojamientos e indicadores de rentabilidad del sector hotelero, etc.
- Sostenibilidad: calidad del aire, protección de la naturaleza, valores climatológicos, calidad del agua en las zonas de baño, etc.
- Conocimiento: informes de escucha activa, comportamiento y percepción del visitante, revistas científicas de turismo, etc.
Los datos están disponibles para su descarga vía API.
Dataestur forma parte de un proyecto más ambicioso en el que el análisis de los datos constituye la base para mejorar el conocimiento del turista, a través de acciones con un amplio alcance, como las que veremos a continuación.
Desarrollo de una Plataforma Inteligente de Destinos (PID)
Dentro del cumplimiento de los hitos marcados por los fondos Next Generation, y correspondiente al desarrollo del Plan de Transformación Digital de Destinos Turísticos, la Secretaría de Estado de Turismo, a través de SEGITTUR, está desarrollando una Plataforma Inteligente de Destinos (PID). Se trata de una plataforma-nodo que recoge la oferta de servicios turísticos y facilita la interoperabilidad de operadores públicos y privados. Gracias a esta plataforma se podrá proveer de servicios para integrar y relacionar datos de ambas fuentes, públicas y privadas.
Algunos de los retos del ecosistema turístico español a los que da respuesta la PID son:
- Potenciar la integración y desarrollo del ecosistema turístico (academia, emprendedores, empresa, etc.) en torno a la inteligencia del dato y garantizar el alineamiento tecnológico, la interoperabilidad y el lenguaje común.
- Promover el uso de la economía del dato para mejorar la generación, agregación y compartición de conocimiento en el sector turístico español, impulsando su transformación digital.
- Contribuir a una correcta gestión de los flujos turísticos y de los puntos de afluencia turística del espacio ciudadano, mejorando la respuesta a los problemas de la ciudadanía y ofreciendo información en tiempo real para la gestión turística.
- Generar un impacto notable en el turista, residentes y empresa, además del resto de agentes, potenciando la marca “país turismo sostenible” durante todo el ciclo de viaje (antes, durante y después).
- Establecer un marco de referencia para consensuar objetivos y métricas que impulsen la sostenibilidad y la reducción de la huella de carbono en la industria turística, fomentando prácticas sostenibles y la integración de tecnologías limpias.

Figura 1. Objetivos de la Plataforma Inteligente de Destinos (PID).
Nuevos casos de uso y metodologías para implementarlos
Para avanzar en la armonización de la gestión de datos, se han definido hasta 25 casos de uso que permiten a los distintos verticales del sector trabajar de manera coordinada. Estos verticales incluyen áreas como enoturismo, turismo termal, gestión de playas, hoteles proveedores de datos, indicadores de impacto, cruceros, turismo deportivo, etc.
Para implementar estos casos de uso, se sigue una metodología de 5 pasos que busca alinear las prácticas del sector con un enfoque más estructurado en torno a los datos:
- Identificar los problemas públicos a resolver.
- Identificar qué datos son necesarios disponer para poder resolverlos.
- Modelizar esos datos para definir una nomenclatura, definición y relaciones comunes.
- Definir qué tecnología hay que desplegar para poder capturar o generar dichos datos.
- Analizar qué capacidades de intervención, tanto públicas como privadas, se necesitan para resolver el problema.
Impulso de la interoperabilidad a través de una ontología común y un espacio de datos
Como resultado de esa definición de los 25 casos de uso se ha creado una ontología del turismo que esperan sirva como referencia mundial. La ontología tiene la vocación de generar un impacto significativo en el sector turístico, ofreciendo una serie de beneficios:
- Interoperabilidad: la ontología es esencial para establecer una estructura de datos homogénea y permitir una interoperabilidad global, lo que facilita la integración de información y el intercambio de datos entre plataformas y países. Al proporcionar un lenguaje común, definiciones y una estructura conceptual unificada, los datos pueden ser comparables y utilizables en cualquier parte del mundo. Los destinos turísticos y el tejido empresarial pueden comunicarse de manera más efectiva y ágil, impulsando una colaboración más estrecha.
- Transformación digital: al fomentar el desarrollo de tecnologías avanzadas, como la inteligencia artificial, las empresas turísticas, el ecosistema innovador o académico pueden analizar grandes volúmenes de datos de manera más eficiente. Esto es debido principalmente a la calidad de la información disponible y a que los sistemas comprenden mejor el contexto en el que operan.
- Competitividad turística: alineado con la cuestión anterior, la implementación de esta ontología contribuye a eliminar desigualdades en el uso y aplicación de la tecnología dentro del sector. Al facilitar el acceso a herramientas digitales avanzadas, tanto las instituciones públicas como las empresas privadas pueden tomar decisiones más informadas y estratégicas. Esto no solo eleva la calidad de los servicios ofrecidos, sino que también impulsa la productividad y competitividad del sector turístico español en un mercado global cada vez más exigente.
- Experiencia turística: gracias a la ontología, es posible ofrecer recomendaciones adaptadas a las preferencias individuales de cada viajero. Esto se logra mediante un perfilado más preciso basado en características demográficas y comportamentales, así como en las motivaciones específicas relacionadas con diferentes tipos de turismo. Al personalizar las ofertas y servicios, se mejora la satisfacción del cliente antes, durante y tras el viaje, y se fomenta una mayor fidelidad hacia los destinos turísticos.
- Gobernanza: el modelo ontológico está diseñado para evolucionar y adaptarse a medida que surgen nuevos casos de uso ante las demandas cambiantes del mercado. SEGITTUR está trabajando activamente en establecer un modelo de gobernanza que promueva la colaboración efectiva entre instituciones públicas y privadas, así como con el sector tecnológico.
Además, para resolver problemas complejos que requieren compartición de datos de diferentes fuentes, se ha creado la Plataforma de Innovación Abierta (PIA), un espacio de datos que facilita la colaboración entre los diferentes actores del ecosistema turístico, tanto públicos como privados. Esta plataforma permite compartir datos de manera segura y eficiente, potenciando la toma de decisiones basadas en datos. El PIA promueve un entorno colaborativo donde se comparten datos abiertos y privados para crear soluciones conjuntas que aborden desafíos específicos del sector, como la sostenibilidad, la personalización de la experiencia turístico o la gestión del impacto ambiental.
Impulso del consenso
Desde SEGITTUR también se están llevando a cabo diversas iniciativas para lograr el consenso necesario en la recopilación, gestión y análisis de datos relacionados con el turismo, a través de la colaboración entre actores públicos y privados. Para ello, en 2021 se creó el Ente Promotor de la Plataforma Inteligente de Destinos, que juega un papel fundamental al aglutinar a diversos actores para coordinar esfuerzos y acordar grandes líneas y directrices en el ámbito de los datos turísticos.
En resumen, España está avanzando en la recopilación, gestión y análisis de datos turísticos mediante la coordinación entre los actores públicos y privados, utilizando metodologías y herramientas avanzadas como la creación de ontologías, casos de uso y plataformas colaborativas como la PIA que aseguran una gestión eficiente y consensuada del sector.
Todo ello no solo está modernizando el sector turístico español, sino que también está sentando las bases para un futuro más inteligente, conectado y eficiente. Con su enfoque en la interoperabilidad, la transformación digital y la personalización de experiencias, España se posiciona como líder en innovación turística, lista para afrontar los desafíos tecnológicos del mañana.
Desde el 28 de octubre y hasta el 24 de noviembre estará abierta la inscripción para presentar propuestas al reto de la Diputación de Bizkaia. El objetivo de la competición es identificar iniciativas que combinen la reutilización de datos disponibles en el portal Open Data Bizkaia con el uso de la inteligencia artificial. Las bases completas están disponibles en este enlace, pero, en este post, te contamos todo lo que tienes que saber sobre este concurso que ofrece premios en metálico para los cinco mejores proyectos.
Los participantes deberán utilizar al menos un dataset de la Diputación Foral de Bizkaia o de los ayuntamientos del territorio, que se pueden encontrar en el catálogo, para abordar uno de los cinco casos de uso propuestos:
- Contenido promocional sobre atractivos turísticos de Bizkaia: contenido promocional por escrito, como pueden ser imágenes generadas, flyers, etc. que utilicen datasets como:
- Playas de Bizkaia por municipio
- Agenda cultural – BizkaiKOA
- Agenda cultural de Bizkaia
- Bizkaibus
- Senderos
- Áreas de esparcimiento
- Hoteles de Euskadi – Open Data Euskadi
- Predicciones de la temperatura en Bizkaia – datos de Weather API
- Impulso del turismo a través del análisis de sentimientos: archivos de texto con recomendaciones para mejorar los recursos turísticos, como reportes en Excel y PowerPoint, etc. que utilicen datasets como:
- Playas de Bizkaia por municipio
- Agenda cultura – BizkaiKOA
- Agenda cultural de Bizkaia
- Bizkaibus
- Senderos
- Áreas de esparcimiento
- Hoteles de Euskadi – Open Data Euskadi
- Google reviews API – este recurso es de pago con posible capa gratuita
- Guías personalizadas para el turismo: Chatbot, documento con recomendaciones personalizadas que utilicen datasets como:
- Tabla de mareas 2024
- Playas de Bizkaia por municipio
- Agenda cultural – BizkaiKOA
- Agenda cultural de Bizkaia
- Bizkaibus
- Senderos
- Hoteles de Euskadi – Open Data Euskadi
- Predicciones de la temperatura en Bizkaia – datos de Weather API, recurso con capa gratuita
- Recomendación personalizada de eventos culturales: Chatbot, documento con recomendaciones personalizadas que utilicen datasets como:
- Agenda cultural - BizkaiKOA
- Agenda cultural de Bizkaia
- Optimización de la gestión de residuos: Reportes Excel, PowerPoint y Word que contengan recomendaciones y estrategias que utilicen datasets como:
- Residuos urbanos
- Contenedores por municipio
¿Cómo participar?
Los participantes podrán inscribirse de forma individual o en equipos a través de este formulario disponible en la web. El plazo de inscripción es del 28 de octubre al 24 de noviembre de 2024. Una vez cerrada la inscripción, los equipos deberán presentar sus soluciones en Sharepoint. Un jurado preseleccionará a cinco finalistas, quienes tendrán la oportunidad de presentar su proyecto en el evento final el 12 de diciembre, en el que se entregarán los premios. La organización recomienda asistir presencialmente, pero, si no es posible, también se permitirá la asistencia online.
La competición está abierta a cualquier persona mayor de 16 años con DNI o pasaporte en vigor, que no pertenezca a las entidades organizadoras. Además, se pueden presentar más de una propuesta.
¿Cuáles son los premios?
Los miembros del jurado elegirán cinco proyectos ganadores en base a los siguientes criterios de valoración:
- Adecuación de la solución propuesta al reto seleccionado.
- La creatividad y la innovación.
- Calidad y coherencia de la solución.
- Adecuación de datasets de Open Data Bizkaia utilizados.
Las candidaturas ganadoras recibirán un premio en metálico, así como el compromiso de abrir los datasets asociados al proyecto, en la medida en que sea posible.
- Primer premio: 2.000 €.
- Segundo premio: 1.000 €.
- Tres premios para el resto de finalistas de 500 € a cada uno.
Uno de los objetivos de este reto, tal y como explica la Diputación Foral de Bizkaia, es conocer si la oferta actual de datasets se ajusta a la demanda. Por este motivo, si alguna persona participante precisa de un conjunto de datos de Bizkaia o de sus ayuntamientos que no está disponible, puede proponer que la institución lo ponga a disposición del público. Siempre y cuando dicha información se ajuste a las competencias de la Diputación Foral de Bizkaia o de los ayuntamientos.
Este es un evento único que no solo te permitirá mostrar tus habilidades en inteligencia artificial y datos abiertos, sino que también contribuirás al desarrollo y mejora de Bizkaia. No dejes pasar la oportunidad de ser parte de este emocionante reto. ¡Inscríbete y empieza a crear soluciones innovadoras!
En este episodio vamos a profundizar en la importancia de tres de las categorías de conjuntos de datos de alto valor relacionadas entre sí. Se trata de los datos de observación de la Tierra y el medio ambiente, los datos geoespaciales y los datos de movilidad. Para hablarnos de ellas, hemos entrevistado a dos expertos en la materia:
- Paloma Abad Power, Subdirectora adjunta del Centro Nacional de Información Geográfica (CNIG).
- Rafael Martínez Cebolla, geógrafo del Gobierno de Aragón.
Con ellos hemos explorado cómo estos conjuntos de datos de alto valor están transformando nuestro entorno, contribuyendo al desarrollo sostenible y a la innovación tecnológica.
Resumen de la entrevista
1. ¿Qué son los datos de alto valor y por qué son importantes?
Paloma Abad Power: Según la normativa, estos conjuntos de datos de alto valor son los que garantizan un mayor potencial socioeconómico y para ello deben ser fáciles de encontrar, es decir, deben ser accesibles, interoperables y utilizables. ¿Y qué es lo que significa esto? Pues que los conjuntos de datos deben tener sus descripciones, es decir, los metadatos en línea, que informen de las estadísticas y de sus propiedades, y que se puedan descargar o utilizar de forma fácil.
En muchos casos, estos datos suelen ser datos de referencia, es decir, datos que sirven para generar otro tipo de datos, como los datos temáticos, o pueden generar valor añadido.
Rafael Martínez Cebolla: Se podrían definir como aquellos conjuntos de datos que representan fenómenos que sirven para la toma de una decisión, para cualquier política pública o para cualquier acción que pueda emprender una persona física o jurídica.
En ese sentido, hay ya unas directivas, que ya no son tan recientes, como la Directiva del Marco del Agua o la Directiva INSPIRE, que motivaban esa necesidad de disponer datos compartidos bajo unos estándares que posibiliten el desarrollo sostenible de nuestra sociedad.
2. Estos datos de alto valor vienen marcados por una Directiva europea y un Reglamento de ejecución en el que se dictaban seis categorías de conjuntos de datos de alto valor. En esta ocasión nos vamos a centrar en tres de ellas: los datos de observación de la Tierra y el medio ambiente, los datos geoespaciales y los datos de movilidad. ¿Qué tienen en común estas tres categorías de datos y qué conjuntos de datos concretos abarcan?
Paloma Abad Power: En mi opinión estos datos tienen en común la componente geográfica, es decir, son datos ubicados sobre la Tierra y, por tanto, sirven para solucionar problemas de diferente naturaleza y vinculados a la sociedad.
Así, por ejemplo, tenemos, con una cobertura nacional, el Plan Nacional de Ortofotografía Aérea (PNOA), que son las imágenes aéreas, el Sistema de Información de Ocupación del Suelo (SIOSE), las parcelas catastrales, las líneas límite, los nombres geográficos, las carreteras, las direcciones postales, los lugares protegidos - que pueden ser tanto de tipo ambiental, como también los castillos, es decir, patrimonio histórico-, etc. Y estas categorías abarcan casi todos los temas definidos por los anexos de la directiva INSPIRE.
Rafael Martínez Cebolla: Hay que saber distinguir qué es información geográfica pura, con una referencia geográfica directa, frente a otro tipo de fenómenos que tienen referencias geográficas de tipo indirecto. En este mundo actual, el 90% de la información puede ser ubicada, ya sea de manera directa o indirecta. Hoy más que nunca, el tag geográfico es obligatorio para cualquier corporación que quiera implantar una determinada actividad, ya sea social, cultural, ambiental o económica: la implantación de energías renovables, dónde voy a ir a comer hoy, etc. Estos conjuntos de datos de alto valor potencian esas referencias geográficas, sobre todo de tipo indirecto, que nos sirven para tomar una decisión.
3. ¿Cuáles son los organismos que publican estos conjuntos de datos de alto valor? En otras palabras, ¿dónde podría un usuario localizar conjuntos de datos de estas categorías?
Paloma Abad Power: Es necesario destacar el papel del Sistema Cartográfico Nacional, que es un modelo de actuación donde participan las organizaciones de la AGE (Administración General del Estado) y las comunidades autónomas. Está coordinando la coproducción de muchos productos únicos, financiados por estas organizaciones.
Estos productos se publican a través de servicios web interoperables. Los publica, en este caso, el Centro Nacional de Información Geográfica (CNIG), quien también se encarga de muchos de los metadatos de estos productos.
Se podrían localizar a través de los catálogos de la IDEE (Infraestructura de Datos Espaciales de España) o el Catálogo Oficial de Datos y Servicios INSPIRE, que también, a su vez, está en datos.gob.es y en el European Data Portal.
¿Y quién puede publicar? Todos los organismos que tengan un mandato legal sobre un producto y ese producto esté clasificado dentro del Reglamento. Ejemplos: todos los organismos cartográficos de las Comunidades Autónomas, la Dirección General de Catastro, Patrimonio Histórico, el Instituto Nacional de Estadística, el Instituto Geológico y Minero (IGME), el Instituto Hidrográfico de la Marina, el Ministerio de Agricultura, Pesca y Alimentación (MAPA), el Ministerio para la Transición Ecológica y el Reto Demográfico, etc. Son multitud de organismos y muchos de ellos, como he comentado, participan en el Sistema Cartográfico Nacional. Dan los datos y se genera un único servicio para el ciudadano.
Rafael Martínez Cebolla: El Sistema Cartográfico Nacional define muy bien el grado de competencias que asumen las administraciones. Es decir, la administración pública a todas las escalas es la que provee de datos oficiales, ayudada por la empresa privada, algunas veces, a través de la contratación pública.
La Administración General del Estado llega hasta unas escalas 1:25.000 en el caso del Instituto Geográfico Nacional (IGN) y luego el reparto competencial del resto de escalas es para las administraciones autonómicas o locales. Además, hay una serie de actores, como las confederaciones hidrográficas, los departamentos estatales o el Catastro, que tienen bajo sus competencias la obligación legal de generar estos conjuntos de datos.
Para mí es un ejemplo de cómo se ha de repartir, aunque es cierto que luego hay que engranar muy bien, a través de organismos colegiados, para que la producción cartografía esté bien incardinada.
Paloma Abad Power: También se hacen proyectos colaborativos, como, por ejemplo, un mapa ciudadano, técnicamente conocido como mapa X, Y, Z, que consiste en capturar la cartografía de todas las organizaciones a nivel nacional y local. Es decir, desde escalas pequeñas 1:1.000.000 o 1:50.000.000, hasta escalas muy grandes, como 1:1000, para proporcionar al ciudadano un único mapa multiescala y que se pueda servir a través de servicios web interoperables y normalizados.
4. ¿Tenéis algún otro ejemplo de aplicación directa de este tipo de datos?
Rafael Martínez Cebolla: Un ejemplo claro lo vimos con la pandemia, con los datos de movilidad que publicó el Instituto Nacional de Estadística. Fueron unos datos muy útiles para la administración, para la toma de decisiones, y con los que tenemos que aprender mucho más para la gestión de futuras pandemias y crisis, también de tipo económico. Nos tienen que servir para aprender y desarrollar nuestros sistemas de alerta temprana.
Yo creo que ahí está la línea de trabajo: datos que sean útiles para la ciudadanía en general. Por eso digo que la movilidad ha sido un ejemplo claro, porque era el propio ciudadano quien estaba informando a la administración sobre cómo se estaba moviendo.
Paloma Abad Power: Yo voy a aportar algún dato. Por ejemplo, según las estadísticas de los servicios del Sistema Cartográfico Nacional, el dato más demandado son las imágenes aéreas y los modelos digitales del terreno. En 2022 eran 8 millones de peticiones y en 2023 pasaron a 19 millones de peticiones, solamente en el caso de las ortoimágenes.
Rafael Martínez Cebolla: Me gustaría añadir que ese aumento también es porque se están haciendo bien las cosas. Por un lado, se mejoran los sistemas de descubrimiento. Mi sensación general es que proyectos de ejemplos exitosos hay muchos, tanto de la propia administración como de empresas que necesitan esa información base para generar sus productos.
Había una aplicación que se generó muy rápidamente con la desescalada - ibas a una página web y te decía hasta donde llegaba a tu término municipal-, porque la gente quería salir y andar. Este ejemplo surge de datos espaciales que se han salido de la administración pública. Yo creo que ahí radica la importancia de ejemplos exitosos, que salen de personas que ven una necesidad imperiosa.
5. ¿Y cómo se incentiva esa reutilización?
Rafael Martínez Cebolla: Yo tengo un sinfín de ejemplos. La incentivación pasa también por la promoción y el marketing, cosa que algunas veces nos ha fallado desde la administración pública. Tú te ciñes a unas competencias y parece que con que lo pongas en un sitio web ya vale. Y no es solo eso.
Nosotros estamos incentivando la reutilización de dos maneras. Por un lado, interna, en la propia administración, enseñándoles que la información geográfica sirve para la planificación y evaluación de las políticas públicas. Y os pongo el ejemplo de Atlas de Salud Pública del Gobierno Aragón, que fue premiado en el año antes de la pandemia por una sociedad ibérica de epidemiología. Para ellos fue útil para saber cómo era la salud del aragonés y qué medidas de prevención tenían que tomar.
En cuanto a los incentivos externos, en el caso del Instituto Geográfico de Aragón, se vio que el perfil que entraba al geoportal era muy técnico. Los formatos que se utilizaban eran también muy técnicos, con lo cual no se llegaba a la ciudadanía en general. Para solucionarlo se promocionaron portales como la IDE didáctica, un portal para enseñar geografía, que llega a cualquier ciudadano que quiera aprender sobre el territorio aragonés.
Paloma Abad Power: Me gustaría resaltar el beneficio económico que esto supone, como se mostró, por ejemplo, en el estudio económico que realizó el Centro Nacional de Información Gráfica con la Universidad de Leuven para medir el beneficio económico de la Infraestructura de Datos Espaciales de España. Se midió el beneficio que suponía que las empresas privadas utilizasen los servicios gratuitos y libres, en vez de utilizar, por ejemplo, Google Maps u otras fuentes que no son abiertas.
Rafael Martínez Cebolla: Para lo bueno y para lo malo, porque la calidad del dato oficial algunas veces nos gustaría que fuera mejor. Tanto Paloma, en la Administración General del Estado, como yo, en la administración autonómica, algunas veces sabemos que hay datos oficiales donde hay que invertir más dinero para que la calidad del dato sea mejor y pueda ser reutilizable.
Pero sí que es cierto que esos estudios son clave para saber en qué dimensión se mueven los conjuntos de datos de alto valor. Es decir, el tener estudios que informen del beneficio real que supone tener una infraestructura de datos espaciales a nivel estado o a nivel autonómico para mí es clave para dos cosas: para que el ciudadano entienda su importancia y, sobre todo, para que el político que llega cada N años entienda la evolución que han tenido estas plataformas y la revolución relativa a la información geoespacial que hemos vivido en los últimos 20 años.
6. También el Instituto Geográfico de Aragón ha realizado un informe sobre las ventajas de la reutilización de este tipo de datos, ¿verdad?
Rafael Martínez Cebolla: Sí, se publicó a comienzos de este año. Llevamos haciendo este informe desde hace tres o cuatro años de forma interna, porque sabíamos que íbamos a dar el salto hacia una infraestructura de conocimiento espacial y queríamos ver el impacto de implantar un grafo de conocimiento dentro de la infraestructura de datos. El Instituto Geográfico de Aragón ha hecho un esfuerzo en estos últimos años para analizar el beneficio económico que reporta el disponer de esta infraestructura para el ciudadano en sí, no para la propia administración. Es decir, cuánto dinero se ahorra el ciudadano aragonés en sus impuestos por tener esta infraestructura. Hoy sabemos que disponer de una plataforma de información geográfica ahorra aproximadamente 2 millones de euros al año a la ciudadanía aragonesa.
A mí me gustaría ver el informe del próximo enero o febrero, porque creo que el salto va a ser importante. El grafo de conocimiento se implantó en abril del año pasado y ese gap se va a notar en el año que estamos viviendo. Hemos notado un aumento considerable de peticiones, tanto a nivel de visualización como de descarga.
Básicamente de un año al otro, hemos casi duplicado tanto el número de accesos como de descargas. Esto afecta a la componente tecnológica: la tienes que volver a rediseñar. Te está descubriendo más gente, está accediendo más gente a tus datos y, por tanto, tienes que, dedicarle más inversión a la componente tecnológica, porque está siendo el cuello de botella.
7. ¿Cuáles creeis que son los retos que se afrontarán en los próximos años?
Paloma Abad Power: En mi opinión, el primer reto es conocer al usuario para darle un mejor servicio. El usuario técnico, los universitarios, los usuarios de la calle, etc. Estamos pensando en hacer una encuesta cuando el usuario vaya a utilizar nuestra información geográfica. Pero claro, ese tipo de encuestas a veces frena el uso de la información geográfica. Ese es el gran reto: conocer al usuario para hacer servicios más amigables, aplicaciones, etc. Saber llegar a lo que quiere y dárselo mejor.
También hay otro reto a nivel técnico. Cuando empezaron las infraestructuras espaciales el nivel técnico era muy elevado, tenías que saber lo que era un servicio de visualización, los metadatos, conocer los parámetros, etc. Esto hay que eliminarlo, que el usuario simplemente diga yo quiero, por ejemplo, consultar y visualizar la longitud del río Ebro, de forma más amigable. O por ejemplo la palabra LiDAR, que era el modelo digital italiano con una alta precisión. Todos estos vocablos hay que hacérselos mucho más amigables al usuario.
Rafael Martínez Cebolla: Sobre todo, que sean descubiertos. Mi percepción es que hay que seguir potenciando el descubrimiento de los datos espaciales sin necesidad de explicarle al usuario no avezado, o incluso a unos técnicos, que tenemos que tener un dato, un metadato, un servicio…. No, no. Básicamente es que desde los buscadores generalistas se pueda encontrar los conjuntos de datos de alto valor sin necesidad de saber que existe una cosa que se llama infraestructura de datos espaciales.
Se trata de publicar los datos bajo unos estándares amigables, bajo unas versiones accesibles y, sobre todo, publicarlos en direcciones URIs permanentes, que no vayan a cambiar. Es decir, que el dato vaya mejorando en calidad, pero no vaya a cambiar nunca.
Y sobre todo, desde el punto de vista técnico, tanto las infraestructuras de datos espaciales y los geoportales como las infraestructuras de conocimiento tenemos que conseguir que los nodos de información de alto valor se relacionan entre sí desde el punto semántico y geográfico. Entiendo que los grafos de conocimiento van a ayudar en este sentido. Es decir, la movilidad tiene que tener relación con la observación del territorio, con los datos de salud pública o con los datos estadísticos, que también tienen componente geográfico. Esa relación semántica geográfica para mí es clave.
Suscríbete a nuestro perfil de Soundcloud para estar al día de nuestros pódcasts
Clips de la entrevista
Clip 1. ¿Qué son los datos de alto valor y por qué son importantes?
Clip 2. ¿Dónde puede un usuario localizar datos geográficos?
Clip 3. ¿Cómo se está incentivando la reutilización de datos con componente geográfica?
Un gemelo digital es una representación virtual e interactiva de un objeto, sistema o proceso del mundo real. Hablamos, por ejemplo, de una réplica digital de una fábrica, una ciudad o incluso un cuerpo humano. Estos modelos virtuales permiten simular, analizar y predecir el comportamiento del elemento original, lo que es clave para la optimización y el mantenimiento en tiempo real.
Debido a sus funcionalidades, los gemelos digitales se están utilizando en diversos sectores como la salud, el transporte o la agricultura. En este artículo, repasamos las ventajas que aporta su uso y mostramos dos ejemplos relacionados con los datos abiertos.
Ventajas de los gemelos digitales
Los gemelos digitales utilizan fuentes de datos reales del entorno, obtenidos a través de sensores y plataformas abiertas, entre otros. Gracias a ello, los gemelos digitales se actualizan en tiempo real para reflejar la realidad, lo que aporta una serie de ventajas:
- Aumento del rendimiento: una de las principales diferencias con las simulaciones tradicionales es que los gemelos digitales utilizan datos en tiempo real para su modelización, lo que permite tomar decisiones más acertadas para optimizar el rendimiento de equipos y sistemas según las necesidades de cada momento.
- Mejora de la planificación: utilizando tecnologías basadas en inteligencia artificial (IA) y aprendizaje automático, el gemelo digital puede analizar problemas de rendimiento o realizar simulaciones virtuales de «qué pasaría si». De esta forma, se pueden predecir fallos y problemas antes de que ocurran, lo que permite un mantenimiento proactivo.
- Reducción de costes: la mejora en la gestión de datos gracias a un gemelo digital genera beneficios equivalentes al 25% del gasto total en infraestructuras. Además, al evitar fallos costosos y optimizar procesos, se pueden reducir significativamente los costes operativos. También permiten monitorear y controlar sistemas en remoto, desde cualquier lugar, mejorando la eficiencia al centralizar las operaciones.
- Personalización y flexibilidad: al crear modelos virtuales detallados de productos o procesos, las organizaciones pueden adaptar rápidamente sus operaciones para satisfacer las demandas cambiantes del entorno y las preferencias individuales de los clientes / ciudadanos. Por ejemplo, en la fabricación, los gemelos digitales permiten la producción personalizada en masa, ajustando las líneas de producción en tiempo real para crear productos únicos según las especificaciones del cliente. Por otro lado, en el ámbito de la salud, los gemelos digitales pueden modelar el cuerpo humano para personalizar tratamientos médicos, mejorando así la eficacia y reduciendo los efectos secundarios.
- Impulso de la experimentación e innovación: los gemelos digitales proporcionan un entorno seguro y controlado para probar nuevas ideas y soluciones, sin los riesgos y costes asociados a los experimentos físicos. Entre otras cuestiones, permiten experimentar con grandes objetos o proyectos que, por su tamaño, no suelen prestarse a la experimentación en la vida real.
- Mejora de la sostenibilidad: al permitir la simulación y el análisis detallado de procesos y sistemas, las organizaciones pueden identificar áreas de ineficiencia y desperdicio, optimizando así el uso de recursos. Por ejemplo, los gemelos digitales pueden modelar el consumo y la producción de energía en tiempo real, permitiendo ajustes precisos que reducen el consumo y las emisiones de carbono.
Ejemplos de gemelos digitales en España
A continuación, se muestran tres ejemplos que ponen de manifiesto estas ventajas.
Proyecto GeDIA: inteligencia artificial para predecir los cambios en los territorios
GeDIA es una herramienta para la planificación estratégica de ciudades inteligentes, que permite realiza simulaciones de escenarios. Para ellos utiliza modelos de inteligencia artificial basados en fuentes de datos y herramientas ya existentes en el territorio.
El alcance de la herramienta es muy amplio, pero sus creadores destacan dos casos de uso:
- Necesidades de infraestructuras futuras: la plataforma realiza análisis detallados considerando las tendencias, gracias a los modelos de inteligencia artificial. De esta forma, se pueden realizar proyecciones de crecimiento y planificar las necesidades de infraestructuras y servicios, como energía y agua, en áreas específicas de un territorio, garantizando su disponibilidad.
- Crecimiento y turismo: GeDIA también se utiliza para estudiar y analizar el crecimiento urbano y turístico en zonas concretas. La herramienta identifica patrones de gentrificación y evalúa su impacto en la población local, utilizando datos censales. De esta forma se pueden comprender mejor los cambios demográficos y su impacto, como las necesidades de vivienda, y tomar decisiones que faciliten el crecimiento equitativo y sostenible.
Esta iniciativa cuenta con la participación de diversas empresas y la Universidad de Málaga (UMA), así como el respaldo económico de Red.es y la Unión Europea.
Gemelo digital del Mar menor: datos para cuidar el medio ambiente
El Mar Menor, la laguna salada de la Región de Murcia, ha sufrido graves problemas ecológicos en los últimos años, influenciados por la presión agrícola, el turismo y la urbanización.
Para conocer mejor las causas y valorar posibles soluciones, TRAGSATEC, una entidad de protección ambiental de propiedad estatal, desarrolló un gemelo digital. Para ello mapeó un área circundante de más de 1.600 kilómetros cuadrados, conocida como la Región del Campo de Cartagena. En total se obtuvieron 51.000 imágenes nadirales, 200.000 imágenes oblicuas y más de cuatro terabytes de datos LiDAR.
Gracias a este gemelo digital, TRAGSATEC ha podido simular diversos escenarios de inundaciones y el impacto que tendría instalar elementos de contención u obstáculos, como un muro, que redirigieran el flujo del agua. También han podido estudiar la distancia entre el terreno y el agua subterránea, para determinar el impacto de la filtración de fertilizantes, entre otras cuestiones.
Retos y camino hacia el futuro
Estos son solo dos ejemplos, pero ponen de manifiesto el potencial de una tecnología cada vez más popular. No obstante, para que su implementación sea aun mayor es necesario hacer frente a algunos retos, como los costes iniciales, tanto en tecnología como en capacitación, o la seguridad, al aumentar la superficie de ataque. Otro de los retos a destacar son los problemas de interoperabilidad que surgen cuando las distintas administraciones públicas establecen gemelos digitales y espacios de datos locales. Para profundizar en esta problemática, la Comisión Europea ha publicado una guía que ayuda a identificar los principales retos organizativos y culturales de interoperabilidad, ofreciendo buenas prácticas para solventarlos.
En resumen, los gemelos digitales ofrecen numerosas ventajas, como la mejora del rendimiento o la reducción de costes. Estos beneficios están impulsando su adopción en diversas industrias y es probable que, a medida que se superen los retos actuales, los gemelos digitales se conviertan en una herramienta esencial para optimizar procesos y mejorar la eficiencia operativa en un mundo cada vez más digitalizado.
1. Introducción
Las visualizaciones son representaciones gráficas de datos que permiten comunicar, de manera sencilla y efectiva, la información ligada a los mismos. Las posibilidades de visualización son muy amplias, desde representaciones básicas como los gráficos de líneas, de barras o métricas relevantes, hasta visualizaciones configuradas sobre cuadros de mando interactivos.
En esta sección de “Visualizaciones paso a paso” estamos presentando periódicamente ejercicios prácticos haciendo uso de datos abiertos disponibles en datos.gob.es u otros catálogos similares. En ellos, se abordan y describen de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y los análisis pertinentes para, finalmente obtener unas conclusiones a modo de resumen de dicha información.
En cada ejercicio práctico se utilizan desarrollos de código documentados y herramientas de uso gratuito. Todo el material generado está disponible para su reutilización en el repositorio de GitHub de datos.gob.es.
En este ejercicio concreto, exploraremos los flujos de turistas a nivel nacional, creando visualizaciones de los turistas que se mueven entre las comunidades autónomas (CCAA) y provincias.
Accede al repositorio del laboratorio de datos en Github.
Ejecuta el código de pre-procesamiento de datos sobre Google Colab.
En este vídeo, el autor te explica que vas a encontrar tanto en el Github como en Google Colab.
2. Contexto
Analizar los flujos de turistas nacionales nos permite observar ciertos movimientos ya muy conocidos, como, por ejemplo, que la provincia de Alicante es un destino muy popular del turismo veraniego. Además, este análisis es interesante para observar tendencias en el impacto económico que el turismo pueda tener, año tras año, en ciertas CCAA o provincias. El artículo sobre experiencias para la gestión de los flujos de visitantes en destinos turísticos ilustra el impacto de los datos en el sector.
3. Objetivo
El objetivo principal del ejercicio es crear visualizaciones interactivas en Python que permitan visualizar información compleja de manera comprensible y atractiva. Se cumplirá este objetivo usando un conjunto de datos abiertos que contiene información sobre flujos de turistas nacionales, planteando varias preguntas sobre los datos y contestándolas gráficamente. Podremos responder a preguntas como las que se plantean a continuación:
- ¿En qué CCAA hay más turismo procedente de la misma CA?
- ¿Cuál es la CA que más sale de su propia CA?
- ¿Qué diferencias hay entre los flujos de turistas a lo largo del año?
- ¿Cuál es la provincia valenciana que más turistas recibe?
La comprensión de las herramientas propuestas aportará al lector la capacidad para poder modificar el código contenido en el notebook que acompaña a este ejercicio para seguir explorando los datos por su cuenta y detectar más comportamientos interesantes a partir del conjunto de datos utilizado.
Para poder crear visualizaciones interactivas y contestar a las preguntas sobre los flujos de turistas, será necesario un proceso de limpieza y reformateado de datos que está descrito en el notebook que acompaña este ejercicio.
4. Recursos
Conjunto de datos
El conjunto de datos abiertos utilizado contiene información sobre los flujos de turistas en España a nivel de CCAA y provincias, indicando también los valores totales a nivel nacional. El conjunto de datos ha sido publicado por el Instituto Nacional de Estadística, a través de varios tipos de ficheros. Para el presente ejercicio utilizamos únicamente el fichero .csv separado por “;”. Los datos datan de julio de 2019 a marzo de 2024 (a la hora de redactar este ejercicio) y se actualizan mensualmente.
Número de turistas por CCAA y provincia de destino desagregados por PROVINCIA de origen
El conjunto de datos también se encuentra disponible para su descarga en este repositorio de Github.
Herramientas analíticas
Para la limpieza de los datos y la creación de las visualizaciones se ha utilizado el lenguaje de programación Python. El código creado para este ejercicio se pone a disposición del lector a través de un notebook de Google Colab.
Las librerías de Python que utilizaremos para llevar a cabo el ejercicio son:
- pandas: es una librería que se utiliza para el análisis y manipulación de datos.
- holoviews: es una librería que permite crear visualizaciones interactivas, combinando las funcionalidades de otras librerías como Bokeh y Matplotlib.
5. Desarrollo del ejercicio
Para visualizar los datos sobre flujos de turistas interactivamente crearemos dos tipos de diagramas, los diagramas de cuerdas y los diagramas de Sankey.
Los diagramas de cuerdas son un tipo de diagrama que está compuesto por nodos y aristas, véase la figura 1. Los nodos se sitúan en un círculo y las aristas simbolizan las relaciones entre los nodos del círculo. Estos diagramas suelen utilizarse para mostrar tipos de flujos, por ejemplo, flujos migratorios o monetarios. El volumen diferente de las aristas se visualiza de manera comprensible y refleja la importancia de un flujo o de un nodo. Por su forma de círculo, el diagrama de cuerdas es una buena opción para visualizar las relaciones entre todos los nodos de nuestro análisis (relación del tipo “varios a varios”).

Figura 1. Diagrama de cuerdas (Migración global). Fuente.
Los diagramas de Sankey, igual que los diagramas de cuerdas, son un tipo de diagrama que está compuesto por nodos y aristas, véase la figura 2. Los nodos se representan en los márgenes de la visualización, estando las aristas entre los márgenes. Por esta agrupación lineal de los nodos, los diagramas de Sankey son mejores que los diagramas de cuerdas para análisis en los cuales queramos visualizar la relación entre:
- varios nodos y otros nodos (tipo varios a varios, o varios a pocos, o viceversa)
- varios nodos y un solo nodo (varios a uno, o viceversa)

Figura 2. Diagrama de Sankey (Migración interna Reino Unido). Fuente.
El ejercicio está dividido en 5 partes, siendo la parte 0 (“configuración inicial”) solo de montar el entorno de programación. A continuación, describimos las cinco partes y los pasos que se llevan a cabo.
5.1. Cargar datos
Este apartado podrás encontrarlo en el punto 1 del notebook.
En este parte cargamos el conjunto de datos para poder procesarlo en el notebook. Comprobamos el formato de los datos cargados y creamos un pandas.DataFrame que utilizaremos para el procesamiento de los datos en los siguientes pasos.
5.2. Exploración inicial de los datos
Este apartado podrás encontrarlo en el punto 2 del notebook.
En esta parte realizamos un análisis exploratorio de los datos para entender el formato del conjunto de datos que hemos cargado y para tener una idea más clara de la información que contiene. Mediante esta exploración inicial, podemos definir los pasos de limpieza que tenemos que llevar a cabo para poder crear las visualizaciones interactivas.
Si quieres aprender más sobre cómo abordar esta tarea, tienes a tu disposición esta guía introductoria sobre análisis exploratorio de datos.
5.3. Análisis del formato de los datos
Este apartado podrás encontrarlo en el punto 3 del notebook.
En esta parte resumimos las observaciones que hemos podido hacer durante la exploración inicial de los datos. Recapitulamos aquí las observaciones más importantes:
| Provincia de origen | Provincia de origen | CCAA y provincia de destino | CCAA y provincia de destino | CCAA y provincia de destino | Concepto turístico | Periodo | Total |
|---|---|---|---|---|---|---|---|
| Total Nacional | Total Nacional | Turistas | 2024M03 | 13.731.096 | |||
| Total Nacional | Ourense | Total Nacional | Andalucía | Almería | Turistas | 2024M03 | 373 |
Figura 3. Fragmento del conjunto de datos original.
Podemos observar en las columnas uno a cuatro que los orígenes de los flujos de turistas están desagregados por provincia mientras que, para los destinos, las provincias están agregadas por CCAA. Aprovecharemos el mapeado de las CCAA y de sus provincias que podemos extraer de la cuarta y quinta columna para agregar las provincias de origen por CCAA.
También podemos ver que la información contenida en la primera columna a veces es superflua, por lo cual, la combinaremos con la segunda columna. Además, hemos constatado que la quinta y sexta columna no aportan valor para nuestro análisis, por lo cual, las eliminaremos. Renombraremos algunas columnas para tener un pandas. DataFrame más comprensible.
5.4. Limpieza de los datos
Este apartado podrás encontrarlo en el punto 4 del notebook.
En esta parte llevamos a cabo los pasos necesarios para darle mejor formato a nuestros datos. Para ello aprovechamos varias funcionalidades que nos ofrece pandas, por ejemplo, para renombrar las columnas. También definimos una función reutilizable que necesitamos para concatenar los valores de la primera y segunda columna con el objetivo de no tener una columna que exclusivamente indique “Total Nacional” en todas las filas del pandas.DataFrame. Además, extraeremos de las columnas de destino un mapeado de CCAA a provincias que aplicaremos a las columnas de origen.
Queremos obtener una versión del conjunto de datos más comprimida con mayor transparencia de los nombres de las columnas y que no contenga información que no vamos a procesar. El resultado final del proceso de limpieza de datos es el siguiente:
| Origen | Provincia de origen | Destino | Provincia de destino | Periodo | Total |
|---|---|---|---|---|---|
| Total Nacional | Total Nacional | 2024M03 | 13731096.0 | ||
| Galicia | Ourense | Andalucía | Almería | 2024M03 | 373.0 |
Figura 4. Fragmento del conjunto de datos limpio.
5.5. Crear visualizaciones
Este apartado podrás encontrarlo en el punto 5 del notebook
En esta parte creamos nuestras visualizaciones interactivas utilizando la librería Holoviews. Para poder dibujar gráficos de cuerdas o de Sankey que visualicen el flujo de personas entre CCAA y CCAA y/o provincias, tenemos que estructurar la información de nuestros datos de tal forma que dispongamos de nodos y aristas. En nuestro caso, los nodos son los nombres de CCAA o provincia y las aristas, es decir, la relación entre los nodos, son el número de turistas. En el notebook definimos una función para obtener los nodos y aristas que podemos reutilizar para los diferentes diagramas que queramos realizar, cambiando el período de tiempo según la estación del año que nos interese analizar.
Vamos a crear primero un diagrama de cuerdas usando exclusivamente los datos sobre flujos de turistas de marzo de 2024. En el notebook, este diagrama de cuerdas es dinámico. Te animamos a probar su interactividad.

Figura 5. Diagrama de cuerdas que muestra el flujo de turistas en marzo 2024 agregado por comunidades autónomas.
En el diagrama de cuerdas se visualizan los flujos de turistas entre todas las CCAA. Cada CA tiene un color y los movimientos que hacen los turistas provenientes de esta CA se simbolizan con el mismo color. Podemos observar que los turistas de Andalucía y Cataluña viajan mucho dentro de sus propias CCAA. En cambio, los turistas de Madrid salen mucho de su propia CA.

Figura 6. Diagrama de cuerdas que muestra el flujo de turistas entrando y saliendo de Andalucía en marzo 2024 agregado por comunidades autónomas.
Creamos otro diagrama de cuerdas utilizando la función que hemos creado y visualizamos los flujos de turistas en agosto de 2023.

Figura 7. Diagrama de cuerdas que muestra el flujo de turistas en agosto 2023 agregado por comunidades autónomas.
Podremos observar que, a grandes rasgos, no cambian los movimientos de los turistas, solo que se intensifican los movimientos que ya hemos podido observar para marzo 2024.

Figura 8. Diagrama de cuerdas que muestra el flujo de turistas entrando y saliendo de la Comunitat Valenciana en agosto 2023 agregado por comunidades autónomas.
El lector puede crear el mismo diagrama para otros períodos de tiempo, por ejemplo, para el verano del año 2020, con el fin de visualizar el impacto de la pandemia en el turismo veraniego, reutilizando la función que hemos creado.
Para los diagramas de Sankey nos vamos a centrar en la Comunitat Valenciana, ya que es un destino vacacional popular. Filtramos las aristas que hemos creado para el diagrama de cuerdas anterior de manera que solo contengan flujos que terminen en la Comunitat Valenciana. El mismo procedimiento se podría aplicar para estudiar cualquier otra CA o se podría invertir para analizar dónde van a veranear los valencianos. Visualizamos el diagrama de Sankey que, igual que los diagramas de cuerdas, es interactivo dentro del notebook. El aspecto visual quedaría así:

Figura 9. Diagrama de Sankey que muestra el flujo de turistas en agosto 2023 con destino a la Comunitat Valenciana.
Como ya hemos podido intuir por el diagrama de cuerdas de arriba, véase la figura 8 el mayor grupo de turistas que llegan a la Comunitat Valenciana proviene de Madrid. Vemos que también hay un elevado número de turistas que visitan la Comunitat Valenciana desde las CCAA vecinas como Murcia, Andalucía y Cataluña.
Para comprobar que estas tendencias se dan en las tres provincias de la Comunitat Valenciana, vamos a crear un diagrama de Sankey que muestre en el margen izquierdo todas las CCAA y en el margen derecho las tres provincias de la Comunitat Valenciana.
Para crear este diagrama de Sankey a nivel de provincias tenemos que filtrar nuestro pandas. DataFrame inicial para extraer de él las filas que contienen la información relevante. Los pasos en el notebook se pueden adaptar para realizar este análisis a nivel de provincias para cualquier otra CA. Aunque no estamos reutilizando la función que hemos usado anteriormente, también podemos cambiar el período de análisis.
El diagrama de Sankey que visualiza los flujos de turistas que llegaron en agosto de 2023 a las tres provincias valencianas quedaría así:

Figura 10. Diagrama de Sankey agosto 2023 que muestra el flujo de turistas con destino a provincias de la Comunitat Valenciana.
Podemos observar que, como ya suponíamos, el mayor número de turistas que llega a la Comunitat Valenciana en agosto proviene de la Comunidad de Madrid. Sin embargo, podemos comprobar que esto no es cierto para la provincia de Castellón, donde en agosto de 2023 la mayoría de los turistas fueron valencianos que se desplazaron dentro de su propia CA.
6. Conclusiones del ejercicio
Gracias a las técnicas de visualización empleadas en este ejercicio, hemos podido observar los flujos de turistas que se desplazan dentro del territorio nacional, enfocándonos en hacer comparaciones entre diversas épocas del año y tratando de identificar patrones. Tanto en los diagramas de cuerdas como en los diagramas de Sankey que hemos creado, hemos podido observar la afluencia de los turistas madrileños en las costas valencianas en verano. También hemos podido identificar las comunidades autónomas donde los turistas salen menos de su propia comunidad autónoma, como Cataluña y Andalucía.
7. ¿Quieres realizar el ejercicio?
Invitamos al lector a ejecutar el código contenido en el notebook de Google Colab que acompaña a este ejercicio para seguir con el análisis de los flujos de turistas. Dejamos aquí algunas ideas de posibles preguntas y de cómo se podrían contestar:
- El impacto de la pandemia: ya lo hemos mencionado brevemente arriba, pero una pregunta interesante sería medir el impacto que ha tenido la pandemia del coronavirus sobre el turismo. Podemos comparar los datos de los años anteriores con el 2020 y también analizar los años siguientes para detectar tendencias de estabilización. Visto que la función que hemos creado permite cambiar fácilmente el período de tiempo bajo análisis, te proponemos hacer este análisis por tu cuenta.
- Intervalos de tiempo: también es posible modificar la función que hemos estado usando de tal manera que no solo permita seleccionar un periodo de tiempo concreto, sino que también permita intervalos de tiempos.
- Análisis a nivel de provincias: igualmente, un lector avanzado con Pandas puede imponerse el reto de crear un diagrama de Sankey que visualice a qué provincias viajan los habitantes de una determinada región, por ejemplo, Ourense. Para no tener demasiadas provincias de destino que podrían hacer ilegible el diagrama de Sankey, se podrían visualizar solo las 10 más visitadas. Para obtener los datos para crear esta visualización, el lector tendría que jugar con los filtros que pone sobre el dataset y con el método de groupby de pandas, dejándose inspirar por el código ya ejecutado.
Esperamos que este ejercicio práctico te haya aportado conocimiento suficiente para desarrollar tus propias visualizaciones. Si tienes algún tema sobre ciencia de datos que quieras que tratemos próximamente, no dudes en proponer tu interés a través de nuestros canales de contacto.
Además, recuerda que tienes a tu disposición más ejercicios en el apartado sección de “Ejercicios de ciencia de datos”.