Blog

El Hub español de Gaia-X (Gaia-X Hub Spain), asociación sin ánimo de lucro cuyo objetivo es acelerar la capacidad europea en materia de compartición de datos y soberanía digital, busca que los diferentes sectores de la economía construyan una comunidad en torno al dato para, así, poder promover un entorno propicio para la creación de espacios de datos sectoriales. Enmarcado en la estrategia España Digital 2026 y con el Plan de Recuperación, Transformación y Resiliencia como hoja de ruta para la transformación digital de España, el objetivo del hub es potenciar el desarrollo de soluciones innovadoras basadas en datos e inteligencia artificial, a la par que contribuye a impulsar la competitividad de las empresas de nuestro país.

El hub se organiza a lo largo de diferentes grupos de trabajo, existiendo uno específico dedicado a analizar los restos y oportunidades de los espacios de datos de compartición y explotación de datos en el sector turístico. El turismo es uno de los sectores productivos clave en la economía española, llegando a alcanzar un volumen del 12,2% del PIB nacional.

El turismo, dado su ecosistema de participantes públicos y privados, de diferentes dimensiones y grado de madurez tecnológico, constituye un entorno óptimo donde contrastar las bondades de estos ecosistemas federados de datos. Gracias a ellos se facilita la extracción de valor de fuentes de datos no tradicionales, con una elevada escalabilidad, y garantizando en todo caso unas condiciones robustas de seguridad, privacidad y, por en ende, de soberanía del dato.

Así, y con la finalidad de producir la primera radiografía de dicho espacio de datos en España, desde la Oficina del dato, en colaboración con el Hub español de Gaia-X  se ha elaborado el informe ‘Radiografía del Espacio de Datos de Turismo en España’, un documento que busca resumir y resaltar en qué momento se encuentra actualmente el diseño de dicho espacio de datos, las diferentes oportunidades para el sector y cuáles son los principales retos que deben superarse para conseguir el despliegue del mismo, ofreciendo una hoja de ruta para su construcción y despliegue.

¿Por qué es necesario un espacio de datos de turismo?

Si algo quedó claro tras el estallido de la pandemia por COVID-19 es que el turismo es una actividad interdependiente de otras industrias por lo que, al pausarse esta, sectores como la movilidad, la logística, la salud, la agricultura, la automoción o la alimentación, entre otros, se vieron también afectados.

Situaciones como la anterior, evidencian las posibilidades que ofrece la compartición de datos entre sectores, ya que éstos pueden ayudar a mejorar la toma de decisiones. Sin embargo, conseguirlo en el ámbito turístico no es una tarea sencilla dado que desplegar un espacio de datos para este sector requiere del esfuerzo coordinado entre las distintas partes de la sociedad implicadas.

Por ello, el objetivo y el reto es crear "espacios" inteligentes capaces de aportar un contexto de seguridad y confianza que favorezca el intercambio y la combinación de datos. De este modo y a partir de la generación del valor añadido que aportan los datos, sería posible resolver algunos de los problemas existentes actualmente en el sector para crear nuevas estrategias enfocadas a conocer mejor al turista y, por ende, a mejorar su experiencia a la hora de viajar.

La generación de estos espacios de compartición y explotación de datos supondrá grandes ventajas para el sector, ya que se facilitará la creación de ofertas, productos y servicios más personalizados que proporcionen una experiencia mejorada y adaptada a las necesidades de los clientes, mejorando así la capacidad de atraer turistas. Además de impulsar un mayor conocimiento del sector y una toma de decisiones informada tanto por parte de organizaciones públicas como privadas, que pueden detectar más fácilmente nuevas oportunidades de negocio.

Retos de seguridad y gobernanza de datos para aprovechar las oportunidades del mercado turístico digital

Uno de los principales escollos a la hora de desarrollar un espacio de datos sectorial es la falta de confianza en el intercambio de datos, la ausencia de modelos de datos compartidos o la insuficiencia de normas de interoperabilidad para un intercambio de datos eficiente entre las diferentes plataformas existentes y los actores de la cadena de valor.

Yendo a los retos más específicos, el sector turístico se encuentra, además, con la necesidad de combinar los espacios de datos B2B (compartición entre empresas y organizaciones privadas) con los C2B y G2B (compartición de usuarios a empresas y sector público a empresas). Si a esto le sumamos que lo ideal es aterrizar los conjuntos de datos del sector turístico a nivel nacional, regional y local, el reto se torna aún mayor.

De forma paralela, para diseñar un espacio de datos del sector, también debe tenerse en cuenta que existen diferencias respecto a la calidad de los datos de los actores anteriormente mencionados. Al no existir una serie de estándares concretos, encontramos diferencias en el nivel de granularidad y calidad de los datos, la semántica, así como disparidad entre formatos y licencias, lo que deja un escenario de datos inconexo.

A su vez, es fundamental conocer de primera mano cuáles son las demandas que tienen los distintos actores de la industria, algo que solo se consigue escuchando y tomando notas sobre las necesidades presentes en los distintos niveles de la industria. Por ello, conviene recordar que el turismo es una actividad social cuyo foco no debe posicionarse solamente en el destino, ya que el éxito de un espacio de datos turístico residirá también en la capacidad para conocer mejor al cliente y, por ende, poder ofrecerle servicios adecuados a sus demandas que mejoren su experiencia e incentiven sus ganas de continuar viajando. 

De este modo, y tal y como recoge el informe elaborado por la Oficina del Dato, en colaboración con el hub español de Gaia-X, resulta interesante reorientar el foco y desplazarlo del destino hacia el turista, en línea con el descubrimiento y generación de casos de uso de SEGITTUR. Y es que, aunque es cierto que la focalización en el destino ha servido para desarrollar plataformas digitales que han impulsado la competitividad, la eficiencia y la estrategia turística, plantear una estrategia que preste la misma atención al turista permitiría ampliar y mejorar los catálogos de datos disponibles.

Medir los factores que condicionan la experiencia de los turistas durante la visita a nuestro país permite optimizar su satisfacción en todo el circuito del viaje, a la par que contribuir a crear campañas de marketing cada vez más personalizadas, tomando como el análisis de los intereses de los diferentes segmentos de mercado.

Situación actual de la construcción del espacio de datos del Turismo español y próximos pasos

La falta de madurez del mercado en la creación de espacios de datos como solución, hace necesario un enfoque de experimentación, tanto para la consolidación de los componentes tecnológicos, como para la validación de las diferentes facetas (infraestructura soft) presentes en los espacios de datos.

Actualmente, el Grupo de Trabajo de Turismo del Hub español de Gaia-X trabaja en la definición de los elementos clave del espacio de datos de turismo, a partir de casos de uso alineados con los retos del sector. El objetivo es dar respuesta a algunas preguntas clave, utilizando el conocimiento existente en materia de espacios de datos:

  • ¿Cuáles son las características clave del entorno turístico y qué problemas de negocio pueden abordarse?
  • ¿Qué modelos orientados a datos se pueden trabajar en los diferentes casos de uso?
  • ¿Qué requisitos existen y qué modelo de gobernanza es necesario? ¿Qué tipologías de participantes deben considerarse?
  • ¿Qué componentes de negocio, legales, operativos, funcionales, tecnológicos son necesarios?
  • ¿Qué arquitectura tecnológica de referencia puede utilizarse?
  • ¿Qué procesos de desarrollo, integración, test y despliegue de la tecnología pueden emplearse?
calendar icon
Noticia

Actualizado: 21/03/2024

En enero de 2023, la Comisión Europea publicó un listado de conjuntos de datos de alto valor que los organismos del sector público deberían poner a disposición de la ciudadanía en un plazo máximo de 16 meses. El principal objetivo de establecer la lista de conjuntos de datos de alto valor es garantizar que los datos públicos de mayor potencial socioeconómico se pongan a disposición para su reutilización con una restricción jurídica y técnica mínima, y sin coste alguno. Dentro de estos conjuntos de datos del sector público, algunos como los meteorológicos o los relativos a la calidad del aire, resultan especialmente interesantes para desarrolladores y creadores de servicios como aplicaciones o páginas webs, que reportan valor añadido e importantes beneficios para la sociedad, el medioambiente o la economía.

La publicación del Reglamento se acompañó de unas preguntas frecuentes para ayudar a los organismos públicos a entender el beneficio de los HVDS (High Value Datasets) en la sociedad y la economía, así como para explicar algunos aspectos sobre la obligatoriedad y las ayudas para la publicación.

En línea con esta propuesta, la Vicepresidenta Ejecutiva para una Europa adaptada a la era digital, Margrethe Vestager, declaró lo siguiente en la nota de prensa lanzada por la Comisión Europea:

“Poner a disposición del público conjuntos de datos de gran valor beneficiará tanto a la economía como a la sociedad, por ejemplo, ayudando a combatir el cambio climático, reduciendo la contaminación atmosférica urbana y mejorando las infraestructuras de transporte. Se trata de un paso práctico hacia el éxito de la Década Digital y la construcción de un futuro digital más próspero”.

De forma paralela, Thierry Breton, Comisario de Mercado Interior, quiso añadir también las siguientes palabras a colación del anuncio del listado de los datos de alto valor: “Los datos son una piedra angular de nuestra competitividad industrial en la UE. Con la nueva lista de conjuntos de datos de alto valor estamos desbloqueando una gran cantidad de datos públicos en beneficio de todos. Las nuevas empresas y las pymes podrán utilizar estos para desarrollar nuevos productos y soluciones innovadoras que mejoren la vida de los ciudadanos de la UE y de todo el mundo”.

Seis categorías para aglutinar los nuevos conjuntos de datos de alto valor

De este modo, el reglamento se crea al amparo de la Directiva Europea de Datos Abiertos, que define seis categorías para diferenciar los nuevos conjuntos de datos de alto valor solicitados:

  • Geoespaciales
  • De observación de la Tierra y medioambiente
  • Meteorológicos
  • Estadísticos
  • De empresas
  • De movilidad

No obstante, tal y como recoge la nota de prensa de la Comisión Europea, esta gama temática podría ampliarse posteriormente en función de la evolución de la tecnología y el mercado. Así, los conjuntos de datos estarán disponibles en formato legible por máquina, a través de una interfaz de programación de aplicaciones (API) y, si fuera relevante, también con opción de descarga masiva.

Además, la reutilización de conjuntos de datos como los de movilidad o geolocalización de edificios puede ampliar las oportunidades de negocio disponibles para sectores como la logística o el transporte. De forma paralela, los datos de observación meteorológica, de radar, de calidad del aire o de contaminación del suelo también pueden apoyar la investigación y la innovación digital, así como la elaboración de políticas en la lucha contra el cambio climático.

En definitiva, una mayor disponibilidad de datos y, en especial de alto valor, tiene la capacidad de impulsar el espíritu empresarial ya que estos conjuntos de datos pueden ser un recurso importante para que las pymes desarrollen nuevos productos y servicios digitales, lo que a su vez también puede atraer nuevos inversores.

Descubre más en esta infografía:

Infografía-resumen sobre los datos de alto valor

Accede a la versión accesible en dos páginas.

calendar icon
Noticia

A tan solo unos días de que finalice 2022, queremos aprovechar para hacer un pequeño balance del año que termina, un periodo en el que la comunidad de datos abiertos no ha dejado de crecer en España y en el que hemos sumado fuerzas e ilusión con la adhesión de  la Oficina del Dato, unidad encargada de dinamizar la gestión, compartición y el uso de los datos a lo largo de todos los sectores productivos de la Economía y Sociedad española, focalizando sus esfuerzos en particular en el impulso de los espacios de compartición y explotación de datos sectoriales.

Gracias precisamente a la incorporación de la Oficina del Dato, desde la Iniciativa Aporta hemos podido duplicar el efecto divulgativo, y promover el papel que desempeñan los datos abiertos en el desarrollo de la economía del dato.

De forma paralela, durante este 2022, hemos continuado trabajando para acercar los datos abiertos a la ciudadanía, la comunidad profesional y las administraciones públicas. Así y con el objetivo de fomentar la reutilización de los datos abiertos con fines sociales, hemos vuelto a organizar una nueva edición del Desafío Aporta.

Con el foco puesto en la salud y el bienestar de los ciudadanos, la cuarta edición de esta competición contó con tres ganadores del más alto nivel y cuyas soluciones digitales tienen como denominador común, mejorar la salud física y mental de las personas, gracias a servicios desarrollados con datos abiertos.

Nuevos ejemplos de casos de uso y visualizaciones paso a paso

A su vez, a lo largo de este año, hemos continuado caracterizando nuevos ejemplos de casos de uso que contribuyen a aumentar el catálogo de empresas reutilizadoras de datos abiertos y aplicaciones. Con las nuevas incorporaciones, datos.gob.es ya cuenta con un catálogo de 84 empresas reutilizadoras y un total de 418 aplicaciones desarrolladas a partir de datos abiertos. De estas, más de 40 han sido identificadas en 2022.

Además, desde que el pasado año inauguramos la sección de visualizaciones paso a paso, seguimos explorando el potencial de las mismas para que los usuarios puedan inspirarse y replicar los ejemplos de manera sencilla.

Informes, guías y material audiovisual para promover el uso de los datos abiertos

Con el propósito de seguir brindando asesoramiento a las comunidades de publicadores y reutilizadores de datos abiertos, otro de los ejes de este 2022 se ha focalizado en ofrecer informes innovadores sobre las últimas tendencias en inteligencia artificial y otras tecnologías emergentes, así como el desarrollo de guías, infografías y vídeos que ayudan a conocer de cerca nuevos casos de uso y tendencias relacionadas con los datos abiertos.

Algunos de los artículos más leídos en el portal datos.gob.es han sido ‘4 ejemplos de proyectos de empresas privadas que apuestan por la compartición de datos en abiertos’, ‘¿Cómo evoluciona la transformación digital en España?’ o ‘Los principales retos para impulsar espacios de datos sectoriales’, entre otros. Respecto a las entrevistas, destacamos las realizadas a los ganadores del IV Desafío Aporta, a Hélène Verbrugghe, Public Policy Manager para España y Portugal de Meta o a Alberto González Yanes, Jefe de Servicio de Estadísticas Económicas del Instituto Canario de Estadística (ISTAC), entre algunos ejemplos.

Por último, queremos agradecer un año más a la comunidad open data su apoyo. Durante 2022, hemos conseguido que el Catálogo Nacional de Datos supere los 64.000 conjuntos de datos publicados. Además, datos.gob.es ha recibido más de 1.300.000 visitas, un 25% más que en 2021, y los perfiles de datos.gob.es en LinkedIn y en Twitter han crecido un 45% y un 12% respectivamente.

Desde datos.gob.es y la Oficina del Dato afrontamos este nuevo año cargados de ilusión y ganas de trabajar para que los datos abiertos sigan avanzando en España de la mano de publicadores y reutilizadores.

¡Por un 2023 cargado de éxitos!

Si deseas ver la infografía a tamaño completo puedes hacer click aquí.

** Para poder acceder a los enlaces incluidos dentro de la propia imagen descargar la versión pdf disponible a continuación.

calendar icon
Documentación

La RED de Entidades Locales por la Transparencia y Participación Ciudadana de la FEMP acaba de presentar una guía centrada en la visualización de datos. El documento, que toma como referencia la Guía de visualización de datos elaboradora por el Ayuntamiento de L’Hospitalet, ha sido elaborado a partir de la búsqueda de buenas prácticas impulsada por organismos públicos y privados.

La guía incluye recomendaciones y criterios básicos para representar datos gráficamente, facilitando su comprensión. En principio, está dirigida al conjunto de las entidades adheridas a la Red de Entidades locales por la transparencia y la participación ciudadana de la FEMP. No obstante, también es de utilidad para todo aquel que desee adquirir un conocimiento general sobre la visualización de datos.

En concreto, la guía ha sido elaborada con tres objetivos en mente:

  • Facilitar principios y buenas prácticas en el ámbito de la visualización de datos.
  • Disponer de un modelo de visualización y comunicación de los datos de las entidades locales gracias a la estandarización del uso de diferentes recursos visuales.
  • Promover los principios de calidad, sencillez, inclusión y ética en la comunicación de datos.

¿Qué incluye la guía?

Tras una breve introducción, la guía comienza con una serie de conceptos básicos y principios generales a seguir en la visualización de datos, como el principio de simplificación, de aprovechamiento del espacio o de accesibilidad y diseño exclusivo. A través de ejemplos gráficos, el lector aprende lo que se debe y no se debe hacer si queremos que nuestra visualización se entienda fácilmente. 

A continuación, la guía se centra en las diferentes etapas del diseño de una visualización de datos a través de un proceso metodológico secuencial, como el que muestra la siguiente imagen:

Gráfico que muestra las fases de un proceso metodológico para el diseño de visualizaciones de datos: 1. Definiri el propósito y los objetivos. 2.Conocer a los destinatarios. 3. Seleccionar los datos. 4. Seleccionar el producto y los objetos de visualización. 5. Analizar y definir el mensaje. 6. Dibujar, redactar y maquetar. 7. Validar

Como muestra la imagen, antes de elabora la visualización es fundamental dedicar tiempo a establecer los objetivos que queremos alcanzar y el público al que nos dirigimos, para poder adaptar el mensaje y seleccionar la visualización más adecuada en base a aquello que queramos representar.

A la hora de representar datos, los usuarios tienen a su disposición una amplia variedad de objetos de visualización con distintas funciones y rendimiento. No todos los objetos son apropiados para todos los casos y habrá que determinar el más adecuado en cada situación concreta. En este sentido, la guía ofrece diversas recomendaciones y pautas para que el lector sea capaz de elegir el elemento adecuado en base a sus objetivos y audiencia, así como a los datos que quiere mostrar.

Gráfico que muestra el tipo de producto visual más adecuado en base a los datos que se quieren representar. Si cuentas con pocos datos y simples, y tu prioridad es el diseño creativo, deberías utilizar una infografía. Si por el contrario tu prioridad es el mensaje estándar, deberías utilizar un producto no infográfico, que también se usa cuando son muchos datos o datos complejos. Los productos no infográficos pueden ser sin interactividad (producto visual estático) o dinámicos e interactivos. Si la interactividad es simple, serán visualizaciones interactivas, si la interactividad es avanzada, estaremos delante de un cuadro de mando.

Los siguientes capítulos se centran en los diversos elementos disponibles (infografías, cuadros de mandos, indicadores, tablas, mapas, etc.) mostrando las distintas subcategorías que existen y las buenas prácticas a seguir en su elaboración, mostrando numerosos ejemplos que facilitan su comprensión. También se ofrecen recomendaciones sobre el uso del texto.

La guía finaliza con una selección de recursos, que permiten ampliar el conocimiento, y de herramientas de visualización de datos a considerar por todo aquel que quiera empezar a elaborar sus propias visualizaciones.

Puedes descargar la guía completa a continuación, en el aparatado de “Documentación”.

calendar icon
Documentación

La anonimización de datos define la metodología y el conjunto de buenas prácticas y técnicas que reducen el riesgo de identificación de personas, la irreversibilidad del proceso de anonimización y la auditoría de la explotación de los datos anonimizados, monitorizando quién, cuándo y para qué se usan.

Este proceso es fundamental, tanto cuando hablamos de datos abiertos como de datos en general, para proteger la privacidad de las personas, garantizando el cumplimiento normativo y de los derechos fundamentales.

El informe “Introducción a la anonimización de datos: Técnicas y casos prácticos”, elaborado por Jose Barranquero, define los conceptos clave de un proceso de anonimización, incluyendo términos, principios metodológicos, tipos de riesgos y técnicas existentes.

El objetivo del informe es ofrecer una introducción suficiente y concisa, principalmente orientada a publicado­res de datos que necesitan garantizar la privacidad de estos. No se trata de una guía exhaustiva, sino una primera toma de contacto para entender los riesgos y técnicas disponibles, así como la complejidad inherente a cualquier proceso de anonimización de datos.

¿Qué técnicas se incluyen en el informe?

Tras una introducción donde se definen los términos más relevantes y los principios básicos de anonimización, el informe se centra en comentar tres enfoques generales para la anonimización de datos, cada uno de los cuales está integrado a su vez por diversas técnicas:

  1. Aleatorización: tratamiento de datos, eliminando la correlación con el individuo, mediante la adición de ruido, la permutación, o la Privacidad Diferencial.
  2. Generalización: alteración de escalas u órdenes de magnitud a través de técnicas basadas en agregación como Anonimato-K, Diversidad-L, o Proximidad-T.
  3. Seudonimización: reemplazo de valores por versiones cifradas o tokens, habitualmente a través de algoritmos de HASH, que impiden la identificación directa del individuo, a menos que se combine con otros datos adicionales, que deben estar custodiados de forma adecuada.

El documento describe cada una de estas técnicas, así como los riesgos que suponen, aportando recomendaciones para evitarlos. Si bien, la decisión final sobre qué técnica o conjunto de técnicas es más adecuada depende de cada caso particular.

El informe finaliza con un conjunto de ejemplos prácticos sencillos que muestran la aplicación de las técnicas Anonimato-K y seudonimización mediante cifrado con borrado de clave. Para simplificar la ejecución del caso, se pone a disposición de los usuarios el código y los datos utilizados en el ejercicio, disponibles en Github. Para seguir el ejercicio, es recomendable tener unos conocimientos mínimos del lenguaje pyhton.

A continuación, puedes descargar el informe completo, así como el resumen ejecutivo y una presentación-resumen.

 

calendar icon
Noticia

El pasado 25 de octubre se celebró el taller de trabajo “Casos de uso del espacio de datos del Turismo español”, con el objetivo de arrancar el diseño y despliegue del primer dataspace del turismo interoperable a nivel europeo, construido bajo el sello de Gaia-X.

Esta actividad, organizada por la Oficina del Dato en colaboración con la Secretaría de Estado de Turismo, a través de SEGITTUR, se encuadra dentro del modelo de colaboración público privado para la constitución de los espacios de datos sectoriales impulsada por la Secretaria de Estado de Digitalización e Inteligencia Artificial del Ministerio de Asuntos Económicos y Transformación Digital. La cita supone la continuación al proceso de dinamización de los espacios de datos nacionales que se inició con la jornada abierta “Impulso gubernamental a una reindustrialización data-driven - Espacio de datos del Turismo español”, y se enmarca dentro de las acciones llevadas a cabo por el Gobierno de España para crear el entorno legal, político, tecnológico y de financiación propicio al despliegue de la economía del dato, tal y como se detalla en la estrategia España Digital 2026. Esta actuación está alineada con la escena europea.

¿Por qué un espacio de datos de turismo?

Los datos son un elemento vital del desarrollo y sostenibilidad del sector turístico. Permitiendo su adecuada puesta en valor se refuerza la ya significativa contribución del sector a la economía nacional. El lugar donde materializar este valor latente son los espacios de datos.

De acuerdo con su acepción europea, los espacios de datos son ecosistemas donde diversos actores comparten datos de manera voluntaria y segura. De esta forma se materializa la compartición de datos entre los partícipes respetando los principios de auto determinación en la compartición de datos (soberanía), privacidad, transparencia, seguridad y competencia justa.

El turismo, dado su ecosistema de participantes públicos y privados, de diferentes dimensiones y grado de madurez tecnológico, constituye un entorno óptimo donde contrastar las bondades de estos ecosistemas federados de datos. Gracias a ellos se facilita la extracción de valor de fuentes de datos no tradicionales, con una elevada escalabilidad, y garantizando en todo caso unas condiciones robustas de seguridad, privacidad y en ende de soberanía del dato.

La alta disponibilidad de datos sobre turismo supone grandes ventajas para el sector, ya que facilita la creación de ofertas, productos y servicios más personalizados que proporcionen una experiencia mejorada y adaptada a las necesidades de los clientes, mejorando así la capacidad de atraer turistas. Además de impulsar un mayor conocimiento del sector y una toma de decisiones informada tanto por parte de organizaciones públicas como privadas, que pueden detectar más fácilmente nuevas oportunidades de negocio.

Un taller eminentemente práctico

Durante el desarrollo del taller, los más de cien participantes, tanto del sector turístico como tecnológico, abordaron la caracterización en detalle de diferentes casos de uso de compartición de datos susceptibles de satisfacer necesidades de negocio concretas del sector turístico. Los participantes se organizaron a lo largo de diferentes mesas de trabajo considerando la madurez de los casos de uso planteados, buscando fomentar la variedad de perfiles y la agrupación de intereses. Las diferentes dinámicas de trabajo que se llevaron a cabo, se realizaron de acuerdo con la metodología de descubrimiento y diseño de casos de uso elaborada por la Oficina del dato, permitiendo validar su contenido y su escalabilidad al resto de espacios de datos sectoriales por constituir.

Durante las conclusiones finales de la jornada, la Oficina del Dato hizo énfasis en el papel central de los espacios de datos como lugar donde crear nuevas oportunidades de negocio dentro del sector turístico. También se resaltó que las sinergias derivadas de la compartición de datos van más allá de la suma de los datos individuales, y las inversiones, debidamente apoyadas por la colaboración pública-privada, deben verse más allá del corto plazo necesitando ser respaldadas por la Dirección. El problema a resolver es un problema de negocio y la solución no es exclusivamente tecnológica, deben buscarse soluciones simples con facilidad de adopción y uso, de despliegue robusto, ágil y sencillo que no generen barreras de entrada a pequeños participantes. Aprovechando el momento tecnológico, económico, político y social, es posible desarrollar un sector turístico orientado al dato, sostenible, generador de valor social e inclusivo.

En este enlace puedes ver la presentación del taller, donde se recogen, entre otros, aspectos metodológicos para la creación de espacios de datos, como las características a cumplir o los elementos a considerar. A continuación también puedes acceder a varias infografías:

  • Los espacios de datos de turismo y el modelo Gaia-X
  • Ficha del caso de uso para la compartición de datos
  • Identificación y propuesta de casos de uso en turismo
  • Elementos que intervienen en el proceso de compartición de datos
calendar icon
Documentación

A la hora de publicar datos abiertos, es fundamental garantizar su calidad. Si los datos están bien documentados y cuentan con la calidad necesaria, será más fácil su reutilización, ya que serán menores los trabajos adicionales de depuración y procesamiento. Además, la baja calidad de los datos puede suponer un coste para los publicadores, que pueden llegar a gastar más dinero en solucionar los errores que en evitar con antelación los potenciales problemas.

Para ayudar en esta tarea, en el marco de la Iniciativa Aporta se ha elaborado la “Guía práctica para la mejora de la calidad de datos abiertos, que proporciona un compendio de directrices para actuar sobre cada una de las características que definen la calidad, impulsando su mejora. El documento toma como referente la guía para la calidad de datos de data.europe.eu, publicada en 2021 por la Oficina de Publicaciones de la Unión Europea.

¿A quién está dirigida la guía?

La guía está dirigida a publicadores de datos abiertos, a quienes proporciona una serie de pautas claras para mejorar la calidad de sus datos.

No obstante, esta recopilación también puede orientar a los reutilizadores de datos sobre cómo afrontar las debilidades de calidad que pueden presentar los conjuntos de datos con los que trabajan.

¿Qué incluye la guía?

El documento comienza definiendo las características, según la norma ISO/IEC 25012, que deben cumplir los datos para considerarse de calidad, las cuales se recogen en la siguiente imagen.

Atributos de la calidad de los datos: exactitud, completitud, consistencia, credibilidad, actualidad, accesibilidad, conformidad, confidencialidad, eficiencia, precisión, trazabilidad, comprensibilidad.

A continuación, el grueso de la guía está enfocado en la descripción de recomendaciones y buenas prácticas para evitar los problemas más habituales que suelen surgir a la hora de publicar datos abiertos, estructuradas de la siguiente manera:

  • Una primera parte donde se detallan una serie pautas generales para garantizar la calidad de los datos abiertos, como, por ejemplo, utilizar una codificación de caracteres estandarizada, evitar la duplicidad de registros o incorporar variables con información geográfica. Para cada pauta se proporciona una descripción detallada del problema, las características de calidad afectadas y las recomendaciones para su resolución, junto a ejemplos prácticos que facilitan su comprensión.
  • Una segunda parte con pautas concretas para asegurar la calidad de los datos abiertos según el formato de datos utilizado. Se han incluido pautas específicas para los formatos CSV, XML, JSON, RDF y APIs.
  • Por último, la guía también incluye recomendaciones para la estandarización y enriquecimiento de datos, así como para su documentación, y un listado de herramientas útiles para trabajar la calidad de los datos.

Puedes descargar la guía aquí o al final de la página.

Materiales adicionales

La guía va acompañada de una serie de infografías que recopilan las pautas antes indicadas:

caratula Infografía “Pautas generales para garantizar la calidad de los datos abiertos”

Version accesible

Captura de la infografía " Pautas para asegurar la calidad usando formatos específicos de datos"

Versión accesible

calendar icon
Documentación

Un espacio de datos es un ecosistema donde, de forma voluntaria, se ponen en común los datos de sus participantes (sector público, grandes y pequeñas empresas tecnológicas o de negocio, individuos, organismos de investigación, etc). Así y bajo un contexto de soberanía, confianza y seguridad, se pueden compartir, consumir y diseñar productos o servicios a partir de estos espacios de datos.  

Esto es especialmente importante porque si el usuario siente que tiene el control sobre sus propios datos, gracias a una comunicación clara y concisa sobre los términos y condiciones que marcarán su uso, la compartición de los mismos se hará efectiva impulsando, así, el desarrollo económico y social del entorno.

En línea con esta idea y con el objetivo de mejorar el diseño de los espacios de datos, desde la Oficina del Dato establecen una serie de características cuyo objetivo es dejar constancia de la normativa que deben seguir para diseñar, desde el punto de vista arquitectónico, espacios de datos eficaces y funcionales.

Resumimos en el siguiente visual algunas de las características más importantes para la creación de espacios de datos. Para consultar el documento original y la todas las normas propuestas por la Oficina del Dato es necesario descargar el documento adjunto que se encuentra al final de esta noticia. 

(Puedes descargar la versión accesible en word aquí)

calendar icon
Blog

La siguiente infografía muestra el contexto que impulsa el desarrollo de los espacios de datos, haciendo foco en algunas iniciativas europeas relacionadas como Gaia-X y ISDA. Para profundizar en su contenido puede leer los siguientes artículos:

Haz clic en la infografía para verla a tamaño real y poder acceder a los enlaces:

Miniatura de la infografía

 

calendar icon
Blog

El pasado diciembre el Congreso de los Diputados aprobó el Real Decreto-ley 24/2021, que incluía la transposición de la Directiva (UE) 2019/1024, relativa a los datos abiertos y la reutilización de la información del sector público. Con este Real Decreto se modifica la Ley 37/2007 sobre reutilización de la información del sector público, incluyendo nuevos requisitos para los organismos públicos, entre los que se encuentra el facilitar el acceso a los datos de alto valor.  

Los datos de alto valor son aquellos cuya reutilización está asociada a considerables beneficios para la sociedad, el medio ambiente y la economía. Inicialmente, la Comisión Europea destacó como datos de alto valor aquellos pertenecientes a las categorías de datos geoespaciales, ambientales, meteorológicos, estadísticos, relativos a sociedades y de movilidad, aunque estas clases pueden ser ampliadas tanto por, la Comisión como por el Ministerio de Asuntos Económicos y Transformación Digital a través de la Oficina del Dato. De acuerdo con la Directiva, este tipo de datos “se pondrán a disposición para su reutilización en un formato legible por máquina, a través de interfaces de programación de aplicaciones adecuadas y, cuando proceda, en forma de descarga masiva”. Es decir, entre otras cuestiones, se hace necesario el contar con una API

¿Qué es una API

Una interfaz de programación de aplicaciones o API (la abreviatura en inglés de Application Programming Interfaces) es un conjunto de definiciones y protocolos que permite el intercambio de información entre sistemas. Cabe destacar que existen distintos tipos de APIs en base a su arquitectura, protocolos de comunicación y sistemas operativos. 

Las APIs suponen una serie de ventajas para los desarrolladores, ya que permiten automatizar el consumo de datos y metadatos, facilitan la descarga masiva y optimizan la recuperación de información al admitir funcionalidades de filtrado, ordenación y paginación. Todo ello repercute en un ahorro tanto económico como de tiempo.  

En este sentido, muchos portales de datos abiertos de nuestro país ya cuentan con sus propias APIs para facilitar el acceso a datos y metadatos. En la siguiente infografía puedes ver algunos ejemplos a nivel nacional, autonómico y local, incluyendo información sobre la API de datos.gob.es. La infografía también incluye información breve sobre qué es una API y qué se necesita para poder utilizarlas. 

APIs para el acceso a datos abiertos y/o sus metadatos

Haz clic aquí para ver la infografía en tamaño completo y en su versión accesible

Estos ejemplos ponen de manifiesto el esfuerzo que los organismos públicos de nuestro país están haciendo para facilitar el acceso a la información que custodian de forma más eficiente y automatizada, con el fin de impulsar la reutilización de sus datos abiertos.  

En datos.gob.es contamos con una Guía práctica para la publicación de datos abiertos usando APIs donde se detallan una serie de pautas y buenas prácticas para definir e implementar este mecanismo en un portal open data. 


Contenido elaborado por el equipo de datos.gob.es.

calendar icon