Blog

La visualización de datos es una práctica fundamental para democratizar el acceso a la información pública. Sin embargo, crear gráficos efectivos va mucho más allá de elegir colores atractivos o utilizar las últimas herramientas tecnológicas. Como señala Alberto Cairo, experto en visualización de datos y docente de la academia del portal europeo de datos abiertos (data.europa.eu), “cada decisión de diseño debe ser deliberada: inevitablemente subjetiva, pero nunca arbitraria”. A través de una serie de tres webinar que puedes volver a ver aquí, el experto ofreció consejos innovadores para estar a la vanguardia de la visualización de datos.

Cuando trabajamos con visualización de datos, especialmente en el contexto de la información pública, es crucial desmontar algunos mitos arraigados en nuestra cultura profesional. Frases como "los datos hablan por sí mismos", "una imagen vale más que mil palabras" o "muestra, no cuentes" suenan bien, pero esconden una verdad incómoda: los gráficos no siempre comunican automáticamente.

La realidad es más compleja. Un/a profesional del diseño puede querer comunicar algo específico, pero los lectores pueden interpretar algo completamente diferente. ¿Cómo se puede superar la brecha entre intención y percepción en visualización de datos? En este post, ofrecemos algunas claves de la serie formativa.

Un marco estructurado para diseñar con propósito

En lugar de seguir "reglas" rígidas o aplicar plantillas predefinidas, en el curso se propone un marco de pensamiento basado en cinco componentes interrelacionados:

  1. Contenido: la naturaleza, origen y limitaciones de los datos
  2. Personas: la audiencia a la que nos dirigimos
  3. Intención: los propósitos que definimos
  4. Restricciones: las limitaciones que enfrentamos
  5. Resultados: cómo es recibido el gráfico

Este enfoque holístico nos obliga a preguntarnos constantemente: ¿qué necesitan realmente saber nuestros lectores? Por ejemplo, cuando comunicamos información sobre riesgos de huracanes o emergencias sanitarias, ¿es más importante mostrar trayectorias exactas o comunicar impactos potenciales? La respuesta correcta depende del contexto y, sobre todo, de las necesidades informativas de la ciudadanía.

El peligro de la agregación excesiva

Aún sin perder de vista el propósito es importante no caer en añadir demasiada información o presentar solo promedios. Imaginemos, por ejemplo, un conjunto de datos sobre seguridad ciudadana a nivel nacional: un promedio puede esconder que la mayoría de las localidades son muy seguras, mientras unas pocas con tasas extremadamente altas distorsionan el indicador nacional.

Como explica Claus O. Wilke en su libro "Fundamentals of Data Visualization", esta práctica puede ocultar patrones cruciales, valores atípicos y paradojas que son precisamente los más relevantes para la toma de decisiones. Para evitar este riesgo, en la formación se propone visualizar una gráfica como un sistema de capas que debemos construir cuidadosamente desde la base:

1. Codificación (Encoding)

  1. Es la base de todo: cómo traducimos datos en atributos visuales. Las investigaciones en percepción visual nos muestran que no todos los "canales visuales" son igual de efectivos. La jerarquía sería:
  • Más efectivos: posición, longitud y altura
  • Medianamente efectivos: ángulo, área y pendiente
  • Menos efectivos: color, saturación y forma

¿Cómo ponemos esto en práctica? Pues, por ejemplo, para realizar comparaciones precisas, un gráfico de barras será casi siempre mejor opción que un gráfico circular. Sin embargo, como se matiza en los materiales formativos, "efectivo" no siempre significa "apropiado". Un gráfico circular puede ser perfecto cuando queremos expresar la idea de un "todo y sus partes", aunque las comparaciones precisas sean más difíciles.

2. Disposición (Arrangement)

El posicionamiento, orden y agrupación de los elementos afecta profundamente a la percepción. ¿Queremos que el lector compare entre categorías dentro de un grupo, o entre grupos? La respuesta determinará si organizamos nuestra visualización con barras agrupadas o apiladas, con paneles múltiples o en una única vista integrada.

3. Andamiaje (Scaffolding)

Los títulos, introducciones, anotaciones, escalas y leyendas son fundamentales. En datos.gob.es hemos visto cómo las visualizaciones interactivas pueden condensar información compleja, pero sin un andamiaje adecuado, la interactividad puede confundir más que aclarar.

El valor de una correcta escala

Uno de los aspectos técnicos más delicados —y a menudo más manipulables— de una visualización es la elección de la escala. Una simple modificación en el eje Y puede cambiar por completo la interpretación del lector: una tendencia suave puede parecer una crisis repentina, o un crecimiento sostenido puede pasar desapercibido.

Como se menciona en el segundo webinar de la serie, las escalas no son un detalle menor: son un componente narrativo. Decidir dónde empieza un eje, qué intervalos se usan o cómo se representan los periodos de tiempo implica hacer elecciones que afectan directamente la percepción de la realidad. Por ejemplo, si una gráfica de empleo comienza el eje Y en 90 % en lugar de 0 %, el descenso puede parecer dramático, aunque, en realidad, sea mínimo.

Por eso, las escalas deben ser honestas con los datos. Ser “honesto” no significa renunciar a decisiones de diseño, sino mostrar claramente qué decisiones se tomaron y por qué. Si existe una razón válida para empezar el eje Y en un valor distinto de cero, debe explicarse explícitamente en la gráfica o en su pie de texto. La transparencia debe prevalecer sobre el dramatismo.

La integridad visual no solo protege al lector de interpretaciones engañosas, sino que refuerza la credibilidad de quien comunica. En el ámbito de los datos públicos, esa honestidad no es opcional: es un compromiso ético con la verdad y con la confianza ciudadana.

Accesibilidad: visualizar para todos

Por otro lado, uno de los aspectos frecuentemente olvidado es la accesibilidad. Aproximadamente el 8 % de los hombres y el 0,5 % de las mujeres tienen algún tipo de daltonismo. Herramientas como Color Oracle permiten simular cómo se ven nuestras visualizaciones para personas con diferentes tipos de deficiencias en la percepción del color.

Además, en el webinar se mencionó el proyecto Chartability, una metodología para evaluar la accesibilidad de las visualizaciones de datos. En el sector público español, donde la accesibilidad web es un requisito legal, esto no es opcional: es una obligación democrática. Bajo esta premisa publicó la Federación Española de Municipios y Provincias publicó una Guía de Visualización de Datos para Entidades Locales

Narrativa visual: cuando los datos cuentan historias

Una vez resueltas las cuestiones técnicas, podemos abordar el aspecto narrativo que cada día es más importante para comunicar correctamente. En este sentido, el curso plantea un método sencillo pero poderoso:

  1. Escribe una frase larga que resuma los puntos que quieres comunicar.
  2. Divide esa frase en componentes, aprovechando las pausas naturales.
  3. Transforma esos componentes en secciones de tu infografía.

Este enfoque narrativo es especialmente efectivo para proyectos como los que encontramos en data.europa.eu, donde se combinan visualizaciones con explicaciones contextuales para comunicar el valor de los conjuntos de datos de alto valor o en los ejercicios de visualización y ciencia de datos de datos de datos.gob.es.

El futuro de la visualización de datos también incluye aproximaciones más creativas y centradas en el usuario. Proyectos que incorporan elementos personalizados, que permiten a los lectores situarse en el centro de la información, o que utilizan técnicas narrativas para generar empatía, están redefiniendo lo que entendemos por "comunicación de datos".

Incluso emergen formas alternativas de "sensificación de datos": la fisicalización (crear objetos tridimensionales con datos) y la sonificación (traducir datos a sonido) abren nuevas posibilidades para hacer la información más tangible y accesible. La empresa española Tangible Data, de la que nos hacemos eco en datos.gob.es porque reutiliza conjuntos de datos abiertos, es prueba de ello.


Figura 1. Ejemplos de sensificación de datos. Fuente: https://data.europa.eu/sites/default/files/course/webinar-data-visualisation-episode-3-slides.pdf

A modo de conclusión, podemos resaltar que la integridad en el diseño no es un lujo: es un requisito ético. Cada gráfico que publicamos en plataformas oficiales influye en cómo los ciudadanos perciben la realidad y toman decisiones. Por eso, dominar herramientas técnicas como las bibliotecas y API de visualización, que se analizan en otros artículos del portal, es tan relevante.

La próxima vez que crees una visualización con datos abiertos, no te preguntes solo "¿qué herramienta uso?" o "¿qué gráfico se ve mejor?". Pregúntate: ¿qué necesita realmente saber mi audiencia? ¿Esta visualización respeta la integridad de los datos? ¿Es accesible para todos? Las respuestas a estas preguntas son las que transforman un gráfico bonito en una herramienta de comunicación verdaderamente efectiva.

calendar icon
Evento

Los EU Open Data Days 2025 son un evento esencial para todos los interesados en el mundo de los datos abiertos y la innovación en Europa y el mundo. Este encuentro, que se celebrará los días 19 y 20 de marzo de 2025, reunirá a expertos, profesionales, desarrolladores, investigadores y responsables de políticas públicas para compartir conocimientos, explorar nuevas oportunidades y abordar los retos a los que se enfrenta la comunidad de datos abiertos.

El evento, organizado por la Comisión Europea a través de data.europa.eu, tiene como objetivo principal promover la reutilización de datos abiertos. Los participantes tendrán la oportunidad de aprender sobre las últimas tendencias en el uso de los datos abiertos, descubrir nuevas herramientas y debatir sobre las políticas y normativas que están modelando el panorama digital en Europa.

¿Dónde y cuándo se celebra?

El evento se celebrará en el Centro Europeo de Convenciones de Luxemburgo, aunque también se podrá seguir online, con el siguiente horario:

  • Miércoles 19 de marzo de 2025, de 13:30 a 18:30.
  • Jueves 20 de marzo de 2025, de 9:00 a 15:30.

¿Qué temáticas se abordarán?

Ya está disponible la agenda del evento, donde encontramos distintas temáticas, como, por ejemplo:

  • Historias de éxito y buenas prácticas: el evento contará con la presencia de profesionales que desarrollan su trabajo en la primera línea de la política de datos europea, para que cuenten su experiencia. Entre otras cuestiones, estos expertos proporcionarán una guía práctica para inventariar y abrir los datos del sector público de un país, abordarán el trabajo que implica la compilación de conjuntos de datos de alto valor o analizarán las perspectivas sobre la reutilización de datos en los modelos de negocio. También se explicarán buenas prácticas para contar con metadatos de calidad o mejorar la gobernanza de datos y su interoperabilidad.
  • Foco en el uso de inteligencia artificial (IA): los datos abiertos ofrecen una fuente invaluable para el desarrollo y avance de la IA. Además, la IA puede optimizar la localización, gestión y uso de estos datos, ofreciendo herramientas que ayuden a agilizar procesos y extraer un mayor conocimiento. En este sentido, en el evento se abordará el potencial de la IA para transformar los ecosistemas de datos gubernamentales abiertos, fomentando la innovación, mejorando la gobernanza y potenciando la participación ciudadana. Los responsables del portal nacional de datos de Noruega contará cómo emplean un motor de búsqueda basado en IA para mejorar la localización de datos. Además, se explicarán los avances en espacios de datos lingüísticos y su uso en modelos de lenguaje, y se analizará cómo combinar de forma creativa los datos abiertos para lograr un impacto social.
  • Aprendizaje sobre visualización de datos: los asistentes al evento podrán explorar cómo la visualización de datos está transformando la comunicación, la elaboración de políticas y la participación ciudadana. A través de diversos casos (como el árbol genealógico de 3.000 personas de la realeza europea o las relaciones del Patrimonio Cultural Inmaterial de la UNESCO) se mostrará cómo los procesos iterativos de diseño pueden descubrir patrones ocultos en redes complejas, aportando ideas sobre la narración y la comunicación de datos. También se abordará cómo influyen los elementos de diseño, como el color, la escala y el enfoque, en la percepción de los datos.
  • Ejemplos y casos de uso: se mostrarán múltiples ejemplos de proyectos concretos basados en la reutilización de datos, en campos como la energía, el desarrollo urbano o el medio ambiente. Entre las experiencias que se compartirán, encontramos una empresa española, Tangible Data, que contará cómo las esculturas físicas de datos convierten conjuntos de datos complejos en experiencias accesibles y atractivas.

Estos son solo algunos de los temas a tratar, pero también se hablará de ciencia abierta, el papel de los datos abiertos en la transparencia y la rendición de cuentas, etc.

¿Por qué son tan importantes los EU Open Data Days?

El acceso a datos abiertos ha demostrado ser una herramienta poderosa para mejorar la toma de decisiones, impulsar la innovación y la investigación, y mejorar la eficiencia de las organizaciones. En un momento en el que la digitalización está avanzando rápidamente, la importancia de compartir y reutilizar datos se hace cada vez más crucial para enfrentar desafíos globales como el cambio climático, la salud pública o la justicia social.

Los EU Open Data Days 2025 son una oportunidad para explorar cómo los datos abiertos pueden aprovecharse para construir una Europa más conectada, innovadora y participativa.

Además, para aquellos que decidan asistir de forma presencial, el evento será también una oportunidad para establecer contactos con otros profesionales y organizaciones del sector, creando nuevas colaboraciones que pueden dar lugar a proyectos innovadores.

¿Cómo puedo asistir?

Para asistir presencialmente, es necesario inscribirse a través de este enlace. Sin embargo, no es necesario el registro para atender el evento de manera online.

Para cualquier consulta, se ha habilitado una dirección de correo donde se atenderán todas las dudas relativas al evento: EU-Open-Data-Days@ec.europa.eu.

Más información en la página web del evento.

calendar icon
Blog

La crisis climática y los desafíos ambientales actuales demandan respuestas innovadoras y efectivas. En este contexto, la iniciativa Destination Earth (DestinE) de la Comisión Europea es un proyecto pionero que tiene como objetivo desarrollar un modelo digital y altamente preciso de nuestro planeta.

A través de este gemelo digital de la Tierra se podrá monitorear y prevenir posibles desastres naturales, adaptar las estrategias de sostenibilidad y coordinar esfuerzos humanitarios, entre otras funciones. En este post, analizamos en qué consiste el proyecto y en qué estado se encuentra su desarrollo.

Características y componentes de Destination Earth

Alineado con el Pacto Verde Europeo y la Estrategia de Europa Digital, Destination Earth integra el modelado digital y las ciencias climáticas para ofrecer una herramienta que sea de utilidad a la hora de abordar retos ambientales. Para ello, cuenta con un enfoque orientado hacia la precisión, el detalle local y la rapidez en el acceso a la información.

En general, la herramienta permite:

  • Monitorear y simular los desarrollos del sistema terrestre, que incluyen la tierra, el mar, la atmósfera y la biosfera, así como las intervenciones humanas.
  • Anticipar desastres ambientales y crisis socioeconómicas, permitiendo así la salvaguarda de vidas y la prevención de recesiones económicas significativas.
  • Generar y probar escenarios que promuevan un desarrollo más sostenible en el futuro.

Para llevar esto a cabo, DestinE se subdivide en tres componentes principales que son:

  • Lago de datos:
    • ¿Qué es? Un repositorio centralizado que permite almacenar datos de diversas fuentes, como la Agencia Espacial Europea (ESA), EUMETSAT y Copernicus, así como de los nuevos gemelos digitales.
    • ¿Qué ofrece? Esta infraestructura permite el descubrimiento y acceso a datos, así como el procesamiento de grandes volúmenes de información en la nube.
  • ·La Plataforma de DestinE:
    • ¿Qué es? Un ecosistema digital que integra servicios, herramientas de toma de decisiones basadas en datos y una infraestructura de computación abierta en la nube, flexible y segura.
    • ¿Qué ofrece? Los usuarios tienen acceso a información temática, modelos, simulaciones, pronósticos y visualizaciones que facilitarán una comprensión más profunda del sistema terrestre.
  • Gemelos digitales e ingeniería:
    • ¿Qué son? Son varias réplicas digitales que cubren diferentes aspectos del sistema terrestre. Ya están desarrollados los dos primeros, uno relacionado con la adaptación al cambio climático y, el otro, sobre eventos climáticos extremos.
    • ¿Qué ofrecen? Estos gemelos ofrecen simulaciones multidecadales (variación de la temperatura) y pronósticos de alta resolución.

Descubre los servicios y contribuye a mejorar DestinE

La plataforma de DestinE ofrece un recopilatorio de aplicaciones y casos de uso desarrollados en el marco de la iniciativa, como, por ejemplo:

  • Gemelo digital del turismo (Beta): permite revisar y anticipar la viabilidad de las actividades turísticas en función de las condiciones medioambientales y meteorológicas de su territorio.
  • VizLab: ofrece una interfaz gráfica de usuario intuitiva y tecnologías avanzadas de renderizado en 3D para proporcionar una experiencia narrativa haciendo que conjuntos de datos complejos sean accesibles y comprensibles para un público amplio.
  • miniDEA: es una app de visualización web interactiva y fácil de usar, basado en DEA, para previsualizar datos de DestinE.
  • GeoAI: es una plataforma de IA geoespacial para casos de uso de observación de la Tierra.
  • Global Fish Tracking System (GFTS): es un proyecto para ayudar a obtener información precisa sobre las poblaciones de peces para elaborar políticas de conservación basadas en datos.
  • Planificación urbana más resiliente: es una solución que proporciona un índice de estrés térmico que permite a los planificadores urbanos conocer cuáles son las mejores prácticas de adaptación contra las temperaturas extremas en entornos urbanos.
  • Monitoreo de la reserva de agua del Delta del Danubio: es un análisis exhaustivo y preciso basado en el lago de datos DestinE para informar sobre los esfuerzos de conservación del Delta del Danubio, una de las regiones con mayor biodiversidad de Europa.

Desde octubre de este año la plataforma de DestinE acepta registros, una posibilidad que permite explorar todo el potencial de la herramienta y acceder a recursos exclusivos. Esta opción sirve para recabar feedback y mejorar el sistema del proyecto.

Para convertirte en usuario y poder generar servicios, debes seguir estos pasos.

Hoja de ruta del proyecto:

La Unión Europea plantea una serie de hitos ubicados en el tiempo que marcarán el desarrollo de la iniciativa:

  • 2022 – Lanzamiento oficial del proyecto.
  • 2023 – Inicio del desarrollo de los principales componentes.
  • 2024 – Desarrollo de todos los componentes del sistema. Puesta en marcha de la plataforma de DestinE y el lago de datos. Demostración.
  • 2026 - Mejora del sistema DestinE, integración de gemelos digitales adicionales y servicios relacionados.
  • 2030 - Réplica digital completa de la Tierra.

Destination Earth no solo representa un avance tecnológico, sino que también es una herramienta poderosa para la sostenibilidad y la resiliencia frente a los desafíos climáticos. Al proporcionar datos precisos y accesibles, DestinE permite tomar decisiones basadas en datos y crear estrategias de adaptación y mitigación efectivas.

calendar icon
Noticia

En el marco del mes europeo de concienciación sobre ciberseguridad, el portal europeo de datos, data.europa.eu, ha organizado un webinar centrado en la protección de datos abiertos. Este evento surge en un momento crítico donde las organizaciones, especialmente en el sector público, se enfrentan al desafío de equilibrar la transparencia y accesibilidad de los datos con la necesidad de protegerlos contra amenazas cibernéticas.

El seminario online contó con la participación de expertos en el campo de la ciberseguridad y la protección de datos, tanto desde el punto de vista privado como público.

En el panel de expertos se abordó la importancia que tiene la apertura de datos en la transparencia gubernamental y la innovación, así como los nuevos riesgos relacionados con brechas de datos, problemas de privacidad y otras amenazas de ciberseguridad. Los proveedores de datos, particularmente en el sector público, deben gestionar esta paradoja de hacer que los datos sean accesibles mientras garantizan su protección contra usos malintencionados.

Durante el evento, se identificaron diversas tácticas malintencionadas que utilizan algunos actores para comprometer la seguridad de los datos abiertos. Estas tácticas pueden producirse tanto antes como después de la publicación. Conocerlas es el primer paso para prevenirlas y contraatacarlas.

Amenazas prepublicación

Antes de que los datos sean puestos a disposición del público, estos pueden ser objeto de las siguientes amenazas:

  • Ataques a la cadena de suministro: los atacantes pueden introducir de manera furtiva código malicioso en proyectos de datos abiertos, como librerías de uso común (Pandas, Numpy o módulos de visualización), aprovechando la confianza que se deposita en estos recursos. Esta técnica permite a los atacantes comprometer sistemas más grandes y recopilar información confidencial de manera gradual y difícil de detectar.
  • Manipulación de la información: los datos pueden ser alterados de forma deliberada para presentar una imagen falsa o engañosa. Esto puede incluir la modificación de valores numéricos, la distorsión de tendencias o la creación de narrativas falsas. Estas acciones socavan la credibilidad de las fuentes de datos abiertos y pueden tener consecuencias significativas, especialmente en contextos donde los datos se utilizan para tomar decisiones importantes.
  • Envenenamiento de datos (data poisoning): los atacantes pueden inyectar datos engañosos o incorrectos en los conjuntos de datos, especialmente aquellos utilizados para el entrenamiento de modelos de IA. Esto puede resultar en modelos que producen resultados inexactos o sesgados, llevando a fallos operacionales o decisiones empresariales erróneas.

Amenazas post-publicación

Una vez que los datos se han publicado, siguen siendo vulnerables a diversos ataques:

  • Compromiso de la integridad de los datos: los atacantes pueden modificar los datos publicados, alterando archivos, bases de datos o incluso la transmisión de datos. Estas acciones pueden conducir a conclusiones erróneas y decisiones basadas en información falsa.
  • Re-identificación y violación de la privacidad: los conjuntos de datos, aunque sean anónimos, pueden combinarse con otras fuentes de información para revelar la identidad de individuos. Esta práctica, conocida como ‘re-identificación’, permite a los atacantes reconstruir perfiles detallados de personas a partir de datos aparentemente anónimos. Esto representa una grave violación de la privacidad y puede exponer a las personas a riesgos como el fraude o la discriminación.
  • Filtración de datos sensibles: las iniciativas de datos abiertos pueden exponer accidentalmente información sensible como registros médicos, información personal identificable (correos electrónicos, nombres, ubicaciones) o datos de empleo. Esta información puede ser vendida en mercados ilícitos como la dark web, o utilizarse para cometer fraude de identidad o discriminación.

Al hilo de estas amenazas, en el webinar se presentó un caso de estudio sobre cómo la desinformación cibernética aprovechó los datos abiertos durante la crisis energética y política asociada a la guerra de Ucrania en 2022. Los atacantes manipularon datos, generaron contenido falso con inteligencia artificial y amplificaron la desinformación en las redes sociales para crear confusión y desestabilizar los mercados.

Diapositiva de la presentación del webinar ”Safeguarding open data: cybersecurity essentials and skills for data providers”

Figura 1. Diapositiva de la presentación del webinar ”Safeguarding open data: cybersecurity essentials and skills for data providers

Estrategias de protección y gobierno de datos

En este contexto, la implementación de una estructura de gobernanza robusta emerge como elemento fundamental para la protección de datos abiertos. Este marco debe incorporar una gestión de calidad rigurosa que asegure la precisión y consistencia de los datos, junto con procedimientos efectivos de actualización y corrección. Los controles de seguridad deben ser exhaustivos, incluyendo:

  • Medidas de protección técnicas.
  • Procedimientos de verificación de integridad.
  • Sistemas de monitoreo de accesos y modificaciones.

La evaluación y gestión de riesgos requiere un enfoque sistemático que comience con una minuciosa identificación de datos sensibles y críticos. Esto implica no solo la catalogación de información crítica, sino también una evaluación detallada de su sensibilidad y valor estratégico. Un aspecto crucial es la identificación y exclusión de datos personales que pudieran permitir la identificación de individuos, implementando técnicas robustas de anonimización cuando sea necesario.

Para una protección efectiva, las organizaciones deben realizar análisis de riesgos exhaustivos que permitan identificar vulnerabilidades potenciales en sus sistemas y procesos de gestión de datos. Estos análisis deben conducir a la implementación de controles de seguridad sólidos y adaptados a las necesidades específicas de cada conjunto de datos. En este sentido, la implementación de acuerdos de compartición de datos establece términos claros y específicos para el intercambio de información con otras organizaciones, asegurando que todas las partes comprendan sus responsabilidades en materia de protección de datos.

Los expertos destacaron que la gobernanza de datos debe estructurarse mediante políticas y procedimientos bien definidos que garanticen una gestión efectiva y segura de la información. Esto incluye el establecimiento de roles y responsabilidades claras, procesos de toma de decisiones transparentes y mecanismos de supervisión y control. Los procedimientos de mitigación deben ser igualmente robustos, incluyendo protocolos de respuesta bien definidos, medidas preventivas efectivas y una actualización continua de las estrategias de protección.

Además, es fundamental mantener un enfoque proactivo en la gestión de la seguridad. Una estrategia que se anticipe a posibles amenazas y adapte las medidas de protección según evoluciona el panorama de riesgos. La formación continua del personal y la actualización regular de las políticas y procedimientos son elementos clave para mantener la efectividad de estas estrategias de protección. Todo esto debe realizarse manteniendo un equilibrio entre la necesidad de protección y el objetivo fundamental de los datos abiertos: su accesibilidad y utilidad para el público.

Aspectos legales y cumplimiento

Además, en el webinar se dio una explicación sobre el marco legal y regulatorio que rodea a los datos abiertos. Un punto crucial fue la distinción entre anonimización y seudoanonimización en el contexto del RGPD (Reglamento General de Protección de Datos).

Por un lado, los datos anonimizados no se consideran datos personales bajo el RGPD, porque es imposible identificar a los individuos. No obstante, la seudoanonimización mantiene la posibilidad de re-identificación si se combina con información adicional. Esta distinción es fundamental para las organizaciones que manejan datos abiertos, ya que determina qué datos pueden publicarse libremente y cuáles requieren protecciones adicionales.

Para ilustrar los riesgos de una inadecuada anonimización, en el webinar se presentó el caso de Netflix en 2006, cuando la empresa publicó un conjunto de datos supuestamente anonimizados para mejorar su algoritmo de recomendaciones. Sin embargo, investigadores pudieron “reidentificar” a usuarios específicos al combinar estos datos con información públicamente disponible en IMDb. Este caso demuestra cómo la combinación de diferentes conjuntos de datos puede comprometer la privacidad incluso cuando se han tomado medidas de anonimización.

En términos generales, se destacó el papel que tiene el Data Governance Act a la hora de proporcionar un marco de gobernanza horizontal para los espacios de datos, estableciendo la necesidad de compartir información de manera controlada y de acuerdo con las políticas y leyes aplicables. El Reglamento de Gobernanza de Datos es especialmente relevante para garantizar que la protección de datos, la ciberseguridad y los derechos de propiedad intelectual se respeten en el contexto de los datos abiertos.

El papel de la IA y la ciberseguridad en la seguridad de los datos

Las conclusiones del webinar se centraron en varios aspectos clave para el futuro de los datos abiertos. Un elemento fundamental fue la discusión sobre el papel de la inteligencia artificial y su impacto en la seguridad de los datos. Se destacó cómo la IA puede actuar como un multiplicador de amenazas cibernéticas, facilitando la creación de desinformación y el mal uso de datos abiertos.

Por otro lado, se enfatizó la importancia de implementar tecnologías de mejora de la privacidad (PET o Privacy Enhancing Technologies) como herramientas fundamentales para proteger los datos. Estas incluyen técnicas de anonimización y seudoanonimización, enmascaramiento de datos, computación que preserva la privacidad y diversos mecanismos de encriptación. Sin embargo, se subrayó que no basta con implementar estas tecnologías de manera aislada, sino que requieren una aproximación integral de ingeniería que considere su correcta implementación, configuración y mantenimiento.

La importancia de la formación

El webinar también enfatizó la importancia crítica de desarrollar habilidades específicas en ciberseguridad. El marco de habilidades cibernéticas de ENISA, presentado durante la sesión, identifica doce perfiles profesionales clave, incluyendo el Oficial de Política y Cumplimiento Legal en Ciberseguridad, el Implementador de Seguridad Cibernética y el Gestor de Riesgo en Ciberseguridad. Estos perfiles son esenciales para abordar los desafíos actuales en la protección de datos abiertos.

Diapositiva de la presentación del webinar "Safeguarding open data: cybersecurity essentials and skills for data providers”

Figura 2. Diapositiva de la presentación del webinar "Safeguarding open data: cybersecurity essentials and skills for data providers

En resumen, una recomendación clave que emergió del webinar fue la necesidad de que las organizaciones adopten un enfoque más proactivo en la gestión de datos abiertos. Esto incluye la implementación de evaluaciones de impacto regulares, el desarrollo de competencias técnicas específicas y la actualización continua de protocolos de seguridad. También se enfatizó la importancia de mantener la transparencia y la confianza pública mientras se implementan estas medidas de seguridad.

calendar icon
Evento

En un mundo cada vez más impulsado por la información, los datos abiertos están transformando la manera en que entendemos y moldeamos nuestras sociedades. Estos datos son una fuente muy valiosa de conocimiento que, además, contribuye a impulsar la investigación, fomentar avances tecnológicos y mejorar la toma de decisiones políticas.

En este contexto, la Oficina de Publicaciones de la Unión Europea organiza cada año los EU Open Data Days para poner en valor el papel de los datos abiertos en la sociedad europea y destacar todas las novedades relacionadas con su desarrollo. La siguiente edición se llevará a cabo los días 19 y 20 de marzo de 2025 en el Centro de Conferencias Europeo de Luxemburgo (ECCL) y de forma online.

Este evento, organizado por el equipo de data.europa.eu, el portal europeo de datos abiertos, reunirá a proveedores de datos, entusiastas y usuarios de todo el mundo, y será una ocasión única para explorar el potencial del open data en diversos sectores. Desde historias de éxito hasta nuevas iniciativas, este evento es una cita obligada para cualquier persona interesada en el futuro de los datos abiertos.

¿Qué son los EU Open Data Days?

Los EU Open Data Days son una oportunidad para intercambiar ideas y hacer networking con otras personas interesadas en el mundo de los datos abiertos y sus tecnologías relacionadas. Este evento está especialmente dirigido a profesionales que se dediquen a la publicación y reutilización de datos, el análisis, la elaboración de políticas públicas o a la investigación académica. No obstante, también está abierto al público general. Al fin y al cabo, son dos jornadas para compartir, aprender y contribuir al futuro de los datos abiertos en Europa.

¿Qué puedes esperar de los EU Open Data Days 2025?

El programa del evento está diseñado para cubrir una amplia gama de temas que son clave en el ecosistema de datos abiertos, tales como:

  • Historias de éxito y buenas prácticas: experiencias reales de quienes están en la primera línea de la política de datos en Europa, para conocer cómo se están utilizando los datos abiertos en diferentes modelos de negocio y abordar las fronteras emergentes de la inteligencia artificial.
  • Desafíos y soluciones: repaso de los retos que presenta el uso de los datos abiertos, desde la perspectiva de editores y usuarios, abordando tanto los problemas técnicos como los éticos y legales.
  • Visualización del impacto: análisis sobre cómo la visualización de datos está cambiando la forma en que comunicamos información compleja y cómo puede facilitar la toma de decisiones más acertadas, además de fomentar la participación ciudadana.
  • Alfabetización en datos: formación para adquirir nuevas habilidades que maximicen el potencial de los datos abiertos en cada área de trabajo o interés de los asistentes.

Un evento abierto a todos los sectores

Los EU Open Data Days están dirigidos un público amplio:

  • Sector privado: especialistas en análisis de datos, desarrolladores y proveedores de soluciones tecnológicas podrán aprender nuevas técnicas y tendencias, y conectar con otros profesionales del sector.
  • Sector público: los responsables de políticas públicas y funcionarios gubernamentales descubrirán cómo los datos abiertos pueden ser utilizados para mejorar la toma de decisiones, aumentar la transparencia y fomentar la innovación en el diseño de políticas.
  • Academia y educación: los investigadores, profesores y estudiantes podrán participar en discusiones sobre cómo los datos abiertos están alimentando nuevos estudios y avances en áreas tan diversas como las ciencias sociales, las tecnologías emergentes y la economía.
  • Periodismo y medios de comunicación: los periodistas y comunicadores especializados en datos aprenderán cómo utilizar la visualización de datos para contar historias más poderosas y precisas, fomentando un mejor entendimiento de temas complejos por parte de la ciudadanía.

Presenta tu propuesta antes del 22 de octubre

¿Te gustaría presentar una ponencia en los EU Open Data Days 2025? Tienes hasta el próximo martes 22 de octubre para mandar tu propuesta sobre alguna de las temáticas mencionadas. Se buscan ponencias que aborden los datos abiertos o en áreas relacionadas, como la visualización de datos o el uso de la inteligencia artificial junto con datos abiertos.

Desde el portal de datos europeos están buscando casos inspiradores que demuestren el impacto del uso de datos abiertos en Europa y más allá. La convocatoria está abierta a participantes de todo el mundo y de todos los sectores: desde organizaciones públicas internacionales, nacionales y de la UE, hasta académicos, periodistas y expertos en visualización de datos. Los proyectos seleccionados formarán parte del programa de la conferencia, y las presentaciones deberán realizarse en inglés.

Las propuestas deberán tener una duración de entre 20 y 35 minutos, que incluirán tiempo para preguntas y respuestas. Si tu propuesta es elegida, los gastos de viaje y alojamiento (una noche) serán reembolsados para aquellos participantes provenientes del sector académico, el sector público y ONGs.

Para más detalles y aclaraciones, puedes ponerte en contacto con el equipo organizador a través del correo: EU-Open-Data-Days@ec.europa.eu.

  • Fecha límite de presentación de propuestas: 22 de octubre de 2024.
  • Notificación a los participantes seleccionados: noviembre de 2024.
  • Entrega del borrador de la presentación: 15 de enero de 2025.
  • Entrega de la presentación final: 18 de febrero de 2025.
  • Fechas de la conferencia: 19-20 de marzo de 2025.

El futuro de los datos abiertos es ahora. Los EU Open Data Days 2025 no solo serán una oportunidad para aprender sobre las últimas tendencias y prácticas en el uso de datos, sino también para construir una comunidad más fuerte y colaborativa alrededor de los datos abiertos. El registro para el evento se abrirá a finales del otoño de 2024, lo anunciaremos a través de nuestras redes sociales en Twitter, LinkedIn e Instagram.

calendar icon
Blog

El potencial transformador de las iniciativas de datos abiertos es hoy en día ampliamente reconocido porque ofrecen oportunidades para el fomento de la innovación, una mayor transparencia y la mejora de la eficiencia en muchos procesos. Sin embargo, obtener una medición fiable del impacto real de estas iniciativas resulta complicado.

Desde este mismo espacio hemos planteado también en más de una ocasión la pregunta recurrente de cuál sería la mejor forma de medir el impacto de los datos abiertos, hemos revisado  distintos métodos y buenas prácticas para intentar cuantificarlo, así como analizarlo a través de casos de uso detallados o del impacto específico en temáticas y sectores concretos como el empleo, los datos geográficos, el transporte o los objetivos de desarrollo sostenible. Ahora, gracias al informe "Indicadores para una Evaluación del Impacto de los Datos Abiertos" elaborado por el equipo de data.europa.eu, contamos con un nuevo recurso para no solo entender sino también ser capaz de amplificar el impacto de las iniciativas de datos abiertos a través del diseño de los indicadores adecuados. Gracias a esta publicación podremos llevar a cabo un rápido análisis sobre la importancia de estos indicadores y explicaremos también brevemente cómo se pueden utilizar para aprovechar al máximo el potencial de los datos abiertos.

Comprendiendo los datos abiertos y su cadena de valor

La apertura de datos se refiere a la práctica de hacer que los datos estén disponibles para el público de manera que sean libremente accesibles y utilizables. Más allá de garantizar la simple disponibilidad, el verdadero valor de los datos abiertos radica en su utilización en varios dominios, fomentando el crecimiento económico, mejorando la transparencia del sector público e impulsando la innovación social. Sin embargo, cuantificar el impacto real de la apertura de los datos plantea desafíos significativos debido a las múltiples formas en que se utilizan los datos y las amplias implicaciones que pueden tener para la sociedad.

Para comprender el impacto de los datos abiertos lo primero que debemos conseguir es entender también su cadena de valor, lo que nos proporcionará un marco estructurado y adecuado para conseguir transformar los datos en bruto en conocimientos prácticos. Esta cadena incluye cuatro etapas principales que forman un proceso continuo desde la producción inicial hasta el uso final de los datos: 

Cadena de valor de los datos abiertos

Figura 1: Cadena de valor de los datos abiertos

  1. Recolección: consiste en identificar los datos existentes y establecer los procedimientos necesarios para su catalogación.
  2. Publicación: haciendo que los datos estén disponibles de forma accesible y que sean fáciles de localizar.
  3. Captación: llegará antes cuando los datos sean fáciles de usar y vengan acompañados de los incentivos adecuados para su uso.
  4. Aplicación: ya sea mediante el consumo directo de los datos o a través de alguna transformación que añada nuevo valor a los datos iniciales.

Cada una de estas etapas tendrá una función crítica a la hora de contribuir a la eficacia general y al valor derivado de los datos abiertos. Los indicadores desarrollados para evaluar el impacto de los datos abiertos estarán también estrechamente ligados a cada una de estas etapas, proporcionando una visión integral de cómo los datos se transforman de simple información a una potente herramienta para el desarrollo.

Indicadores para la evaluación del impacto

En el informe se introducen un conjunto de indicadores robustos que están específicamente diseñados para monitorizar las iniciativas de datos abiertos a través de sus productos, efectos e impacto como resultado de su cadena de valor. Estos indicadores no deben ser considerados como simple mediciones, sino como herramientas que nos ayudarán a entender la efectividad de las iniciativas de datos abiertos y a llevar a cabo mejoras estratégicas. Veamos pues estos indicadores un poco más en detalle:

  • Indicadores de producto: son los que se centran en la medición de los resultados inmediatos que llegan al conseguir que los datos abiertos estén disponibles. Algunos ejemplos serían el número de conjuntos de datos liberados, la frecuencia de actualización de los conjuntos de datos, el número de visitantes del catálogo de datos,la accesibilidad de los datos a través de varias plataformas o incluso los esfuerzos llevados a cabo a la hora de promocionar los datos y darles mayor visibilidad. Los indicadores de producción nos ayudan a evaluar la eficiencia de los procesos de publicación y difusión de datos y son generalmente fáciles de medir, aunque únicamente nos darán una medida bastante superficial del impacto.
  • Indicadores de efecto: los indicadores de resultado miden las consecuencias a corto y medio plazo de los datos abiertos. Estos indicadores son cruciales para poder entender cómo los datos abiertos influyen en los procesos de toma de decisiones, dan lugar al desarrollo de nuevas aplicaciones o consiguen mejorar la transparencia gubernamental. Así pues, una mejora en la planificación del transporte público basada en los datos de uso, una mayor participación ciudadana en el desarrollo de las políticas públicas para atajar el cambio climático provocada por la mayor disponibilidad de datos e información, o una mejora de la productividad de los servicios públicos gracias al uso de los datos pueden considerarse ejemplos significativos de indicadores de resultado.
  • Indicadores de impacto: este es el nivel más profundo de medición, ya que los indicadores de impacto evalúan los efectos más amplios y a largo plazo de los datos abiertos. Estos indicadores pueden incluir entre otros beneficios económicos como la creación de empleo o el crecimiento del PIB, impactos sociales como la mejora de la confianza en las entidades públicas, o incluso impactos ambientales como la reducción efectiva de gases de efecto invernadero. En este nivel los indicadores son mucho más complejos y específicos, por lo que deberían definirse para cada dominio específico que se desee analizar y de acuerdo también a los objetivos establecidos dentro de ese dominio.

Indicadores para la evaluación del impacto

Figura 2: Indicadores para la evaluación del impacto

La implementación de estos indicadores en la práctica requerirá de la implantación de un marco metodológico robusto que pueda capturar y analizar datos procedentes de diversas fuentes. Se recomienda combinar métodos de recolección de datos automatizados con otros basados en encuestas para recopilar datos más completos. Este tipo de enfoque dual permite capturar datos cuantitativos a través de sistemas automatizados mientras también incorpora percepciones cualitativas a través del feedback de los usuarios y del análisis de casos de uso más en profundidad.

Mirando hacia el futuro

El futuro de la evaluación del impacto de los datos abiertos mira hacia el refinamiento de los indicadores utilizados para la medición y su consolidación mediante el uso de herramientas de monitorización interactiva. Este tipo de herramientas habilitaría la posibilidad de una evaluación más continua que proporcionaría información en tiempo real sobre cómo se están utilizando los datos abiertos y sus efectos en diferentes sectores. Además, el desarrollo de un sistema de métricas estandarizado para estos indicadores facilitaría el análisis comparativo entre regiones y a lo largo del tiempo, mejorando aún más la comprensión global del impacto de los datos abiertos.

Otro factor importante a tener en cuenta son las posibles consideraciones de privacidad y ética aplicables a los indicadores seleccionados. Como en cualquier otra iniciativa centrada en los datos, las consideraciones relativas a la privacidad y la protección de datos serán primordiales y de obligado cumplimiento para los indicadores desarrollados. Generalmente, esta cuestión no debería resultar especialmente problemática cuando hagamos un seguimiento de los datos. Sin embargo, una vez nos adentramos en su uso por parte de los usuarios podríamos dar lugar a situaciones más delicadas. Asegurar también el anonimato en los indicadores y las prácticas seguras en su gestión es crucial para mantener la confianza y la integridad en los procesos de datos abiertos.

En conclusión, el desarrollo e implementación de indicadores específicos detallados siguiendo las recomendaciones del informe "Indicadores para una Evaluación de Impacto de Datos Abiertos" sería un avance significativo en cuanto a cómo medimos y comprendemos el impacto de los datos abiertos. El refinamiento y la adaptación continua de estos indicadores serán también acciones cruciales a la hora de evolucionar en conjunto con las estrategias de datos abiertos a las que acompañan y su creciente ámbito de influencia. A medio plazo, la Comisión Europea seguirá desarrollando su análisis en esta área de trabajo a través del proyecto data.europa.eu con el objetivo final de poder formular una metodología común para la evaluación del impacto proveniente de la reutilización de los datos públicos y desarrollar una herramienta de monitorización interactiva para su implantación.


Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

La European Open Science Cloud (EOSC) es una iniciativa de la Unión Europea que tiene como objetivo promover la ciencia abierta a través de la creación de una infraestructura digital de investigación abierta, colaborativa y sostenible. El objetivo principal de EOSC es el de proporcionar a los investigadores europeos un acceso más fácil a los datos, las herramientas y los recursos necesarios para poder llevar a cabo investigaciones de calidad.

EOSC en la agenda europea de investigación y datos

EOSC forma parte de las 20 acciones de la agenda 2022-2024 del Espacio Europeo de Investigación (ERA) y se reconoce como el espacio europeo de datos de ciencia, investigación e innovación, llamado a integrarse con otros espacios de datos sectoriales definidos en la estrategia europea para los datos. Entre los beneficios que se esperan obtener gracias a esta plataforma se encuentran:

  • Una mejora en la confianza, calidad y productividad de la ciencia europea.

  • El desarrollo de nuevos productos y servicios innovadores.
  • Una mejora en el impacto de la investigación a la hora de afrontar los mayores desafíos sociales.

La plataforma EOSC

EOSC es en realidad un proceso continuo que marca una hoja de ruta en la que todos los Estados Europeos participan, basándose en la idea central de que los datos de investigación son un bien público que debe estar disponible para todos los investigadores, independientemente de su ubicación o afiliación. Mediante este modelo se persigue que los resultados científicos cumplan con los Principios FAIR (Findable, Accesible, Interoperable, Reusable) para facilitar la reutilización, al igual que en cualquier otro espacio de datos.

No obstante, la parte más visible de ESCO es su plataforma que da acceso a millones de recursos aportados por cientos de proveedores de contenido. Dicha plataforma está diseñada para facilitar la búsqueda, el descubrimiento y la interoperabilidad de los datos y otros contenidos como recursos formativos, de seguridad, de análisis, herramientas, etc. Para ello, entre los elementos clave de la arquitectura prevista en EOSC encontramos dos componentes principales:

  • EOSC Core: que proporciona todos los elementos básicos necesarios para descubrir, compartir, acceder y reutilizar recursos – autenticación, gestión de metadatos, métricas, identificadores persistentes, etc.
  • EOSC Exchange: para asegurar que los servicios comunes y temáticos para la gestión y explotación de los datos estén disponibles a la comunidad científica.

A lo anterior hay que sumar el Framework de interoperabilidad de ESOC (EOSC-IF), un conjunto de políticas y directrices que habilitan la interoperabilidad entre distintos recursos y servicios y facilitan su posterior combinación.

En la actualidad la plataforma está disponible en 24 idiomas y se actualiza continuamente para añadir nuevos datos y servicios. Para los próximos siete años se prevé una inversión conjunta por parte de los socios de la Unión Europea de al menos 1.000 millones de euros para continuar con su desarrollo.

Participación en EOSC

La evolución de EOSC está siendo guiada por un organismo de coordinación tripartito formado por la propia Comisión Europea, los países participantes representados en la Junta Directiva de EOSC y la comunidad de investigación representada mediante la Asociación EOSC. Además, para poder formar parte de la comunidad ESCO tan sólo hay que seguir una serie de reglas mínimas de participación:

  1. Todo el concepto de EOSC se basa en el principio general de apertura.

  2. Los recursos existentes en EOSC deben cumplir con los principios FAIR.
  3. Los servicios deben cumplir con la arquitectura y pautas de interoperabilidad de EOSC.
  4. EOSC sigue los principios de comportamiento ético e integridad en la investigación.
  5. Se espera que los usuarios de EOSC también contribuyan a EOSC.
  6. Los usuarios deben cumplir los términos y condiciones asociados a los datos que usen.
  7. Los usuarios de EOSC siempre citan las fuentes de los recursos que usen en su trabajo.
  8. La participación en EOSC está sujeta a las políticas y legislaciones aplicables.

EOSC en España

El Consejo Superior de Investigaciones Científicas (CSIC) de España fue uno de los 4 miembros fundadores de la asociación y actualmente es miembro encomendado de la misma, encargado de la coordinación a nivel nacional.

El CSIC lleva ya años trabajando en su repositorio de acceso abierto DIGITAL.CSIC como paso previo a su futura integración en EOSC. Dentro de su trabajo en ciencia abierta podemos señalar por ejemplo la adopción de los Current Research Information System (CRIS), sistemas de información diseñados para ayudar a las instituciones de investigación a recopilar, organizar y gestionar datos sobre su actividad investigadora: investigadores, proyectos, publicaciones, patentes, colaboraciones, financiación, etc.

Los CRIS son ya de por sí herramientas importantes a la hora de ayudar a las instituciones a rastrear y administrar su producción científica, promoviendo la transparencia y el acceso abierto a la investigación. Pero, además, pueden también desempeñar un papel relevante como fuentes de información que alimentan la EOSC, ya que los datos recopilados en los CRIS pueden ser también fácilmente compartidos y utilizados a través de la EOSC.

El camino hacia la ciencia abierta

La colaboración entre los CRIS y la EOSC tiene el potencial de mejorar significativamente la accesibilidad y la reutilización de los datos de investigación, pero hay también otras acciones de transición que se pueden adoptar en el camino hacia la producción de una ciencia cada vez más abierta:

  1. Garantizar la calidad de los metadatos para facilitar el intercambio abierto de datos.

  2. Divulgar los principios FAIR entre la comunidad investigadora.
  3. Promover y desarrollar estándares comunes para facilitar la interoperabilidad.
  4. Fomentar la utilización de repositorios abiertos.
  5. Contribuir compartiendo recursos con el resto de la comunidad.

Todo ello ayudará a impulsar la ciencia abierta, aumentando la eficiencia, transparencia y replicabilidad de las investigaciones.

Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Blog

El 8 de septiembre se celebró el webinar Geospatial trends 2023:  Opportunities for data.europa.eu,  organizado por la Data Europa Academy y centrado en las tendencias emergentes en el ámbto geoespacial. En concreto, la conferencia online abordó el concepto de GeoAI (Inteligencia Artificial Geoespacial), que consiste en la aplicación de inteligencia artificial (IA) combinada con datos geoespaciales. 

A continuación, analizaremos cuáles han sido los desarrollos tecnológicos más punteros de 2023 en este ámbito, tomando como base el conocimiento aportado por los expertos participantes en dicho webinar. 

¿Qué es el GeoAI? 

El término GeoAI hace referencia, tal y como define Kyoung-Sook Kim, copresidente del Grupo de Trabajo de GeoAI del Open Geospatial Consortium (OGC), a: “un conjunto de métodos o entidades automatizadas que utilizan datos geoespaciales para percibir, construir (automatizar) y optimizar espacios en los que los humanos, así como todo lo demás, pueden continuar de manera segura y eficiente sus actividades geográficamente referenciadas\". 

El GeoAI nos permite crear enormes oportunidades que hasta el momento no habían sido posibles como: 

  • Extraer datos geoespaciales enriquecidos con aprendizaje profundo: Permite automatizar la extracción, la clasificación y la detección de información de datos como imágenes, vídeos, nubes de puntos y texto.
  • Realizar análisis predictivos con aprendizaje automático: Habilita la creación de modelos de predicción más precisos, detección de patrones y automatización de algoritmos espaciales.
  • Mejorar la calidad, la uniformidad y la precisión de los datos: Simplifica los flujos de generación manual de datos mediante la automatización para mejorar la eficiencia y reducir los costes.
  • Acelerar el tiempo de obtención de conocimiento de la situación: Ayuda a responder más rápidamente a las necesidades medioambientales y tomar decisiones más proactivas basadas en datos en tiempo real.
  • Incorporar la inteligencia de ubicación en la toma de decisiones: Ofrece nuevas posibilidades en la toma de decisiones basadas en datos del estado actual de la zona que necesitamos gobernar o planificar.   

Aunque esta tecnología ha cobrado protagonismo a lo largo del año 2023, ya se hablaba de ella en el informe sobre tendencias geoespaciales de 2022, donde se indicaba que la incorporación de inteligencia artificial a los datos espaciales supone una gran oportunidad en el mundo de los datos abiertos y en el sector geoespacial. 

 Casos de uso de GeoIA 

El potencial de esta tecnología emergente quedó de manifiesto durante la conferencia Geospatial trends 2023. La sesión fue moderada por Inmaculada Farfan Velasco, quien trabaja como project manager en la Oficina de Publicaciones de la Unión Europea y está involucrada en la iniciativa de datos de la UE.  

Durante el webinar, las empresas del sector GIS Con terra y 52ºNorth compartieron varios ejemplos prácticos para responder a la pregunta ¿Cuáles son las tendencias actuales en materia de datos geoespaciales?  Todos los casos de usos presentados a tal fin tienen algo en común: el uso de GeoAI. 

Los ejemplos presentados por parte de Con terra fueron:

  • KINoPro: Un proyecto de investigación que utiliza GeoAI para predecir la actividad de la polilla \"black arches\" y su impacto en los abetos de los bosques alemanes. Se analiza una amplia gama de datos, desde la temperatura hasta la humedad del suelo, para prever la aparición de estas plagas y tomar medidas preventivas.
  • Anomalía en la detección de torres de telefonía: Usa una red neuronal para la detección de las causas de las anomalías que se detectan en algunas torres y que puede arrojar una errónea localización en la posición de una llamada, dato crucial en las llamadas de emergencias para localizar la zona afectada.
  • Análisis automatizado de áreas de construcción: Pretende detectar áreas de edificaciones destinadas a zonas industriales a partir del uso de datos de OpenData e imágenes satelitales. Para ello realiza dos modelos: uno de los cambios en el territorio y otro que predice si estos cambios se deben al uso de las edificaciones (uso industrial o comercial). 

Por su parte, 52ºNorth presentó los siguientes casos de usos: 

  • MariData: Busca reducir las emisiones del transporte marítimo optimizando las operaciones de los barcos de carga. Utiliza GeoAI para calcular rutas óptimas, considerando factores como la posición del barco, los datos ambientales y las regulaciones de tráfico marítimo.
  • KI:STE: Aplica tecnologías de inteligencia artificial en ciencias ambientales para obtener valor con un enfoque en la infraestructura y la gestión de datos. El proyecto KI:STE se centra en la interoperabilidad de datos, la ejecución de modelos en entornos diversos y la elaboración de distintos proyectos como son los siguientes:
    • Vida silvestre: conceptos sensibles para la vida silvestre que clasifica las imágenes de Sentinel-2 en áreas (no) protegidas
    • Emisiones biogénicas: métodos no supervisados ​​para estimar las emisiones biogénicas a partir de la observación de la Tierra.
    • Predicción de peligros: flujo de trabajo de mapeo de peligros que incorpora tanto modelos basados ​​en la física como algoritmos de aprendizaje automático basados ​​en fuentes de datos heterogéneas.
    • Extremos hidrometeorológicos: métodos Al para fusionar modelos y reanálisis/observación para la cuantificación de extremos hidrometeorológicos .
    • Variabilidad de las nubes: aprendizaje auto supervisado sobre datos de Meteosat. 

Estos proyectos resaltan la importancia del GeoAI en diversas aplicaciones, desde la predicción de eventos ambientales hasta la optimización de rutas de transporte marítimo. Todos ellos ponen de manifiesto que esta tecnología se presenta como una herramienta crucial para abordar problemas complejos en la comunidad geoespacial. 

 GeoAI no sólo representa una gran oportunidad para el sector espacial, sino que pondrá a prueba la importancia de disponer de datos abiertos que cumplan los principios FAIR. Estos principios (Encontrable, Accessible, Interoperable, Reusable) son fundamentales para los proyectos GeoAI, ya que garantizan un acceso a la información de manera transparente, eficiente y ética. Al adherirse a los principios FAIR, los conjuntos de datos se vuelven más accesibles para los investigadores y desarrolladores, alimentando la colaboración y la mejora constante de los modelos. Además, la transparencia y la capacidad de reutilizar datos abiertos contribuyen a generar confianza en los resultados obtenidos mediante proyectos de GeoAI.   

Referencias  

Video de la conferencia  https://www.youtube.com/watch?v=YYiMQOQpk8A 

 

calendar icon
Blog

La participación activa de los jóvenes en la vida cívica y política es una de las claves para fortalecer la democracia en Europa. Analizar y comprender la voz de los jóvenes permite conocer sus actitudes y opiniones, algo que ayuda a prever las tendencias futuras de la sociedad con suficiente margen de maniobra para atender sus necesidades y preocupaciones hacia un futuro más próspero y cómodo para todos.

En la misión de obtener una perspectiva más clara sobre cómo éstos participan en Europa, los datos abiertos se han convertido en una herramienta valiosa . En este post, exploraremos cómo los jóvenes en Europa se involucran activamente en la sociedad y la política a través de datos abiertos relevantes de la Unión Europea (UE) publicados en el portal europeo de datos abiertos.

Compromiso de la juventud en las elecciones europeas

La Unión Europea tiene como uno de sus objetivos promover la participación activa de la población joven en la democracia y la sociedad. Su participación en elecciones y actividades cívicas enriquece la democracia europea. Los jóvenes aportan ideas y perspectivas diversas, algo que contribuye a la toma de decisiones y asegura que las políticas se adapten a sus necesidades y desafíos. Además, su participación contribuye a un sistema político que refleja los intereses de todos los ciudadanos, lo que, a su vez, fomenta una sociedad inclusiva y pacífica.

En las últimas elecciones al Parlamento Europeo, se logró la cifra de participación más alta en los últimos 20 años, con más del 50% de la población europea votando, tal y como corroboró la encuesta poselectoral del Eurobarómetro de la UE. Este aumento de la participación se debió en gran medida a un incremento en la participación de los jóvenes.

Los datos muestran que la generación más joven (menores de 25 años) aumentó su participación electoral en un 14% hasta alcanzar el 42%, mientras que la participación de las personas de 25 a 39 años incrementó en un 12% hasta llegar al 47%, en comparación entre las elecciones europeas de 2014 y las de 2019. Este crecimiento en la participación joven plantea una pregunta: ¿qué motivó que los jóvenes participasen más? Según la Encuesta Eurobarómetro sobre la Juventud de 2021, el sentido del deber como ciudadano (32%) y la voluntad de asumir responsabilidades para el futuro (32%) fueron los principales factores que motivaron a los jóvenes a votar en las elecciones europeas.

¿Por qué los jóvenes quieren participar en la UE?

Además de votar en las elecciones, existen otras formas en las que los jóvenes demuestran ser una parte activa de la ciudadanía. La Encuesta de Juventud 2021 revela datos interesantes sobre su interés en la política y la vida cívica.

En general, la política es un tema que les interesa. La mayoría de los participantes en la Encuesta de Juventud 2021 afirmaron discutir sobre política con amigos o familiares (85%). Además, muchos dijeron comprender cómo funciona el gobierno nacional de su país (58%). Sin embargo, la mayoría de los jóvenes sienten que tienen poca influencia en las decisiones, leyes y políticas importantes que los afectan. Los jóvenes sienten que tienen más voz en su gobierno local (47%), que en el gobierno nacional (40%) o en el nivel de la UE (30%).

El siguiente paso, tras comprender la política, es la acción. Los jóvenes creen que ciertas actividades políticas y cívicas son más efectivas que otras para hacer llegar su voz a los responsables de la toma de decisiones. Por orden, la votación en las elecciones (41%), la participación en protestas o manifestaciones callejeras (33%) y la participación en peticiones (30%) fueron consideradas las tres actividades más efectivas por los encuestados. Muchos jóvenes habían votado en sus últimas elecciones locales, nacionales o europeas (46%) y habían creado o firmado una petición (42%).

No obstante, la encuesta revela una interesante divergencia entre las percepciones de los jóvenes y sus acciones. En algunas ocasiones, la juventud se involucra en actividades a pesar de que no son las que considera más efectivas, como en el caso de las peticiones de firmas online. Por otro lado, no siempre participan en actividades que perciben que son eficaces, como las protestas callejeras o el contacto con políticos.

El impulso juvenil a la democracia europea

La juventud desea que los temas que considera prioritarios estén en la agenda política de las próximas elecciones europeas. Un Eurobarómetro especial más reciente sobre la democracia en acción en 2023 reveló que los jóvenes de entre 15 y 24 años son el grupo de edad más satisfecho con el funcionamiento de la democracia en la UE (61%, en comparación con la media de la UE del 54%).

El cambio climático es una preocupación particularmente destacada entre los jóvenes, ya que el 40% de los encuestados de 15 a 24 años considera esta cuestión como prioritaria, en comparación con el 31% de la población general de la UE.

Para fomentar la participación de los jóvenes en la agenda política europea, se han desarrollado iniciativas que utilizan datos abiertos para acercar la política a los ciudadanos. Ejemplos como TrackmyEU y Democracy Game buscan involucrar a los jóvenes en la política y permitirles acceder a información sobre las políticas de la UE y participar en debates y actividades cívicas.

En general, los datos abiertos proporcionan una visión valiosa sobre muchas realidades, por ejemplo, la que afecta a la juventud y su interacción en la sociedad y la política. Este análisis permite a los gobiernos y las administraciones públicas tomar decisiones informadas sobre cuestiones que afectan a este grupo social. Los jóvenes europeos están interesados en la política, participan activamente en elecciones y se involucran en organizaciones juveniles; se preocupan por cuestiones como la desigualdad y el cambio climático. Los datos abiertos también se utilizan en iniciativas que promueven la participación de los jóvenes en la vida política y cívica, lo que refuerza aún más la democracia europea.

En una sociedad cada día más digital y basada en datos, el acceso a los datos abiertos es básico para entender las preocupaciones e intereses de la juventud y su participación en la toma de decisión cívicas y políticas. Como una parte de una ciudadanía activa y comprometida, la juventud tiene un papel importante a desempeñar en el futuro de Europa, y los datos abiertos son una herramienta esencial para apoyar su participación.

 

Contenido elaborado a partir del post del portal europeo de datos abiertos Understanding youth engagement in Europe through open data

 

calendar icon
Blog

IATE, acrónimo en inglés de Interactive Terminology for Europe (Terminología Interactiva para Europa), es una base de datos dinámica diseñada para respaldar la redacción multilingüe de textos de la Unión Europea. Su objetivo es proporcionar datos relevantes, confiables y de fácil acceso con un valor añadido distintivo en comparación con otras fuentes de información léxica como pueden ser archivos electrónicos, memorias de traducción o internet. 

Esta herramienta es de interés para las instituciones de la UE que la utilizan desde 2004 y para cualquier persona, como profesionales de la lengua o del mundo académico, administraciones públicas, empresas o público en general Este proyecto, puesto en marcha en 1999 por el Centro de Traducción, está disponible para cualquier organización o persona que necesite redactar, traducir o interpretar un texto sobre la UE.  

Origen y usabilidad de la plataforma 

IATE se creó en 2004 mediante la fusión de diferentes bases de datos terminológicas de la UE. Para su creación se importaron a IATE las bases de datos originales de Eurodicautom, TIS, Euterpe, Euroterms y CDCTERM. Este proceso originó una gran cantidad de entradas duplicadas, lo que tiene como consecuencia que muchos conceptos estén cubiertos por varias entradas en lugar de una sola. Para solucionar este problema, se constituyó un grupo de trabajo de limpieza que desde 2015 se encarga de organizar análisis e iniciativas de limpieza de datos para consolidar entradas duplicadas en una sola entrada. Esto explica por qué las estadísticas sobre el número de entradas y términos muestran una tendencia a la baja, ya que se eliminan y actualizan más contenidos de los que se crean. 

Además de poder realizar consultas, existe la posibilidad de descargar sus ficheros de datos junto con la herramienta de extracción IATExtract que permite generar exportaciones filtradas.  

Esta base terminológica interinstitucional fue inicialmente diseñada para gestionar y normalizar la terminología de las agencias de la UE. No obstante, posteriormente, también se empezó a utilizar como herramienta de apoyo en la redacción multilingüe de los textos de la UE, hasta llegar a convertirse en la actualidad en un sistema complejo y dinámico de gestión terminológica. Aunque su principal objetivo es facilitar la labor de los traductores que trabajan para la UE, también es de gran utilidadl para el público en general. .  

IATE lleva a disposición del público desde 2007, y reúne los recursos terminológicos de todos los servicios de traducción de la UE. El Centro de Traducción gestiona los aspectos técnicos del proyecto en nombre de los socios que participan en él: el Parlamento Europeo (EP), el Consejo de la Unión Europea (Consilium), la Comisión Europea (COM), el Tribunal de Justicia (CJUE), el Banco Central Europeo (ECB), el Tribunal de Cuentas Europeo (ECA), el Comité Económico y Social Europeo (EESC/CoR), el Comité Europeo de las Regiones (EESC/CoR), el Banco Europeo de Inversiones (EIB) y el Centro de Traducción de los Órganos de la Unión Europea (CdT). 

La estructura de datos de IATE se basa en un enfoque orientado a conceptos, lo que significa que cada entrada corresponde a un concepto (los términos se agrupan por su significado), y cada concepto idealmente debería estar cubierto por una sola entrada. Cada entrada de IATE se divide en tres niveles: 

  • Nivel independiente del idioma (LIL) 

  • Nivel de idioma (LL) 

  • Nivel de término (TL) Para obtener más información, consulte la Sección 3 ('Visión general de la estructura') a continuación. 

Fuente de referencia para profesionales y útil para el público en general  

En IATE se reflejan las necesidades de los traductores de la Unión Europea, por lo que puede cubrirse cualquier ámbito que haya aparecido o pueda aparecer en los textos de las publicaciones del entorno de la UE, sus agencias y organismos. La crisis financiera, el medio ambiente, la pesca y la migración son ámbitos en los que se ha trabajado de forma intensa durante los últimos años. Para conseguir el mejor resultado, IATE utiliza el tesauro EuroVoc como sistema de clasificación de campos temáticos. 

Como ya hemos señalado, esta base de datos puede ser utilizada por cualquier persona que esté buscando el término adecuado sobre la Unión Europea. IATE permite explorar en campos diferentes al del término consultado y filtrar los dominios en todos los ámbitos y descriptores de EuroVoc. Las tecnologías utilizadas hacen que los resultados obtenidos tengan una gran precisión, mostrándose como una lista enriquecida que incluye además una clara distinción entre las coincidencias exactas y difusas del término.  

La versión pública de IATE incluye las lenguas oficiales de la Unión Europea, que se definen en el Reglamento n.º 1 de 1958. . Además, se efectúa una alimentación sistemática a través de proyectos anticipativos: si se sabe que va a tratarse en textos de la UE un tema determinado, se crean o mejoran las fichas que guardan relación con ese tema para que, cuando lleguen los textos, los traductores dispongan ya en IATE de la terminología precisada. 

Cómo utilizar IATE 

Para realizar una búsqueda en IATE simplemente se debe escribir una palabra clave o parte del nombre de una colección. Se pueden definir más filtros para su búsqueda, como institución, tipo o fecha de creación. Una vez que se ha realizado la búsqueda, se selecciona una colección y al menos una lengua de visualización. 

Para descargar subconjuntos de datos de IATE es necesario estar registrado, una opción totalmente gratuita que permite además de la descarga, almacenar algunas preferencias de usuario. La descarga es también un proceso sencillo y se puede realizar en formato csv o tbx.  

El archivo de descarga de IATE, a cuya información se puede también acceder de otras formas, contiene los siguientes campos:  

  • Nivel independiente de la lengua:  

  • Número de ficha: el identificador único de cada concepto. 

  • Campo temático: los conceptos están vinculados a ámbitos de conocimiento en los que se utilizan. La estructura conceptual se organiza en torno a veintiún campos temáticos con diversos subcampos. Hay que señalar que los conceptos pueden estar vinculados a más de un campo temático.  

  • Nivel de la lengua:  

  • Nivel del término 

  • Término: concepto de la ficha.  

  • Tipo de término. Pueden ser: términos, abreviatura, frase, fórmula o fórmula corta. 

  • Código de fiabilidad. IATE utiliza cuatro códigos para indicar la fiabilidad de los términos: sin comprobar, mínima, fiable o muy fiable.  

  • Evaluación. Cuando se almacenan varios términos en una lengua, se pueden asignar evaluaciones específicas del siguiente modo: preferible, admisible, desechado, obsoleto y propuesto.  

Una base de datos terminológica en continua actualización 

La base de datos IATE es un documento en permanente crecimiento, abierto a la participación ciudadana, de forma que cualquier persona puede contribuir a su crecimiento proponiendo nuevas terminologías para añadir a fichas existentes, o para crear fichas nuevas: puede enviar su propuesta a iate@cdt.europa.eu, o bien utilizar el enlace ‘Observaciones’ que aparece en la parte inferior derecha de la ficha del término buscado. Se puede facilitar cuanta información pertinente se desee para justificar la fiabilidad del término propuesto, o plantear un nuevo término a incluir. Un terminólogo de la lengua en cuestión estudiará cada propuesta ciudadana y valorará su incorporación al IATE. 

En agosto de 2023, la IATE anunciaba la disponibilidad de la versión 2.30.0 de este sistema de datos, añadiendo nuevos campos en su plataforma y la mejora de funciones, como la exportación de archivos enriquecidos para optimizar el filtrado de datos. Como hemos visto, esta base de datos terminológica interinstitucional de la UE seguirá evolucionando de manera continua para satisfacer las necesidades de los traductores de la UE y los usuarios de IATE en general. 

Otro aspecto importante es que esta base de datos sirve para el desarrollo de herramientas de traducción asistida por ordenador (TAO), lo que contribuye a garantizar la calidad de los trabajos de traducción de los servicios de traducción de la UE. Los resultados de la labor de terminología de los traductores se almacenan en IATE y éstos, a su vez, utilizan esta base de datos para realizar búsquedas interactivas y para alimentar bases de datos terminológicas específicas para un ámbito o documento que utilizan en sus herramientas TAO. 

IATE, con más de 7 millones de términos en más de 700.000 entradas, es una referencia en el ámbito de la terminología y está considerada como la mayor base de datos terminológica multilingüe del mundo. Cada año se realizan en IATE más de 55 millones de consultas desde más de 200 países, lo que da buena cuenta de su utilidad.  

calendar icon