ASEDIE, Asociación Multisectorial de la Información, celebrará el próximo 13 de diciembre su habitual Conferencia Internacional sobre Reutilización de información del Sector Público. Esta será su 15ª edición y el lema central es ‘Aprendiendo del pasado, construimos el futuro de los datos’. El objetivo del encuentro es abordar la interacción que existe entre las diferentes normativas que conviven en el ecosistema de los datos, analizar las barreras más significativas identificadas por el sector y debatir cuáles serían sus soluciones.
¿Cuándo y dónde se celebra?
El evento, que se celebrará en formato presencial el próximo 13 de diciembre de 2023 en la Universidad Rey Juan Carlos, en el Salón de Grados del Edificio Departamental (Paseo de los Artilleros, Madrid). La recepción de asistentes comienza a las 9:00 y el acto finalizará a las 13:10.
¿Cuál es el programa?
El foco de esta edición estará puesto en el aprendizaje colectivo tomando como referencia los pasos dados hasta ahora en el mundo de los datos y en la construcción del futuro del sector.
La sesión se abrirá a las 9:40 con la inauguración del evento a cargo del presidente de ASEDIE, Ignacio Jiménez y de la Directora de Gobernanza Pública del Ministerio de Hacienda y Función Pública, Dª Clara Mapelli para dar paso a la intervención de Carlos Romero, Consejero de Transformación Digital en la Representación Permanente de España ante la Unión Europea.
El evento contará con dos mesas redondas:
-
La primera mesa tendrá lugar a las 10:00 y versará sobre ‘La economía del dato en busca de una regulación coherente’. Contará con la participación de Santiago Graña, Subdirector General de Planificación y Gobernanza de la Administración Digital; Joaquín Meseguer, Consejero técnico en el Ayuntamiento de Madrid; Lorenzo Avello, Subdirector General de Ordenación de las Telecomunicaciones; y Mercedes Ortuño, Vocal Asesor de la Subdirección General de Promoción y Autorizaciones de la Agencia Española de Protección de Datos (AEPD). Será moderada por Casilda Lazcano, presidenta de la Comisión Jurídica de ASEDIE.
-
La segunda mesa, a las 12:00h, pondrá el foco en el futuro bajo el título ‘Los datos abiertos en perspectiva temporal: 2024 y más allá’. En ella participarán Carmen de Pablos Heredero, Catedrática de Organización de Empresas en la URJC; Agustín T. de Villar Iglesias, Subdirector del Área de Infraestructuras de la Información del Instituto de Estadística y Cartografía de Andalucía; y Fernando de Pablo Martín, Director General de la Oficina Digital del Ayuntamiento de Madrid.
Entre medias, a las 11:00 de la mañana, se hará entrega de los Premios ASEDIE 2023, en dos categorías.
-
Los finalistas en la categoría Impulsando la Economía del Dato son: la Oficina del Dato, por la generación de un dato de calidad contrastada desde un gobierno efectivo y normalizado; el Ayuntamiento de Zaragoza, con su proyecto Conoce y explora Zaragoza; y la Generalitat de Catalunya, por la clasificación de los conjuntos de datos por los Objetivos de Desarrollo Sostenible.
-
En la categoría Impulsando el conocimiento del dato, las iniciativas finalistas son el Data Management Summit, evento que impulsa el conocimiento del dato, la Federación Española de Municipios y Provincias, por la ordenanza tipo del Gobierno del dato en las entidades municipales y el Instituto Geográfico de Aragón por ICEARAGON, con el proyecto de conocimiento espacial de la región.
Tras la entrega de premios, intervendrán Conchita Cornejo, Coordinadora del área de la Secretaría General de Inspección y control de Movimientos de Capitales, y Emilio López, director del Centro Nacional de Información Geográfica.
Puedes consultar el programa completo aquí.
¿Cómo puedo inscribirme?
La asistencia es presencial con aforo limitado y las inscripciones pueden realizarse en la web de ASEDIE.
El concepto de datos de alto valor (High-Value datasets) fue introducido por el Parlamento Europeo y el Consejo de la Unión Europea hace 4 años, en la Directiva (UE) 2019/1024. En ella se definían como una serie de conjuntos de datos con un gran potencial para generar “beneficios para la sociedad, el medio ambiente y la economía”. Por ello, los estados miembro debían impulsar su apertura de manera gratuita, en formatos legibles por máquinas, a través de APIs, en forma de descarga masiva y descritos de forma exhaustiva mediante metadatos.
De manera inicial, la directiva proponía en su anexo seis categorías temáticas a considerar como de alto valor: datos geoespaciales, observación de la tierra y medioambientales, meteorológicos, estadísticos, registros empresariales y datos sobre redes de transporte. Estas categorías fueron detalladas posteriormente en un reglamento de ejecución publicado en diciembre de 2022. Además, para facilitar su apertura, en junio de 2023 se editó un documento con pautas sobre cómo usar DCAT-AP para su publicación.
Nuevas categorías de datos a considerar de alto valor
Estas categorías iniciales siempre estuvieron abiertas a su ampliación. En este sentido, la Comisión Europea acaba de publicar el informe “Identification of data themes for the extensions of public sector High-Value Datasets” donde se incluyen siete nuevas categorías que se estudia considerar como datos de alto valor
-
Pérdida climática: Hace referencia a los datos relacionados con los enfoques y acciones necesarios para evitar, minimizar y abordar los daños asociados al cambio climático. Ejemplos de conjuntos de datos de esta categoría son las pérdidas económicas y no económicas derivadas de los fenómenos meteorológicos extremos o los cambios de evolución lenta, como el aumento del nivel del mar o la desertificación. También incluye datos relacionados con los sistemas de alerta temprana ante desastres naturales, la repercusión de las medidas de mitigación o datos de investigación sobre la atribución de fenómenos extremos al cambio climático.
-
Energía: Esta categoría incluye estadísticas completas sobre la producción, transporte, comercio y consumo final de fuentes de energía primarias y secundarias, tanto renovables como no renovables. Algunos ejemplos de conjuntos de datos a considerar son los indicadores de precios y consumo o la información sobre seguridad energética.
-
Finanzas: Se trata de información sobre la situación de las empresas privadas y las administraciones públicas, que puede utilizarse para evaluar el rendimiento empresarial o la sostenibilidad económica, así como para definir estrategias de gasto e inversión. Incluye conjuntos de datos sobre registros de empresas, estados financieros, fusiones y adquisiciones, así como informes financieros anuales.
-
Gobierno y administración pública: Esta temática incluye aquellos datos que los servicios y empresas públicas recopilan para informar y mejorar la acción de gobierno y la administración de una unidad territorial específica, ya sea un estado, una región o un municipio. Incluye datos relativos al gobierno (por ejemplo, actas de reuniones), los ciudadanos (censos o registro en los servicios públicos) y las infraestructuras gubernamentales. Estos datos se reutilizan posteriormente para fundamentar la elaboración de políticas, prestar servicios públicos, optimizar los recursos y la asignación presupuestaria, así como proporcionar información procesable y transparente a ciudadanos y empresas.
-
Salud: Este concepto identifica los conjuntos de datos que cubren el bienestar físico, y mental de la población, haciendo referencia tanto a aspectos objetivos como subjetivos de la salud de las personas. También incluye indicadores clave sobre el funcionamiento de los sistemas de asistencia sanitaria y la seguridad en el trabajo. Algunos ejemplos son los datos relativos a la Covid-19, la equidad sanitaria o el listado de servicios prestados por los centros sanitarios.
-
Justicia y asuntos jurídicos: Identifica conjuntos de datos que permiten reforzar la capacidad de respuesta, la rendición de cuentas y la interoperabilidad de los sistemas judiciales de la UE, cubriendo ámbitos como la aplicación de la justicia, el sistema jurídico o la seguridad pública, es decir, aquella que garantiza la protección de los ciudadanos. Los conjuntos de datos sobre justicia y asuntos jurídicos incluyen documentación de jurisprudencia nacional o internacional, decisiones de tribunales y fiscales generales, así como actos jurídicos y su contenido.
-
Datos lingüísticos: Hace referencia a expresiones escritas u orales que están en la base de la inteligencia artificial, el procesamiento del lenguaje natural y el desarrollo de servicios relacionados. La Comisión ofrece una definición bastante amplia de esta categoría de datos, todos ellos agrupados bajo la denominación de "datos lingüísticos multimodales". Pueden incluir repositorios de colecciones de textos, corpus de lenguas habladas, recursos de audio, o grabaciones de vídeo.

Para realizar esta selección, los autores del informe llevaron a cabo una investigación documental, así como consultas a administraciones públicas, expertos en datos y empresas privadas mediante una serie de talleres y encuestas. Además de esta evaluación, el equipo del estudio cartografió y analizó el ecosistema normativo en torno a cada categoría, así como las iniciativas políticas relacionadas con su armonización y puesta en común, especialmente en relación con la creación de Espacios Comunes Europeos de Datos.
Potencial para las PYMEs y las plataformas digitales
Además de definir estas categorías, el estudio también ofrece una estimación de alto nivel sobre el impacto de las nuevas categorías en las pequeñas y medianas empresas, así como en las grandes plataformas digitales. Una de las conclusiones del estudio es que la relación coste-beneficio de la apertura de datos es similar en todos los nuevos temas, destacando especialmente aquellos relativos a las categorías "Finanzas" y "Gobierno y administración pública".
Basándose en los conjuntos de datos disponibles públicamente, también se realizó una estimación del grado de madurez actual de los datos pertenecientes a las nuevas categorías, según su cobertura territorial y su grado de apertura (teniendo en cuenta si estaban abiertos en formatos leíbles por máquinas, con metadatos adecuados, etc.). Para maximizar la relación coste-beneficio global, el estudio sugiere seleccionar para cada categoría temática una aproximación distinta: en base a su nivel de madurez, se recomienda indicar un mayor o menor número de criterios obligatorios para su publicación, asegurándose así el evitar solapamientos entre los nuevos temas y con los datos de alto valor ya existentes.
Puedes leer el estudio completo en este enlace.
Desde el pasado 24 de septiembre el Reglamento (UE) 2022/868 del Parlamento Europeo y del Consejo, de 30 de mayo de 2022, relativo a la gobernanza europea de datos (Reglamento de Gobernanza de Datos) resulta de aplicación en toda la Unión Europea. Al tratarse de un Reglamento, sus previsiones son directamente eficaces sin necesidad de una normativa estatal de transposición, como sucede por el contrario en el caso de las directivas. Sin embargo, por lo que se refiere a la aplicación de su regulación a las Administraciones Públicas, el legislador español ha considerado oportuno realizar algunas modificaciones en la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del Sector Público. En concreto:
- Se ha incorporado un régimen sancionador específico en el ámbito de la Administración General del Estado para los supuestos de incumplimiento de sus previsiones por parte de los reutilizadores, tal y como se explicará en detalle más adelante;
- Se han establecido criterios específicos sobre el cálculo de las tasas que pueden cobrar las Administraciones Públicas y entidades del sector público que no tengan carácter industrial o mercantil;
- Y, finalmente, se ha fijado algunas singularidades con relación al procedimiento administrativo para solicitar la reutilización, en particular se establece un plazo máximo de dos meses para notificar la correspondiente resolución –que se podrá ampliar hasta un máximo de treinta días debido a la extensión o complejidad de la solicitud–, transcurrido el cual se entenderá desestimada la petición.
¿Cuál es el ámbito de aplicación de esta nueva regulación?
Al igual que sucede con la Directiva (UE) 2019/1024 del Parlamento Europeo y del Consejo, de 20 de junio de 2019, relativa a los datos abiertos y la reutilización de la información del sector público, este Reglamento se aplica a los datos que se generen con ocasión de la “misión de servicio público” con el fin de facilitar su reutilización. Sin embargo, aquella no contemplaba la reutilización de aquellos datos protegidos por la concurrencia de ciertos bienes jurídicos, como es el caso de la confidencialidad, los secretos comerciales, la propiedad intelectual o, singularmente, la protección de los datos de carácter personal.
Puedes ver un resumen del reglamento en esta infografía.
Precisamente, uno de los principales objetivos del Reglamento consiste en facilitar la reutilización de este tipo de datos en manos de las Administraciones y otras entidades del sector público con fines de investigación, innovación y estadísticos, contemplando unas garantías reforzadas para ello. Se trata, por tanto, de establecer las condiciones jurídicas que permitan el acceso a los datos y su uso posterior sin que, por ello, se vean afectados otros derechos y bienes jurídicos de terceros. En consecuencia, el Reglamento no establece nuevas obligaciones para que los organismos públicos permitan el acceso a la información y su posterior reutilización, competencia que sigue reservada para los Estados miembros. Simplemente se incorporan una serie de mecanismos novedosos que tienen por finalidad hacer compatibles, en la medida de lo posible, el acceso a la información con el respeto a las exigencias de confidencialidad antes aludidas. De hecho, se advierte expresamente que, en caso de conflicto con el Reglamento (UE) 2016/679 relativo a la protección de las personas físicas en lo que respecta al tratamiento de datos personales y a la libre circulación de estos datos (RGPD), en todo caso habrá de prevalecer este último.
Al margen de la regulación referida al sector público, –a la que nos referiremos más adelante–, el Reglamento incorpora previsiones específicas para cierto tipo de servicios que, si bien podrían prestar también las entidades públicas en algún caso, normalmente serán asumidos por sujetos privados. En concreto, se regulan los servicios de intermediación y la cesión altruista de datos, estableciendo un régimen jurídico específico para ambos supuestos. El Ministerio de Asuntos Económicos y Transformación Digital será el encargado en España de supervisar este proceso
Por lo que se refiere, en concreto, a la incidencia del Reglamento en el sector público, sus previsiones no resultan aplicables a las empresas públicas –esto es, aquellas en las que exista una influencia dominante de un organismo del sector público–, a las actividades de radiodifusión ni, entre otros supuestos, a los centros culturales y de enseñanza. Tampoco a los datos que, aun siendo generados en ejecución de una misión de servicio público, se encuentren protegidos por motivos de seguridad pública, defensa o seguridad nacional.
¿En qué condiciones se puede reutilizar la información?
Con carácter general, las condiciones en que se autorice la reutilización han de preservar la naturaleza protegida de la información. Por esta razón, como regla general, el acceso tendrá lugar a datos anonimizados o, en su caso, agregados, modificados o sometidos a un tratamiento previo que permita cumplir con dicha exigencia. A este respecto, se autoriza a los organismos públicos para que cobren tasas que, entre otros criterios, habrán de calculase en función de los costes necesarios para la anonimización de los datos personales o la adaptación de los sometidos a confidencialidad.
Asimismo, se contempla expresamente que el acceso y la reutilización tengan lugar en un entorno seguro controlado por la propia entidad pública, ya sea un entorno físico o virtual. De esta manera, se puede realizar una supervisión directa que podría consistir, no sólo en verificar la actividad del reutilizador, sino incluso, en prohibir los resultados de aquellos tratamientos que pongan en peligro los derechos e intereses de terceros cuya integridad debe garantizarse. Precisamente, el coste por el mantenimiento de estos espacios se incluye entre los criterios que se pueden tener en cuenta a la hora de calcular la correspondiente tasa que puede cobrar el organismo público.
Cuando se trate de datos de carácter personal, el Reglamento no añade una nueva base jurídica que legitime su reutilización distinta de las que ya establece la normativa general en dicha materia. Por ello, se insta a los organismos públicos a que, en este tipo de supuestos, presten asistencia a los reutilizadores para ayudarles a obtener el permiso de los interesados. Ahora bien, se trata de una medida de apoyo que en ningún caso puede suponer cargas desproporcionadas para los organismos. A este respecto, la posibilidad de reutilizar datos seudonimizados debe encontrar amparo en algunos de los supuestos que contempla el RGPD. Asimismo, como garantía adicional, la finalidad para la que se pretendan reutilizar los datos habrá de ser compatible con la que inicialmente justificara el tratamiento de los datos por parte de la entidad pública en el ejercicio de su actividad principal, debiendo adoptarse las garantías adecuadas.
Un ejemplo práctico de gran interés es el relativo a la reutilización de datos de salud con fines de investigación biomédica que ha establecido el legislador español al amparo de lo previsto en este último precepto. En concreto, la disposición adicional 17ª de la Ley Orgánica 3/2018, de 5 de diciembre, de Protección de Datos de Carácter Personal y Garantía de los Derechos Digitales, admite la reutilización de datos seudonimizados en este ámbito cuando se establezcan ciertas garantías específicas, que podrían reforzarse con el uso de los referidos entornos seguros en el caso de que se empleen tecnologías especialmente incisivas, como podría ser la inteligencia artificial. Todo ello sin perjuicio de cumplir, asimismo, con otras obligaciones que deban tenerse en cuenta en función de las condiciones del tratamiento de los datos, singularmente la realización de evaluaciones de impacto.
¿Qué instrumentos se prevén para garantizar la efectividad de su aplicación?
Desde una perspectiva organizativa, los Estados han de garantizar que la información se encuentre fácilmente accesible a través de un punto único. En el caso de España, este punto se encuentra habilitado a través de la plataforma datos.gob.es, si bien pueden existir también otros puntos de acceso para sectores concretos y diferentes niveles territoriales, en cuyo caso deberán estar vinculados. Los reutilizadores podrán dirigirse a dicho punto para formular consultas y solicitudes, que se remitirán a la entidad o al órgano competente para su tramitación y respuesta.
Asimismo, se han de designar y notificar a la Comisión Europea una o varias entidades especializadas que cuenten con los medios técnicos y personales adecuados, que podrían ser algunas de las ya existentes, que desarrollan la función de prestar asistencia a los organismos públicos a la hora de conceder o denegar la reutilización. No obstante, si lo previera la regulación europea o de los Estados, dichos organismos podrían asumir funciones decisorias y no únicamente de mera asistencia. En todo caso, se prevé que sean las Administraciones y, en su caso, las entidades del sector público institucional ‑‑según la terminología del artículo 2 de la Ley 27/2007‑‑ quienes realicen esta designación y la comuniquen al Ministerio de Asuntos Económicos y Transformación Digital, que por su parte se encargará de la correspondiente notificación a nivel europeo.
Finalmente, como se indicaba al principio, se han tipificado como infracciones específicas para el ámbito de la Administración General del Estado algunas conductas de los reutilizadores que se sancionan con multas que van desde los 10.001 a los 100.000 euros. En concreto, se trata de conductas que, de forma deliberada o por negligencia, supongan el incumplimiento de las principales garantías que contempla la normativa europea: en concreto, el incumplimiento de las condiciones de acceso a los datos o a los espacios seguros, la reidentificación o la falta de comunicación de problemas de seguridad.
En definitiva, como señalaba la Estrategia Europea de Datos, si la Unión Europea quiere desempeñar un papel de liderazgo en la economía de los datos resulta imprescindible, entre otras medidas, mejorar las estructuras de gobernanza e incrementar los repositorios de datos de calidad que, con frecuencia, se encuentran afectados por relevantes obstáculos jurídicos. Con el Reglamento de Gobernanza de Datos se ha dado un paso importante a nivel regulatorio, pero ahora resta por comprobar si los organismos públicos son capaces de asumir una posición proactiva para facilitar la puesta en marcha de sus medidas que, en última instancia, implica importantes desafíos en la transformación digital de su gestión documental.
Contenido elaborado por Julián Valero, catedrático de la Universidad de Murcia y Coordinador del Grupo de Investigación “Innovación, Derecho y Tecnología” (iDerTec).
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El 8 de septiembre se celebró el webinar “Geospatial trends 2023: Opportunities for data.europa.eu”, organizado por la Data Europa Academy y centrado en las tendencias emergentes en el ámbto geoespacial. En concreto, la conferencia online abordó el concepto de GeoAI (Inteligencia Artificial Geoespacial), que consiste en la aplicación de inteligencia artificial (IA) combinada con datos geoespaciales.
A continuación, analizaremos cuáles han sido los desarrollos tecnológicos más punteros de 2023 en este ámbito, tomando como base el conocimiento aportado por los expertos participantes en dicho webinar.
¿Qué es el GeoAI?
El término GeoAI hace referencia, tal y como define Kyoung-Sook Kim, copresidente del Grupo de Trabajo de GeoAI del Open Geospatial Consortium (OGC), a: “un conjunto de métodos o entidades automatizadas que utilizan datos geoespaciales para percibir, construir (automatizar) y optimizar espacios en los que los humanos, así como todo lo demás, pueden continuar de manera segura y eficiente sus actividades geográficamente referenciadas\".
El GeoAI nos permite crear enormes oportunidades que hasta el momento no habían sido posibles como:
- Extraer datos geoespaciales enriquecidos con aprendizaje profundo: Permite automatizar la extracción, la clasificación y la detección de información de datos como imágenes, vídeos, nubes de puntos y texto.
- Realizar análisis predictivos con aprendizaje automático: Habilita la creación de modelos de predicción más precisos, detección de patrones y automatización de algoritmos espaciales.
- Mejorar la calidad, la uniformidad y la precisión de los datos: Simplifica los flujos de generación manual de datos mediante la automatización para mejorar la eficiencia y reducir los costes.
- Acelerar el tiempo de obtención de conocimiento de la situación: Ayuda a responder más rápidamente a las necesidades medioambientales y tomar decisiones más proactivas basadas en datos en tiempo real.
- Incorporar la inteligencia de ubicación en la toma de decisiones: Ofrece nuevas posibilidades en la toma de decisiones basadas en datos del estado actual de la zona que necesitamos gobernar o planificar.
Aunque esta tecnología ha cobrado protagonismo a lo largo del año 2023, ya se hablaba de ella en el informe sobre tendencias geoespaciales de 2022, donde se indicaba que la incorporación de inteligencia artificial a los datos espaciales supone una gran oportunidad en el mundo de los datos abiertos y en el sector geoespacial.
Casos de uso de GeoIA
El potencial de esta tecnología emergente quedó de manifiesto durante la conferencia Geospatial trends 2023. La sesión fue moderada por Inmaculada Farfan Velasco, quien trabaja como project manager en la Oficina de Publicaciones de la Unión Europea y está involucrada en la iniciativa de datos de la UE.
Durante el webinar, las empresas del sector GIS Con terra y 52ºNorth compartieron varios ejemplos prácticos para responder a la pregunta ¿Cuáles son las tendencias actuales en materia de datos geoespaciales? Todos los casos de usos presentados a tal fin tienen algo en común: el uso de GeoAI.
Los ejemplos presentados por parte de Con terra fueron:
- KINoPro: Un proyecto de investigación que utiliza GeoAI para predecir la actividad de la polilla \"black arches\" y su impacto en los abetos de los bosques alemanes. Se analiza una amplia gama de datos, desde la temperatura hasta la humedad del suelo, para prever la aparición de estas plagas y tomar medidas preventivas.
- Anomalía en la detección de torres de telefonía: Usa una red neuronal para la detección de las causas de las anomalías que se detectan en algunas torres y que puede arrojar una errónea localización en la posición de una llamada, dato crucial en las llamadas de emergencias para localizar la zona afectada.
- Análisis automatizado de áreas de construcción: Pretende detectar áreas de edificaciones destinadas a zonas industriales a partir del uso de datos de OpenData e imágenes satelitales. Para ello realiza dos modelos: uno de los cambios en el territorio y otro que predice si estos cambios se deben al uso de las edificaciones (uso industrial o comercial).
Por su parte, 52ºNorth presentó los siguientes casos de usos:
- MariData: Busca reducir las emisiones del transporte marítimo optimizando las operaciones de los barcos de carga. Utiliza GeoAI para calcular rutas óptimas, considerando factores como la posición del barco, los datos ambientales y las regulaciones de tráfico marítimo.
- KI:STE: Aplica tecnologías de inteligencia artificial en ciencias ambientales para obtener valor con un enfoque en la infraestructura y la gestión de datos. El proyecto KI:STE se centra en la interoperabilidad de datos, la ejecución de modelos en entornos diversos y la elaboración de distintos proyectos como son los siguientes:
- Vida silvestre: conceptos sensibles para la vida silvestre que clasifica las imágenes de Sentinel-2 en áreas (no) protegidas
- Emisiones biogénicas: métodos no supervisados para estimar las emisiones biogénicas a partir de la observación de la Tierra.
- Predicción de peligros: flujo de trabajo de mapeo de peligros que incorpora tanto modelos basados en la física como algoritmos de aprendizaje automático basados en fuentes de datos heterogéneas.
- Extremos hidrometeorológicos: métodos Al para fusionar modelos y reanálisis/observación para la cuantificación de extremos hidrometeorológicos .
- Variabilidad de las nubes: aprendizaje auto supervisado sobre datos de Meteosat.

Estos proyectos resaltan la importancia del GeoAI en diversas aplicaciones, desde la predicción de eventos ambientales hasta la optimización de rutas de transporte marítimo. Todos ellos ponen de manifiesto que esta tecnología se presenta como una herramienta crucial para abordar problemas complejos en la comunidad geoespacial.
GeoAI no sólo representa una gran oportunidad para el sector espacial, sino que pondrá a prueba la importancia de disponer de datos abiertos que cumplan los principios FAIR. Estos principios (Encontrable, Accessible, Interoperable, Reusable) son fundamentales para los proyectos GeoAI, ya que garantizan un acceso a la información de manera transparente, eficiente y ética. Al adherirse a los principios FAIR, los conjuntos de datos se vuelven más accesibles para los investigadores y desarrolladores, alimentando la colaboración y la mejora constante de los modelos. Además, la transparencia y la capacidad de reutilizar datos abiertos contribuyen a generar confianza en los resultados obtenidos mediante proyectos de GeoAI.
Referencias
| Video de la conferencia | https://www.youtube.com/watch?v=YYiMQOQpk8A |
El Instituto Canario de Estadística (ISTAC) ha dado un paso significativo en volumen de datos geográficos gracias a la publicación de un total de 4.002 nuevos conjuntos de datos (3.859 mapas temáticos y 143 cubos estadísticos) en datos.gob.es , tras su federación en Canarias Datos Abiertos.
Este tipo de iniciativas están alineadas con la Estrategia de datos de la Unión Europea que establece las pautas para lograr un mercado único de datos que beneficie a las empresas, investigadores y administraciones públicas. La automatización de procesos de publicación mediante estándares comunes es clave para garantizar la interoperabilidad y el acceso adecuado a los conjuntos de datos abiertos de las AA.PP.
La generación de estos conjuntos de datos es la culminación de un trabajo de automatización que ha permitido la ampliación del número de cubos publicados, ya que ahora se presentan combinaciones de granularidad y año desde 2004. A principios de octubre, el ISTAC añadió a su catálogo más de 500 activos semánticos y más de 2100 cubos estadísticos, tal y como contamos en este post de datos.gob.es.
Además, los conjuntos publicados hasta la fecha se han sometido a un proceso de renovación para convertirse en los citados 143 cubos estadísticos. El incremento de estos conjuntos de datos mejora no solo cuantitivamente el directorio de datos.canarias.es y datos.gob.es, sino que amplía los usos que ofrece gracias al tipo de información añadida.
Los indicadores de estos cubos se representan sobre la cartografía a través de mapas de coropletas y en múltiples formatos. Esta automatización permitirá a su vez, no solo publicar otros conjuntos de datos de manera más sencilla en el futuro, sino que también se pueda hacer con más frecuencia.
Otro de los avances de este trabajo es que los servicios se generan al vuelo desde el servidor de mapas Geoserver, y no a través de una carga en CKAN, como se hacía hasta ahora, lo cual reduce su almacenamiento y agiliza su actualización.
Cómo acercar los indicadores demográficos a la población
Los indicadores demográficos son cubos densos en datos que ofrecen una gran cantidad de información geográfica detallada, incluyendo población total, desagregada por sexo, residencia, edad y otros índices hasta sumar 27 variables diferentes.
Al haber contenida tanta información en cada cubo, se puede dificultar la representación de los indicadores específicos sobre la cartografía, especialmente si el usuario no está habituado a trabajar con determinados softwares GIS (sistema de información geográfica, por sus siglas en inglés Geographical Information System ).
Para acercar este contenido a todo tipo de usuarios, el ISTAC ha generado 3.859 nuevos mapas, representando sobre un mapa de coropletas cada uno de los indicadores contenidos en los 143 cubos estadísticos. La publicación de estos nuevos datos cartográficos se presenta así como una forma más eficiente y simplificada de obtener la información ya representada, permitiendo a los usuarios acceder fácilmente a los datos específicos que necesitan.
Podríamos comparar esta transformación con las flores. Anteriormente solo se publicaban ramos enteros , con 27 flores por ramo, que había que saber gestionar y manejar para representar las flores que fueran de interés. Ahora, además de seguir publicando los ramos, se han generado nuevos procesos para poder publicar cada flor por separado, automatizando la generación de cada uno de estos conjuntos, que también se actualizarán con mayor frecuencia.
Esta nueva opción facilita la utilización de estos mapas de coropletas (como el que vemos en la imagen) por parte de personas sin conocimientos técnicos GIS, ya que se presentan en formatos fácilmente descargables como imagen (.jpg y .png) para un uso profesional, educativo o personal.

Mapa de población de 65 o más años (% sobre total) por municipios. Año 2022
Para los usuarios más avanzados, el ISTAC también ha ampliado la oferta de formatos en los que se sirven los cubos de indicadores originales. Los “ramos”, que anteriormente solo mostraban los datos en formato CSV, ahora cuentan con una amplia variedad de distribuciones: KML, GML, GeoPackage, GeoJSON, WFS, WMS. Aprovechando las ventajas que proporciona el uso de los estilos en el formato WMS, se han generado todos los estilos asociados a los indicadores, de manera que, haciendo uso de ellos, se consigue representar el mismo mapa que se descarga en formato imagen. Estos estilos están calculados para cada combinación de indicador-granularidad-año, según el método de cálculo de cuantiles para cinco intervalos.
Este nuevo enfoque con datos geográficos, tanto simples como complejos, enriquece el catálogo y permite que usuarios sin conocimientos específicos puedan acceder a ellos y reutilizarlos. Además, hay que tener en cuenta que esto abre las puertas a otras publicaciones masivas de datos basados en otras operaciones estadísticas.
En definitiva, se trata de un paso importante en el proceso de apertura de datos. Un proceso que permite mejorar el uso y la compartición de datos, tanto para el usuario de pie, como para profesionales del sector. Dada la creciente necesidad de compartir, procesar y comparar datos, se hace indispensable la aplicación de procesos que faciliten la interoperabilidad y el acceso adecuado a los datos abiertos . En este sentido, el Instituto Canario de Estadística está concentrando esfuerzos para garantizar que sus conjuntos de datos abiertos sean accesibles y estén en los formatos adecuados para su compartición. Todo ello para lograr obtener valor a partir de ellos.
La participación activa de los jóvenes en la vida cívica y política es una de las claves para fortalecer la democracia en Europa. Analizar y comprender la voz de los jóvenes permite conocer sus actitudes y opiniones, algo que ayuda a prever las tendencias futuras de la sociedad con suficiente margen de maniobra para atender sus necesidades y preocupaciones hacia un futuro más próspero y cómodo para todos.
En la misión de obtener una perspectiva más clara sobre cómo éstos participan en Europa, los datos abiertos se han convertido en una herramienta valiosa . En este post, exploraremos cómo los jóvenes en Europa se involucran activamente en la sociedad y la política a través de datos abiertos relevantes de la Unión Europea (UE) publicados en el portal europeo de datos abiertos.
Compromiso de la juventud en las elecciones europeas
La Unión Europea tiene como uno de sus objetivos promover la participación activa de la población joven en la democracia y la sociedad. Su participación en elecciones y actividades cívicas enriquece la democracia europea. Los jóvenes aportan ideas y perspectivas diversas, algo que contribuye a la toma de decisiones y asegura que las políticas se adapten a sus necesidades y desafíos. Además, su participación contribuye a un sistema político que refleja los intereses de todos los ciudadanos, lo que, a su vez, fomenta una sociedad inclusiva y pacífica.
En las últimas elecciones al Parlamento Europeo, se logró la cifra de participación más alta en los últimos 20 años, con más del 50% de la población europea votando, tal y como corroboró la encuesta poselectoral del Eurobarómetro de la UE. Este aumento de la participación se debió en gran medida a un incremento en la participación de los jóvenes.
Los datos muestran que la generación más joven (menores de 25 años) aumentó su participación electoral en un 14% hasta alcanzar el 42%, mientras que la participación de las personas de 25 a 39 años incrementó en un 12% hasta llegar al 47%, en comparación entre las elecciones europeas de 2014 y las de 2019. Este crecimiento en la participación joven plantea una pregunta: ¿qué motivó que los jóvenes participasen más? Según la Encuesta Eurobarómetro sobre la Juventud de 2021, el sentido del deber como ciudadano (32%) y la voluntad de asumir responsabilidades para el futuro (32%) fueron los principales factores que motivaron a los jóvenes a votar en las elecciones europeas.

¿Por qué los jóvenes quieren participar en la UE?
Además de votar en las elecciones, existen otras formas en las que los jóvenes demuestran ser una parte activa de la ciudadanía. La Encuesta de Juventud 2021 revela datos interesantes sobre su interés en la política y la vida cívica.
En general, la política es un tema que les interesa. La mayoría de los participantes en la Encuesta de Juventud 2021 afirmaron discutir sobre política con amigos o familiares (85%). Además, muchos dijeron comprender cómo funciona el gobierno nacional de su país (58%). Sin embargo, la mayoría de los jóvenes sienten que tienen poca influencia en las decisiones, leyes y políticas importantes que los afectan. Los jóvenes sienten que tienen más voz en su gobierno local (47%), que en el gobierno nacional (40%) o en el nivel de la UE (30%).
El siguiente paso, tras comprender la política, es la acción. Los jóvenes creen que ciertas actividades políticas y cívicas son más efectivas que otras para hacer llegar su voz a los responsables de la toma de decisiones. Por orden, la votación en las elecciones (41%), la participación en protestas o manifestaciones callejeras (33%) y la participación en peticiones (30%) fueron consideradas las tres actividades más efectivas por los encuestados. Muchos jóvenes habían votado en sus últimas elecciones locales, nacionales o europeas (46%) y habían creado o firmado una petición (42%).
No obstante, la encuesta revela una interesante divergencia entre las percepciones de los jóvenes y sus acciones. En algunas ocasiones, la juventud se involucra en actividades a pesar de que no son las que considera más efectivas, como en el caso de las peticiones de firmas online. Por otro lado, no siempre participan en actividades que perciben que son eficaces, como las protestas callejeras o el contacto con políticos.

El impulso juvenil a la democracia europea
La juventud desea que los temas que considera prioritarios estén en la agenda política de las próximas elecciones europeas. Un Eurobarómetro especial más reciente sobre la democracia en acción en 2023 reveló que los jóvenes de entre 15 y 24 años son el grupo de edad más satisfecho con el funcionamiento de la democracia en la UE (61%, en comparación con la media de la UE del 54%).
El cambio climático es una preocupación particularmente destacada entre los jóvenes, ya que el 40% de los encuestados de 15 a 24 años considera esta cuestión como prioritaria, en comparación con el 31% de la población general de la UE.
Para fomentar la participación de los jóvenes en la agenda política europea, se han desarrollado iniciativas que utilizan datos abiertos para acercar la política a los ciudadanos. Ejemplos como TrackmyEU y Democracy Game buscan involucrar a los jóvenes en la política y permitirles acceder a información sobre las políticas de la UE y participar en debates y actividades cívicas.
En general, los datos abiertos proporcionan una visión valiosa sobre muchas realidades, por ejemplo, la que afecta a la juventud y su interacción en la sociedad y la política. Este análisis permite a los gobiernos y las administraciones públicas tomar decisiones informadas sobre cuestiones que afectan a este grupo social. Los jóvenes europeos están interesados en la política, participan activamente en elecciones y se involucran en organizaciones juveniles; se preocupan por cuestiones como la desigualdad y el cambio climático. Los datos abiertos también se utilizan en iniciativas que promueven la participación de los jóvenes en la vida política y cívica, lo que refuerza aún más la democracia europea.
En una sociedad cada día más digital y basada en datos, el acceso a los datos abiertos es básico para entender las preocupaciones e intereses de la juventud y su participación en la toma de decisión cívicas y políticas. Como una parte de una ciudadanía activa y comprometida, la juventud tiene un papel importante a desempeñar en el futuro de Europa, y los datos abiertos son una herramienta esencial para apoyar su participación.
Contenido elaborado a partir del post del portal europeo de datos abiertos Understanding youth engagement in Europe through open data
El Instituto de Estadística y Cartografía de Andalucía (IECA), en colaboración con la Agencia Andaluza de Cooperación Internacional para el Desarrollo (AACID), ha incorporado nuevos indicadores a nivel municipal en su Sistema de Indicadores de Desarrollo Sostenible de Andalucía para la Agenda 2030, en sus esfuerzos por integrar la información estadística y geográfica, mientras potencian la eficiencia de la administración pública andaluza y los servicios de información prestados a la sociedad.
Gracias a estos trabajos, Andalucía ha sido seleccionada como una de las regiones participantes en el proyecto europeo REGIONES 2030: Seguimiento de los ODS en las regiones de la UE. Llenar los vacíos de datos, junto con otras nueve regiones de la Unión Europea. Todas estas regiones comparten un fuerte compromiso en cuanto al análisis y el cumplimiento de los ODS, conscientes de la importancia de este trabajo en la toma de decisiones y en el desarrollo regional sostenible.
El proyecto REGIONES 2030, financiado por el Parlamento Europeo y desarrollado por el Centro Común de Investigación (Joint Research Centre - JRC) de la Comisión Europea, en colaboración con la Dirección General de las Regiones y EUROSTAT, tiene como objetivo llenar los vacíos de datos en el seguimiento de los ODS en las regiones de la UE.

Imagen 1: Proyecto REGIONES 2030. Seguimiento de los ODS en las regiones de la UE.
Regiones participantes en el proyecto
Fuente: Instituto de Estadística y Cartografía de Andalucía (IECA)
Los nuevos indicadores incorporados, fundamentales para la medición de los objetivos ODS
El Instituto de Estadística y Cartografía de Andalucía, en colaboración con la AACID (Agencia Andaluza de Cooperación Internacional para el Desarrollo), ha creado un conjunto de indicadores que permiten evaluar el avance de los Objetivos de Desarrollo Sostenible a nivel regional, disponibles en su web. Todos los nuevos indicadores a nivel municipal están identificados por la marca Joint Research Centre (municipal) para Andalucía, y abordan 9 de los 17 objetivos de desarrollo sostenible.
La metodología utilizada para la mayoría de los indicadores se basa en información georreferenciada del Instituto de Estadística y Cartografía de Andalucía, tomando como referencia las publicaciones sobre la Distribución Espacial de la Población en Andalucía y la Caracterización y Distribución del Espacio Construido en Andalucía.
Uno de los indicadores proporciona información sobre el Objetivo 1: Fin de la pobreza, y mide los riesgos de pobreza a través del porcentaje de personas que residen en una dirección donde ninguno de sus miembros está afiliado a la Seguridad Social. Este indicador revela comportamientos más desfavorables en municipios urbanos en comparación con los rurales, en línea con estudios anteriores que identifican las ciudades como centros con situaciones de pobreza más agudas que los entornos rurales.
De manera similar, el indicador de Superficie construida per cápita del Objetivo 11: Ciudades y comunidades sostenibles se ha calculado utilizando datos catastrales y procesos geoespaciales en sistemas de información geográfica.
Visualización y consulta de los nuevos indicadores municipales
El análisis de los nuevos indicadores permite obtener información a nivel municipal sobre el valor y la variación de los indicadores en comparación con el año anterior, tanto para el conjunto de Andalucía, como para diferentes grados de urbanización.

Imagen 2: Visualización de datos del indicador
Fuente: Instituto de Estadística y Cartografía de Andalucía (IECA)
Además, el filtro aplicado permite realizar un análisis de la evolución temporal y geográfica de los indicadores en cada uno de los ámbitos considerados, lo que proporciona una perspectiva temporal y territorial.

Imagen 3: Visualización de la evolución del indicador según ámbito
Fuente: Instituto de Estadística y Cartografía de Andalucía (IECA)
Estos resultados se presentan a través de un mapa interactivo a nivel municipal, que muestra la distribución del indicador en el territorio.

Imagen 4: Mapa interactivo del indicador
Fuente: Instituto de Estadística y Cartografía de Andalucía (IECA)
Los datos de los indicadores también están disponibles en formatos estructurados descargables (XLS, CSV y JSON). Además, se aporta información metodológica sobre los cálculos realizados para cada uno de los indicadores.
La incorporación de Andalucía al proyecto REGIONES 2030
Todos estos trabajos se han integrado junto al resto de indicadores del Sistema de Indicadores de Desarrollo Sostenible de Andalucía para la Agenda 2030, los cuales han sido calculados y publicados por el IECA hasta la fecha. Esta labor conjunta entre las diferentes regiones servirá para establecer una metodología y seleccionar los indicadores más relevantes a nivel regional en Europa (nivel NUTS2 europeo), con el objetivo de que en un futuro esta metodología pueda aplicarse a todas las regiones europeas.
El proyecto REGIONES 2030, tras la realización de los primeros trabajos en Andalucía, ha difundido sus resultados en el artículo "Monitoring the SDGs in Andalusia region, Spain", publicado por la Comisión Europea en julio de 2023, así como en el evento celebrado en la Fundación Tres Culturas del Mediterráneo el pasado 27 de septiembre bajo el nombre ‘SDG Localisation and monitoring framework for 2030 Agenda governance: milestones & challenges in Andalusia’. En este evento, cada región seleccionada presentó los resultados y discutió las necesidades, carencias o lecciones aprendidas en la generación de sus informes.
El proyecto REGIONES 2030 concluirá en diciembre de 2023 con la presentación y publicación de un informe final. Este informe consolidará los diez informes regionales generados durante el seguimiento de los Objetivos de Desarrollo Sostenible a nivel regional en Europa, contribuyendo a su óptimo seguimiento, como parte del correcto cumplimiento de la Agenda 2030.
Esta aplicación es una herramienta que presenta en tiempo real los costes de la electricidad en España para la Tarifa Regulada PVPC (Precio Voluntario al Pequeño Consumidor). El objetivo es que cualquier usuario pueda comprobar las horas con los costes más bajos de luz para así poder ahorrar en su factura de electricidad.
Se ofrecen diferentes gráficas del precio de la luz hora a hora, así como datos útiles para los usuarios obtenidos de la API abierta de ESIOS (Red Eléctrica de España). Todos estos gráficos y datos muestran información acerca de las fluctuaciones en el precio de la electricidad en España.
El usuario puede conocer fácilmente a qué hora es más barata la luz en cada momento y el precio exacto, así como una estimación de los precios del día siguiente a partir de las 20:30 de la tarde del día anterior.
Las fuentes de datos abiertos son:
-
Datos de Red Eléctrica: https://api.esios.ree.es/
El activismo de datos es una práctica ciudadana cada vez más significativa en la era de las plataformas por su creciente contribución a la democracia, la justicia social y los derechos. Se trata de un activismo que utiliza los datos y su análisis para generar evidencias y visualizaciones con el objetivo de revelar injusticias, mejorar la vida de las personas y fomentar el cambio social.
Frente al uso masivo de datos de vigilancia por parte de determinadas corporaciones, el activismo de datos es ejercido por la ciudadanía y organizaciones no gubernamentales. Por ejemplo, la organización Forensic Architecture (FA), un centro de Goldsmiths dependiente de la Universidad de Londres, investiga violaciones de derechos humanos, incluidas las violencias de Estado, usando datos públicos, ciudadanos y satelitales, y metodologías como la inteligencia de fuentes abiertas (conocida como OSINT). El análisis de datos y metadatos, la sincronización de vídeos tomados por testigos o periodistas, así como de grabaciones y documentos oficiales, permiten reconstruir los hechos y generar un relato alternativo acerca de eventos y crisis.
El activismo de datos ha suscitado el interés de centros de investigación y organizaciones no gubernamentales, generando una línea de trabajo dentro de la disciplina de los estudios críticos. Esto ha permitido reflexionar sobre el efecto de los datos, las plataformas y sus algoritmos en nuestras vidas, así como acerca del empoderamiento que se genera cuando la ciudadanía ejerce su derecho a los datos y los usa para el bien común.

Imagen 1: Ecocidio en Indonesia (2015)
Fuente: Forensic Architecture (https://forensic-architecture.org/investigation/ecocide-in-indonesia)
Centros de investigación como Datactive o Data + Feminism Lab han creado teoría y debates sobre la práctica del activismo de datos. Asimismo, organizaciones como Algorights –una red colaborativa que fomenta la participación de la sociedad civil en el campo de las tecnologías de IA- y AlgorithmWatch -organización de derechos humanos- generan conocimiento, redes y argumentos para luchar por un mundo donde los algoritmos y la Inteligencia Artificial (IA)contribuyan a la justicia, la democracia y la sostenibilidad, en vez de debilitarlas.
Este artículo revisa cómo surgió el activismo de datos, qué interés ha suscitado en la ciencia social y su relevancia en la era de las plataformas.
Historia de una práctica
La producción de mapas usando datos ciudadanos podría ser de las primeras manifestaciones del activismo de datos tal y como se conoce ahora. Un mapa fundamental en la historia del activismo de datos fue el generado por víctimas y activistas con datos sobre el terremoto de Haití en 2010, sobre la plataforma keniata Ushahidi (“testimonio”, en Suajili). Una comunidad de humanitaristas digitales creó el mapa desde otros países y convocó a las víctimas y a sus familiares y conocidos para que compartieran datos de lo que estaba ocurriendo en tiempo real. En cuestión de pocas horas, los datos se verificaron y se visualizaron en un mapa interactivo que continuó actualizándose con más datos, y que fue decisivo a la hora de asistir a las víctimas en el terreno. Hoy en día se generan mapas de este tipo cada vez que surge una crisis, y se enriquecen con datos ciudadanos, satelitales y generados por drones dotados de cámaras para esclarecer hechos y generar evidencias.
Emergiendo de movimientos conocidos como cypherpunk y el tecnopositivismo o tecnoptimismo (basado en la confianza en que la tecnología es la respuesta a los retos de la humanidad), el activismo de datos ha ido evolucionando como práctica para adoptar posturas más críticas frente a la tecnología y a las asimetrías de poder que surgen entre quienes originan y ceden sus datos, y quienes los captan y analizan.
Hoy día, por ejemplo, la plataforma de producción de mapas comunitarios Ushahidi se ha empleado para crear datos sobre la violencia machista en Egipto y en Siria, y sobre ginecólogos confiables en India, por ejemplo. Actualmente, la invisibilización y el silenciamiento de las mujeres es la razón por la cual algunas organizaciones luchan por el reconocimiento y una política de visibilidad, algo que se hizo evidente con el movimiento #MeToo (#Cuéntalo en español). Las prácticas de datos feministas buscan visibilidad e interpretaciones críticas de la datificación (o la transformación de toda acción humana y no humana en datos mesurables y transformables en valor). Por ejemplo, Datos Contra el Feminicidio o Feminicidio.net ofrecen mapas y análisis de datos sobre el feminicidio en varios lugares del mundo.
El potencial para el empoderamiento algorítmico que ofrecen estos proyectos elimina las barreras a la igualdad, mejorando las condiciones que permiten a las mujeres resolver problemas, determinar cómo se recaban y se usan los datos y ejercer el poder.
Nacimiento y evolución de un concepto
En 2015 se publicó Los medios ciudadanos se encuentran con los grandes datos: el surgimiento del activismo de datos, en el que, por primera vez, se acuñaba y definía el activismo de datos como un concepto basado en prácticas observadas en activistas que se involucran políticamente con la infraestructura de datos. La infraestructura de datos incluye los datos, el software, el hardware y los procesos necesarios para convertir los datos en valor. Más adelante, Data activism and social change (London, Palgrave) y Activismo de datos y cambio social. Alianzas, mapas, plataformas y acción para un mundo mejor (Madrid: Dykinson) desarrollan marcos analíticos basados en casos reales que ofrecen formas de analizar otros casos.
Acompañando las variadas prácticas que existen dentro de activismo de datos, su estudio está creando espacios para la investigación feminista y postcolonialista sobre las consecuencias de la datificación. Mientras que los cronistas de la historia (principalmente fuentes masculinas) definieron la tecnología en relación con el valor sus productos, los estudios de datos feministas consideran a las mujeres como usuarias y diseñadoras de sistemas algorítmicos y buscan utilizar los datos para la igualdad, y alejarse de la explotación capitalista y sus estructuras de dominación.
El activismo de datos es hoy un concepto establecido en la ciencia social. Por ejemplo, Google Scholar ofrece más de 2.000 resultados sobre “data activism”. Varios investigadores e investigadoras lo emplean como perspectiva para analizar diversos asuntos. Por ejemplo, Rajão y Jarke exploran el activismo ambiental en Brasil; Gezgin estudia la ciudadanía crítica y el uso que hace esta de la infraestructura de datos; Lehtiniemi y Haapoja explora la agencia de datos y la participación ciudadana; y Scott examina la necesidad de los usuarios y usuarias de plataformas de desarrollar una vigilancia digital y cuidar de sus datos personales.
En el centro de estas preocupaciones se encuentra el concepto de agencia de datos, que se refiere a que las personas no sólo son conscientes del valor de sus datos, sino que también ejercen control sobre ellos, determinando cómo se usan y comparten. Se podría definir como acciones y prácticas relacionadas con la infraestructura de datos basadas en la reflexión y el interés individual y colectivo. Es decir, mientras darle un like a un post no se consideraría una acción con un alto grado de agencia de datos, participar en un hackaton –un evento colectivo en el que se mejora un programa informático o se crea— sí lo sería. La agencia de datos se basa en la alfabetización en datos, o el grado de conocimientos, acceso a los datos y a sus herramientas, y a las oportunidades para ejercerla que tienen las personas. El activismo de datos no es posible sin agencia de datos.
En el panorama en rápida evolución de la economía de plataformas, la convergencia del activismo de datos, los derechos digitales y la agencia de datos se ha vuelto crucial. El activismo de datos, impulsado por una creciente conciencia del posible uso indebido de los datos personales, alienta a individuos y colectivos a utilizar la tecnología digital para el cambio social, así como a abogar por una mayor transparencia y responsabilidad por parte de las gigantes tecnológicas. Dado que cada vez más la generación de datos y el uso de algoritmos determinan nuestras vidas en áreas como la educación, el empleo, los servicios sociales y la salud, el activismo de datos emerge como una necesidad y un derecho, más que como una opción.
____________________________________________________________________________
Contenido elaborado por Miren Gutiérrez, Doctora e investigadora en la Universidad de Deusto, experta en activismo de datos, justicia de datos, alfabetización de datos y desinformación de género.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor
En la era de los datos, nos enfrentamos al desafío de la escasez de datos de valor para la construcción de nuevos productos y servicios digitales. Aunque vivimos en una época en la que los datos están por todas partes, a menudo nos encontramos con dificultades para acceder a datos de calidad que nos permitan comprender procesos o sistemas desde una perspectiva basada en datos. La falta de disponibilidad, la fragmentación, la seguridad y la privacidad son solo algunas de las razones que dificultan el acceso a datos reales.
Sin embargo, los datos sintéticos han surgido como una solución prometedora a este problema. Los datos sintéticos son información fabricada artificialmente que imita las características y distribuciones de los datos reales, sin contener información personal o sensible. Estos datos se generan mediante algoritmos y técnicas que preservan la estructura y las propiedades estadísticas de los datos originales.
Los datos sintéticos son útiles en diversas situaciones donde la disponibilidad de datos reales es limitada o se requiere proteger la privacidad de las personas involucradas. Tienen aplicaciones en la investigación científica, pruebas de software y sistemas, y entrenamiento de modelos de inteligencia artificial. Permiten a los investigadores explorar nuevos enfoques sin acceder a datos sensibles, a los desarrolladores probar aplicaciones sin exponer datos reales y a los expertos en IA entrenar modelos sin la necesidad de recopilar todos los datos del mundo real que en ocasiones son, simplemente, imposibles de capturar en tiempos y costes asumibles.
Existen diferentes métodos para generar datos sintéticos, como el remuestreo, el modelado probabilístico y generativo, y los métodos de perturbación y enmascaramiento. Cada método tiene sus ventajas y desafíos, pero en general, los datos sintéticos ofrecen una alternativa segura y confiable para el análisis, la experimentación y el entrenamiento de modelos de inteligencia artificial.
Es importante destacar que el uso de datos sintéticos ofrece una solución viable para superar las limitaciones de acceso a datos reales y abordar preocupaciones de privacidad y seguridad. Los datos sintéticos permiten realizar pruebas, entrenar algoritmos y desarrollar aplicaciones sin exponer información confidencial. Sin embargo, es fundamental garantizar la calidad y la fidelidad de los datos sintéticos mediante evaluaciones rigurosas y comparaciones con los datos reales.
En este informe, abordamos de forma introductoria la disciplina de los datos sintéticos, ilustrando algunos casos de uso de valor para los diferentes tipos de datos sintéticos que se pueden generar. Los vehículos autónomos, la secuenciación de ADN o los controles de calidad en las cadenas de producción son solo algunos de los casos que detallamos en este informe. Además, hemos destacado el uso del software open-source SDV (Synthetic Data Vault), desarrollado en el entorno académico del MIT, que utiliza algoritmos de aprendizaje automático para crear datos sintéticos tabulares que imitan las propiedades y distribuciones de los datos reales. Desarrollamos un ejemplo práctico, en un entorno de Google Colab para generar datos sintéticos sobre clientes ficticios alojados en un hotel ficticio. Hemos seguido un flujo de trabajo que involucra la preparación de datos reales y metadatos, el entrenamiento del sintetizador y la generación de datos sintéticos basados en los patrones aprendidos. Además, hemos aplicado técnicas de anonimización para proteger los datos sensibles y hemos evaluado la calidad de los datos sintéticos generados.
En resumen, los datos sintéticos son una herramienta poderosa en la era de los datos, ya que nos permiten superar la escasez y la falta de disponibilidad de datos de valor. Con su capacidad para imitar los datos reales sin comprometer la privacidad, los datos sintéticos tienen el potencial de transformar la forma en que desarrollamos proyectos de inteligencia artificial y análisis. A medida que avanzamos en esta nueva era, es probable que los datos sintéticos desempeñen un papel cada vez más importante en la generación de nuevos productos y servicios digitales.
Si quieres saber más sobre el contenido de este informe, puedes ver la entrevista a su autor.
En esta infografía se resume el concepto y sus principales aplicaciones:

Puedes descargarla en PDF aquí
A continuación, puedes descargar el informe completo, el resumen ejecutivo y una presentación-resumen.