Fecha publicación 29/09/2025
Fecha actualización 30/09/2025
Servidores con datos
Descripción

Los datos abiertos de fuentes públicas han evolucionado a lo largo de estos años, pasando de ser simples repositorios de información a constituir ecosistemas dinámicos que pueden transformar la gobernanza pública. En este contexto, la inteligencia artificial (IA) emerge como una tecnología catalizadora que se beneficia del valor de los datos abiertos y potencia exponencialmente su utilidad. En este post veremos cómo es la relación simbiótica de mutuo beneficio entre la IA y los datos abiertos.

Tradicionalmente, el debate sobre datos abiertos se ha centrado en los portales: las plataformas en las que gobiernos publican información para que la ciudadanía, las empresas y las organizaciones puedan acceder a ella. Pero la llamada “Tercera Ola de Datos Abiertos”, término acuñado por el GovLab de la Universidad de Nueva York, enfatiza que ya no basta con publicar datasets a demanda o por defecto. Lo importante es pensar en el ecosistema completo: el ciclo de vida de los datos, su explotación, mantenimiento y, sobre todo, el valor que generan en la sociedad.

¿Qué función pueden tener los datos abiertos aplicados a la IA?

En este contexto, la IA aparece como un catalizador capaz de automatizar tareas, enriquecer los datos abiertos gubernamentales (OGD), facilitar su comprensión y estimular la colaboración entre actores.

Una investigación reciente, desarrollada por universidades europeas, mapea cómo está sucediendo esta revolución silenciosa. El estudio propone una clasificación de los usos según en dos dimensiones:

  1. Perspectiva, que a su vez se divide en dos posibles vías:

    1. Inward-looking (portal): el foco está en las funciones internas de los portales de datos.

    2. Outward-looking (ecosistema): el foco se amplía a las interacciones con actores externos (ciudadanos, empresas, organizaciones).

  2. Fases del ciclo de vida del dato, las cuales podemos dividir en pre-procesamiento, exploración, transformación y mantenimiento.

En resumen, el informe identifica estos ocho tipos de uso de la IA en los datos abiertos gubernamentales, que se producen al cruzar las perspectivas y las fases en el ciclo de vida del dato.

Imagen de una tabla titulada “ocho usos de la IA para mejorar los datos abiertos gubernamentales". La tabla está dividida en dos grandes perspectivas: “Inward looking (perspectiva del portal)” y “Outward looking (perspectiva del ecosistema)”. Cada perspectiva contiene varias fases del ciclo de vida de los datos gubernamentales abiertos (OGD), con descripciones del papel de la inteligencia artificial (IA) en cada fase.  Perspectiva del portal:  Preprocesamiento – IA como depuradora (portal curator): Automatiza tareas como etiquetado, categorización y control de calidad, incluyendo anonimización de datos sensibles mediante modelos de riesgo de privacidad.  Exploración – IA como exploradora del portal (portal explorer): Mejora el acceso a los datos mediante interfaces de lenguaje natural y chatbots. Transformación – IA que referencia el portal (portal linker): Transforma y agrega datos OGD, por ejemplo, convirtiéndolos en datos vinculados mediante aprendizaje automático.  Mantenimiento – IA como supervisora del portal (portal monitor): Supervisa el cumplimiento de estándares, detecta anomalías y mejora la calidad de los metadatos.  Perspectiva del ecosistema:  Preprocesamiento – IA como recolectora de información en la web (ecosystem data retriever): Recupera datos externos, como textos legales, para enriquecer el ecosistema OGD.  Exploración – IA que referencia el portal (ecosystem connector): Conecta actores del ecosistema según sus intereses, recomendando conjuntos de datos relevantes.  Transformación – IA como desarrolladora de valor en el ecosistema (ecosystem value developer): Apoya el desarrollo de productos y servicios basados en OGD, como paneles de control inteligentes.  Mantenimiento – IA como dinamizadora del ecosistema (ecosystem engager): Fomenta la participación continua mediante predicción del uso del portal.

Figura 1. Ocho uso de la IA para mejorar los datos abiertos gubernamentales. Fuente: presentación "Data for AI or AI for data: artificial intelligence as a catalyser for open government ecosystems", basada en el informe del mismo nombre, de los EU Open Data Days 2025.

A continuación, se detalla cada uno de estos usos:

1. IA como depuradora (portal curator)

Esta aplicación se centra en el pre-procesamiento de datos dentro del portal. La IA ayuda a organizar, limpiar, anonimizar y etiquetar datasets antes de su publicación. Algunos ejemplos de tareas son:

  • Automatización y mejora de las tareas de publicación de datos.

  • Realización de funciones de etiquetado automático y categorización.

  • Anonimización de datos para proteger la privacidad.

  • Limpieza y filtrado automático de conjuntos de datos.

  • Extracción de características y manejo de datos faltantes.

2. IA como recolectora de datos del ecosistema (ecosystem data retriever)

También en la fase de pre-procesamiento, pero con un enfoque externo, la IA amplía la cobertura de los portales al identificar y recopilar información de fuentes diversas. Algunas tareas son:

  • Recuperar datos estructurados desde textos legales o normativos.

  • Minería de noticias para enriquecer datasets con información contextual.

  • Integración de datos urbanos procedentes de sensores o registros digitales.

  • Descubrimiento y enlace de fuentes heterogéneas.

  • Conversión de documentos complejos en información estructurada.

3. IA como exploradora del portal (portal explorer)

En la fase de exploración, los sistemas de IA también pueden facilitar la búsqueda e interacción con los datos publicados, con un enfoque más interno. Algunos casos de uso:

  • Desarrollar buscadores semánticos para localizar conjuntos de datos.

  • Implementar chatbots que guíen a los usuarios en la exploración de datos.

  • Proporcionar interfaces de lenguaje natural para consultas directas.

  • Optimizar los motores de búsqueda internos del portal.

  • Utilizar modelos de lenguaje para mejorar la recuperación de información.

4. IA como recolectora de información en la web (ecosystem connector)

Operando también en la fase de exploración, la IA actúa como un puente entre actores y recursos del ecosistema. Algunos ejemplos son:

  • Recomendar datasets relevantes a investigadores o empresas.

  • Identificar socios potenciales a partir de intereses comunes.

  • Extraer temas emergentes para apoyar la formulación de políticas.

  • Visualizar datos de múltiples fuentes en paneles interactivos.

  • Personalizar sugerencias de datos basadas en actividades en redes sociales.

5. IA que referencia el portal (portal linker)

Esta funcionalidad se enfoca en la transformación de datos dentro del portal. Su función es facilitar la combinación y presentación de información para distintos públicos. Algunas tareas son:

  • Convertir datos en grafos de conocimiento (estructuras que conectan información relacionada, conocidas como Linked Open Data).

  • Resumir y simplificar datos con técnicas de PLN (Procesamiento del Lenguaje Natural).

  • Aplicar razonamiento automático para generar información derivada.

  • Potenciar la visualización multivariante de datasets complejos.

  • Integrar datos diversos en productos de información accesibles.

6. IA como desarrolladora de valor en el ecosistema (ecosystem value developer)

En la fase de transformación y con mirada externa, la IA genera productos y servicios basados en datos abiertos que aportan valor añadido. Algunas tareas son:

  • Sugerir técnicas analíticas adecuadas según el tipo de conjunto de datos.

  • Asistir en la codificación y procesamiento de información.

  • Crear paneles de control basados en análisis predictivo.

  • Garantizar la corrección y coherencia de los datos transformados.

  • Apoyar el desarrollo de servicios digitales innovadores.

7. IA como supervisora del portal (portal monitor)

Se centra en el mantenimiento del portal, con un enfoque interno. Su papel es garantizar la calidad, consistencia y cumplimiento de estándares. Algunas tareas son:

  • Detectar anomalías y valores atípicos en conjuntos de datos publicados.

  • Evaluar la consistencia de metadatos y esquemas.

  • Automatizar procesos de actualización y depuración de datos.

  • Identificar incidencias en tiempo real para su corrección.

  • Reducir costes de mantenimiento mediante monitorización inteligente.

8. IA como dinamizadora del ecosistema (ecosystem engager)

Y, por último, esta función opera en la fase de mantenimiento, pero hacia afuera. Busca promover la participación ciudadana y la interacción continua. Algunas tareas son:

  • Predecir patrones de uso y anticipar necesidades de los usuarios.

  • Proporcionar retroalimentación personalizada sobre datasets.

  • Facilitar la auditoría ciudadana de la calidad de los datos.

  • Incentivar la participación en comunidades de datos abiertos.

  • Identificar perfiles de usuarios para diseñar experiencias más inclusivas.

¿Qué nos dice la evidencia?

El estudio se basa en una revisión de más de 70 artículos académicos que examinan la intersección entre IA y los datos abiertos gubernamentales (open government data u OGD). A partir de estos casos, los autores observan que:

  • Algunos de los perfiles definidos, como portal curator, portal explorer y portal monitor, están relativamente maduros y cuentan con múltiples ejemplos en la literatura.

  • Otros, como ecosystem value developer y ecosystem engager, están menos explorados, aunque son los que más potencial tienen para generar impacto social y económico.

  • La mayoría de las aplicaciones actuales se centran en automatizar tareas concretas, pero hay un gran margen para diseñar arquitecturas más integrales, que combinen varios tipos de IA en un mismo portal o en todo el ciclo de vida del dato.

Desde un punto de vista académico, esta tipología aporta un lenguaje común y una estructura conceptual para estudiar la relación entre IA y datos abiertos. Permite identificar vacíos en la investigación y orientar futuros trabajos hacia un enfoque más sistémico.

En la práctica, el marco es útil para:

  • Gestores de portales de datos: les ayuda a identificar qué tipos de IA pueden implementar según sus necesidades, desde mejorar la calidad de los datasets hasta facilitar la interacción con los usuarios.

  • Responsables políticos: les orienta sobre cómo diseñar estrategias de adopción de IA en iniciativas de datos abiertos, equilibrando eficiencia, transparencia y participación.

  • Investigadores y desarrolladores: les ofrece un mapa de oportunidades para crear herramientas innovadoras que atiendan necesidades específicas del ecosistema.

Limitaciones y próximos pasos de la sinergia entre IA y open data

Además de las ventajas, el estudio reconoce algunas asignaturas pendientes que, en cierta manera, sirven como hoja de ruta para el futuro. Para empezar, varias de las aplicaciones que se han identificado están todavía en fases tempranas o son conceptuales. Y, quizá lo más relevante, aún no se ha abordado en profundidad el debate sobre los riesgos y dilemas éticos del uso de IA en datos abiertos: sesgos, privacidad, sostenibilidad tecnológica.

En definitiva, la combinación de IA y datos abiertos es todavía un terreno en construcción, pero con un enorme potencial. La clave estará en pasar de experimentos aislados a estrategias integrales, capaces de generar valor social, económico y democrático. La IA, en este sentido, no funciona de manera independiente a los datos abiertos: los multiplica y los hace más relevantes para gobiernos, ciudadanía y sociedad en general.