Argitalpen data 05/05/2026
Persona utilizando un ordenador con IA
Azalpena

En los últimos años, la inteligencia artificial ha pasado de ser una tecnología emergente a convertirse en una realidad cotidiana en administraciones públicas, empresas y organizaciones de todo tipo. Se habla de sistemas que predicen la demanda sanitaria, optimizan rutas de transporte o detectan anomalías en el gasto público. Pero detrás de cada uno de estos casos de uso existe una pregunta que rara vez ocupa el primer plano del debate: ¿en qué se apoya realmente esa inteligencia artificial?

La respuesta no está solo en los algoritmos. Está en los datos. Y, más concretamente, en cómo las organizaciones se estructuran, y los estructuran, para gestionarlos.

En este post abordaremos:

  • Por qué los datos son la base real de cualquier sistema de IA y qué riesgos implica ignorarlos

  • Qué estructuras organizativas permiten gobernarlos de forma efectiva

  • El papel estratégico del dato abierto en este ecosistema

  • Las diferencias y sinergias entre gobierno del dato y gobierno de la IA

  • Los estándares y marcos de referencia disponibles en España y a nivel internacional

Los datos como base de la inteligencia artificial

El aprendizaje automático ha transformado el paradigma del desarrollo tecnológico. Donde antes los sistemas seguían reglas fijas y explícitas, hoy aprenden de patrones que emergen de los datos. Esto supone un cambio de enorme relevancia: el comportamiento de un modelo de IA no depende tanto de la lógica con la que fue programado como de la calidad, representatividad y coherencia de los datos con los que fue entrenado.

Aquí reside uno de los riesgos más subestimados de la IA: el espejismo del dato neutral. Los datos no son verdades objetivas; son representaciones de la realidad capturadas en un contexto concreto (procesos de negocio), con sus propias limitaciones y sesgos. Un sistema entrenado con datos incompletos o sesgados no solo replicará esos sesgos, sino que los amplificará. Los ejemplos son numerosos: desde modelos de reconocimiento facial con peor rendimiento en determinados grupos poblacionales hasta sistemas de priorización que reproducen desigualdades históricas.

Además, los datos envejecen. Lo que hoy es un conjunto de entrenamiento representativo puede dejar de serlo mañana si la realidad cambia y el modelo no se actualiza. Este fenómeno, conocido como data drift, es uno de los principales motivos por los que sistemas de IA inicialmente exitosos acaban degradando su rendimiento a lo largo del tiempo si no se sigue un adecuado mantenimiento. Un caso ilustrativo fue el de varios modelos predictivos desplegados durante la pandemia de COVID-19: entrenados con patrones de comportamiento previos, su precisión se deterioró cuando la realidad cambió de forma drástica y repentina, evidenciando que un modelo es tan vigente como los datos que lo sustentan.

Por todo ello, la calidad de los datos no puede dejarse al azar. Requiere una gestión activa, sistemática y con responsabilidades claramente asignadas.

Estructuras organizativas para gobernar el dato

Reconocer que los datos son un activo estratégico es el primer paso. El segundo, y más difícil, es organizarse para gestionarlos como tal.

Gobernar el dato significa establecer quién decide sobre los datos, cómo se gestionan y bajo qué reglas se utilizan. No es una cuestión puramente técnica; es, sobre todo, organizativa. Implica:

Infografía titulada “¿Qué implica la gobernanza de datos?” que muestra un proceso en seis pasos conectados en secuencia:  Definir roles (icono de engranaje). Crear instancias de decisión (icono de organigrama). Diseñar procesos (icono de engranajes). Establecer políticas que garanticen su calidad (icono de pulgar arriba). Concretar procesos de documentación (icono de carpeta). Garantizar que se usan de forma confiable (icono de escudo con check).  Los pasos aparecen unidos por flechas en un flujo continuo. En la parte inferior figura “datos.gob.es – potenciando nuestra economía digital”.

Figura 1. Visual sobre las implicaciones de la gobernanza de datos. Fuente: elaboración propia - datos.gob.es

Las organizaciones más maduras en este ámbito suelen articular su gobernanza en torno a tres niveles:

  • En el nivel estratégico, se sitúan figuras como el Chief Data Officer (CDO) y órganos colegiados de supervisión, cuya función es definir el papel que juegan los datos en la estrategia de la organización y asegurar que las decisiones de alto nivel estén alineadas con esa visión.

  • En el nivel operativo, una Oficina de Gobierno del Dato traduce esa estrategia en políticas concretas: estándares de calidad, catálogos de metadatos, procedimientos de gestión del ciclo de vida del dato, normas de seguridad y privacidad.

  • En el nivel de dominio, los data owners (responsable del dato) y data stewards (gestor del dato) son los responsables de que los datos se gestionen correctamente en el día a día: los primeros con responsabilidad formal sobre determinados conjuntos de datos; los segundos garantizando su calidad, consistencia y correcta documentación.

Cuando la IA entra en escena, esta estructura no cambia en esencia, pero sí se amplía. Aparecen nuevos perfiles como los científicos de datos o ingenieros de modelos, responsables de cumplimiento algorítmico, y nuevas necesidades: documentar los conjuntos de entrenamiento, garantizar la trazabilidad de las decisiones del modelo, gestionar el riesgo de sesgos. Todo ello debe integrarse en el marco de gobernanza existente, no añadirse como una capa separada, y teniendo en cuenta regulaciones como el Reglamento de Inteligencia Artificial de la UE (AI Act).

El dato abierto dentro del gobierno del dato

En el contexto del sector público español, el gobierno del dato no puede disociarse de la política de datos abiertos. Ambas dimensiones se refuerzan mutuamente.

El dato abierto aporta valor mucho más allá de la transparencia. En el contexto de la inteligencia artificial, sus aportaciones son múltiples.

Primero, como materia prima para la innovación: muchos proyectos de IA, especialmente en sus fases iniciales, se apoyan en datasets abiertos para entrenar y validar modelos. Portales como datos.gob.es ponen a disposición de investigadores, empresas y administraciones miles de conjuntos de datos reutilizables sobre movilidad, demografía, medio ambiente o gasto público, entre otros sectores. Un ejemplo concreto es el uso de datos abiertos de tráfico y transporte público para entrenar modelos de predicción de demanda o de optimización de rutas: sin esa capa de información pública, estructurada y de calidad, muchas de estas iniciativas simplemente no despegan.

En segundo lugar, como mecanismo de auditoría y confianza: cuando los datos que alimentan un sistema de IA son accesibles, la comunidad puede analizarlos, identificar posibles sesgos y cuestionar los resultados. Esto es especialmente relevante en decisiones de alto impacto, donde la explicabilidad y la rendición de cuentas son exigencias ineludibles.

Y, tercero, como catalizador de ecosistemas de datos: el dato abierto es uno de los pilares de los espacios de datos compartidos, donde múltiples organizaciones intercambian información bajo reglas comunes. Iniciativas como el Espacio Nacional de Datos de Salud (ENDS) o los espacios europeos sectoriales se apoyan en esta lógica. Para que funcionen, necesitan una gobernanza sólida que garantice la interoperabilidad, el control de acceso y la confianza entre los participantes.

Gobierno del dato y gobierno de la IA: diferencias y complementariedad

Es frecuente que ambos conceptos se confundan o se usen de forma intercambiable, pero tienen alcances distintos, aunque profundamente relacionados.

  • El gobierno del dato tiene como objeto el activo en sí mismo. Se pregunta: ¿son los datos de calidad? ¿Están bien definidos? ¿Se gestionan con seguridad? ¿Quién es responsable de ellos? Su horizonte es la integridad, la disponibilidad y el uso apropiado de la información.

  • El gobierno de la IA, en cambio, tiene como objeto el sistema algorítmico. Se pregunta: ¿es el modelo explicable? ¿Introduce sesgos? ¿Cumple con los requisitos éticos y legales? ¿Cómo se supervisa su funcionamiento a lo largo del tiempo? Su horizonte es la responsabilidad, la transparencia y la mitigación de riesgos.

La relación entre ambos no es de sustitución sino de dependencia: no puede haber un gobierno efectivo de la IA sin un gobierno previo y sólido del dato. Si no sabemos de dónde viene el dato que alimenta un modelo, si no podemos garantizar su calidad o su representatividad, cualquier sistema de gestión de IA se construye sobre arena. El gobierno del dato es, en este sentido, la infraestructura invisible sobre la que descansa la confianza en la inteligencia artificial.

Estándares y marcos de referencia

Para que estas estructuras organizativas no queden en una declaración de intenciones,  es fundamental apoyarse en marcos normativos y estándares que ofrezcan orientación práctica y permitan comparar, evaluar e incluso certificar el nivel de madurez alcanzado.

En España, la familia de especificaciones UNE impulsadas desde la Dirección del Dato ofrece una guía completa y cohesionada. La UNE 0077 aborda el gobierno del dato; la UNE 0078, su gestión; la UNE 0079, la calidad; la UNE 0080, la evaluación de madurez; y la UNE 0085, la implantación progresiva de estas capacidades. A estas se suma la UNE 0081, que establece criterios específicos para la evaluación de la calidad de datasets, pieza crítica cuando hablamos de entrenamiento y validación de modelos de IA.

Este enfoque está plenamente alineado con las recomendaciones publicadas en datos.gob.es sobre gobernanza del datos, donde se insiste en la necesidad de definir roles claros, establecer políticas y asegurar la calidad como elementos estructurales para generar confianza y valor a partir de los datos. En este sentido, la gobernanza no es solo una capa organizativa, sino un habilitador de todo el ciclo de vida del dato., donde se insiste en la necesidad de definir roles claros, establecer políticas y asegurar la calidad como elementos estructurales para generar confianza y valor a partir de los datos. En este sentido, la gobernanza no es solo una capa organizativa, sino un habilitador de todo el ciclo de vida del dato.

En el plano internacional, este marco se amplía y se conecta directamente con la inteligencia artificial. La ISO/IEC 38507 proporciona directrices para el gobierno de la IA, mientras que la ISO/IEC 42001 define el primer sistema de gestión específico para IA, estableciendo requisitos organizativos, de control y mejora continua. Estas normas dejan claro que no puede existir una gestión efectiva de la IA sin una base sólida de gobernanza y gestión del dato.

A su vez, la calidad de la IA se articula sobre tres pilares fundamentales: datos, modelos y software, cada uno respaldado por estándares específicos. La calidad del dato se apoya en normas como la ISO/IEC 5259, mientras que la seguridad y la protección se vinculan a estándares como ISO/IEC 27090 o ISO/IEC 27563. En el ámbito del software y los productos de IA, destacan referencias como ISO/IEC 25059, y en procesos, estándares como ISO/IEC 5338, junto con normas de seguridad específicas como ISO/IEC 5469 o ISO/IEC 22440.

Infografía titulada “Calidad de producto de datos de analítica y ML”. Divide la calidad en tres bloques:  1) Calidad de Datos Inherente (izquierda, fondo amarillo): Exactitud, Completitud, Consistencia, Credibilidad y Actualidad.  2) Calidad de Datos Dependiente del Sistema (centro, fondo gris/azulado): Accesibilidad, Conformidad, Confidencialidad, Eficiencia, Precisión, Trazabilidad, Comprensibilidad, Disponibilidad, Portabilidad y Recuperabilidad.  3) Características Adicionales (derecha, fondo rosado): Auditabilidad, Identificabilidad, Eficacia, Equilibrio, Diversidad, Pertinencia, Representatividad, Similitud y Oportunidad.  En la parte inferior aparece “datos.gob.es – potenciando nuestra economía digital” y la referencia “Fuente: ISO/IEC 5259”

Figura 2. Visual sobre la calidad de producto de datos de analítica y machine learning (ML)

Todos estos marcos apuntan en la misma dirección: la gobernanza del dato no es un requisito burocrático, sino la base sobre la que se construye la calidad, la seguridad y, en última instancia, la confianza en los sistemas de inteligencia artificial. Sin ella, ni la gestión ni la calidad de la IA pueden sostenerse de forma fiable ni escalable.

Conclusión: gobernar el dato es gobernar el futuro

La inteligencia artificial ha puesto de relieve algo que existía pero que no siempre resultaba visible: la calidad de cualquier decisión basada en datos depende, en última instancia, de cómo esos datos se gestionan.

En este sentido, las organizaciones que mejor aprovecharán las oportunidades que ofrece la IA serán las que hayan construido estructuras organizativas capaces de garantizar que sus datos son de calidad, están bien documentados, cuentan con responsables claros y se gestionan bajo políticas coherentes.

Y, en definitiva, gobernar el dato con rigor es la condición que hace posible una innovación sostenible, responsable y digna de confianza. Porque, en un entorno donde la IA aprende de aquello que le damos, la pregunta más importante no es qué modelo usamos, sino qué datos lo alimentan y cómo los hemos cuidado.

Contenido elaborado por Dr. Fernando Gualo, Profesor en UCLM y Consultor de Gobierno y Calidad de datos. El contenido y el punto de vista reflejado en esta publicación es responsabilidad exclusiva de su autor.