Cada vez gana más terreno la idea de concebir la inteligencia artificial (IA) como un servicio de consumo inmediato o utility, bajo la premisa de que basta con “comprar una aplicación y empezar a utilizarla”. Sin embargo, subirse a la IA no es como comprar software convencional y ponerlo en marcha al instante. A diferencia de otras tecnologías de la información, la IA difícilmente se podrá utilizar con la filosofía del plug and play. Existe un conjunto de tareas imprescindibles que los usuarios de estos sistemas deberían emprender, no solo por razones de seguridad y cumplimiento legal, sino sobre todo para obtener resultados eficientes y confiables.
El Reglamento de inteligencia artificial (RIA)[1]
El RIA define marcos de referencia que deberían ser tenidos en cuenta por los proveedores[2] y responsables de desplegar[3] la IA. Esta es una norma muy compleja cuya orientación es doble. En primer lugar, en una aproximación que podríamos definir como de alto nivel, la norma establece un conjunto de líneas rojas que nunca podrán ser traspasadas. La Unión Europea aborda la IA desde un enfoque centrado en el ser humano y al servicio de las personas. Por ello, cualquier desarrollo deberá garantizar ante todo que no se vulneren derechos fundamentales ni se cause ningún daño a la seguridad e integridad de las personas. Adicionalmente, no se admitirá ninguna IA que pudiera generar riesgos sistémicos para la democracia y el estado de derecho. Para que estos objetivos se materialicen, el RIA despliega un conjunto de procesos mediante un enfoque orientado a producto. Esto permite clasificar los sistemas de IA en función de su nivel de riesgo, -bajo, medio, alto- así como los modelos de IA de uso general[4]. Y también, establecer, a partir de esta categorización, las obligaciones que cada sujeto participante deberá cumplir para garantizar los objetivos de la norma.
Habida cuenta de la extraordinaria complejidad del reglamento europeo, queremos compartir en este artículo algunos principios comunes que se deducen de su lectura y podrían inspirar buenas prácticas por parte de las organizaciones públicas y privadas. Nuestro enfoque no se centra tanto en definir una hoja de ruta para un determinado sistema de información como en destacar algunos elementos que, a nuestro juicio, pueden resultar de utilidad para garantizar que el despliegue y utilización de esta tecnología resulten seguros y eficientes, con independencia del nivel de riesgo de cada sistema de información basado en IA.
Definir un propósito claro
El despliegue de un sistema de IA es altamente dependiente de la finalidad que persigue la organización. No se trata de subirse al carro de una moda. Es cierto que la información pública disponible parece evidenciar que la integración de este tipo de tecnología forma parte importante de los procesos de transformación digital de las empresas y de la Administración, proporcionando mayor eficiencia y capacidades. Sin embargo, no puede convertirse en una moda instalar cualquiera de los Large Language Models (LLM). Se necesita una reflexión previa que tenga en cuenta cuáles son las necesidades de la organización y defina que tipo de IA va a contribuir a la mejora de nuestras capacidades. No adoptar esta estrategia podría poner en riesgo a nuestra entidad, no solo desde el punto de vista de su funcionamiento y resultados, sino incluso desde una perspectiva jurídica. Por ejemplo, introducir un LLM o un chatbot en un entorno de alto riesgo decisional podría suponer padecer impactos reputacionales o incurrir en responsabilidad civil. Insertar este LLM en un entorno médico, o utilizar un chatbot en un contexto sensible con población no preparada o en procesos de asistencia críticos, podría acabar generando situaciones de riesgo de consecuencias imprevisibles para las personas.
No hacer el mal
El principio de no maleficiencia es un elemento clave y debe inspirar de modo determinante nuestra práctica en el mundo de la IA. Por ello el RIA establece una serie de prácticas expresamente prohibidas para proteger los derechos fundamentales y la seguridad de las personas. Estas prohibiciones se centran en evitar manipulaciones, discriminaciones y usos indebidos de sistemas de IA que puedan causar daños significativos.
Categorías de prácticas prohibidas
1. Manipulación y control del comportamiento. Mediante el uso de técnicas subliminales o manipuladoras que alteren el comportamiento de personas o colectivos, impidiendo la toma de decisiones informadas y provocando daños considerables.
2. Explotación de vulnerabilidades. Derivadas de la edad, discapacidad o situación social/económica para modificar sustancialmente el comportamiento y causar perjuicio.
3. Puntuación social (Social Scoring). IA que evalúe a personas en función de su comportamiento social o características personales, generando calificaciones con efectos para los ciudadanos que resulten en tratos injustificados o desproporcionados.
4. Evaluación de riesgos penales basada en perfiles. IA utilizada para predecir la probabilidad de comisión de delitos únicamente mediante elaboración de perfiles o características personales. Aunque se admite su uso para la investigación penal cuando el delito se ha cometido efectivamente y existen hechos que analizar.
5. Reconocimiento facial y bases de datos biométricas. Sistemas para la ampliación de bases de datos de reconocimiento facial mediante la extracción no selectiva de imágenes faciales de Internet o de circuitos cerrados de televisión.
6. Inferencia de emociones en entornos sensibles. Diseñar o usar la IA para inferir emociones en el trabajo o en centros educativos, salvo por motivos médicos o de seguridad.
7. Categorización biométrica sensible. Desarrollar o utilizar una IA que clasifique a individuos según datos biométricos para deducir raza, opiniones políticas, religión, orientación sexual, etc.
8. Identificación biométrica remota en espacios públicos. Uso de sistemas de identificación biométrica remota «en tiempo real» en espacios públicos con fines policiales, salvo excepciones muy limitadas (búsqueda de víctimas, prevención de amenazas graves, localización de sospechosos de delitos graves).
Al margen de las conductas expresamente prohibidas es importante tener en cuenta que el principio de no maleficencia implica que no podemos utilizar un sistema de IA con la clara intención de causar un daño, con la conciencia de que esto podría ocurrir o, en cualquier caso, cuando la finalidad que perseguimos sea contraria a derecho.
Garantizar una adecuada gobernanza de datos
El concepto de gobernanza de datos se encuentra en el artículo 10 del RIA y aplica a los sistemas de alto riesgo. No obstante, contiene un conjunto de principios de alta rentabilidad a la hora de desplegar un sistema de cualquier nivel. Los sistemas de IA de alto riesgo que usan datos deben desarrollarse con conjuntos de entrenamiento, validación y prueba que cumplan criterios de calidad. Para ello se definen ciertas prácticas de gobernanza para asegurar:
- Diseño adecuado.
- Que la recogida y origen de los datos, y en el caso de los datos personales la finalidad perseguida, sean adecuadas y legítimas.
- Que se adopten procesos de preparación como la anotación, el etiquetado, la depuración, la actualización, el enriquecimiento y la agregación.
- Que el sistema se diseñe con casos de uso cuya información sea coherente con lo que se supone que miden y representan los datos.
- Asegurar la calidad de los datos garantizando la disponibilidad, la cantidad y la adecuación de los conjuntos de datos necesarios.
- Detectar y revisar de sesgos que puedan afectar a la salud y la seguridad de las personas, a los derechos o generar discriminación, especialmente cuando las salidas de datos influyan en las informaciones de entrada de futuras operaciones. Deben adoptarse medidas para prevenir y corregir estos sesgos.
- Identificar y resolver lagunas o deficiencias en los datos que impidan el cumplimiento del RIA, y añadiríamos que la legislación.
- Los conjuntos de datos empleados deben ser relevantes, representativos, completos y con propiedades estadísticas adecuadas para su uso previsto y deben considerar las características geográficas, contextuales o funcionales necesarias para el sistema, así como garantizar su diversidad. Además, carecerán de errores y estarán completos en vista de su finalidad prevista.
La IA es una tecnología altamente dependiente de los datos que la alimentan. Desde este punto de vista, no disponer de gobernanza de datos no solo puede afectar al funcionamiento de estas herramientas, sino que podría generar responsabilidad para el usuario.
En un futuro no lejano, la obligación de que los sistemas de alto riesgo obtengan un marcado CE emitido por un organismo notificado (es decir, designado por un Estado miembro de la Unión Europea) ofrecerá condiciones de confiabilidad al mercado. Sin embargo, para el resto de los sistemas de menor riesgo aplica la obligación de transparencia. Esto no implica en absoluto que el diseño de esta IA no deba tener en cuenta estos principios en la medida de lo posible. Por tanto, antes de realizar una contratación sería razonable verificar la información precontractual disponible tanto en relación con las características del sistema y su confiabilidad como respecto de las condiciones y recomendaciones de despliegue y uso.
Otra cuestión atañe a nuestra propia organización. Si no disponemos de las adecuadas medidas de cumplimiento normativo, organizativas, técnicas y de calidad que aseguren la confiabilidad de nuestros propios datos, difícilmente podremos utilizar herramientas de IA que se alimenten de ellos. En el contexto del RIA el usuario de un sistema también puede incurrir en responsabilidad. Es perfectamente posible que un producto de esta naturaleza haya sido desarrollado de modo adecuado por el proveedor y que en términos de reproducibilidad éste pueda garantizar que bajo las condiciones adecuadas el sistema funciona correctamente. Lo que desarrolladores y proveedores no pueden resolver son las inconsistencias en los conjuntos de datos que integre en la plataforma el usuario-cliente. No es su responsabilidad si el cliente no desplegó adecuadamente un marco de cumplimiento del Reglamento General de Protección de Datos o está utilizando el sistema para una finalidad ilícita. Tampoco será su responsabilidad que el cliente mantenga conjuntos de datos no actualizados o no confiables que al ser introducidos en la herramienta generen riesgos o contribuyan a la toma de decisiones inadecuadas o discriminatorias.
En consecuencia, la recomendación es clara: antes de implementar un sistema basado en inteligencia artificial debemos asegurarnos de que la gobernanza de datos y el cumplimiento de la legislación vigente se garanticen adecuadamente.
Garantizar la seguridad
La IA es una tecnología particularmente sensible que presenta riesgos de seguridad específicos, -los llamados efectos adversarios-, como por ejemplo la corrupción de los conjuntos de datos. No es necesario buscar ejemplos sofisticados. Como cualquier sistema de información la IA exige que las organizaciones los desplieguen y utilicen de modo seguro. En consecuencia, el despliegue de la IA en cualquier entorno exige el desarrollo previo de un análisis de riesgos que permita identificar cuáles son las medidas organizativas y técnicas que garantizan un uso seguro que la herramienta.
Formar a su personal
A diferencia del RGPD, en el que esta cuestión es implícita, el RIA expresamente establece como obligación el deber de formar. El artículo 4 del RIA es tan preciso que merece la pena su reproducción íntegra:
Los proveedores y responsables del despliegue de sistemas de IA adoptarán medidas para garantizar que, en la mayor medida posible, su personal y demás personas que se encarguen en su nombre del funcionamiento y la utilización de sistemas de IA tengan un nivel suficiente de alfabetización en materia de IA, teniendo en cuenta sus conocimientos técnicos, su experiencia, su educación y su formación, así como el contexto previsto de uso de los sistemas de IA y las personas o los colectivos de personas en que se van a utilizar dichos sistemas.
Este sin duda es un factor crítico. Las personas que utilizan la inteligencia artificial deben haber recibido una formación adecuada que les permita entender la naturaleza del sistema y ser capaces de tomar decisiones informadas. Uno de los principios nucleares de la legislación y del enfoque europeo es el de supervisión humana. Por tanto, con independencia de las garantías que ofrezca un determinado producto de mercado, la organización que lo utiliza siempre será responsable de las consecuencias. Y ello ocurrirá tanto en el caso en el que la última decisión se atribuya a una persona, como cuando en procesos altamente automatizados los responsables de su gestión no sean capaces de identificar una incidencia tomando decisiones adecuadas con supervisión humana.
La culpa in vigilando
La introducción masiva de los LLM plantea el riesgo de incurrir en la llamada culpa in vigilando: un principio jurídico que hace referencia a la responsabilidad que asume una persona por no haber ejercido la debida vigilancia sobre otra, cuando de esa falta de control se deriva un daño o un perjuicio. Si su organización ha introducido cualquiera de estos productos de mercado que integran funciones como realizar informes, evaluar información alfanumérica e incluso asistirle en la gestión del correo electrónico, será fundamental que asegure el cumplimiento de las recomendaciones que anteriormente hemos señalado. Resultará particularmente aconsejable que defina de modo muy preciso los fines para los que se implementa la herramienta, los roles y responsabilidades de cada usuario y proceda a documentar sus decisiones y a formar adecuadamente al personal.
Desgraciadamente el modelo de introducción en el mercado de los LLM ha generado por sí mismo un riesgo sistémico y grave para las organizaciones. La mayor parte de herramientas han optado por una estrategia de comercialización que no difiere en nada de la que en su día emplearon las redes sociales. Esto es, permiten el acceso en abierto y gratuito a cualquier persona. Es obvio que con ello consiguen dos resultados: reutilizar la información que se les facilita monetizando el producto y generar una cultura de uso que facilite la adopción y comercialización de la herramienta.
Imaginemos una hipótesis, por supuesto, descabellada. Un médico interno residente (MIR) ha descubierto que varias de estas herramientas han sido desarrolladas y, de hecho, se utilizan en otro país para el diagnóstico diferencial. Nuestro MIR está muy preocupado por tener que despertar al jefe de guardia médica en el hospital cada 15 minutos. Así que, diligentemente, contrata una herramienta, que no se ha previsto para ese uso en España, y toma decisiones basadas en la propuesta de diagnóstico diferencial de un LLM sin tener todavía las capacidades que lo habilitan para una supervisión humana. Evidentemente existe un riesgo significativo de acabar causando un daño a un paciente.
Situaciones como la descrita obligan a considerar cómo deben actuar las organizaciones que no utilizan IA pero que son conscientes del riesgo de que sus empleados las usen sin su conocimiento o consentimiento. En este sentido, se debería adoptar una estrategia preventiva basada en la emisión de circulares e instrucciones muy precisas respecto de la prohibición de su uso. Por otra parte, existe una situación de riesgo híbrida. El LLM se ha contratado por la organización y es utilizada por la persona empleada para fines distintos de los previstos. En tal caso la dupla seguridad-formación adquiere un valor estratégico.
Probablemente la formación y la adquisición de cultura sobre la inteligencia artificial sea un requisito esencial para el conjunto de la sociedad. De lo contrario, los problemas y riesgos sistémicos que en el pasado afectaron al despliegue de Internet volverán a suceder y quién sabe si con una intensidad difícil de gobernar.
Contenido elaborado por Ricard Martínez Martínez, Director de la Cátedra de Privacidad y Transformación Digital, Departamento de Derecho Constitucional de la Universitat de València. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
NOTAS
[1] Reglamento (UE) 2024/1689 del Parlamento Europeo y del Consejo, de 13 de junio de 2024, por el que se establecen normas armonizadas en materia de inteligencia artificial y por el que se modifican los Reglamentos (CE) n.° 300/2008, (UE) n.° 167/2013, (UE) n.° 168/2013, (UE) 2018/858, (UE) 2018/1139 y (UE) 2019/2144 y las Directivas 2014/90/UE, (UE) 2016/797 y (UE) 2020/1828 disponible en https://eur-lex.europa.eu/legal-content/ES/TXT/?uri=OJ%3AL_202401689
[2] El RIA define como «proveedor»: una persona física o jurídica, autoridad pública, órgano u organismo que desarrolle un sistema de IA o un modelo de IA de uso general o para el que se desarrolle un sistema de IA o un modelo de IA de uso general y lo introduzca en el mercado o ponga en servicio el sistema de IA con su propio nombre o marca, previo pago o gratuitamente.
[3] EL RIA define como «responsable del despliegue»: una persona física o jurídica, o autoridad pública, órgano u organismo que utilice un sistema de IA bajo su propia autoridad, salvo cuando su uso se enmarque en una actividad personal de carácter no profesional.
[4] El RIA define como «modelo de IA de uso general»: un modelo de IA, también uno entrenado con un gran volumen de datos utilizando autosupervisión a gran escala, que presenta un grado considerable de generalidad y es capaz de realizar de manera competente una gran variedad de tareas distintas, independientemente de la manera en que el modelo se introduzca en el mercado, y que puede integrarse en diversos sistemas o aplicaciones posteriores, excepto los modelos de IA que se utilizan para actividades de investigación, desarrollo o creación de prototipos antes de su introducción en el mercado.
La energía es el motor de nuestra sociedad, un recurso vital que impulsa nuestras vidas y la economía global. Sin embargo, el modelo energético tradicional se enfrenta a desafíos monumentales: la creciente demanda, la urgencia climática y la necesidad imperante de una transición hacia fuentes más limpias y sostenibles. En este panorama de transformación profunda, emerge un actor silencioso pero poderoso: los datos. No solo "tener datos" es importante, sino también la capacidad de gobernarlos adecuadamente para transformar el sector energético.
En este nuevo paradigma energético, los datos se han convertido en un recurso estratégico tan esencial como la propia energía. La clave no está solo en generar y distribuir electricidad, sino en entender, anticipar y optimizar su uso en tiempo real. Y para ello, es necesario captar el pulso digital del sistema energético a través de millones de puntos de medición y observación.
Así, antes de abordar cómo se gobiernan estos datos, conviene comprender de dónde provienen, qué tipo de información generan y cómo están transformando silenciosamente el funcionamiento de la red eléctrica.
El latido digital de la red: datos de contadores inteligentes y sensores
Imagina una red eléctrica que no solo distribuye energía, sino que también "escucha", "aprende" y "reacciona". Esta es la promesa de las redes inteligentes, o smart grids, un sistema que va mucho más allá de los cables y transformadores que vemos. Un smart grid es un sistema de distribución de electricidad que utiliza la tecnología digital para mejorar la eficiencia, la sostenibilidad y la seguridad de la red. En el corazón de esta revolución se encuentran los contadores inteligentes y una vasta red de sensores.
Los contadores inteligentes, también conocidos como Advanced Metering Infrastructure (AMI), son dispositivos que registran el consumo de electricidad de forma digital, a menudo, en intervalos de tiempo muy cortos (por ejemplo, cada 15 minutos o por hora), y transmiten estos datos a las compañías eléctricas a través de diversas tecnologías de comunicación, como redes celulares, WiFi, PLC (Power Line Communication) o radiofrecuencia (RF). Estos datos no se limitan a la cantidad total de energía consumida, sino que ofrecen un desglose detallado de patrones de consumo, niveles de voltaje, calidad de la energía e incluso la detección de fallos.
Pero la inteligencia de la red no recae solo en los contadores. Una miríada de sensores distribuidos por toda la infraestructura eléctrica monitorea variables críticas en tiempo real: desde la temperatura de los transformadores y el estado de los equipos hasta las condiciones ambientales y el flujo de energía en diferentes puntos de la red. Estos sensores actúan como los "ojos y oídos" del sistema, proporcionando una visión granular y dinámica del rendimiento de la red.
La magia ocurre en el flujo de estos datos. La información de los contadores y sensores viaja de forma bidireccional: desde el punto de consumo o generación hasta las plataformas de gestión de la empresa eléctrica y viceversa. Esta comunicación constante permite a las empresas de servicios públicos:
- Facturar con precisión
- Implementar programas de respuesta a la demanda
- Optimizar la distribución de energía
- Predecir y prevenir interrupciones
- Integrar de manera eficiente fuentes de energía renovable que por su naturaleza son intermitentes
Gobierno de datos: la columna vertebral de una red conectada
La mera recopilación de datos, por abundante que sea, no garantiza su valor. De hecho, sin una gestión adecuada, esta heterogeneidad de fuentes puede convertirse en una barrera insuperable para la integración y el análisis útil de la información. Aquí es donde entra en juego el gobierno del dato.
El gobierno del dato en el contexto de las redes inteligentes implica establecer un conjunto robusto de principios, procesos, roles y tecnologías para asegurar que los datos generados sean fiables, accesibles, útiles y seguros. Es la "regla de juego" que define cómo se capturan, almacenan, mantienen, usan, protegen y eliminan los datos a lo largo de todo su ciclo de vida.
¿Por qué es esto tan crucial?
- Interoperabilidad: una red inteligente no es un sistema monolítico, sino una constelación de dispositivos, plataformas y actores (generadores, distribuidores, consumidores, prosumidor, reguladores). Para que todos estos elementos "hablen el mismo idioma", la interoperabilidad es fundamental. El gobierno del dato establece estándares de nomenclatura, formatos, codificación y sincronización, permitiendo que la información fluya sin fricciones entre sistemas dispares. Sin ella, corremos el riesgo de crear silos de información fragmentados y costosos.
- Calidad: los algoritmos de inteligencia artificial y el aprendizaje automático, tan vitales para las redes inteligentes, son tan buenos como los datos con los que se alimentan. El gobierno del dato garantiza la exactitud, completitud y consistencia de los datos (y a futuro de la información y conocimiento) mediante la definición de reglas de negocio, la limpieza de duplicados y la gestión de errores en los datos. Datos de mala calidad pueden llevar a decisiones erróneas, ineficiencias operativas y resultados poco confiables.
- Seguridad: la interconexión de millones de dispositivos en una red inteligente expande exponencialmente la superficie de ataque para ciberdelincuentes. Un fallo en la seguridad de los datos podría tener consecuencias catastróficas, desde interrupciones masivas del suministro eléctrico hasta la vulneración de la privacidad de los usuarios. El gobierno del dato es el escudo que implementa controles de acceso robustos, protocolos de cifrado y auditorías de uso, salvaguardando la integridad y la confidencialidad de la información crítica. Adherirse a marcos de seguridad consolidados como ENS, ISO/IEC 27000, NIST, IEC 62443 y NERC CIP es fundamental.
En última instancia, un gobierno del dato efectivo convierte los datos en una infraestructura crítica, tan importante como los cables y las subestaciones, para la toma de decisiones, la optimización de recursos y la automatización inteligente.
Datos en acción: optimizando, anticipando y facilitando la transición energética
Gobernar los datos no es un fin en sí mismo, sino el medio para desbloquear un vasto potencial de eficiencia y sostenibilidad en el sector energético.
1. Optimización del consumo y eficiencia operativa
Los datos exactos, completos, consistentes, actuales y creíbles, así como en tiempo real permiten múltiples ventajas en la gestión energética:
-
Consumo a nivel de usuario: los contadores inteligentes empoderan a los ciudadanos y a las empresas al proporcionarles información detallada sobre su propio consumo. Esto les permite identificar patrones, ajustar sus hábitos y, en última instancia, reducir sus facturas de energía.
- Gestión de la demanda: las empresas de servicios públicos pueden utilizar los datos para implementar programas de respuesta a la demanda (DR, por sus siglas en inglés). Estos programas incentivan a los consumidores a reducir o trasladar su consumo de electricidad durante los períodos de alta demanda o de precios elevados, equilibrando así la carga en la red y evitando costosas inversiones en nueva infraestructura.
- Reducción de ineficiencias: la disponibilidad de datos precisos y bien integrados permite a las empresas eléctricas automatizar tareas, evitar procesos redundantes y reducir paradas no planificadas en sus sistemas. Por ejemplo, una planta de generación puede ajustar su producción en tiempo real basándose en el análisis de datos de rendimiento y demanda.
- Monitorización energética y control de emisiones: el seguimiento en tiempo real del consumo de energía, agua o emisiones de gases contaminantes revela ineficiencias ocultas y oportunidades de ahorro. Los cuadros de mando inteligentes, alimentados por datos gobernados, permiten a las plantas industriales y a las ciudades reducir sus costes y avanzar en sus objetivos de sostenibilidad ambiental.
2. Anticipación de la demanda y resiliencia de la red
Las redes inteligentes también pueden prever el futuro del consumo energético:
-
Predicción de la demanda: mediante el uso de algoritmos avanzados de inteligencia artificial y machine learning (como el análisis de series temporales o las redes neuronales), los datos históricos de consumo, combinados con factores externos como el clima, los días festivos o eventos especiales, permiten a las empresas eléctricas pronosticar la demanda con una precisión asombrosa. Esta anticipación es vital para optimizar la asignación de recursos, evitar sobrecargas y garantizar la estabilidad de la red.
- Mantenimiento predictivo: al combinar datos históricos de mantenimiento con información en tiempo real de sensores en equipos críticos, las empresas pueden anticipar fallos en las máquinas antes de que ocurran, programar el mantenimiento de forma proactiva y evitar costosas interrupciones inesperadas.
3. Facilitación de la transición energética
El gobierno del dato es un catalizador indispensable para la integración de energías renovables y la descarbonización:
- Integración de renovables: fuentes como la energía solar y eólica son intermitentes por naturaleza. Los datos en tiempo real sobre la generación, las condiciones meteorológicas y el estado de la red son fundamentales para gestionar esta variabilidad, balancear la carga y maximizar la inyección de energía limpia en la red.
- Gestión de Recursos Energéticos Distribuidos (RED): la proliferación de paneles solares en tejados, baterías de almacenamiento y vehículos eléctricos (que pueden cargar y descargar energía a la red) requiere una gestión de datos sofisticada. El gobierno del dato asegura la interoperabilidad necesaria para coordinar estos recursos de manera eficiente, transformándolos en "centrales eléctricas virtuales" que pueden apoyar la estabilidad de la red.
- Impulso a la economía circular: gracias a la trazabilidad total del ciclo de vida de un producto, desde su diseño hasta su reciclaje, los datos permiten identificar oportunidades de reutilización, valorización de materiales y diseño sostenible. Esto es crucial para cumplir con nuevos reglamentos de economía circular y el Pasaporte de Producto Digital (DPP, por sus siglas en inglés).
- Gemelos digitales: para que una réplica virtual de un proceso o sistema físico funcione, necesita alimentarse de datos precisos y coherentes. El gobierno del dato garantiza la sincronización entre el mundo físico y el virtual, permitiendo simulaciones fiables para optimizar el diseño de nuevas líneas de producción o la disposición de los elementos en una fábrica.
Beneficios tangibles para ciudadanos, empresas y administraciones
La inversión en gobierno del dato en redes inteligentes genera un valor significativo para todos los actores de la sociedad:
Para los ciudadanos
-
Ahorro en la factura de la luz: al tener acceso a datos de consumo en tiempo real y a tarifas flexibles (por ejemplo, con precios más bajos en horas valle), los ciudadanos pueden ajustar sus hábitos y reducir sus gastos de energía.
-
Empoderamiento y control: los ciudadanos pasan de ser meros consumidores a "prosumers", con la capacidad de generar su propia energía (por ejemplo, con paneles solares) e incluso inyectar el excedente en la red, siendo compensados por ello. Esto fomenta una participación y un mayor control sobre su consumo energético.
-
Mejor calidad de vida: una red más resiliente y eficiente significa menos interrupciones del suministro y una mayor fiabilidad, lo que se traduce en una mejor calidad de vida y servicios esenciales ininterrumpidos.
- Fomento de la sostenibilidad: al participar en programas de respuesta a la demanda y adoptar comportamientos de consumo más eficientes, los ciudadanos contribuyen directamente a la reducción de la huella de carbono y a la transición energética del país.
Para las empresas
- Optimización de operaciones y reducción de costes: las empresas pueden predecir la demanda, ajustar la producción y realizar un mantenimiento predictivo de su maquinaria, reduciendo pérdidas por fallos y optimizando el uso de recursos energéticos y materiales.
- Nuevos modelos de negocio: la disponibilidad de datos crea oportunidades para el desarrollo de nuevos servicios y productos. Esto incluye plataformas para el intercambio de energía, sistemas inteligentes de gestión energética para edificios y hogares, o la optimización de infraestructuras de carga para vehículos eléctricos.
- Reducción de pérdidas: una gestión de datos inteligente permite a las empresas eléctricas minimizar las pérdidas en la transmisión y distribución de energía, prevenir sobrecargas y aislar fallos de manera más rápida y eficiente.
- Mejora de la trazabilidad: en sectores regulados como la alimentación, automoción o farmacéutica, la trazabilidad completa del producto desde la materia prima hasta el cliente final no es solo un valor añadido, sino una obligación regulatoria. El gobierno del dato asegura que esta trazabilidad sea verificable y cumpla los estándares.
- Cumplimiento normativo: una gestión de datos robusta permite a las empresas cumplir con regulaciones cada vez más estrictas en materia de sostenibilidad, eficiencia energética y emisiones, así como con normativas de privacidad de datos (como el GDPR).
Para las Administraciones públicas
- Formulación de políticas energéticas inteligentes: los datos agregados y anonimizados de la red inteligente proporcionan a las Administraciones públicas información valiosa para diseñar políticas energéticas más efectivas, establecer objetivos de descarbonización ambiciosos y planificar estratégicamente el futuro energético del país.
- Planificación de infraestructuras: con una visión clara de los patrones de consumo y las necesidades futuras, las Administraciones pueden planificar de manera más eficiente las actualizaciones y expansiones de la red, así como la integración de recursos energéticos distribuidos como las micro-redes inteligentes.
- Impulso a la resiliencia urbana: la capacidad de gestionar y coordinar recursos energéticos distribuidos a nivel local, como en las micro-redes, mejora la resiliencia de las ciudades ante eventos extremos o fallos en la red principal.
- Promoción de la soberanía tecnológica y de datos: al fomentar la publicación de estos datos en portales de datos abiertos junto a la creación de espacios de datos nacionales y sectoriales, las Administraciones garantizan que el valor generado por los datos se quede en el país y en las empresas locales, impulsando la innovación y la competitividad a nivel internacional.
Retos y mejores prácticas en gobierno del dato de redes inteligentes
A pesar de los inmensos beneficios, la implementación de iniciativas de gobierno del dato efectivas en el sector energético presenta desafíos significativos:
- Heterogeneidad y complejidad de la integración de datos: los datos provienen de una multitud de fuentes dispares (contadores, sensores, SCADA, ERP, MES, sistemas de mantenimiento, etc.). Integrar y armonizar esta información es un reto técnico y organizacional considerable.
- Privacidad y cumplimiento normativo: los datos de consumo energético pueden revelar patrones de comportamiento altamente sensibles. Garantizar la privacidad del usuario y cumplir con regulaciones como el GDPR es un desafío constante que requiere marcos éticos y legales sólidos.
- Ciberseguridad: La interconexión masiva de dispositivos y sistemas expande la superficie de ataque, haciendo que las redes inteligentes sean objetivos atractivos para ciberataques sofisticados. La integración de sistemas heredados con nuevas tecnologías también puede crear vulnerabilidades.
- Calidad de datos: sin procesos robustos, la información puede ser inconsistente, incompleta o inexacta, lo que lleva a decisiones erróneas.
- Falta de estándares universales: la ausencia de prácticas y regulaciones de ciberseguridad uniformes en diferentes regiones puede reducir la eficacia de las medidas de seguridad.
- Resistencia al cambio y falta de cultura del dato: la implementación de nuevas políticas y procesos de gobierno del dato puede encontrar resistencia interna, y la falta de comprensión sobre la importancia de los datos a menudo obstaculiza los esfuerzos.
- Asignación de roles y recursos: definir claramente quién es responsable de qué aspecto del dato y asegurar los recursos financieros y humanos adecuados es fundamental para el éxito.
- Escalabilidad: a medida que el volumen y la variedad de datos crecen exponencialmente, la estructura de gobierno debe ser capaz de escalar eficientemente para evitar cuellos de botella y problemas de cumplimiento.
Para superar estos desafíos, la adopción de las siguientes mejores prácticas es esencial:
- Establecer un marco de gobierno sólido: definir principios, políticas, procesos y roles claros desde el principio, con el apoyo de las administraciones públicas y la alta dirección. Esto puede verse solventado con la implantación de los procesos de las UNE 0077 a 0080 que incluye la definición de los procesos de gobierno, gestión y calidad de datos, así como la definición de las estructuras organizativas.
- Garantizar la calidad de los datos: implementar metodologías y procesos de evaluación de calidad de datos, como la clasificación y catalogación de activos de datos, el control de calidad (validación, limpieza de duplicados) y la gestión del ciclo de vida del dato. Todo ello puede basarse en la implantación de un modelo de calidad siguiendo la UNE 0081.
- Priorizar la ciberseguridad y la privacidad: implementar marcos de seguridad robustos (ENS, ISO 27000, NIST, IEC 62443, NERC CIP), asegurar los dispositivos IoT, utilizar herramientas avanzadas de detección de amenazas (incluida la IA) y construir sistemas resilientes con segmentación de red y redundancia. Asegurar el cumplimiento de las regulaciones de privacidad de datos (como el GDPR).
- Fomentar la interoperabilidad mediante estándares: adoptar estándares abiertos para la comunicación y el intercambio de datos entre sistemas, como OPC UA o ISA-95.
- Invertir en tecnología y automatización: utilizar herramientas de gobierno del dato que permitan la detección y clasificación automática de datos, la aplicación de reglas de protección de datos, la automatización de la gestión de metadatos y la catalogación de datos. La automatización de tareas rutinarias mejora la eficiencia y reduce errores.
- Colaboración y compartición de información: fomentar el intercambio de información sobre amenazas y mejores prácticas entre empresas de servicios públicos, agencias gubernamentales y otras partes interesadas de la industria. En esta línea hay que destacar los más de 900 conjuntos de datos publicados en el catálogo de datos.gob.es del tema Energía, así como la creación de "Espacios de Datos" (como el Espacio de Datos Nacional de Energía o Industria en España) facilita la compartición segura y eficiente de datos entre organizaciones, impulsando la innovación y la competitividad sectorial.
- Monitoreo continuo y mejora: elgobierno del dato es un proceso continuo. Se deben establecer KPI para monitorear el progreso, evaluar el rendimiento y realizar mejoras basadas en la retroalimentación y los cambios regulatorios o estratégicos.
Conclusiones: un futuro conectado y sostenible
La energía y los datos están unidos en el futuro. Las redes inteligentes son la manifestación de esta simbiosis, y elgobierno del dato es la clave para desbloquear su potencial. Al transformar los datos de simples registros en activos estratégicos y una infraestructura crítica, podemos avanzar hacia un modelo energético más eficiente, sostenible y resiliente.
La colaboración entre empresas, ciudadanos y administraciones, impulsada por iniciativas como el Espacio de Datos Nacional de Industria en España, es fundamental para construir este futuro. Este espacio no solo busca mejorar la eficiencia industrial, sino también reforzar la soberanía tecnológica y de datos del país, asegurando que el valor generado por los datos beneficie a nuestras propias empresas, regiones y sectores. Al invertir en iniciativas degobierno del dato sólidas y en la creación de ecosistemas de datos compartidos, estamos invirtiendo en una industria más conectada, inteligente y preparada para los retos energéticos y climáticos del mañana.
Contenido elaborado por Dr. Fernando Gualo, Profesor en UCLM y Consultor de Gobierno y Calidad de datos. El contenido y el punto de vista reflejado en esta publicación es responsabilidad exclusiva de su autor.
La industria actual se enfrenta a uno de los mayores retos de su historia reciente. Las exigencias del mercado, la presión para cumplir objetivos climáticos, la demanda de transparencia por parte de los consumidores y la aceleración tecnológica están convergiendo en una transformación profunda del modelo de producción. Esta transformación no solo busca una mayor competitividad, sino también una producción más resiliente, flexible, eficiente y sostenible.
En este contexto, la digitalización industrial —impulsada por tecnologías como el Internet de las Cosas (IoT en sus siglas en inglés), la inteligencia artificial, el edge computing, o los sistemas ciberfísicos— está generando cantidades ingentes de datos operativos, ambientales y logísticos. Sin embargo, la mera existencia de estos datos no garantiza valor por sí misma. La clave está en gobernarlos adecuadamente, es decir, establecer principios, procesos, roles y tecnologías que aseguren que esos datos sean fiables, accesibles, útiles y seguros. En otras palabras, que los datos estén en condiciones de ser aprovechados para mejorar los procesos industriales.
Por eso, el gobierno del dato industrial se posiciona como un factor estratégico. No se trata solo de “tener datos”, sino de convertirlos en una infraestructura crítica para la toma de decisiones, la optimización de recursos, la automatización inteligente y la transición ecológica. Sin gobierno del dato, no hay industria 4.0 que valga. Y sin industria 4.0, los retos de sostenibilidad, eficiencia energética o trazabilidad completa son inabordables.
En este artículo exploramos por qué el gobierno del dato es esencial en el ámbito industrial, qué beneficios concretos aporta a los procesos productivos y cómo iniciativas como el Espacio de Datos Nacional de Industria pueden acelerar esta transformación.
A continuación, analizamos su impacto a distintos niveles, desde los casos de uso más relevantes hasta los marcos colaborativos que están emergiendo en España.
¿Por qué es clave el gobierno del dato en la industria?
Los datos industriales provienen de una multitud de fuentes distribuidas: sensores IoT, sistemas SCADA, líneas de montaje automatizadas, plataformas de mantenimiento, sistemas ERP o MES (Manufacturing Execution Systems o sistemas de ejecución de fabricación), entre otros. Esta heterogeneidad, si no se gestiona adecuadamente, puede convertirse en una barrera para la integración y el análisis útil de la información.
El gobierno del dato permite superar estas barreras estableciendo las reglas del juego para la captura, almacenamiento, calidad, interoperabilidad, uso, protección y eliminación de los datos. Esto habilita no solo la eficiencia operativa sino también la sostenibilidad a largo plazo. ¿Cómo?
- Reduciendo ineficiencias operativas: al contar con datos precisos, actualizados y bien integrados entre sistemas, se pueden automatizar tareas, evitar reprocesos, y reducir paradas no planificadas. Por ejemplo, una planta puede ajustar la velocidad de sus líneas de producción en tiempo real según el análisis de datos de rendimiento y demanda.
- Mejorando la sostenibilidad: una gestión del dato sólida permite identificar patrones de consumo energético, materiales o emisiones. Con esta información se pueden rediseñar procesos para ser más sostenibles, aplicar ecodiseño y reducir la huella ambiental. El dato, en este caso, actúa como brújula hacia la descarbonización.
- Asegurando el cumplimiento normativo y la trazabilidad: desde la ISO 9001 hasta los nuevos reglamentos de economía circular o el Pasaporte de Producto Digital, las industrias deben demostrar cumplimiento. Esto solo es posible con datos fiables, trazables y auditables.
- Facilitando la interoperabilidad entre sistemas: el gobierno del dato actúa como “pegamento” que une los distintos silos tecnológicos de una organización: calidad, producción, logística, mantenimiento, compras, etc. La normalización y alineación semántica de los datos permite flujos más ágiles y decisiones mejor fundamentadas.
- Impulsando la economía circular: gracias a la trazabilidad total del ciclo de vida de un producto, desde su diseño hasta su reciclaje, es posible identificar oportunidades de reutilización, valorización de materiales y diseño sostenible. Todo ello apoyado en datos que siguen al producto a lo largo de su vida.
¿Cómo debería ser el gobierno del dato en el entorno industrial?
Un modelo de gobierno del dato adaptado a este contexto debe incluir:
▸Roles específicos: es necesario contar con un equipo definido, donde quede clara la responsabilidad y las tareas de cada uno. Algunos de los roles que no pueden faltar son:
- Propietarios del dato (data owners): responsables del uso del dato en su área (producción, calidad, mantenimiento…).
- Gestores de calidad del dato (data stewards): velan por la consistencia, completitud y precisión de la información.
- Equipo de gobierno del dato: coordina la estrategia, define políticas comunes y evalúa el cumplimiento.
▸Procesos estructurados: al igual que los roles, es necesario definir las diversas fases y operaciones a llevar a cabo. Entre ellas se encuentran las siguientes:
- Clasificación y catalogación de activos de datos (por tipo, criticidad, uso).
- Control de calidad de datos: definición de reglas de validación, limpieza de duplicados, gestión de excepciones.
- Ciclo de vida del dato: desde su creación en máquina hasta su archivo o destrucción.
- Acceso y seguridad: gestión de privilegios, auditorías de uso, trazabilidad.
▸Políticas organizativas: para garantizar la interoperabilidad y calidad del dato es necesario contar con estándares, normas y guías que orienten a los usuarios. Algunos ejemplos son:
- Estándares de nomenclatura, formatos, codificación y sincronización.
- Normas para la interoperabilidad entre sistemas (por ejemplo, uso de estándares como OPC UA o ISA-95).
- Guías de uso ético y conforme a la legislación (como el Reglamento de Datos, GDPR o legislación medioambiental).
Este enfoque convierte el dato industrial en un activo gestionado con el mismo rigor que cualquier infraestructura física.
Casos de uso industriales habilitados por el gobierno del dato
Los beneficios del gobierno del dato en la industria se materializan en múltiples aplicaciones prácticas. Algunos de los casos de uso más representativos son:
1.Mantenimiento predictivo
Uno de los grandes clásicos de la industria 4.0. Al combinar datos históricos de mantenimiento con sensores en tiempo real, las organizaciones pueden anticipar fallos en máquinas y evitar paradas inesperadas. Pero esto solo es posible si los datos están gobernados: si se ha definido su frecuencia de captura, formato, responsables, calidad y disponibilidad.
2. Trazabilidad completa del producto
Desde la materia prima hasta el cliente final, cada evento en la cadena de valor queda registrado y es accesible. Esto es vital para sectores como la alimentación, la automoción o la farmacéutica, donde la trazabilidad es tanto un valor añadido como una obligación regulatoria. El gobierno del dato asegura que esta trazabilidad no se pierda, sea verificable y cumpla los estándares de interoperabilidad requeridos.
3. Gemelos digitales y simulación de procesos
Para que un gemelo digital —una réplica virtual de un proceso o sistema físico— funcione, necesita alimentarse de datos precisos, actualizados y coherentes. El gobierno del dato garantiza la sincronización entre el mundo físico y el virtual, y permite generar escenarios de simulación fiables, desde el diseño de una nueva línea de producción hasta la optimización del layout de fábrica, es decir, de los distintos elementos dentro de la planta.
4. Monitorización energética y control de emisiones
El seguimiento en tiempo real del consumo de energía, agua o gases puede revelar ineficiencias ocultas y oportunidades de ahorro. A través de cuadros de mando inteligentes y KPI definidos sobre datos gobernados, las plantas industriales pueden reducir sus costes y avanzar en sus objetivos de sostenibilidad ambiental.
5. Automatización y control de calidad inteligente
Los sistemas de visión artificial y algoritmos de machine learning entrenados con datos de producción permiten detectar defectos en tiempo real, ajustar parámetros automáticamente y mejorar la calidad final. Sin una buena calidad de datos (exactitud, completitud, consistencia), estos algoritmos pueden fallar o generar resultados no confiables.
El Espacio de Datos Nacional de Industria: clave para la colaboración y la competitividad
Para que el gobierno del dato industrial trascienda el ámbito de cada empresa y se convierta en una auténtica palanca de transformación sectorial, es necesario contar con infraestructuras que faciliten la compartición segura, confiable y eficiente de los datos entre organizaciones. En esta línea, se sitúa el Espacio de Datos Nacional de Industria, enmarcado dentro del Plan de Impulso de los Espacios de Datos Sectoriales promovido por el Ministerio para la Transformación Digital y de la Función Pública.
Este espacio tiene como objetivo crear un entorno de confianza donde empresas, asociaciones, centros tecnológicos y administraciones puedan compartir y reutilizar datos industriales de forma interoperable, conforme a principios éticos, legales y técnicos. A través de este marco, se busca habilitar nuevas formas de colaboración, acelerar la innovación y reforzar la autonomía estratégica del tejido productivo nacional.
El sector industrial en España es enormemente diverso, con un ecosistema compuesto por grandes corporaciones, pymes, proveedores, subcontratas, clústeres y centros de I+D. Esta diversidad puede convertirse en una fortaleza si se articula mediante una infraestructura común de datos que facilite la integración y el intercambio de información de forma ordenada y segura. Además, estos datos industriales pueden verse complementados con los datos abiertos publicados por organismos públicos, como los disponibles en el Catálogo Nacional de Datos Abiertos, ampliando así el valor y las posibilidades de reutilización para el conjunto del sector.
Los puntos fuertes de esta infraestructura común permiten:
- Detectar sinergias a lo largo de la cadena de valor, como oportunidades de reciclaje industrial entre sectores distintos (por ejemplo, residuos plásticos de una industria química como materia prima en otra).
- Reducir barreras de entrada a la digitalización, especialmente para pymes que no cuentan con recursos propios para desplegar soluciones avanzadas de análisis de datos, pero sí podrían acceder a servicios o datos compartidos dentro del espacio.
- Fomentar modelos de innovación abierta donde empresas compartan datos de forma controlada para el desarrollo conjunto de soluciones basadas en inteligencia artificial o mantenimiento predictivo.
- Impulsar indicadores agregados sectoriales, como huellas de carbono compartidas, niveles de eficiencia energética o índices de circularidad industrial, que permiten al conjunto del país avanzar de forma más coordinada en los objetivos de sostenibilidad y competitividad.
La creación del Espacio de Datos Nacional de Industria puede suponer una auténtica palanca de modernización para el tejido industrial español:
- Mayor competitividad internacional, al facilitar el cumplimiento con los requisitos del mercado europeo, como el Reglamento de Datos, el Pasaporte de Producto Digital o los estándares de sostenibilidad.
- Agilidad regulatoria y trazabilidad mejorada, permitiendo a las industrias responder con rapidez a auditorías, certificaciones o cambios normativos.
- Capacidad de anticipación, gracias al análisis conjunto de datos de producción, consumo o mercado que permiten prever disrupciones en las cadenas de suministro o la demanda de recursos críticos.
- Creación de nuevos modelos de negocio, basados en la puesta a disposición de productos como servicio, la reutilización de materiales o el alquiler compartido de capacidades industriales.
El despliegue de este espacio nacional no solo busca mejorar la eficiencia de procesos industriales. También aspira a reforzar la soberanía tecnológica y de datos del país, habilitando un modelo donde el valor generado por los datos se quede en las propias empresas, regiones y sectores. En este sentido, el Espacio de Datos Nacional de Industria se alinea con iniciativas europeas como GAIA-X o Manufacturing-X, pero con un enfoque adaptado al contexto y necesidades del ecosistema industrial español.
Conclusiones
El gobierno del dato es un pilar fundamental para que la industria avance hacia modelos más eficientes, sostenibles y resilientes. No basta con disponer de grandes volúmenes de información: es necesario gestionarla correctamente para generar valor real.
Los beneficios son claros: optimización operativa, mejora de la trazabilidad, impulso a la economía circular y soporte a tecnologías como la inteligencia artificial o los gemelos digitales. Pero el verdadero salto se da cuando los datos dejan de gestionarse de forma aislada y pasan a formar parte de un ecosistema compartido.
El Espacio de Datos Nacional de Industria ofrece ese marco de colaboración y confianza, facilitando la innovación, la competitividad y la soberanía tecnológica. Apostar por su desarrollo es invertir en una industria más conectada, inteligente y preparada para los retos del futuro.
Contenido elaborado por Dr. Fernando Gualo, Profesor en UCLM y Consultor de Gobierno y Calidad de datos. El contenido y el punto de vista reflejado en esta publicación es responsabilidad exclusiva de su autor.
En la última década, la cantidad de datos que las organizaciones generan y necesitan gestionar ha crecido de manera exponencial. Con el auge del cloud, Internet de las Cosas (IoT, por sus siglas en inglés), edge computing y la inteligencia artificial (IA), las empresas se enfrentan al reto de integrar y gobernar datos que provienen de múltiples fuentes y entornos. En este contexto, han surgido dos enfoques clave para la gestión de datos que buscan solucionar los problemas asociados a la centralización de datos: Data Mesh y Data Fabric. Aunque estos conceptos se complementan, cada uno ofrece una aproximación distinta para resolver los desafíos de datos de las organizaciones modernas.
¿Por qué un data lake no es suficiente?
Muchas empresas han implementado data lakes o data warehouses centralizados con equipos dedicados como estrategia para impulsar el análisis de datos de compañía. Sin embargo, este enfoque suele generar problemas a medida que la empresa escala, como por ejemplo:
- Los equipos de datos centralizados se convierten en un cuello de botella. Estos equipos no pueden responder con la rapidez necesaria ante la variedad y volumen de preguntas que surgen desde diferentes áreas del negocio.
- La centralización crea una dependencia que limita la autonomía de los equipos de dominio, quienes conocen mejor sus necesidades de datos.
Aquí es donde entra en escena el enfoque Data Mesh.
Data Mesh: un enfoque descentralizado y orientado a dominios
Data Mesh rompe con la centralización de los datos y los distribuye en dominios específicos, permitiendo que cada equipo de negocio (o equipo de dominio) gestione y controle los datos que más conoce y utiliza. Este enfoque se basa en cuatro principios básicos:
- Propiedad de dominio: en lugar de que un equipo central de datos tenga todo el control, cada equipo es responsable de los datos que genera. Es decir, si eres el equipo de ventas, tú gestionas los datos de ventas; si eres el de marketing, gestionas los datos de marketing. Nadie conoce mejor esos datos que el propio equipo que los usa día a día.
- Datos como producto: esta idea nos recuerda que los datos no son solo para el uso del dominio que los genera, sino que pueden ser útiles para toda la empresa. Así que cada equipo debe pensar en sus datos como un “producto” que otros equipos también puedan usar. Esto implica que los datos deben ser accesibles, confiables y fáciles de encontrar, casi como si fueran una API pública.
- Plataforma autoservicio: la descentralización no significa que cada equipo tenga que reinventar la rueda. Para evitar que cada equipo de dominio se especialice en herramientas complejas de datos, el Data Mesh se apoya en una infraestructura de autoservicio que facilita la creación, despliegue y mantenimiento de productos de datos. Esta plataforma debe permitir a los equipos de dominio consumir y generar datos sin depender de una alta especialización técnica.
- Gobernanza federada: aunque los datos están distribuidos, sigue habiendo reglas comunes para todos. En un Data Mesh, la gobernanza es “federada”, es decir, cada equipo sigue unos estándares de interoperabilidad definidos globalmente. Esto asegura que todos los datos sean seguros, de alta calidad y cumplan con las normativas.
Estos principios hacen que el Data Mesh sea una arquitectura ideal para organizaciones que buscan mayor agilidad y que los equipos tengan autonomía sin perder de vista la calidad y el cumplimiento. A pesar de la descentralización, Data Mesh no crea silos de datos porque fomenta la colaboración y el intercambio estandarizado de datos entre equipos, asegurando acceso y gobernanza comunes en toda la organización.
Data Fabric: arquitectura para el acceso seguro y eficiente a datos distribuidos
Mientras que el Data Mesh se enfoca en la organización y propiedad de los datos en torno a dominios, el Data Fabric es una arquitectura que permite conectar y exponer los datos de una organización, independientemente de su ubicación. A diferencia de enfoques basados en la centralización de datos, como el data lake, el Data Fabric actúa como una capa unificada, ofreciendo acceso fluido a los datos distribuidos en múltiples sistemas sin necesidad de trasladarlos físicamente a un único repositorio.
En términos generales, el Data Fabric se basa en tres aspectos fundamentales:
- Acceso a los datos: en una empresa moderna, los datos se encuentran dispersos en diversas ubicaciones, tales como data lakes, data warehouses, bases de datos relacionales y numerosas aplicaciones SaaS (Software como servicio). En lugar de consolidar todos estos datos en un solo lugar, el Data Fabric emplea una capa de virtualización que permite acceder a ellos directamente desde sus fuentes de origen. Este enfoque minimiza la duplicación de datos y permite el acceso en tiempo real, facilitando así la toma de decisiones ágil. En los casos en que una aplicación requiera latencias bajas, el Data Fabric también dispone de herramientas de integración robusta, como ETL (extracción, transformación y carga), para mover y transformar los datos cuando sea necesario.
- Gestión del ciclo de vida de los datos: el Data Fabric no solo facilita el acceso, sino que también garantiza una gestión adecuada a lo largo de todo el ciclo de vida de los datos. Esto incluye aspectos críticos como la gobernanza, la privacidad y el cumplimiento de normativas. La arquitectura del Data Fabric se apoya en metadatos activos que automatizan la aplicación de políticas de seguridad y acceso, asegurando que solo los usuarios con los permisos adecuados accedan a la información correspondiente. Asimismo, ofrece funcionalidades avanzadas de trazabilidad (linaje), que permiten rastrear el origen de los datos, conocer sus transformaciones y evaluar su calidad, lo cual resulta esencial en entornos regulados bajo normativas como el Reglamento General de Protección de Datos (GDPR en sus siglas en inglés).
- Exposición de los datos: tras conectar los datos y aplicar las políticas de gobernanza y seguridad, el siguiente paso del Data Fabric es poner esos datos a disposición de los usuarios finales. A través de catálogos empresariales, los datos se organizan y presentan de forma accesible para analistas, científicos de datos y desarrolladores, quienes pueden localizarlos y utilizarlos de manera eficiente.
En resumen, el Data Fabric no reemplaza a los data lakes o data warehouses, sino que facilita la integración y gestión de los datos ya existentes en la organización. Su objetivo es crear un entorno seguro y flexible que permita el flujo controlado de datos y una visión unificada, sin la necesidad de trasladarlos físicamente, impulsando así una toma de decisiones más ágil y bien fundamentada.
Data Mesh vs. Data Fabric: ¿Competidores o aliados?
Si bien el Data Mesh y el Data Fabric tienen algunos objetivos en común, cada uno resuelve problemas diferentes y, de hecho, pueden encontrarse beneficios al aplicar mecanismos de ambos enfoques de forma complementaria. La siguiente tabla muestra una comparativa de ambos enfoques:
ASPECTO | DATA MESH | DATA FABRIC |
---|---|---|
Enfoque | Organizacional y estructural, orientado a dominios. | Técnico, centrado en la integración de datos. |
Propósito | Descentralizar la propiedad y la responsabilidad de los datos a los equipos de dominio. | Crear una capa unificada de acceso a datos distribuida en múltiples entornos. |
Gestión de datos | Cada dominio gestiona sus propios datos y define los estándares de calidad. | Los datos se integran mediante servicios y APIs, lo que permite una visión unificada sin mover físicamente los datos. |
Gobernanza | Federada, con reglas establecidas por cada dominio, manteniendo estándares comunes. | Centralizada a nivel de plataforma, con automatización de políticas de acceso y seguridad mediante metadatos activos. |
Figura 1. Tabla comparativa de Data Mesh VS. Data Fabric. Fuente: Elaboración propia.
Conclusión
Tanto el Data Mesh como el Data Fabric están diseñados para resolver los desafíos de la gestión de datos en empresas modernas. El Data Mesh aporta un enfoque organizacional que empodera a los equipos de dominio, mientras que el Data Fabric permite una integración flexible y accesible de datos distribuidos sin necesidad de moverlos físicamente. La elección entre ambos, o la combinación de los dos, dependerá de las necesidades específicas de cada organización, aunque es importante considerar la inversión en infraestructura, formación y posibles cambios organizativos que estos enfoques requieren. Para empresas pequeñas o medianas, un data warehouse tradicional puede ser una alternativa práctica y rentable, especialmente si sus volúmenes de datos y la complejidad organizativa son manejables. De cualquier modo, dado el crecimiento de los ecosistemas de datos en las organizaciones, ambos modelos representan un avance hacia un entorno de datos más ágil, seguro y útil, facilitando una gestión de datos mejor alineada con los objetivos estratégicos en un entorno.
Definiciones
- Data Lake: Es un repositorio de almacenamiento que permite guardar grandes volúmenes de datos en su formato original, ya sean estructurados, semiestructurados o no estructurados. Su estructura flexible permite almacenar datos sin procesar y usarlos para análisis avanzados y machine learning.
- Data Warehouse: Es un sistema de almacenamiento de datos estructurados que organiza, procesa y optimiza los datos para realizar análisis y generar reportes. Está diseñado para consultas rápidas y análisis de datos históricos, siguiendo un esquema predefinido para facilitar el acceso a la información.
Referencias
- Dehghani, Zhamak. Data Mesh Principles and Logical Architecture. https://martinfowler.com/articles/data-mesh-principles.html
- Dehghani, Zhamak. Data Mesh: Delivering Data-Driven Value at Scale. O''Reilly Media. Libro que detalla la implementación y los principios fundamentales del Data Mesh en organizaciones.
- Data Mesh Architecture. Sitio web sobre Data Mesh y arquitecturas de datos. https://www.datamesh-architecture.com/
- IBM. Data Fabric. IBM Topics. https://www.ibm.com/topics/data-fabric
- IBM Technology. Data Fabric: Unifying Data Across Hybrid and Multicloud Environments. YouTube. https://www.youtube.com/watch?v=0Zzn4eVbqfk&t=4s&ab_channel=IBMTechnology
Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
En un mundo cada vez más impulsado por los datos, todas las organizaciones, tanto las empresas privadas, como los organismos públicos, buscan aprovechar su información para tomar decisiones más acertadas, mejorar la eficiencia de sus procesos y cumplir sus objetivos estratégicos. Sin embargo, crear una estrategia de datos efectiva es un desafío que no debe subestimarse.
Con frecuencia, organizaciones de todos los sectores caen en errores comunes que pueden comprometer el éxito de sus estrategias desde el principio. Desde ignorar la importancia del gobierno del dato hasta no alinear los objetivos estratégicos con las necesidades reales de la institución, estos fallos pueden traducirse en ineficiencias, incumplimientos normativos e, incluso, pérdida de confianza por parte de ciudadanos, empleados o usuarios.
En este artículo, exploraremos los errores más habituales en la creación de una estrategia de datos, con el propósito de ayudar tanto a entidades públicas como privadas a evitarlos. Nuestro objetivo es ofrecerles herramientas para construir una base sólida que les permita maximizar el valor de los datos en beneficio de su misión y sus objetivos.
Figura 1. Consejos para diseñar una estrategia de gobierno del dato. Fuente: elaboración propia
A continuación, se detallan algunos de los errores más comunes en la elaboración de una estrategia de datos, justificando su impacto y el grado de afectación que pueden tener en una organización:
Falta de vinculación con los objetivos de la organización y no identificación de las áreas clave
Para que la estrategia de datos sea efectiva en cualquier tipo de organización, es fundamental que esté alineada con sus objetivos estratégicos. Estos objetivos incluyen áreas clave como el incremento de los ingresos, la mejora del servicio, la optimización de costes o la experiencia del cliente/ciudadano. Además, priorizar las iniciativas es esencial para identificar las áreas de la organización que se beneficiarán más de la estrategia de datos. Este enfoque no solo permite maximizar el retorno de la inversión en datos, sino también asegurar que las iniciativas estén claramente conectadas con los resultados deseados, reduciendo posibles brechas entre los esfuerzos en datos y los objetivos estratégicos.
No definir objetivos claros a corto y medio plazo
Definir metas específicas y alcanzables en las etapas iniciales de una estrategia de datos es muy importante para establecer una dirección clara y demostrar su valor desde el principio. Esto impulsa la motivación de los equipos involucrados y genera confianza entre los líderes y las partes interesadas. Priorizar objetivos a corto plazo, como la implementación de un dashboard de indicadores clave o la mejora en la calidad de un conjunto específico de datos críticos, permite obtener resultados tangibles de manera rápida y justifica la inversión en la estrategia de datos. Estos logros iniciales no solo consolidan el respaldo de la dirección, sino que también fortalecen el compromiso de los equipos.
De igual forma, los objetivos a medio plazo son fundamentales para construir sobre los avances iniciales y preparar el terreno para proyectos más ambiciosos. Por ejemplo, la automatización de procesos de generación de informes o la implementación de modelos predictivos para áreas clave pueden ser metas intermedias que demuestren el impacto positivo de la estrategia en la organización. Estos logros permiten medir el progreso, evaluar el éxito de la estrategia y garantizar que esté alineada con las prioridades estratégicas de la organización.
Establecer una combinación de metas a corto y medio plazo asegura que la estrategia de datos mantenga su relevancia a lo largo del tiempo y continúe generando valor. Este enfoque ayuda a la organización a avanzar de manera estructurada, reforzando su posición tanto frente a sus competidores como en el cumplimiento de su misión en el caso de organismos públicos.
No realizar una evaluación de madurez previa para definir la estrategia lo más acotada posible
Antes de diseñar una estrategia de datos, es crucial realizar una evaluación previa que permita entender el estado actual de la organización en términos de datos y delimitar el alcance de manera realista y efectiva. Este paso no solo evita que los esfuerzos se dispersen, sino que también asegura que la estrategia esté alineada con las necesidades reales de la organización, maximizando así su impacto. Sin una evaluación previa, es fácil caer en el error de abordar iniciativas demasiado amplias o poco conectadas con las prioridades estratégicas.
Por lo tanto, realizar esta evaluación previa no es solo un ejercicio técnico, sino una herramienta estratégica que asegura que los recursos y esfuerzos estén bien dirigidos desde el principio. Con un diagnóstico claro, la estrategia de datos se convierte en una hoja de ruta sólida, capaz de generar resultados tangibles desde las primeras etapas. Cabe recordar que para realizar esta evaluación de madurez previa a la estrategia se podría utilizar la UNE 0080:2023, centrada en la evaluación de la madurez del gobierno y gestión del dato, proporciona un marco estructurado para esta evaluación inicial. Esta norma permite analizar de manera objetiva los procesos, tecnologías y capacidades de la organización en torno a los datos.
No llevar a cabo iniciativas de gobierno del dato
La definición de una estrategia sólida es fundamental para el éxito de las iniciativas de gobierno del dato. Es esencial contar con un área o unidad responsable del gobierno del dato, como una oficina del dato o un centro de excelencia, desde donde se establezcan las directrices claras y se coordinen las acciones necesarias para alcanzar los objetivos estratégicos comprometidos. Estas iniciativas deben estar alineadas con las prioridades de la organización, asegurando que los datos sean seguros, usables para los fines previstos y cumplan con la normativa y legislación vigente.
Un marco sólido de gobierno del dato es clave para garantizar la consistencia y la calidad de los datos, fortaleciendo la confianza en los informes y análisis que generan tanto valor interno como externo. Además, un enfoque adecuado reduce riesgos como el incumplimiento normativo, promoviendo un uso efectivo de los datos y protegiendo la reputación de la organización.
Por ello, es importante diseñar estas iniciativas con un enfoque integral, priorizando la colaboración entre las distintas áreas y alineándolas con la estrategia global de datos. Para profundizar en cómo estructurar un sistema de gobierno del dato efectivo, puedes consultar esta serie de artículos: De la estrategia del dato al sistema de gobierno de datos – Parte 1.
Enfocarse exclusivamente en la tecnología
Muchas organizaciones tienen la opinión errónea de que la adquisición de herramientas y plataformas sofisticadas será la solución definitiva a sus problemas de datos. Sin embargo, la tecnología constituye solo una parte del ecosistema. Sin los procesos adecuados, un marco de gobernanza y, por supuesto, personas, incluso la mejor tecnología fracasará. Esto es problemático porque puede dar lugar a enormes inversiones sin un retorno claro, así como a frustración entre los equipos cuando no obtienen los resultados esperados.
No involucrar a todas las partes interesadas ni definir los roles y responsabilidades
Una estrategia de datos sólida necesita sumar a todos los actores relevantes, ya sea en una administración pública o en una empresa privada. Cada área, departamento o unidad tiene una visión única de cómo los datos pueden ser útiles para alcanzar objetivos, mejorar servicios o tomar decisiones más informadas. Por eso, involucrar a todas las partes interesadas desde el principio no solo enriquece la estrategia, sino que también asegura que se alineen con las necesidades reales de la organización.
Asimismo, definir roles y responsabilidades claras es clave para evitar confusiones y duplicidades. Al saber quién es responsable de los datos, quién los gestiona y quién los usa, se garantiza un flujo de trabajo más eficiente y se fomenta la colaboración entre equipos. Tanto en el ámbito público como en el privado, este enfoque ayuda a maximizar el impacto de la estrategia de datos, asegurando que los esfuerzos estén coordinados y enfocados hacia un objetivo común.
No establecer métricas claras de éxito
Establecer indicadores clave de rendimiento (KPI) es fundamental para evaluar si las iniciativas están generando valor. Los KPI permiten demostrar los resultados de la estrategia de datos, reforzando el apoyo de los líderes y fomentando la disposición a seguir invirtiendo en el futuro. Al medir el impacto de las acciones, las organizaciones pueden garantizar la sostenibilidad y el desarrollo continuo de su estrategia, asegurando que esté alineada con los objetivos estratégicos y que aporte beneficios tangibles.
No posicionar la calidad de los datos en el centro
Una estrategia de datos sólida debe construirse sobre una base de datos confiables y de alta calidad. Ignorar este aspecto puede llevar a decisiones equivocadas, procesos ineficientes y pérdida de confianza en los datos por parte de los equipos. La calidad de datos no es solo un aspecto técnico, sino un habilitador estratégico: garantiza que la información utilizada sea completa, consistente, válida y oportuna.
Integrar la calidad de datos desde el principio implica definir métricas claras, establecer procesos de validación y limpieza, y asignar responsabilidades para su mantenimiento. Además, al colocar la calidad de datos en el centro de la estrategia, las organizaciones pueden desbloquear el verdadero potencial de los datos, asegurando que estos respalden con precisión los objetivos de negocio y refuercen la confianza de los usuarios. Sin calidad, la estrategia pierde fuerza y se convierte en una oportunidad desperdiciada.
No gestionar el cambio cultural ni la resistencia al cambio
La transición hacia una organización orientada a datos requiere no solo herramientas y procesos, sino también un enfoque claro en la gestión del cambio para involucrar a los empleados. Promover una mentalidad abierta hacia las nuevas prácticas es clave para garantizar la adopción y el éxito de la estrategia. Al priorizar la comunicación, la formación y el compromiso de los equipos, las organizaciones pueden facilitar este cambio cultural, asegurando que todos los niveles trabajen alineados con los objetivos estratégicos y maximizando el impacto de la estrategia de datos.
No planificar para la escalabilidad
Es fundamental que las organizaciones consideren cómo su estrategia de datos puede escalar a medida que crece el volumen de información. Diseñar una estrategia preparada para manejar este crecimiento asegura que los sistemas puedan soportar el aumento de datos sin necesidad de reestructuraciones futuras, lo que optimiza recursos y evita costos adicionales. Al planificar pensando en la escalabilidad, las organizaciones pueden garantizar una eficiencia operativa sostenible a largo plazo y aprovechar al máximo el valor de sus datos a medida que evolucionan sus necesidades.
Falta de actualización y revisión continua de la estrategia
Los datos y las necesidades de las organizaciones están en constante evolución, por lo que es importante revisar y adaptar regularmente la estrategia para mantenerla relevante y efectiva. Una estrategia de datos flexible y actualizada permite responder de manera ágil a nuevas oportunidades y desafíos, asegurando que siga generando valor a medida que cambian las prioridades del mercado o de la organización. Este enfoque proactivo garantiza que la estrategia continúe alineada con los objetivos estratégicos y refuerza su impacto positivo a largo plazo.
Como conclusión, es importante destacar que el éxito de una estrategia de datos radica en su capacidad para alinearse con los objetivos estratégicos de la organización, estableciendo metas claras y fomentando la participación de todas las áreas involucradas. Un buen sistema de gobierno del dato, acompañado de métricas que permitan medir su impacto, es la base para garantizar que la estrategia genere valor y sea sostenible a lo largo del tiempo.
Además, abordar aspectos como la calidad de los datos, el cambio cultural y la escalabilidad desde el inicio es esencial para maximizar su efectividad. Enfocarse exclusivamente en tecnología o descuidar estos elementos puede limitar los resultados y poner en riesgo la capacidad de la organización para adaptarse a nuevas oportunidades y desafíos. Finalmente, revisar y actualizar la estrategia de manera continua asegura su relevancia y refuerza su impacto positivo.
Para profundizar en cómo estructurar una estrategia de datos eficaz y su conexión con un sistema de gobierno del dato sólido, te recomendamos explorar los artículos publicados en datos.gob.es: De la estrategia del dato al sistema de gobierno de datos – Parte 1 y Parte 2. Estos recursos complementan los conceptos presentados en este artículo y ofrecen una visión práctica para su implementación en cualquier tipo de organización.
Contenido elaborado por Dr. Fernando Gualo, Profesor en UCLM y Consultor de Gobierno y Calidad de datos. El contenido y el punto de vista reflejado en esta publicación es responsabilidad exclusiva de su autor.
El 28 de noviembre se celebró en Sevilla el II Foro de encuentro del Gobierno y las Comunidades Autónomas en torno al dato, organizado por la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA), en colaboración con el Instituto de Estadística y Cartografía de Andalucía (IECA) y la Agencia Digital de Andalucía (ADA). En él participaron casi todas las comunidades autónomas, reflejando su compromiso con el dato como motor estratégico de la transformación digital.
El programa abordó temas clave, como las lecciones aprendidas en la implantación del gobierno del dato, el impacto de su uso ético, y el potencial la colaboración público-privada en el despliegue de los espacios de datos sectoriales, incidiendo en el Plan de Impulso de Espacios de Datos Sectoriales recientemente presentado por el Ministerio para la Transformación Digital el pasado 21 de noviembre.
A continuación, te resumimos las claves del encuentro.
Un espacio para intercambiar experiencias, casos de éxito y aprendizajes
La cita reunió a más de 70 expertos de unidades de la Administración General del Estado y de 15 comunidades autónomas y la Ciudad Autónoma de Melilla, que desarrollan su actividad en torno al uso y gestión del dato en sus organizaciones. El objetivo era poner en común las experiencias en este ámbito y compartir los casos de éxito y los aprendizajes derivados de la implantación de iniciativas de gobierno del dato, promoviendo la colaboración entre administraciones para mejorar la competitividad y la eficiencia digital futura.
El foro fue inaugurado por el Consejero de Presidencia, Interior, Diálogo Social y Simplificación Administrativa de la Junta de Andalucía, y la Directora General del Dato del Ministerio para la Transformación Digital y de la Función Pública, y fue clausurado por el Director del IECA.
La jornada se estructuró a través de tres mesas redondas con 15 ponentes. Los asistentes pudieron contestar también diversas cuestiones relacionadas con la temática de cada una de estas mesas, con el fin de conocer su percepción al respecto. Este formato facilitó un intercambio de ideas fructífero y enriquecedor que permitió a los asistentes explorar temas clave.
- Mesa 1. “Experiencias de implantación del Gobierno del Dato: Lecciones aprendidas”. La primera mesa redonda se centró en exponer diferentes experiencias en torno al gobierno del dato. Los ponentes compartieron los retos afrontados y las lecciones prácticas extraídas, con el objetivo de servir como ejemplo y punto de reflexión para iniciativas similares que los participantes pudieran abordar en el futuro. Se recalcó la importancia de contar con apoyo al más alto nivel y de utilizar los frameworks existentes, como las especificaciones UNE o la metodología DAMA. También se insistió en la necesidad de no centrarse exclusivamente en tecnología, dando respuesta también al cambio cultural y organizacional, y estableciendo procesos y estructuras que perduren en el tiempo.
Figura 1. Ponentes de la mesa 1 del Segundo Foro de encuentro del Gobierno y las Comunidades Autónomas en torno al dato.
- Mesa 2. "Datos con propósito: Historias de éxito de un uso ético y confiable del dato". La segunda mesa se enfocó en presentar resultados concretos obtenidos a partir de un uso ético y confiable de los datos. Los ponentes compartieron sus trayectorias y los logros alcanzados, ilustrando las amplias posibilidades que un dato bien gobernado y gestionado puede generar en términos de servicio al ciudadano y mejora de la Administración pública. Se destacó el trabajo por hacer respecto a la cantidad y calidad de los datos, sin perder el foco del objetivo futuro, que es resolver los problemas de hoy mediante proyectos sostenibles.
Figura 2. Ponentes de la mesa 2 del Segundo Foro de encuentro del Gobierno y las Comunidades Autónomas en torno al dato.
- Mesa 3. "Espacios de datos desde una óptica de colaboración público-privada y de puesta en valor del dato público". La tercera y última mesa redonda profundizó en el paradigma de los espacios de datos. Se hizo especial énfasis en la colaboración público-privada y en cómo poner en valor el dato público. Un punto destacado de esta sesión fue la presentación por parte de la Dirección General del Dato del Plan de Impulso de Espacios de Datos Sectoriales. Este plan busca desplegar espacios de datos a lo largo de los diferentes sectores productivos, subrayando el valor fundamental que un dato público de calidad puede tener en su implementación efectiva.
Figura 3. Ponentes de la mesa 3 del Segundo Foro de encuentro del Gobierno y las Comunidades Autónomas en torno al dato.
En conjunto, estas mesas redondas no solo proporcionaron una plataforma para el intercambio de conocimientos y experiencias, sino que también sentaron las bases para futuras colaboraciones y proyectos innovadores en el ámbito de la gestión y gobernanza de datos en la Administración pública española.
Los asistentes valoraron muy positivamente la amplia variedad de roles que participaron, dando diferentes visiones a algo tan complejo como es el gobierno del dato, que incluye muchos enfoques y competencias diferentes. La percepción generalizada es que las experiencias compartidas sirven a los demás para intentar esquivar las barreras que otros han tenido que sortear previamente y llegar más rápido a la meta final, que no es otra que dar mejor servicio e implantar mejores políticas públicas para la ciudadanía mediante un gobierno que se base en datos.
Conclusiones del Foro
Algunas de las conclusiones obtenidas fueron:
- Es necesario apostar por la calidad del dato. Sin un dato de calidad, bien gobernado y gestionado, difícilmente se conseguirán soluciones de valor, por ejemplo, en el ámbito de la inteligencia artificial.
- Se debe invertir en gobernanza de los datos garantizando proyectos sostenibles. El gobierno del dato no trata solo de tecnología, sino de negocio y servicios. Requiere un esfuerzo considerable por parte de las organizaciones para crear datos que reflejen la realidad y sean realmente útiles para la toma de decisiones, acabando con los silos y poniendo en marcha servicios orientados a la ciudadanía. Para ello, se recomienda apoyarse en los marcos conceptuales existentes, orientados a procesos y estructuras organizativas que perduren en el tiempo.
- Las comunidades autónomas pueden ayudar al despliegue del Plan de Impulso de los Espacios de datos desde una óptica de colaboración público-privada y beneficiarse de sus actuaciones.
- Hay que incidir en la cultura del dato en las organizaciones. El objetivo es incorporar el gobierno del dato a las diferentes áreas de negocio, apoyando los objetivos organizativos, consiguiendo que la cultura del dato cale en la organización y se perciba como algo transversal que aporta valor tanto a los diferentes sectores como al conjunto de la administración y de la sociedad.
Próximas actuaciones
Tras el éxito obtenido en la primera edición, celebrada en Navarra en 2023, el foro se consolida como un espacio de referencia para el intercambio de experiencias y buenas prácticas en la gestión del dato, imprescindible para aquellos que buscan liderar el futuro de la gestión de datos en las administraciones públicas.
La jornada concluyó con una propuesta de continuidad, destacando la necesidad de crear una comunidad de intercambio de conocimiento entre ediciones. Además, el Principado de Asturias se postuló como anfitrión de la tercera edición del foro, a celebrar en 2025, lo que demuestra el creciente interés por seguir consolidando este espacio de cooperación interinstitucional en torno al dato.
Este episodio se centra en el gobierno del dato y en explicar por qué es importante contar con normas, políticas y procesos que permitan asegurar que los datos sean correctos, fiables, seguros y útiles. Para ello, analizamos la Ordenanza Tipo sobre Gobierno del Dato de la Federación Española de Municipios y Provincias, conocida como la FEMP, y su aplicación en un organismo público como es el Ayuntamiento de Zaragoza. De ello se encargarán los siguientes invitados:
- Roberto Magro Pedroviejo, Coordinador del Grupo de Trabajo de Datos Abiertos de la Red de Entidades Locales por la Transparencia y la participación Ciudadana de la Federación Española de Municipios y Provincias y funcionario público del Ayuntamiento de Alcobendas.
- María Jesús Fernández Ruiz, Jefa de la Oficina Técnica de Transparencia y Gobierno Abierto del Ayuntamiento de Zaragoza.
Resumen de la entrevista
1. ¿Qué es el gobierno del dato?
Roberto Magro Pedroviejo: Nosotros, en el ámbito de las Administraciones Públicas, definimos el gobierno del dato como un mecanismo organizativo y técnico que aborda de forma integral las cuestiones relativas al uso de los datos en nuestra organización. Abarca todo el ciclo de vida de los datos, es decir, desde su creación hasta su archivo o incluso, si fuera necesario, su purga y destrucción. Su propósito es que los datos sean de calidad y estén disponibles para todos aquellos que los precisen: a veces, será solo la propia organización internamente, pero otras muchas veces será la ciudadanía en general, los reutilizadores, el ámbito universitario, etc. El gobierno del dato debe facilitar el derecho de acceso a los mismos. En definitiva, el gobierno del dato permite dar respuesta al objetivo de gestionar eficaz y eficientemente nuestra administración y conseguir mayor interoperabilidad entre todas las administraciones.
2. ¿Por qué es importante este concepto para un municipio?
María Jesús Fernández Ruiz: Porque hemos comprobado que, dentro de las organizaciones, tanto públicas como privadas, la obtención y la gestión de los datos muchas veces se realizan sin seguir criterios homogéneos, estándares o las técnicas adecuadas. Esto se traduce en una situación difícil y costosa, que se agrava cuando intentamos desarrollar un espacio de datos o desarrollar servicios relacionados con los datos. Por lo tanto, es necesario un paraguas que nos obligue a la gestión del dato, como ha comentado Roberto, eficaz y eficiente, siguiendo estándares y criterios homogéneos, lo que nos facilita la interoperabilidad.
3. Para dar respuesta a este reto, es necesario establecer una serie de directrices que ayuden a las administraciones locales a establecer un marco legal. Por ello se ha creado la Ordenanza Tipo sobre Gobierno del Dato de la FEMP. ¿Cómo fue el proceso de desarrollo de este documento de referencia?
Roberto Magro Pedroviejo: Dentro del Grupo de Datos Abiertos de la Red que se creó allá por el año 2017, una de las personas con la que hemos contado y que ha aportado muchísimas ideas, ha sido María Jesús, desde el Ayuntamiento de Zaragoza. Salíamos del COVID, justo en marzo de 2021, y recuerdo perfectamente la reunión que tuvimos en una sala que nos prestó el Ayuntamiento de Madrid en el Palacio de Cibeles. María Jesús estaba en Zaragoza y entró por videoconferencia a esa reunión. Ese día María Jesús, viendo qué cosas y qué trabajos podíamos abordar dentro de este grupo multidisciplinar, propuso crear una ordenanza tipo. La FEMP y la Red ya tenían experiencia en crear ordenanzas tipo para intentar mejorar, y sobre todo ayudar, a los municipios y entidades locales o diputaciones a que crearan normativas.
Empezamos a trabajar un equipo multidisciplinar, liderado por José Félix Muñoz Soro, de la Universidad de Zaragoza, que es la persona que ha coordinado el texto normativo que hemos publicado. Y unos meses más tarde, concretamente en enero de 2022, hicimos ya una quedada. Nos reunimos presencialmente en el Ayuntamiento de Zaragoza y ahí empezamos a fijar las bases de por qué la ordenanza tipo, qué tipo de articulado debía ser, qué tipo de estructura debía tener, etc. Y nos reunimos un equipo, como decíamos, multidisciplinar, en el que estaban expertos en gobernanza del dato y juristas de la Universidad de Zaragoza, personal de la Universidad Politécnica de Madrid, compañeras de la Universidad Politécnica de Valencia, profesionales del ámbito público local y periodistas expertos en datos abiertos.
El primer borrador se publicó en mayo/junio del año 2022. Además, se dispuso a consulta pública a través de la plataforma que tiene el Ayuntamiento de Zaragoza de Participación Ciudadana. Nos pusimos en contacto con unos 100 expertos de ámbito nacional y recibimos como unas 30 aportaciones de mejoras, de las cuales se incluyeron la mayoría, y que permitieron que a finales del año pasado tuviéramos ya el texto definitivo, que se pasó al área jurídica de la FEMP para validarlo. En febrero del año 2024 se publicó la normativa, que ya está dispuesta en la página web de la Red para su descarga de forma gratuita.
Quiero aprovechar esta oportunidad para agradecer el excelente trabajo realizado por todas las personas participantes en el equipo que desde sus respectivas ópticas han trabajado de forma desinteresada para crear este conocimiento y compartirlo con todas las administraciones públicas españolas.
4. ¿Cuáles son los beneficios que se esperaban de la ordenanza?
María Jesús Fernández Ruiz: Para mí, uno de los objetivos principales de la ordenanza, y creo que es un gran instrumento, es que recoge el ciclo completo de vida del dato. Se recoge desde que se genera el dato, cómo se gestiona el dato, cómo se facilita el dato, cómo se tiene que guardar la documentación asociada al dato, cómo se tienen que guardar los históricos, etc. Lo más importante es que establece unos criterios para gestionar el dato respetando todo su ciclo de vida.
La ordenanza también establece unos principios, que no son muchos, pero que son muy importantes y que nos van marcando, que nos hablan, por ejemplo, de la gobernanza efectiva del dato y nos describe lo importante que es establecer procesos a la hora de generar el dato, de gestionar el dato, de facilitar el dato, etc.
También es otro principio muy importante, que lo ha comentado Roberto, el tratamiento ético del dato. Es decir, la importancia de recoger la trazabilidad del dato, de ver por dónde se mueve el dato y de respetar los derechos de las personas físicas y jurídicas.
Otro principio muy importante y que genera mucho ruido en las instituciones es que hay que gestionar el dato desde la fase de diseño, la gestión del dato por defecto. Muchas veces, cuando empezamos a trabajar los datos con criterios de apertura, lo estamos ya haciendo a la mitad del ciclo de vida del dato o casi al final. Tenemos que diseñar la gestión del dato desde el principio, desde el origen. Esto nos ahorra muchísimos recursos, tanto humanos como económicos.
Otro tema importante para nosotros y que defendemos dentro de la ordenanza es que la administración tiene que estar orientada al dato. Tiene que ser una administración que va a diseñar sus políticas basada en la evidencia. Una administración que va a considerar el dato como un activo estratégico y por lo tanto facilitará los recursos que sean necesarios.
Y otro tema, que comentamos muchas veces también con Roberto, es la importancia de la cultura del dato. Cuando trabajamos y publicamos el dato, un dato que es interoperable, que es fácil de reutilizar, que se comprende, etc. no podemos detenernos ahí, sino que hay que hablar de la cultura del dato, que también viene recogida en la ordenanza. Es importante que difundamos qué es un dato, qué es un dato de calidad, cómo acceder al dato, cómo utilizar el dato. Es decir, cada vez que publiquemos un conjunto de datos, debemos plantearnos actuaciones relacionadas con la cultura del dato.
5. El Ayuntamiento el de Zaragoza ha sido pionero en la aplicación de esta ordenanza. ¿Cómo ha sido este proceso de implementación y qué retos os estáis encontrando?
María Jesús Fernández Ruiz: Este reto ha sido muy interesante y además nos ha ayudado a mejorar. Fue muy rápido al principio y ya en junio íbamos a presentar la ordenanza a lo que es el gobierno de la ciudad. Hay un proceso donde los diferentes partidos hacen votos particulares sobre la ordenanza y dicen “este punto me gusta”, “este punto me parece más interesante”, “este habría que modificarlo”, etc. Nuestra sorpresa es que hemos tenido más de 50 votos particulares a la ordenanza, después de haber pasado el proceso de consulta pública y de haber salido en todos los medios de comunicación, que también fue enriquecedor, y ha habido que contestar a estos votos. La verdad es que nos ha ayudado a mejorar y, en estos momentos, estamos esperando a que vaya a gobierno.
Cuando me dicen ¿cómo te sientes María Jesús? La respuesta es bien, vamos avanzando, porque gracias a esa ordenanza que está pendiente de aprobarse en gobierno del Ayuntamiento de Zaragoza, ya hemos sacado una serie de contratos. Uno que es importantísimo para nosotros: elaborar un inventario de datos y de fuentes de información de nuestra institución, que creemos que es el instrumento básico para gestionar el dato, saber qué datos tenemos, dónde se originan, qué trazabilidad tienen, etc. Por lo tanto, no hemos parado. Gracias a ese marco todavía no aprobado, nosotros hemos podido avanzar a base de contratos o algo que es básico en una institución: la definición de los profesionales que tienen que participar en la gestión del dato.
6. Mencionabas la necesidad de elaborar un inventario de conjuntos de datos y fuentes de información, ¿de qué tipo de conjuntos de datos estamos hablando y qué información descriptiva debe incluirse de cada uno?
Roberto Magro Pedroviejo: Hay un core, digamos un núcleo central, con una serie de conjuntos de datos que nosotros recomendamos en la propia ordenanza, haciendo referencia a otro trabajo que se hace en el grupo de datos abiertos, que es el de recomendar 80 conjuntos de datos que podríamos publicar en las administraciones públicas españolas. Ahí, además, se pone el foco en los conjuntos de datos de alto valor, los que más pueden beneficiar a la gestión municipal o pueden beneficiar aportando valor social y económico a la ciudadanía en general y al ámbito empresarial y los reutilizadores. Cualquier administración que quiera empezar a trabajar el tema de los conjuntos de datos y se pregunte por dónde empezar a publicar o gestionar datos, se tiene que centrar, sobre todo, bajo mi punto de vista, en tres apartados clave en una en una ciudad:
- Los datos de las personas, es decir, nuestro queridísimo padrón: quiénes son las personas que vive en nuestra ciudad, sus edades, sexo, direcciones postales, etc.
- Los datos urbanísticos y de territorio, es decir, dónde viven esas personas, cuál es la delimitación territorial que tiene el municipio, etc. Todo lo que tiene que ver con esos conjuntos de datos relacionados con las calles, los viales, incluso el alcantarillado, las vías públicas o el alumbrado, es necesario inventariarlo, conocer dónde están esos datos y tenerlos, como ya hemos dicho, actualizados, estructurados, accesibles, etc.
- Y, por último, todo lo que tiene que ver con cómo se gestiona la ciudad, por supuesto, con el ámbito tributario y presupuestario.
Es decir: el ámbito de las personas, el ámbito del territorio y el ámbito tributario. Eso es por lo que nosotros recomendamos empezar. Y al final ese inventario de conjuntos de datos lo que hace es describir cuáles son, dónde están, cómo están y será la primera base sobre la que empezar a construir el gobierno del dato.
María Jesús Fernández Ruiz: Otro tema que también es muy fundamental, que se recoge en la ordenanza, es definir los conjuntos de datos maestros. Simplemente una pequeña anécdota. A la hora de crear un espacio de datos espaciales, es básico el callejero, la cartografía base y el portalero. A la hora de reunirnos a trabajar, se creó una comisión técnica y consideramos que estos eran conjuntos de datos maestros del Ayuntamiento de Zaragoza. La calidad del dato viene determinada por un concepto que viene en la ordenanza, que es respetar la soberanía del dato: quien crea el dato es el soberano del dato y él es el responsable de la calidad del dato. Hay que respetar la soberanía y eso determina la calidad.
Entonces descubrimos que, en el Ayuntamiento de Zaragoza, teníamos cinco identificadores distintos de portal. Para mejorar esta situación, definimos un identificador único descriptivo que declaramos como dato maestro. De esta forma, todas las entidades municipales van a utilizar el mismo identificador, el mismo callejero, la misma cartografía, etc. y eso hará que todos los servicios relacionados con la ciudad sean interoperables.
7. ¿Qué mejoras adicionales creéis que podrían incluirse en futuras revisiones de la ordenanza?
Roberto Magro Pedroviejo: La propia ordenanza, al ser un instrumento normativo, está adaptada a la normativa actual española y europea. Es decir, habrá que estar muy atentos. -ya lo estamos- a todo lo que se está publicando sobre inteligencia artificial, espacios de datos y datos abiertos. La ordenanza se tendrá que ir adaptando porque es un marco normativo para dar cumplimiento a la legislación presente, pero si ese marco normativo cambia, haremos las modificaciones oportunas para su cumplimiento.
También me gustaría resaltar, dos cosas. Ha habido algún ayuntamiento más y una universidad, concretamente el Ayuntamiento de San Feliu de Llobregat y la Universidad de La Laguna, interesados en la ordenanza. Hemos recibido más peticiones para conocer un poquito más la ordenanza, pero lo más valientes han sido el Ayuntamiento de Zaragoza, que fueron los que la propusieron y son los que están sufriendo en sus carnes el proceso de publicación y aprobación definitiva. De esa experiencia que está obteniendo el propio Ayuntamiento de Zaragoza seguramente aprenderemos todos, sobre cómo abordarlo en cada una de las administraciones, porque nos copiamos y podemos ir más rápido. Yo creo que, poco a poco, una vez que Zaragoza publique la ordenanza, otros ayuntamientos y otras instituciones se irán sumando. Primero porque ayuda a organizar la casa por dentro. Ahora que estamos en un proceso de transformación digital que no es rápido, sino que es un proceso largo, este tipo de ordenanzas nos va a ayudar, sobre todo, a ordenar los datos que tenemos en la administración. Los datos y la gestión del gobierno de los datos nos van a poder ayudar a mejorar la gestión pública hacia dentro de la propia organización, pero sobre todo hacia los servicios que se prestan a la ciudadanía.
Y lo último que quería remarcar, y es muy importante también, es que, si los datos no son de calidad, no están actualizados y no están metadatados, poco haremos o nada en la administración desde el punto de vista de la inteligencia artificial, porque la inteligencia artificial se va a basar en los datos que tengamos y si no son correctos ni están actualizados, el resultado y las predicciones que nos pueda hacer la IA no nos van a servir para nada en la administración pública.
María Jesús Fernández Ruiz: Decir que es muy importante lo que acaba de decir Roberto sobre la inteligencia artificial y los datos de calidad. Y añadir dos cosas que estamos aprendiendo a la hora de implementar esta ordenanza. La primera sería la necesidad de definir procesos, es decir, la gestión eficiente de los datos se tiene que basar en procesos. Y otra cosa que yo creo que tendríamos que hablar, y hablaremos dentro de la FEMP, es la importancia de definir los roles de los diferentes profesionales que participan en la gestión del dato. Hablamos de gestor de los datos, de proveedor de los datos, proveedor tecnológico, etc. Si yo tuviera ahora la ordenanza, hablaría de esa definición de los roles que tienen que participar en una eficiente gestión de los datos. Es decir, procesos y profesionales.
Clips de la entrevista
Clip 1. ¿Qué es el gobierno del dato?
Clip 2. ¿En qué consiste la Ordenanza Tipo sobre Gobierno del Dato de FEMP?
El reciente Reglamento (UE) 2023/2854 del Parlamento Europeo y del Consejo de 13 de diciembre de 2023 sobre normas armonizadas para un acceso justo a los datos y su utilización (Data Act) incorpora importantes novedades en la normativa europea a la hora de facilitar el acceso a los datos generados por los productos conectados y los servicios relacionados. Además de establecer medidas para impulsar la interoperabilidad en los espacios de datos, los servicios de tratamiento de datos y los contratos inteligentes, la nueva regulación también incorpora una importante novedad al regular la puesta a disposición de datos a favor de las entidades públicas en situaciones excepcionales.
¿Una nueva orientación en la regulación europea?
Con la normativa sobre reutilización de la información del sector público se pretendía fundamentalmente facilitar el acceso a los datos generados por las entidades del sector público, de manera que se impulsara el desarrollo de servicios de valor añadido basados en la innovación tecnológica. De hecho, tal y como se afirma expresamente en la Directiva de 2019, la reforma que llevó a cabo se justificaba en gran medida por la necesidad de actualizar el marco normativo aplicable a los nuevos desafíos que planteaba la tecnología digital y, en particular, la Inteligencia Artificial o el Internet de las Cosas.
Posteriormente, al amparo de la Estrategia Europea de Datos se aprobó una regulación sobre gobernanza, se han impulsado los espacios de datos y, asimismo, se ha publicado hace tan solo unos meses la Data Act. Esta última implica un importante giro desde el punto de vista de los sujetos afectados ya que, a diferencia de las regulaciones anteriores centradas en las obligaciones de las entidades del sector público, por una parte, disciplina las relaciones entre privados y, por otra, establece una importante medida destinada a que las entidades privadas sean quienes proporcionen datos a los organismos públicos en ciertas condiciones singulares.
¿En qué situaciones han de proporcionarse los datos?
En primer lugar, es necesario enfatizar que la Data Act no tiene por objeto ampliar los supuestos en que las entidades privadas tienen que entregar datos a los organismos públicos en cumplimiento de sus potestades de supervisión y cumplimiento normativo, como puede ser el caso de la prevención, investigación e imposición de sanciones penales o administrativas. Así pues, no afecta a las obligaciones que los sujetos privados ya tengan que cumplir para que, en base a los datos solicitados, los organismos públicos puedan ejerzan su actividad habitual en el ejercicio de una misión de servicio público como las indicadas.
Se trata, en cambio, de una regulación que pretende hacer frente a situaciones excepcionales, imprevisibles y limitadas en el tiempo, que pueden referirse:
- bien a la necesidad de obtener los datos para responder a una emergencia pública que no se encuentren disponibles por medios alternativos en condiciones equivalentes, como puede ser el caso del suministro de datos en entornos y plataformas ya existentes que se hubiesen desplegado para otra finalidad (por ejemplo: prestación de un servicio, ejecución de un proyecto de colaboración…);
- o, en su caso, a la imposibilidad por parte de la entidad pública de disponer de datos específicos para hacer frente a una tarea asignada por la ley y realizada en interés público cuando se hayan agotado todos los demás medios a su disposición, como puede ser el caso de la compra de datos no personales en el mercado por el organismo público, la consulta a una base de datos púbicas o su obtención en base a obligaciones previamente existentes para los sujetos privados.
En este último supuesto, es decir, cuando la necesidad de disponer de los datos no se justifique por la exigencia de responder a situaciones de emergencia, el objeto de la solicitud no podrá referirse a datos de carácter personal salvo que, por la propia naturaleza de la petición, sea imprescindible poder conocer en algún momento la identidad de su titular. En ese caso será necesario proceder a la seudonimización. En consecuencia, dado que los datos no estarían anonimizados, se habrán de tener en cuenta las garantías que establece la normativa sobre protección de datos. En concreto:
- Los datos se tendrán que separar de su titular para que este no pueda ser identificado por otra persona no autorizada.
- Habrán de adoptarse medidas técnicas y organizativas que impidan la reidentificación del titular, salvo por quien está habilitado para ello cuando resulte necesario.
¿Para qué finalidades no se pueden utilizar los datos?
Salvo que la entidad privada que los proporcione lo hubiese autorizado expresamente, los organismos públicos no pueden emplear los datos para satisfacer una finalidad distinta a la que justificó su puesta a disposición. Sin embargo, en el ámbito de la estadística oficial o cuando se necesiten llevar a cabo actividades de investigación científica o análisis que no puedan realizar por sí mismas las propias entidades públicas que solicitan los datos, se permite que se puedan ceder a otras entidades para realizar dichas actividades. Ahora bien, esta posibilidad presenta importantes limitaciones, ya que dichas actividades deben resultar compatibles con los fines para los que se obtuvieron los datos, lo que impediría por ejemplo utilizar los datos para entrenar algoritmos que luego puedan emplearse para el ejercicio de otras funciones o competencias propias de la entidad pública no relacionadas con la investigación o el análisis. Asimismo, los datos sólo podrán ponerse a disposición de entidades sin ánimo de lucro o que satisfagan fines de interés público como pueden ser las universidades y los organismos públicos de investigación.
Tampoco se podrán utilizar los datos para desarrollar o mejorar productos y servicios relacionados con la entidad que los entrega, ni compartirlos con terceros para dichos fines. Esto impediría, por ejemplo, que utilicen los datos para entrenar sistemas de Inteligencia Artificial por parte de la entidad pública o uno de sus contratistas que afecten negativamente al objeto de la actividad habitual de la entidad que los proporcionó.
Por último, los datos obtenidos en aplicación de esta regulación no pueden ponerse a disposición de otros sujetos al amparo de la normativa sobre datos abiertos y reutilización del sector público, de manera que su aplicación queda excluida expresamente.
¿Qué garantías se establecen para el titular de los datos obligado a entregarlos?
La petición de los datos deberá formularse por el organismo público mediante una solicitud formal en la que será preciso determinar los datos necesarios y justificar por qué se dirige a la entidad que recibe el requerimiento. Además, será imprescindible explicar las razones excepcionales que sustenten la solicitud y, en concreto, por qué no es posible obtener los datos por otra vía.
Con carácter general, el titular de los datos tiene derecho a formular una reclamación frente a la solicitud de los datos, que habrá de dirigir a la autoridad competente designada por cada Estado para garantizar la aplicación del Reglamento y que figurará en el registro que establezca la Comisión Europea.
Finalmente, en ciertos casos, se reconoce al titular de los datos el derecho a solicitar una compensación razonable por los costes y un margen razonable necesario para poner los datos a disposición de la entidad pública, si bien esta última puede impugnar la compensación solicitada ante la autoridad antes referida. Sin embargo, cuando la petición de acceso a los datos se justifique en la necesidad de responder a emergencias públicas o la salvaguarda de un interés público significativo, no se contempla compensación alguna a los titulares de los datos. Este sería el caso de un acontecimiento de origen natural (terremotos, riadas…) o situaciones imprevistas y graves que afectan al normal funcionamiento social en ámbitos esenciales como la salud o el orden público.
En definitiva, la obligación de proporcionar datos a las entidades públicas por parte de los sujetos privados en estos casos va más allá del objetivo de impulsar un mercado único de datos a nivel de la Unión Europea, finalidad que en gran medida había sustentado el avance en la regulación en materia de datos en los últimos años. Sin embargo, la gravedad de la situación generada como consecuencia del COVID-19 ha evidenciado la necesidad de establecer un marco normativo general que garantice que las entidades públicas puedan disponer de los datos necesarios para hacer frente a situaciones excepcionales por razones de interés público. En todo caso, la efectividad de estas medidas sólo podrá comprobarse a partir de septiembre de 2025, cuando está prevista su efectiva aplicación.
Contenido elaborado por Julián Valero, catedrático de la Universidad de Murcia y Coordinador del Grupo de Investigación “Innovación, Derecho y Tecnología” (iDerTec). Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
La Ley 37/2007 sobre reutilización de la información del sector público recoge la obligatoriedad de las administraciones públicas de contar con un catálogo de datos propio que, a su vez, contribuirá a nutrir el catálogo nacional (datos.gob.es). Algunos portales autonómicos, además de albergar conjuntos de datos, ofrecen contenido, organizan eventos y firman alianzas en pro de difundir la cultura del dato. Analizamos el caso de Catalunya con su portal de datos abiertos y su compromiso durante los últimos años.
Datos abiertos en Catalunya: historia de los últimos años
Desde la creación de su primer portal de datos abiertos en 2010, la Generalitat de Catalunya ha publicado casi 1.200 conjuntos de datos abiertos.
Su objetivo es fomentar la apertura y accesibilidad de los datos con los que cuenta, colaborando con diversos sectores de la sociedad, incluyendo la academia, el sector privado y la sociedad civil, para maximizar el valor de los datos abiertos y fomentar su uso en la toma de decisiones y el desarrollo de soluciones para los desafíos actuales de la sociedad.
En esta línea, la Generalitat de Catalunya alcanzó un acuerdo de gobierno sobre estrategia de datos abiertos. Este hito sitúa la abertura y reutilización de la información pública en el centro de la relación entre ciudadanía y administración pública catalana. Entre los objetivos de este enfoque, el documento destaca el aprovechamiento de la inteligencia colectiva y la creación de políticas públicas teniendo en cuenta las necesidades de la ciudadanía. A partir de entonces, el Gobierno de Catalunya apuesta por promover su portal de datos abiertos y fomentar su uso siempre respetando los principios del gobierno de datos.
En este sentido, en 2022 el área de Datos Abiertos pasó a formar parte de la Dirección General de Administración Digital, la cual concibe los datos como activo estratégico y palanca de cambio para la administración digital, con el fin último de mejorar los servicios públicos ofrecidos por esta administración. Es en este momento que el área de Datos Abiertos se ve reforzada por el papel estratégico que cobra el dato en el marco de esta administración pública: los datos abiertos pasan a formar parte del ciclo de vida del dato, como un elemento integral y esencial. El Gobierno de los datos en la Generalitat de Catalunya se lleva a cabo mediante el Modelo de Gobierno de los Datos, que establece las directrices en toda la organización, promueve el impulso de la cultura del dato e involucra a todos los agentes clave que deben participar en ese proceso de transformación.
El documento también recoge el compromiso de la Generalitat de Catalunya de adherirse a los principios de la Carta Internacional de Datos Abiertos promovida por la red Open Data Charter (ODC), en la que participan actualmente más de 170 gobiernos de todo el mundo, y que tiene como objetivo integrar la cultura y la práctica de la apertura de datos en los gobiernos. Teniendo en cuenta lo que establece ODC en su Carta Internacional, los datos deben ser:
- Abiertos por defecto
- Actualizados
- Accesibles y reutilizables
- Comparables e interoperables
- Para mejorar la gobernanza y la participación ciudadana
- Para el desarrollo inclusivo y la innovación
El compromiso de la Generalitat de Catalunya por la apertura de los datos del sector público y el fomento de la reutilización también quedó de manifiesto en 2020 cuando entró a formar parte del Open Government Partnership. Esta organización, que apuesta por una gobernanza transparente, participativa, inclusiva y responsable, es referente a nivel mundial en lo que respecta a poner en valor el uso de los datos abiertos para mejorar la sociedad.
El mismo año en el que Open Data Catalunya se suma a ODC también se celebra la primera sesión de Cafè amb Dades: una serie de charlas divulgativas presenciales y en línea en las que se aborda un tema relacionado con los datos abiertos en la Generalitat de Catalunya.
Cafè amb Dades: un espacio para divulgar sobre datos abiertos
Estos eventos que organiza el portal de datos abiertos catalán son un espacio pensado para compartir experiencias y conocimientos sobre datos abiertos y temas relacionados. Las ponencias duran dos horas, se celebran de forma pesencial y virtual y los temas que se abordan dependen de la actualidad y/o el interés de la audiencia que puede proponer sus ideas a través de un buzón de contacto. El Àrea de Dades Obertes de la Direcció General d’Administració Digital organiza estos eventos basados en los siguientes valores:
- Pedagogía: dar a conocer la estrategia de datos abiertos de la Generalitat Catalana y su impacto en diferentes ámbitos.
- Dinamismo: ofrecer ponencias cortas con contenidos comprensibles para todo el mundo.
- Trabajo online: organizar sesiones participativas, abiertas que inviten al diálogo para crear comunidad.
- Aplicación: animar a los asistentes a incorporar el uso de los datos abiertos en su día a día.
Todas las sesiones quedan grabadas y disponibles para el público. Las últimas que se han celebrado versaron sobre cuestiones tan relevantes como la gestión del agua utilizando datos abiertos o los datos con perspectiva de género.
Facilitar la comprensión del dato
La Generalitat de Catalunya reconoce la importancia de publicar datos y facilitar la búsqueda, así como fomentar la comprensión de los datos. Con el objetivo de facilitar la búsqueda de datos por los Objetivos de Desarrollo Sostenible (ODS), la Generalitat de Catalunya llevó a cabo una clasificación de los conjuntos de datos del portal de la Generalitat por cada uno de los ODS al que se puede acceder desde un visor de datos.
Esta clasificación también proporciona información sobre cómo se está alineando la actividad de los departamentos en torno a los ODS y facilita la búsqueda y reutilización de los conjuntos de datos relacionados con los mismos.
Apuesta por la difusión de la cultura del dato
El portal de la Comunidad Autónoma de Catalunya, además de albergar más un millar de conjuntos de datos abiertos y difundir eventos presenciales y virtuales sobre la aplicación de sus conjuntos de datos en diferentes temáticas, ofrece:
- Contenidos que difunden la cultura del dato:
- Sesiones web, con toda la actualidad digital de la administración explicada en vídeos de 30min que se presentan el primer jueves de cada mes.
- Entrevistas a personas expertas en temáticas relacionadas con los datos abiertos.
- Publicaciones especializadas en materia de Administración digital y de Gobierno Abierto.
- Noticias, donde se incluyen las novedades del sector.
- Participación y representación en actividades como:
- Semana del Gobierno abierto
- Eventos por motivo del Open Data Day
- Proyectos de sensibilización y colaboración con la sociedad civil
- Interacción con la comunidad de reutilizadores
- Contacto a través de un formulario de peticiones
- Información y recursos para desarrolladores
El inventario de conjuntos de datos de la Generalitat de Catalunya
Por otro lado, la Generalitat de Catalunya, en el proceso de apertura de datos públicos, ha llevado a cabo una tarea de inventariar los datos, cuya primera fase finalizó en 2022. Este inventario, concebido como un registro único, ordenado y descriptivo de los conjuntos de datos tiene como objetivo coordinar los procesos de apertura de los datos de esta administración.
En esta primera fase, el inventario dotó de una herramienta para consultar de forma sencilla todos los conjuntos de datos disponibles y su información descriptiva, además de dar una visión transversal de la información disponible y un lenguaje único en toda la organización.
Actualmente, se está trabajando en una segunda fase del proyecto, que pasa por actualizar y mantener la información recogido en el inventario, así como ampliarlo a las entidades del sector público.
Si no quieres perderte nada, puedes seguir al portal de datos abiertos de Catalunya en Twitter.
En resumen, la Generalitat de Catalunya cuenta con un acuerdo de gobierno sobre estrategia de datos abiertos, un modelo de gobierno de datos en marcha y presencia en organizaciones internacionales como Open Data Charter u Open Government Partnership. Su compromiso por el acceso y la reutilización de los datos abiertos la sitúan como una de las administraciones públicas referentes en España.
En datos.gob.es nos hacemos eco de las buenas prácticas en materia de datos abiertos y tecnologías relacionadas que existen por todo el territorio español. Si quieres que hablemos de tu iniciativa, escríbenos a dinamizacion@datos.gob.es.
A continuación, se recoge la definición de diversos términos relacionados con los datos y tecnologías relacionadas.
1. Glosario de términos relacionados con datos abiertos.