La aplicación de nuevas técnicas orientadas a la extracción de valor de los datos se ha convertido en una realidad en el entorno actual, acelerándose su transformación en conocimiento para la toma de decisiones. Por ello, es frecuente focalizar la explotación de datos como parte indispensable de su gestión, surgiendo ligado al concepto de su explotación el concepto de espacio de datos, habilitando su compartición, involucrando tanto al sector privado como a los diferentes organismos públicos, ya sean locales, nacionales o internacionales.
Un espacio de datos es un ecosistema donde materializar la compartición voluntaria de los datos de sus participantes dentro de un entorno de soberanía, confianza y seguridad, establecido mediante mecanismos integrados de gobernanza, organizativos, normativos y técnicos. El concepto de soberanía es clave, entendiéndose como la capacidad de un participante de mantener el control sobre sus propios datos, expresando los términos y condiciones que regirán sus usos permitidos.
¿Qué es Gaia – X?
En este contexto, nace la iniciativa de Gaia-X, una iniciativa europea del sector privado para la creación de una infraestructura de datos abierta, federada e interoperable, constituida sobre los valores de soberanía digital y disponibilidad de los datos, y el fomento de la Economía del Dato. El reto es establecer un ecosistema en el que los datos de entidades europeas estén disponibles y sean compartidos en un entorno confiable y gestionado de acuerdo a los principios europeos de descentralización, apertura, transparencia, soberanía e interoperabilidad.
Gaia-X tiene como objetivo el desarrollo de una federación de servicios de datos en la nube, habilitando la cooperación y el intercambio de datos entre empresas y organizaciones a lo largo de la Unión Europea con independencia de los proveedores de infraestructura. Gaia-X define los conceptos técnicos, así como la gobernanza, para la interoperabilidad de conjuntos de datos e infraestructuras de datos, asumiendo el papel de orquestador, mediando entre proveedores y consumidores de datos vía los servicios federados, y creando un desacoplamiento físico entre la capa de datos y la capa de infraestructuras
Desde los orígenes
La iniciativa de Gaia-X comenzó a ver la luz en octubre de 2019, cuando los ministerios de asuntos económicos de Francia y Alemania presentaron el proyecto. Desde entonces, su crecimiento ha sido exponencial. A finales de 2020, se impulsa una cumbre que desemboca en la fundación de la asociación de Gaia-X AISBLen enero de 2021. Durante ese año, se define Gaia-X como marca, así como las primeras versiones de sus servicios. Entre sus objetivos se encuentra el desarrollo de estándares comunes, buenas prácticas, herramientas, así como mecanismos de gobernanza.
Actualmente, Gaia-X está compuesta por 324 miembros repartidos por todo el mundo. Empresas, asociaciones, instituciones de investigación, administraciones y políticos han unido sus fuerzas para trabajar juntos en la iniciativa. Los 22 miembros fundadores se reparten entre Francia y Alemania, donde destacan organizaciones como Amadeus, Atos, OVH, Orange Business Services, Siemens, IDS, SAP SE o Deustche Telekom. No obstante, a esos 22 se han ido uniendo en estos años organizaciones privadas y públicas de Asia (China, India, Japón, Singapur, Qatar, Korea), de EEUU y, principalmente, de Europa (Austria, Bélgica, Estonia, Finlandia, Francia, Alemania, Grecia, Polonia, Irlanda, Italia, Lituania, Luxemburgo, Holanda, Polonia, Portugal, Eslovaquia, Eslovenia, España, Suecia, Suiza, Reino Unido).
En España, a mediados de 2021, el Ministerio de Asuntos Económicos y Transformación Digital, a través de la Secretaría de Estado de Digitalización e Inteligencia Artificial, impulsa la creación del hub nacional de Gaia-X, una iniciativa organizativa cuyo objetivo es acelerar la capacidad europea en materia de compartición de datos industriales/sectoriales y soberanía digital, contribuyendo a generar la infraestructura común europea, mediante el lanzamiento de un manifiesto de interés cuya respuesta por parte de empresas del sector privado fue abrumadora.
De esta manera, España también se integra en el Consejo gubernamental (Government Advisory Board) de Gaia-X, la asociación europea para acelerar la respuesta en materia de compartición de datos. El Hub español de Gaia-X busca que empresas de todos los tamaños creen comunidad en torno al dato, sirviendo para desarrollar e implantar soluciones innovadoras basadas en datos e Inteligencia Artificial, que impulsen la competitividad nacional, prestando especial atención a las PYMEs y microPYMEs. Así, se plantea la creación de espacios de datos en los diferentes sectores productivos, interoperables con los espacios europeos y sin interferir en otros espacios que la industria tenga planificados desarrollar.
La economía del dato en España
Este proyecto persigue contribuir al crecimiento económico de nuestro país. Según el estudio European Data Market, la economía del dato en España tenía en 2019 un valor equivalente al 2,5% del PIB nacional, y se calcula que para el 2025, este valor llegue a representar más del 4% del PIB español, siempre y cuando se cree el entorno legal político y de financiación adecuado, lo que pone de manifiesto la importancia del dato en la economía.
La apuesta de España por la economía del dato se enmarca dentro de la estrategia España Digital 2025, donde se pone de manifiesto la necesidad de apoyar la digitalización de sectores clave para la economía, como el de turismo y el de salud especialmente, pero también otros como lo son la movilidad, el sector agroalimentario o el comercio electrónico.
Conclusiones
Los datos constituyen el foco de las grandes transformaciones que se están llevando a cabo en el entorno actual como consecuencia de la aplicación de nuevas tecnologías digitales. Por ese motivo, ninguna economía digital podrá consolidarse y competir globalmente si no dispone de una sólida economía del dato.
La estrategia europea tiene como objetivo la creación de un mercado único europeo de datos, abierto a datos procedentes de todo el mundo, en el que los datos personales y no personales, incluidos los datos sensibles de empresas, estén seguros y las empresas tengan acceso a datos industriales de alta calidad, de manera que se impulse el crecimiento y se cree valor. Mediante las normas y mecanismos asociados se pretende garantizar que los datos puedan fluir, se respeten plenamente las normas y valores europeos, y las normas de acceso a los datos y su uso sean justas, prácticas y claras.
Los espacios de datos en general, e iniciativas como Gaia-X en particular, son los elementos clave para alcanzar los objetivos de la estrategia europea, sirviendo para fomentar ecosistemas que creen nuevos productos y servicios basados en datos más accesibles
Contenido elaborado por Juan Mañes, experto en Data Governance, con las aportaciones de la Oficina del Dato.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El favorable régimen de acceso a la información medioambiental
La legislación sobre medio ambiente se ha caracterizado tradicionalmente por establecer un régimen jurídico más beneficioso que el que ha inspirado la normativa general sobre acceso a la información en poder del sector público. En efecto, la Convención de Aarhus, adoptada en 1998, supuso un importante hito al reconocer el derecho de acceso a la información medioambiental en condiciones jurídicas muy avanzadas, imponiendo relevantes obligaciones para las autoridades públicas. En concreto, la Convención parte de una premisa inexcusable: para que la sociedad pueda disfrutar del derecho a un medio ambiente saludable y cumplir el deber de respetarlo y protegerlo debe tener un acceso relevante a la información medioambiental. A tal efecto, de una parte, se reconocía el derecho a obtener información en poder de las autoridades públicas y, de otra, se estableció una obligación dirigida a estas últimas para que hicieran pública cierta información sin que existiera una solicitud previa.
En ejecución de dicho tratado internacional y, en concreto, de las obligaciones asumidas por la Unión Europea a través de la Directiva 2003/4/CE del Parlamento Europeo y del Consejo, de 28 de enero de 2003, relativa al acceso del público a la información medioambiental, se aprobó la Ley 27/2006, de 18 de julio, por la que se regulan los derechos de acceso a la información, de participación pública y de acceso a la justicia en materia de medio ambiente. A diferencia del régimen general que contempla la Ley 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno, la ley 27/2006 no contiene referencia alguna a los a los formatos abiertos y reutilizables. Sin embargo sí incluye los siguientes avances:
- establece la obligación de proporcionar la información incluso cuando, sin haberla generado directamente en el ejercicio de sus funciones, se encuentre en poder de la entidad a la que se solicita;
- exige que los motivos de denegación de la solicitud de acceso se interpreten de manera restrictiva, de manera que en caso de duda a la hora de interpretar las excepciones previstas legalmente se ha de favorecer el acceso a la información;
- para los supuestos en que no se resuelva y notifique la solicitud en el plazo establecido se aplica la regla del silencio positivo y, por tanto, se entenderá otorgado el acceso.
La incidencia de la normativa sobre datos abiertos y reutilización de la información del sector público
Al igual que sucediera en la anterior regulación, la Directiva (UE) 1024/2019 excluye su aplicación en aquellos supuestos en los que la correspondiente regulación de los Estados miembros limite el acceso. No sería este, por tanto, el caso del medio ambiente ya que, al margen de los supuestos en los que no procede el acceso, con carácter general la disponibilidad de la información se encuentra especialmente asegurada. En consecuencia, salvo por lo que se refiere a las excepciones legales a la obligación de facilitar información ambiental, no existen restricciones específicas que supongan un obstáculo a la hora de facilitar su reutilización.
Por otro lado, entre las principales novedades de normativa europea destaca una medida que, en última instancia, obliga a que los Estados miembros adapten su regulación por lo que se refiere al acceso a la información medioambiental. En efecto, el capítulo V de la Directiva establece un régimen singular para los denominados conjuntos de datos de alto valor que, con carácter general, estarán disponibles gratuitamente, serán legibles por máquina, se suministrarán a través de API y, cuando proceda, se proporcionarán en forma de descarga masiva. Precisamente, este régimen jurídico tan favorable se contempla, entre otros, para el ámbito de la Observación de la Tierra y el Medio Ambiente, si bien los conjuntos de datos específicos a los que se aplicará están todavía pendiente de una decisión por parte de la Comisión Europea tras la elaboración de un extenso análisis de impacto cuyo resultado definitivo se encuentra aún pendiente de concretar.
Por otra parte, siguiendo el modelo regulatorio europeo, entre las novedades que el Real Decreto-ley 24/2021, de 2 de noviembre ha incorporado a la legislación española sobre reutilización de la información del sector público destaca una referida a los datos de alto valor. En concreto, el artículo 3.ter de la Ley 37/2007 contempla la posibilidad de que, además de los conjuntos de datos que establezca la Comisión Europea, se puedan añadir otros a nivel nacional por el Ministerio de Asuntos Económicos y Transformación Digital teniendo en cuenta la selección que realice la División Oficina del Dato, de manera que se podrían ampliar, en su caso, los referidos específicamente al medio ambiente.
El potencial de los datos de alto valor relativos al medio ambiente
Como señala la propia regulación europea, la reutilización de los conjuntos de datos de alto valor se plantea como una herramienta para facilitar, entre otros objetivos, la creación y dinamización de aplicaciones y servicios digitales de valor añadido que tengan el potencial de generar considerables beneficios para la sociedad, el medio ambiente y la economía. Así, en este ámbito los datos abiertos pueden tener un importante papel a la hora de afrontar desde la innovación tecnológica a desafíos de enorme relevancia como el cambio climático, la deforestación y, en general, los retos que plantea la conservación del medio ambiente.
Por otro lado, el desarrollo de aplicaciones y servicios digitales puede servir para dinamizar las zonas rurales e impulsar modelos turísticos que pongan en valor el conocimiento y la protección de los recursos naturales, sobre todo teniendo en cuenta el rico y variado patrimonio natural existente en España, para lo cual resulta imprescindible disponer de conjuntos de datos específicos, en particular por lo que se refiere a los espacios naturales.
En última instancia, desde la perspectiva y las exigencias del Gobierno Abierto, la accesibilidad de la información ambiental, según los estándares de los datos de alto valor conforme a las previsiones de la normativa sobre reutilización de la información del sector público, podría tener un refuerzo destacado al facilitar el control social de las decisiones de las entidades públicas y la participación ciudadana. Sin embargo, para ello resulta imprescindible superar el modelo en que se ha sustentado tradicionalmente el marco normativo sobre acceso a la información ambiental ya que, aun cuando en su momento supuso un avance destacado, lo cierto es que la regulación de 2006 no incorpora referencia alguna a las posibilidades de innovación tecnológica basadas en los datos abiertos.
En definitiva, parece llegado el momento de suscitar un debate acerca de una eventual actualización de la normativa sectorial sobre acceso a la información medioambiental con la finalidad de dar cumplimiento a las exigencias del régimen jurídico contemplado en la Directiva (UE) 1024/2019.
Contenido elaborado por Julián Valero, catedrático de la Universidad de Murcia y Coordinador del Grupo de Investigación “Innovación, Derecho y Tecnología” (iDerTec).
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El impulso de la Economía del Dato es una de las prioridades de la Unión Europea y de nuestro país. Entre los objetivos de la UE está convertirse en líder de una sociedad impulsada por los datos, apoyándose en un mercado único digital donde los datos se compartan libremente entre los países miembro. Con este fin se puso en marcha la Estrategia Europea de Datos, entre cuyos pilares se encuentra:
- El desarrollo de un marco de gobernanza para el acceso y uso de datos multisectorial.
- El impulso de la colaboración público-privada.
- El empoderamiento de la ciudadanía y las empresas a través de formación e inversión.
Fruto de esta estrategia se está trabajando, entre otras cuestiones, en una Ley de Datos (Data Act), continuación de la propuesta de Reglamento sobre la gobernanza de los datos.
Con ello, la UE estima que la Economía del Dato alcanzará un valor de 829.000 millones de euros en 2025 para los 27 países miembro y empleará a casi 11 millones de trabajadores.
El contexto estratégico de España para impulsar la Economía del Dato
Alineada con el marco europeo, la Economía del Dato se incluye como uno de los ejes principales de España Digital 2025, el plan diseñado para impulsar la transformación digital en nuestro país. Entre otras cuestiones el documento aborda la necesidad de convertir a España en un referente en la transformación hacia una Economía del Dato, aprovechando también las oportunidades que ofrecen las nuevas tecnologías, como la Inteligencia Artificial o los servicios en la nube.
Una de las medidas para alcanzar estos objetivos es la puesta en marcha de una Oficina del Dato, encargada de diseñar y proponer estrategias que impulsen la compartición, gestión y uso de los datos a lo largo de todos los sectores productivos de la economía y sociedad, garantizando la buena gobernanza y seguridad.
¿Cuáles son las funciones de la Oficina del Dato?
Dependiente de la Secretaría de Estado de Digitalización e Inteligencia Artificial, la Oficina del Dato busca hacer frente a los principales retos que existen hoy en día en la Economía del Dato, definiendo los marcos legales y políticos de compartición y gobernanza de datos. En este sentido, abarca aspectos de tecnología, estándares, buenas prácticas, gobernanza, codificación, seguridad y privacidad relacionados con varios ámbitos de actuación. Estos ámbitos, aunque conceptualmente están separados, se encuentran muy directamente interrelacionados, y materializados dentro del concepto de espacio de datos:
Entre otras cuestiones, la Oficina del Dato se encarga de diseñar, coordinar y realizar el seguimiento del “modelo de referencia arquitectónico para fomentar la recolecta, gestión e intercambio de datos”. Para ello, se basa en la amplia experiencia ya existente en la Administración, optimizando el uso de los recursos existentes.
Al frente de la Oficina del Dato se encuentra Alberto Palomo, Chief Data Officer de España.
Dónde seguir las novedades de la Oficina del Dato
Desde el mes de enero, puedes seguir las novedades relativas a la Oficina del Dato desde la cuenta de Twitter datos.gob.es - Oficina del Dato. En ella se ofrecen novedades y tendencias relacionadas con la innovación basada en datos y en open data: noticias, información sobre eventos, casos de uso, guías e informes, etc.
Además, desde datos.gob.es continuaremos informando de novedades y ampliando contenidos relacionados con la Economía del Dato.
El pasado diciembre el Congreso de los Diputados aprobó el Real Decreto-ley 24/2021, que incluía la transposición de la Directiva (UE) 2019/1024, relativa a los datos abiertos y la reutilización de la información del sector público. Con este Real Decreto se modifica la Ley 37/2007 sobre reutilización de la información del sector público, incluyendo nuevos requisitos para los organismos públicos, entre los que se encuentra el facilitar el acceso a los datos de alto valor.
Los datos de alto valor son aquellos cuya reutilización está asociada a considerables beneficios para la sociedad, el medio ambiente y la economía. Inicialmente, la Comisión Europea destacó como datos de alto valor aquellos pertenecientes a las categorías de datos geoespaciales, ambientales, meteorológicos, estadísticos, relativos a sociedades y de movilidad, aunque estas clases pueden ser ampliadas tanto por, la Comisión como por el Ministerio de Asuntos Económicos y Transformación Digital a través de la Oficina del Dato. De acuerdo con la Directiva, este tipo de datos “se pondrán a disposición para su reutilización en un formato legible por máquina, a través de interfaces de programación de aplicaciones adecuadas y, cuando proceda, en forma de descarga masiva”. Es decir, entre otras cuestiones, se hace necesario el contar con una API.
¿Qué es una API?
Una interfaz de programación de aplicaciones o API (la abreviatura en inglés de Application Programming Interfaces) es un conjunto de definiciones y protocolos que permite el intercambio de información entre sistemas. Cabe destacar que existen distintos tipos de APIs en base a su arquitectura, protocolos de comunicación y sistemas operativos.
Las APIs suponen una serie de ventajas para los desarrolladores, ya que permiten automatizar el consumo de datos y metadatos, facilitan la descarga masiva y optimizan la recuperación de información al admitir funcionalidades de filtrado, ordenación y paginación. Todo ello repercute en un ahorro tanto económico como de tiempo.
En este sentido, muchos portales de datos abiertos de nuestro país ya cuentan con sus propias APIs para facilitar el acceso a datos y metadatos. En la siguiente infografía puedes ver algunos ejemplos a nivel nacional, autonómico y local, incluyendo información sobre la API de datos.gob.es. La infografía también incluye información breve sobre qué es una API y qué se necesita para poder utilizarlas.
Haz clic aquí para ver la infografía en tamaño completo y en su versión accesible
Estos ejemplos ponen de manifiesto el esfuerzo que los organismos públicos de nuestro país están haciendo para facilitar el acceso a la información que custodian de forma más eficiente y automatizada, con el fin de impulsar la reutilización de sus datos abiertos.
En datos.gob.es contamos con una Guía práctica para la publicación de datos abiertos usando APIs donde se detallan una serie de pautas y buenas prácticas para definir e implementar este mecanismo en un portal open data.
Contenido elaborado por el equipo de datos.gob.es.
La Secretaría de Estado de Digitalización e Inteligencia Artificial, en colaboración con SEGITTUR y como parte de la feria internacional FITUR, organizó el pasado 19 de diciembre el primer taller del Hub español de Gaia-X, centrado en avanzar la creación del espacio de datos de la industria del Turismo.
Los datos son una palanca de transformación digital del mundo, así como un elemento habilitador para la innovación y el desarrollo de nuevas tecnologías y servicios. Sin embargo, los datos por sí solos no generan ningún valor, y es clave ponerlos en contexto para obtener beneficios tangibles. Para ello, generalmente se hace necesario compartir y relacionar distintos conjuntos de datos, a menudo de distintas disciplinas o dominios.
En este contexto de necesidad de compartición es donde surge el concepto de los espacios de datos. Estos son estructuras (tecnológicas y de gobernanza) que proporcionan confianza y seguridad en torno a la compartición voluntaria de datos entre sus participantes. Son ecosistemas donde se articulan y gestionan las voluntades, funciones y procesos necesarios para compartir datos, a través de mecanismos de consenso, bajo un contexto de soberanía y control, y en base a una arquitectura de sistemas federada.
Este primer taller colaborativo se ha centrado en el uso de los datos en la industria del Turismo, uno de los sectores clave para España. Su objetivo es conformar una visión para este espacio de datos. Para ello, se analizaron los retos y oportunidades en materia de gobernanza del espacio, las tecnologías y arquitecturas disponibles para facilitar la compartición de datos, así como casos de uso tractores para el sector. El taller tuvo forma híbrida (presencial + online) y contó con la participación de diferentes representantes de la política, de oficinas técnicas gubernamentales, de empresas a lo largo de toda la cadena de valor del Turismo, universidades e institutos tecnológicos, así como integradores del mundo TI. Se contó además con ponentes de cada una de estas clases de organizaciones, queriendo así reflejar que la construcción y operación de los espacios de datos necesita de la involucración de un ecosistema variado y multidisciplinar.
El Hub español de Gaia-X
El Gobierno de España está trabajando en promover el entorno propicio para la creación de espacios de datos sectoriales, a través de las distintas iniciativas en materia de datos que se detallan en la Agenda España Digital 2025, y aprovechando la excepcional oportunidad que ofrecen los fondos NextGenEU. Bajo este marco, se ha impulsado la creación del Hub español de Gaia-X, que busca que sectores de todos los tamaños creen comunidad en torno al dato. El objetivo es que sirva para desarrollar e implantar nuevas soluciones innovadoras basadas en datos e Inteligencia Artificial, e impulsen la competitividad de las empresas. Estos espacios son además tractores para generar beneficios a lo largo de toda la cadena transformativa del dato, y se presta especial atención a que en la misma estén también representadas PYMEs y microPYMEs.
Gaia-X es una iniciativa europea del sector privado cuyo objetivo es la creación de una infraestructura de datos abierta, federada e interoperable, constituida sobre los valores de la disponibilidad y el control de los datos, y para el fomento de la Economía del Dato. Su principal objetivo es apoyar la respuesta europea en materia de compartición de datos a lo largo de distintos sectores y geografías de la Unión, y en base a un modelo federado que garantice la confianza y la soberanía digital. La iniciativa logra la capilaridad en el territorio de los diferentes estados miembro a través de 15 hubs nacionales de Gaia-X, incluido el de España.
Desarrollo de la jornada de trabajo
Durante la jornada de trabajo, se señaló que España será el primer país en liderar un espacio de datos en la industria del Turismo, que desarrollará estándares y maneras para compartir datos en la práctica, aportando de esa manera su capacitación y experiencia al resto de Europa. Esto supondrá a su vez una gran oportunidad dentro del proceso de transformación digital que ya vive la economía española.
La puesta en marcha de este proyecto conlleva una serie de retos relativos a la generación de confianza, la reducción de costes en la interoperabilidad, el establecimiento de semánticas y estándares, la creación de modelos de negocio generadores de valor, así como el logro de un modelo de gobernanza práctico que garantice la soberanía y control de los partícipes sobre sus datos y lo qué se hace con ellos. Éstas, consideraciones comunes a la creación de todo espacio de datos, se agudizan en este caso por la alta fragmentación y atomización del sector, así como su incompleta digitalización. La solución pasa por la implantación de una cadena de valor digitalizada de extremo a extremo, que englobe a todos los intervinientes en un modelo de compartición de datos que permita una visión holística, dando respuesta a las cuestiones relativas a la gestión de la privacidad, el mantenimiento de las ventajas competitivas, y la fijación de modelos de recompensa.
Para ello, durante la sesión de trabajo se evidenció la necesidad de avanzar en un enfoque de casos de uso: desde una necesidad de negocio concreta se abordan requerimientos y necesidades, fijándose así las condiciones básicas que garanticen su viabilidad y sostenibilidad. De esta manera, se dota además de escalabilidad al espacio de datos, que permite desplegarlo de manera ágil e incremental, contando con un producto inicial y que puede ampliarse fácilmente en sucesivas etapas con más funcionalidades y roles, según vayan incorporándose al espacio de datos nuevos participantes y casos de uso.
Estos casos de uso son la base para fijar los requisitos de la arquitectura del ecosistema de compartición de datos, incluyendo los estándares semánticos, modelos y vocabularios de datos concretos, la fijación de los roles y funciones de los participantes, así como los requisitos de los diferentes componentes software necesarios. La infraestructura de datos y de los sistemas es abierta y federada, goza de la escalabilidad y flexibilidad que ofrece el modelo de referencia de IDS (International Data Spaces), y cumple con los criterios de Gaia-X. De esa manera, tanto el espacio de datos del Turismo, como los futuros espacios sectoriales que se vayan generando, no sólo cumplen su función habilitadora para la Economía del Dato, sino que además lo hacen en base a los principios europeos básicos de soberanía digital, transparencia y transversalidad e igualdad.
Los datos se han convertido en el presente y futuro, no sólo de las organizaciones privadas, sino también de las diferentes administraciones públicas. Es por ello que se pone de manifiesto el beneficio derivado de una compartición de los datos entre las diferentes administraciones. No obstante, no es extraño encontrar que cada una de ellas mantenga sus propios listados y, por tanto, que inevitablemente surjan inconsistencias. Para ello, surge la Gestión de Datos Maestros.
¿Qué son los datos maestros?
Los Datos Maestros son aquellos datos que proporcionan un contexto a los datos transaccionales, dotándoles de una descripción funcional y convirtiéndolos así en conocimiento. Por ejemplo, si hablamos de 37 millones, tenemos un dato transaccional que por sí solo no nos aporta nada. Sin embargo, si decimos que es el número de personas vacunadas y, además, lo aterrizamos al contexto de España, podemos saber que casi el 80% de la población española está vacunada, y de esta manera, convertimos un dato en bruto en conocimiento.
Su principal objetivo es gestionar la compartición de datos reduciendo los riesgos asociados a la redundancia de datos y asegurando así la calidad de los mismos.
¿Cómo afecta al sector público?
Cuando hablamos de datos asociados a organismos públicos, especialmente aquellos puestos a disposición de ciudadanos y otras administraciones a través de portales de datos abiertos, se hace más evidente la necesidad de una estandarización, es decir, la creación de una visión única y fiable de los datos sobre ciudadanos, programas, departamentos, proveedores, empleados…
En ese contexto, una de las misiones que se quiere abordar dentro del Plan de Recuperación, Transformación y Resiliencia anunciado por el Gobierno de España para la recuperación económica tras la pandemia, es la dinamización de la compartición de datos a lo largo de los sectores productivos de la economía y la sociedad, convirtiendo al dato en un pilar estratégico para la economía. Con ese objetivo, se ha creado la Oficina del Dato, ubicada en la Secretaría de Estado de Digitalización e IA, dependiente del Ministerio de Asuntos Económicos y Transformación Digital.
Para la consecución de este objetivo, los portales abiertos para la reutilización de la información pública, como pueda ser datos.gob.es, jugarán un papel fundamental. Pero antes, debemos asegurar que los datos maestros puestos a disposición tienen la calidad necesaria.
¿Por qué es necesario gestionar los datos maestros?
Con el avance de la era digital, los datos han ocupado un lugar fundamental en la sociedad, cuya presencia es exponencial en el tiempo. Hoy en día, se cuenta con innumerables instrumentos que permiten una correcta gestión de ellos. Sin embargo, esa transformación está siendo progresiva en el tiempo. Años atrás, las administraciones públicas comenzaron a recopilar los datos que utilizaban en sistemas específicos en base a las necesidades de cada una de ellas. Con el paso del tiempo, esto ha provocado que los datos que se manejan en la actualidad procedan de diversas fuentes origen y, en ocasiones, esta información sea aparentemente similar. Es decir, podemos encontrar distintas fuentes origen con la misma información sobre ciudadanos, servicios… que al comparar entre sí ofrecen ambigüedades y problemas de consistencia de los datos. Además, es un problema que no se da necesariamente al comparar diferentes administraciones, sino que, dentro de una misma administración, también suceden por diferentes razones, como puedan ser migraciones de datos entre sistemas realizadas sin control, procedencias diversas de datos (encuestas, alta manual, registro en un portal…), etc.
En definitiva, se pierde la confianza en lo que los datos nos dicen y consecuencia directa de ello es la pérdida de valor de nuestra información.
Además, este tipo de casuísticas puede llegar a generar riesgos de magnitudes inabarcables. Es una gran oportunidad para llevar a cabo acciones de fraude, puede provocar derroches innecesarios y, por tanto, un aumento de costes, filtraciones de datos, pérdidas reputacionales, dificultades para cumplir con normativas como pueda ser el Reglamento General de Protección de Datos, etc.
¿Cómo aplicar una herramienta de gestión de datos maestros?
Para lograr el objetivo final de compartir datos, previamente debemos disponer de la visión única y fiable de los datos, especialmente aquellos más críticos o prioritarios, que garantice, no solo la integridad y consistencia de los mismos, sino también la calidad y exactitud, al poder crear reglas de negocio en un único punto de la verdad.
Este proceso, frecuentemente puede realizarse a través de las siguientes etapas:
- Gestión de modelo de datos, mediante documentación que permita ubicar los diferentes orígenes para un mismo dominio de información.
- Adquisición de datos desde las distintas fuentes para la centralización de todos los posibles valores.
- Validación, estandarización y enriquecimiento de datos para la limpieza del maestro en base a las reglas de calidad definidas.
- Resolución de entidades con el objetivo de determinar si dos referencias a objetos se refieren al mismo objeto o a dos objetos diferentes. Se trata de una etapa de toma de decisiones, generando el proceso de coincidencia y fusión de registros que permite la construcción del maestro.
- Custodia del maestro y mantenimiento, así como compartición con terceros.
En resumidas cuentas, partiendo de los diversos orígenes de la información, se establece un registro único o Golden Record sobre el que aplicar las reglas que permitan la compartición segura.
De esta manera, las administraciones públicas pueden poner a disposición de terceros información garantizando su calidad, así como aprovecharse de la de otros organismos públicos, reduciendo esfuerzos y teniendo acceso ágil al conocimiento.
Ejemplo: certificación de eficiencia energética
Esta gestión adquiere una mayor relevancia en registros públicos, especialmente en aquellos vinculados a la Administración General del Estado (AGE) gestionados por diversas administraciones como, por ejemplo, los registros de certificación de eficiencia energética.
Se trata de un documento que proporciona información objetiva sobre las características energéticas de los edificios, a partir de una evaluación sobre diversos parámetros, como energía consumida o emisiones de CO2 generadas.
Sin embargo, aunque las exigencias para la tramitación fueron emitidas en el año 2002 por el Parlamento Europeo, las encargadas de otorgar las etiquetas de eficiencia energética son las Comunidades Autónomas, y por esta razón, existen disparidades según el territorio por diversas cuestiones.
Es en este caso, generar un maestro que unifique todos estos datos a nivel nacional, sería de gran utilidad, tanto para el conjunto de ciudadanos, como para cada autonomía en particular. Por ello, incluso ya se ha puesto en marcha durante el 2021 un procedimiento para la certificación de la eficiencia energética de los edificios.
Asimismo, podrían normalizarse otros datos públicos de la sociedad, estableciendo un único punto de referencia que interconecte los datos de una misma entidad y fomente la compartición de datos a través de ese único punto.
Otros ámbitos de potencial aplicación podemos encontrarlo en las diferentes consejerías, como pueda ser turismo o salud, adoptando todos los beneficios de una gestión centralizada para, posteriormente, adaptarlo a la vista que más se ajuste a los requerimientos o necesidades de cada organismo.
De hecho, el Gobierno de España ya ha impulsado la creación de un hub nacional de GAIA-X para desplegar la economía del dato y apostar por el liderazgo de espacios de datos, especialmente en sectores estratégicos como precisamente son turismo y salud.
Conclusiones
La compartición de datos en el sector público es una tendencia al alza que, previsiblemente, ocupará un papel fundamental en los próximos años. Prueba de ello es el esfuerzo que se está realizando desde la Administración, a través de, entre otros, la creación de la Oficina del Dato y la puesta en marcha del Plan de Recuperación, Transformación y Resiliencia.
Por ello, cada organismo debe gestionar sus datos maestros de tal forma que elimine ambigüedades en los mismos. De esta forma, podrá consolidarse una compartición de datos entre las distintas administraciones públicas que permitan acciones enfocadas a la mejora de los servicios al ciudadano, conociendo mejor las necesidades de la sociedad.
Contenido elaborado por Juan Mañes, experto en Data Governance.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
En el entorno actual, las organizaciones tratan de mejorar la explotación de sus datos mediante el uso de nuevas tecnologías, dotando al negocio de un valor adicional y convirtiendo al dato en el principal activo estratégico de las mismas.
Sin embargo, únicamente podremos extraer el valor real de los datos si estos son confiables y para ello, surge la función del Gobierno del Dato, enfocada en la gestión eficiente de los activos de información. Los datos abiertos no pueden ser ajenos a estas prácticas debido a sus características, principalmente de disponibilidad y acceso.
Para dar respuesta a la pregunta de cómo debemos gobernar los datos, existen diversas metodologías internacionales, como DCAM, MAMD, DGPO o DAMA. En este post, nos basaremos en las guías ofrecidas por este último.
¿Qué es DAMA?
DAMA, por sus siglas en inglés Data Management Association, es una asociación internacional para profesionales de la gestión de datos. Cuenta con un capítulo en España, DAMA España, desde marzo de 2019.
Su principal misión consiste en promover y facilitar el desarrollo de la cultura de gestión de los datos, convirtiéndose en la referencia para las organizaciones y profesionales en la gestión de la información, aportando recursos, formación y conocimiento sobre la materia.
La asociación se compone de profesionales de la gestión de datos en diferentes sectores.
El Gobierno del dato según el marco de referencia de DAMA
“Un dato ubicado en un contexto da lugar a información. Si le añadimos inteligencia obtenemos conocimiento que, combinado con una buena estrategia, genera poder”
Aunque sólo es una frase, sintetiza a la perfección la estrategia, la búsqueda de poder a partir de los datos. Para ello, es necesario realizar un ejercicio de autoridad, control y toma de decisiones compartida (planificación, vigilancia y aplicación) sobre la gestión de los activos de datos o, lo que es lo mismo, aplicar Gobierno del Dato.
DAMA nos presenta lo que entiende que son las mejores prácticas para garantizar el control sobre la información, independientemente del negocio de aplicación, y para ello, posiciona al Gobierno del Dato como principal actividad alrededor de la cual se gestionan el resto de actividades, como puedan ser arquitectura, interoperabilidad, calidad o metadatado, como muestra la siguiente figura:
La aplicación del Gobierno del Dato en datos abiertos
Partiendo de la rueda expuesta en el apartado anterior, el gobierno, control, calidad, gestión y conocimiento de los datos son la clave del éxito y, para ello, se debe cumplir con los siguientes principios:
Para lograr que los datos cumplan con estos principios, será necesario establecer una estrategia de gobernanza de los mismos, mediante la implantación de una Oficina del Dato capaz de definir las políticas y procedimientos que dictaminen las pautas para su gestión. Deberán incluir la definición de los roles y sus responsabilidades, el modelo de relación de todos ellos y la forma en la que se velará por el cumplimiento de las mismas, así como otras iniciativas relacionadas con los datos.
Además de la gobernanza del dato, algunas de las características recomendadas a la hora de gestionar datos abiertos, son las siguientes:
- Una arquitectura capaz de asegurar la disponibilidad de la información en el portal. En este sentido, CKAN se ha convertido en una de la arquitectura de referencia para la apertura de datos. CKAN es una plataforma de código abierto, gratuito y libre, desarrollada por la Open Knowledge Foundation, que sirve para publicar y catalogar colecciones de datos. En este enlace tienes una guía para conocer más sobre cómo publicar datos abiertos con CKAN.
- La interoperabilidad de los catálogos de datos. Cualquier usuario que lo desee, podrá hacer uso de la información mediante descarga directa de los datos que considere. Por ello, se pone de manifiesto la necesidad de una integración sencilla de la información, independientemente de qué portal de datos abiertos se haya obtenido. Se deben utilizar estándares reconocidos para fomentar la interoperabilidad de los catálogos de datos y metadatos en toda Europa, como el vocabulario para catálogos de datos (DCAT) definido por el W3C y su perfil de aplicación DCAT-AP. En España, tenemos la Norma Técnica de Interoperabilidad (NTI), basada en dicho vocabulario. Puedes profundizar más en este el informe.
- El metadatado, entendido como los datos de los datos, es uno de los pilares fundamentales a la hora de categorizar y etiquetar la información, lo que posteriormente se reflejará en una navegación ágil y sencilla en el portal para cualquier usuario. Algunos de los metadatos que debemos incluir son el título, el formato o la periodicidad de actualización, tal y como nos muestra la mencionada NTI.
- Al tratarse de información ofrecida por las administraciones públicas para su reutilización, no es necesario cumplir con estrictas medidas de privacidad para su explotación, ya que previamente han sido anonimizados. Por el contrario, deben existir actividades que garanticen la seguridad de los datos. Por ejemplo, se podrán evitar usos indebidos o fraudulentos mediante una monitorización de los accesos y el seguimiento de la actividad de los usuarios.
- Además, la información disponible en el portal cumplirá con los criterios de calidad tanto técnica como funcional requerida por los usuarios, garantizada mediante la aplicación de indicadores de calidad.
- Por último, aunque no es una de las características del marco de referencia como tal, DAMA nos habla de forma transversal a todas ellas sobre la ética del dato, entendida como la responsabilidad social respecto al tratamiento de los datos. Existe determinada información sensible cuyo uso indebido podría tener impacto en las personas.
La evolución del Gobierno del Dato
Debido a la crisis financiera del año 2008, se puso el foco en la gestión de la información en las entidades financieras: qué información se tiene, cómo se explota… Por ello, actualmente, es uno de los sectores más regulados, lo que le convierte también en uno de los más avanzados con respecto a la aplicabilidad de estas prácticas.
Sin embargo, el auge de las nuevas tecnologías asociadas al procesamiento de los datos, comenzaron a cambiar la concepción de estas actividades de gestión. Ya no se veían tanto como un mero control de la información, sino que considerar los datos como activos estratégicos suponía grandes avances en el negocio.
Gracias a esta nueva concepción, organizaciones privadas de todo tipo se han interesado por esta materia e, incluso, en algunos organismos públicos, no es extraño ver como se comienza a profesionalizar el gobierno del dato mediante iniciativas focalizadas en ofrecer al ciudadano una atención más personalizada y eficaz a partir del dato. Por ejemplo, la ciudad de Edmonton utiliza esta metodología y por ello ha sido reconocida.
En este webinar puedes ver más información sobre la gestión del dato en el marco de referencia de DAMA. También puedes ver el video de su evento anual donde se explican diversos casos de uso o seguir su blog.
El camino hacia la cultura del dato
Nos encontramos inmersos en un mundo digital globalizado en constante evolución y los datos no son ajenos a ello. Constantemente están surgiendo nuevas iniciativas de datos ante las que se hace necesario un gobierno del dato eficiente capaz de dar respuesta a estos cambios.
Por ello, el camino hacia una cultura del dato es una realidad que todas las organizaciones y organismos públicos deben tomar en el corto plazo. El uso de una metodología de gobierno del dato, como el de DAMA, sin duda, será un gran apoyo durante todo el trayecto.
Contenido elaborado por David Puig, Graduado en Información y Documentación y responsable del grupo de trabajo de Datos Maestros y de Referencia en DAMA ESPAÑA, y Juan Mañes, experto en Data Governance.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
La siguiente infografía muestra la situación estratégica, normativa y política que afectará al mundo de los datos abiertos en España y Europa. Para profundizar en su contenido puede leer los siguientes artículos:
- Las estrategias relacionadas con los datos que marcarán 2021 en Europa
- Las estrategias relacionadas con los datos que marcarán 2021 en España
España ya cuenta con una nueva Estrategia Nacional de Inteligencia Artificial. El documento, que recoge 600 millones de euros para medidas relacionadas con la inteligencia artificial (IA), se presentó el pasado día 2 de diciembre en el Palacio de la Moncloa.
La Estrategia Nacional de Inteligencia Artificial (conocida como ENIA) es el componente 16 del Plan de Recuperación, Transformación y Resiliencia de la economía española, y una de las propuestas fundamentales de la Agenda España Digital 2025 en su línea 9 de acción, que destaca la IA como un elemento clave para impulsar el crecimiento de nuestra economía en los próximos años. Además, la nueva estrategia está alineada con los planes de acción europeos desarrollados en la materia, y en especial con Libro Blanco sobre Inteligencia Artificial.
Objetivos y ejes de actuación
La ENIA es un marco dinámico, flexible y abierto a la aportación de empresas, ciudadanos, agentes sociales y resto de Administraciones, que nace con 7 Objetivos: la excelencia científica y la innovación, la proyección de la lengua española, la creación de empleo cualificado, la transformación del tejido productivo español, la creación de un entorno de confianza en relación a la IA y el fomento de una IA inclusiva y sostenible que tenga en cuenta los valores humanistas.
Para alcanzar estos objetivos, se han creado 6 ejes de actuación que agrupan un total de 30 medidas a desarrollar en el período 2020-2025:
En definitiva, se trata de crear un ecosistema nacional de inteligencia artificial innovador, competitivo y ético. Y para ello, es fundamental contar con grandes volúmenes de datos y metadatos de calidad e interoperable, que sean accesibles, completos, seguros y respetuosos con la privacidad.
Los datos abiertos en la Estrategia Nacional de Inteligencia Artificial
La disponibilidad de datos abiertos es esencial para el correcto funcionamiento de la inteligencia artificial, ya que los algoritmos han de ser alimentados y entrenados por datos cuya calidad y disponibilidad permita una continua mejora. De ese modo podremos crear servicios de valor que repercutan en la mejora de la sociedad y la economía.
La Estrategia Nacional de Inteligencia Artificial resalta cómo gracias a las distintas iniciativas abordadas en los últimos años, España se sitúa como un referente europeo en materia de datos abiertos, destacando el papel de la Iniciativa Aporta en el impulso de la apertura y reutilización de información pública.
En el eje estratégico 3 del documento se resaltan varias áreas clave donde actuar ligadas a las plataformas de datos e infraestructuras tecnológicas de IA:
- Desarrollar el marco regulatorio del open data, para definir una estrategia de publicación y acceso a los datos públicos de las administraciones en formatos multilingües, y asegurar el uso correcto y seguro de los datos.
- Impulsar acciones en el ámbito de las plataformas de datos, modelos, algoritmos, motores de inferencia y ciberseguridad, con el foco puesto en impulsar la investigación y la innovación. Se hace referencia a la necesidad de impulsar Tecnología Habilitadoras Digitales como las infraestructuras de conectividad, los entornos masivos de datos (cloud) o la automatización y control de procesos, prestando especial atención a las Capacidades Estratégicas de Supercomputación (HPC).
- Impulsar el desarrollo específico de tecnologías IA en el ámbito del procesamiento del lenguaje natural, fomentando el uso del español en el mundo. En este sentido se impulsará el Plan Nacional de Tecnologías del Lenguaje y se apoyará el proyecto LEIA, desarrollado por la Real Academia Española para la defensa, proyección y buen uso de la lengua española en el universo digital.
En el caso concreto de los datos abiertos, una de las primeras medidas destacadas es la creación de la Oficina del Dato a nivel estatal que coordinará a todas las administraciones publicas con el fin de homogeneizar el almacenamiento, acceso y tratamiento de los datos. Para potenciar esta acción se nombrará un Chief Data Officer. Además, se articulará un grupo de trabajo multidisciplinar de datos abiertos en el sector público estatal para poner en valor el esfuerzo que se viene realizado en materia de datos en España y para seguir impulsando la apertura y reutilización de la información del sector público.
La estrategia también tiene en cuenta al sector privado, y resalta la necesidad de fomentar el desarrollo de repositorios accesibles y de orientar a las empresas en la definición de estrategias de datos abiertos o compartidos. En este sentido se crearán espacios compartidos de datos sectoriales e industriales, que faciliten la creación de aplicaciones de IA. Además, se hace mención a la necesidad de ofrecer los datos desagregados por sexo, edad, nacionalidad y territorio, de tal forma que se eliminen sesgos ligados a estos aspectos.
Con el fin de estimular el uso y la gobernanza de datos públicos y ciudadanos se establece como objetivo la creación del Proyecto Datos por el Bien Social donde los datos abiertos y generados por la ciudadanía tendrán un papel clave para impulsar la rendición de cuentas y participación pública en el gobierno.
El siguiente cuadro resume la medidas vistas en este apartado:
Otros aspectos destacados de la ENIA
Además de acciones relacionadas con los datos abiertos, la Estrategia Nacional de Inteligencia Artificial incluye acciones más transversales, por ejemplo:
- Se fomentará la incorporación de la IA en la administración pública, mejorando desde la transparencia y la toma de decisiones efectiva, hasta la productividad y calidad del servicio (haciendo más eficientes las gestiones y la relación con los ciudadanos). Aquí la Iniciativa Aporta viene jugando un rol clave con su apoyo a los organismos del sector público en la publicación de datos de calidad y el fomento de su reutilización. Se crearán repositorios de datos abiertos que permitan el acceso óptimo a la información necesaria para desarrollar nuevos servicios y aplicaciones para el sector público y privado. En este sentido, se creará un laboratorio de innovación (GobTechLab) y se llevarán a cabo programas de capacitación.
- Se busca impulsar la investigación científica a través de la creación de una Red española de excelencia en IA con programas de investigación y formación y la puesta en marcha de nuevos centros de desarrollo tecnológico. Se prestará especial atención a acabar con la brecha de género.
- Se pondrá en marcha un programa de ayudas a empresas para el desarrollo de soluciones de IA y datos, y se reforzará la red de Centros de Innovación Digital (Digital innovation Hubs). Se creará un Fondo NextTech de capital riesgo público-privado.
- Se impulsará el talento a través del Plan Nacional de Competencias Digitales. Se introducirán elementos relacionados con la IA en la escuela y se impulsará la oferta universitaria y de Formación Profesional en IA. Se desarrollará el programa SpAIn Talent Hub en coordinación con ICEX Invest para atraer inversión extranjera y talento.
- Una novedad de la estrategia es que tiene en cuenta la regulación ética y social para luchar contra la discriminación. Se crearán observatorios de evaluación ética y jurídica de los sistemas algorítmicos y se desarrollará la Carta de Derechos Digitales, que actualmente está en revisión.
En definitiva, estamos ante una estrategia necesaria para impulsar el crecimiento de la IA en España, impulsado nuestra sociedad y economía, y mejorando nuestra competitividad internacional.