Noticia

No hay duda de que la inteligencia artificial se ha convertido en un pilar fundamental de la innovación tecnológica. Hoy en día, mediante inteligencia artificial (IA) se pueden crear chatbots especializados en datos abiertos, aplicaciones que faciliten el trabajo profesional e incluso un gemelo digital de la Tierra para anticiparse a desastres naturales.

Las posibilidades son infinitas, sin embargo, el futuro de la IA también tiene retos a superar para que los modelos sean más inclusivos, accesibles y transparentes. En este sentido, la Unión Europea está desarrollando diversas iniciativas para conseguir avanzar en este campo.

Marco regulatorio europeo a favor de una IA más abierta y transparente

El planteamiento de la UE en materia de IA busca ofrecer a los ciudadanos la confianza necesaria para adoptar estas tecnologías y animar a las empresas a desarrollarlas. Para ello, el Reglamento Europeo de IA establece unas pautas de desarrollo de la inteligencia artificial alineadas con los valores europeos de privacidad, seguridad y diversidad cultural. Por otro lado, el Reglamento de Gobernanza de Datos (DGA) define que se debe garantizar un acceso amplio a los datos sin comprometer derechos de propiedad intelectual, privacidad y equidad.

Junto con la Ley de Inteligencia Artificial, la actualización del Plan Coordinado sobre la IA garantiza la seguridad y los derechos fundamentales de las personas y las empresas, reforzando al mismo tiempo la inversión y la innovación en todos los países de la UE. La Comisión también ha puesto en marcha un paquete de innovación en materia de inteligencia artificial para ayudar a las empresas emergentes y pymes europeas a que desarrollen una IA fiable que respete los valores y normas de la UE.

Otras instituciones también están trabajando en el impulso de una inteligencia impulsando los modelos de IA de código abierto como una solución muy interesante. Un informe reciente de Open Future y Open Source Initiative (OSI) define cómo debería ser la gobernanza de datos en los modelos de IA open source. Uno de los desafíos que destaca el informe es, precisamente, lograr un equilibrio entre apertura de datos y derechos sobre los mismos, conseguir más transparencia y evitar sesgos culturales. De hecho, los expertos en la materia Ricard Martínez y Carmen Torrijos debatieron sobre este tema en el pódcast de datos.gob.es.

El proyecto OpenEuroLLM

Con el objetivo de solventar los posibles desafíos y planteándose como una solución innovadora y abierta, la Unión Europea, a través del programa Europa Digital ha presentado  A través de este proyecto de inteligencia artificial de código abierto se esperan crear modelos de lenguaje eficientes, transparentes y alineados con la normativa europea de IA.

El proyecto OpenEuroLLM tiene como meta principal el desarrollo de modelos de lenguaje de última generación que sirvan para una amplia variedad de aplicaciones tanto públicas como privadas. Entre los objetivos más destacados, podemos mencionar:

  1. Extender las capacidades multilingües de los modelos existentes: esto incluye no solo las lenguas oficiales de la Unión Europea, sino también otras lenguas que son de interés social y económico. Europa es un continente rico en diversidad lingüística, y el proyecto busca reflejar esa diversidad en los modelos de IA.
  2. Acceso sostenible a modelos fundamentales: los modelos desarrollados dentro del proyecto serán fáciles de acceder y estarán listos para ser ajustados a diversas aplicaciones. Esto no solo beneficiará a grandes empresas, sino también a pequeñas y medianas empresas (PYMES) que deseen integrar la IA en sus procesos sin enfrentar barreras tecnológicas.
  3. Evaluación de resultados y alineación con la normativa europea: los modelos serán evaluados de acuerdo con rigurosos estándares de seguridad y alineación con el Reglamento Europeo de IA y otros marcos regulatorios europeos. Esto garantizará que las soluciones de IA sean seguras y respetuosas con los derechos fundamentales.
  4. Transparencia y accesibilidad: una de las premisas del proyecto es compartir de manera abierta las herramientas, procesos y resultados intermedios de los procesos de entrenamiento. Esto permitirá que otros investigadores y desarrolladores puedan reproducir, mejorar y adaptar los modelos para sus propios propósitos.
  5. Fomento de la comunidad: OpenEuroLLM no se limita a la creación de modelos, sino que también tiene como objetivo construir una comunidad activa y comprometida, tanto en el sector público como en el privado, que pueda colaborar, compartir conocimientos y trabajar en conjunto para avanzar en la investigación de IA.

El Consorcio OpenEuroLLM: un proyecto colaborativo y multinacional

El proyecto OpenEuroLLM está siendo desarrollado por un consorcio de 20 instituciones europeas de investigación, empresas tecnológicas y centros de supercomputación, bajo la coordinación de la Universidad de Charles (República Checa) y la colaboración de Silo GenAI (Finlandia). El consorcio reúne a algunas de las instituciones y empresas líderes en el campo de la inteligencia artificial en Europa, creando una colaboración multinacional para desarrollar modelos de lenguaje de código abierto.

Entre las principales instituciones que participan en el proyecto se encuentran universidades de renombre como la Universidad de Helsinki (Finlandia) o la Universidad de Oslo (Noruega), así como empresas tecnológicas como Aleph Alpha Research (Alemania) o la empresa ilicitana prompsit (España), entre otras. Además, los centros de supercomputación como Barcelona Supercomputing Center (España) o SURF (Países Bajos) proporcionan la infraestructura necesaria para entrenar modelos a gran escala.

Diversidad lingüística, transparencia y conformidad con las normas de la UE

Uno de los mayores desafíos de la inteligencia artificial globalizada es la inclusión de múltiples idiomas y la preservación de las diferencias culturales. Europa, con su vasta diversidad lingüística, presenta un entorno único para abordar estos problemas. OpenEuroLLM se compromete a preservar esa diversidad y garantizar que los modelos de IA desarrollados sean sensibles a las variaciones lingüísticas y culturales de la región.

Como hemos visto al inicio del post, el desarrollo tecnológico debe ir de la mano de los valores éticos y responsables. En este sentido, una de las características clave del proyecto OpenEuroLLM es su enfoque en la transparencia. Los modelos, los datos, la documentación, el código de entrenamiento y las métricas de evaluación estarán completamente disponibles para el público. Esto permitirá que investigadores y desarrolladores puedan auditar, modificar y mejorar los modelos, garantizando un enfoque abierto y colaborativo.

Además, el proyecto se alinea con las estrictas normativas europeas de IA. OpenEuroLLM está diseñado para cumplir con la Ley de IA de la UE, que establece criterios rigurosos para garantizar la seguridad, la equidad y la privacidad en los sistemas de inteligencia artificial.

Democratización del acceso a la IA

Uno de los logros más importantes de OpenEuroLLM es la democratización del acceso a la IA de alto rendimiento. Los modelos de código abierto permitirán que empresas, instituciones académicas y organizaciones del sector público de toda Europa tengan acceso a tecnología de vanguardia, independientemente de su tamaño o presupuesto.

Esto es especialmente relevante para las pequeñas y medianas empresas (PYMES), que a menudo enfrentan dificultades para acceder a soluciones de IA debido a los altos costos de licencias o las barreras tecnológicas. OpenEuroLLM eliminará estas barreras y permitirá que las empresas desarrollen productos y servicios innovadores utilizando IA, lo que contribuirá al crecimiento económico de Europa.

El proyecto OpenEuroLLM también es una apuesta de la UE por la soberanía digital que está invirtiendo de manera estratégica en el desarrollo de infraestructura tecnológica que reduzca la dependencia de actores globales y refuerce la competitividad europea en el ámbito de la inteligencia artificial. Este es un paso importante hacia una inteligencia artificial que no solo sea más avanzada, sino también más justa, segura y responsable.

calendar icon
Blog

No hay duda de que la formación en competencias digitales es necesaria hoy en día. Los conocimientos digitales básicos son fundamentales para poder interactuar en una sociedad en la que la tecnología ya juega un papel transversal. En concreto, es importante conocer aspectos básicos de la tecnología para trabajar con datos.

En este contexto, las trabajadoras y trabajadores del sector público también deben mantenerse en constante actualización. Capacitarse en este ámbito es clave para optimizar procesos, garantizar la seguridad de la información y fortalecer la confianza en las instituciones.

En este post, identificamos habilidades digitales relacionadas con los datos abiertos tanto dirigidas a la publicación como al uso de estos. No solo identificamos las competencias profesionales que deben tener y mantener los empleados públicos que trabajan con open data, también recopilamos una serie de recursos formativos que están a su disposición.

Competencias profesionales para trabajar con datos

En el Encuentro Nacional de Datos Abiertos de 2024 se constituyó un grupo de trabajo con un objetivo: identificar las competencias digitales que debían tener los profesionales de la administración pública que trabajasen con datos abiertos. Más allá de las conclusiones de este evento de relevancia nacional, el grupo de trabajo definió perfiles y roles necesarios para la apertura de datos, recogiendo información sobre sus funciones y las capacidades y conocimientos necesarios. Los principales roles identificados fueron:

  • Rol responsable: tiene funciones de responsabilidad técnica en el impulso de políticas de datos abiertos y organiza actividades de definición de las políticas y modelos de datos. Algunos conocimientos necesarios son:
    • Liderazgo en el impulso de estrategias para impulsar la apertura del dato.
    • Impulsar la estrategia del dato para impulsar la apertura con propósito.
    • Comprender el marco normativo relacionado con los datos para actuar dentro de la legalidad en todo el ciclo de vida del dato.
    • Fomentar el uso de herramientas y procesos para la gestión del dato.
    • Capacidad de generar sinergias para consensuar instrucciones transversales a toda la organización.
  • Rol técnico de apertura de datos (perfil TIC): desarrolla actividades de ejecución más vinculadas con la gestión de los sistemas, los procesos de extracción, limpieza de datos, etc. Este perfil debe conocer, por ejemplo:
    • Cómo estructurar el conjunto de datos, el vocabulario de metadatos, calidad del dato, estrategia a seguir...
    • Ser capaz de analizar un conjunto de datos e identificar los procesos de depuración y limpieza de manera rápida e intuitiva.
    • Generar visualizaciones de datos, conectando bases de datos de diferentes formatos y orígenes, y así obtener gráficos, indicadores y mapas dinámicos e interactivos.
    • Dominar las funcionalidades de la plataforma, es decir, saber aplicar soluciones tecnológicas para la gestión de datos abiertos o conocer técnicas y estrategias para acceder, extraer e integrar datos de diferentes plataformas.
  • Rol funcional de apertura de datos (técnico de un servicio): ejecuta actividades más vinculadas con la selección de datos a publicar, la calidad, promoción de los datos abiertos, visualización, analítica de datos, etc. Por ejemplo:
    • Manejar herramientas de visualización y dinamización.
    • Conocer la economía del dato y conocer la información referente al dato en toda su extensión (generación por las AAPP, datos abiertos, infomediarios, reutilización de la información pública, Big Data, Data Driven, roles implicados, etc.).
    • Conocer y aplicar los aspectos éticos y de protección de datos de carácter personal que aplican a la apertura de datos.
  • Uso de datos por parte de los trabajadores públicos: este perfil lleva a cabo actividades sobre el uso de los datos para la toma de decisiones, analítica básica de datos, entre otros. Para ello, deberá tener estas competencias:
    • Navegación, búsqueda y filtrado de datos.
    • Evaluación de datos.
    • Almacenamiento y explotación de datos.
    • Análisis y explotación de datos.

Además, como parte de este reto para incrementar las capacidades para la apertura de datos, se elaboró un listado de formaciones y guías gratuitas en materia de datos abiertos y análisis de datos. Recopilamos algunas de ellas que están disponibles online y en formato abierto.

Institución Recurso Enlace Nivel
Centro Knight para el Periodismo en las Américas Periodismo de datos y visualización con herramientas gratuitas https://journalismcourses.org/es/course/dataviz/ Principiante
Data Europa Academy Introducción a los datos abiertos https://data.europa.eu/en/academy/introducing-open-data Principiante
Data Europa Academy Comprender el lado legal de los datos abiertos https://data.europa.eu/en/academy/understanding-legal-side-open-data Principante
Data Europa Academy Mejorar la calidad de los datos abiertos y los metadatos https://data.europa.eu/en/academy/improving-open-data-and-metadata-quality Avanzado
Data Europa Academy Medir el éxito en las iniciativas de datos abiertos https://data.europa.eu/en/training/elearning/measuring-success-open-data-initiatives  Avanzado
Escuela de Datos Curso de tubería de datos – Data Pipeline https://escueladedatos.online/curso/curso-tuberia-de-datos-data-pipeline/  Intermedio
FEMP Guía estratégica para su puesta en marcha – Conjuntos de datos mínimos a publicar https://redtransparenciayparticipacion.es/download/guia-estrategica-para-su-puesta-en-marcha-conjuntos-de-datos-minimos-a-publicar/  Intermedio
Datos.gob.es Pautas metodológicas para la apertura de datos /es/conocimiento/pautas-metodologicas-para-la-apertura-de-datos  Principiante
Datos.gob.es Guía práctica para la publicación de datos abiertos usando APIs /es/conocimiento/guia-practica-para-la-publicacion-de-datos-abiertos-usando-apis Intermedio
Datos.gob.es Guía práctica para la publicación de datos espaciales /es/conocimiento/guia-practica-para-la-publicacion-de-datos-espaciales  Intermedio
Junta de Andalucía Tratar conjuntos de datos con Open Refine https://www.juntadeandalucia.es/datosabiertos/portal/tutoriales/usar-openrefine.html Principiante

Figura 1. Tabla de elaboración propia con recursos formativos. Fuente: https://encuentrosdatosabiertos.es/wp-content/uploads/2024/05/Reto-2.pdf

El Instituto Nacional de Administración Pública (INAP) cuenta con un Programa de Actividades Formativas para 2025, enmarcado en la Estrategia de Aprendizaje del INAP 2025-2028. Este catálogo formativo incluye más de 180 actividades organizadas en diferentes programas de aprendizaje, que se desarrollarán a lo largo del año con el objetivo de fortalecer las competencias del personal público en ámbitos clave como la gestión de datos abiertos y el uso de tecnologías relacionadas.

En el programa formativo de INAP para 2025 se ofrece una amplia variedad de cursos orientados a mejorar las capacidades digitales y la alfabetización en datos abiertos. Algunas de las formaciones destacadas incluyen:

  • Fundamentos y herramientas del análisis de datos.
  • Introducción a SQL de Oracle.
  • Datos abiertos y reutilización de la información.
  • Análisis y visualización de datos con Power BI.
  • Blockchain: aspectos técnicos.
  • Programación en Python avanzado.

Estos cursos, dirigidos a distintos perfiles de empleados públicos, desde responsables de datos abiertos hasta técnicos en gestión de información, permiten adquirir conocimientos sobre extracción, tratamiento y visualización de datos, así como sobre estrategias para la apertura y reutilización de datos abiertos en la Administración Pública. Puedes consultar el catálogo completo aquí.

Otras referencias formativas

Algunas administraciones públicas o entidades disponen de oferta de cursos de formación vinculadas a los datos abiertos. Para más información de su oferta formativa, se facilita el catálogo con la oferta de cursos programados.

En resumen, la formación en competencias digitales, en general, y en datos abiertos, en particular, es una práctica que recomendamos desde datos.gob.es. ¿Necesitas algún recurso formativo en específico? Escríbenos en comentarios, ¡te leemos!

calendar icon
Blog

La inteligencia artificial (IA) de código abierto es una oportunidad para democratizar la innovación y evitar la concentración de poder en la industria tecnológica. Sin embargo, su desarrollo depende en gran medida de la disponibilidad de conjuntos de datos de alta calidad y de la implementación de marcos sólidos de gobernanza de datos. Un informe reciente de Open Future y la Open Source Initiative (OSI) analiza los desafíos y oportunidades en esta intersección, proponiendo soluciones para una gobernanza de datos equitativa y responsable. Puedes leer aquí el informe completo.

En este post, analizaremos las ideas más relevantes del documento, así como los consejos que ofrece para garantizar una correcta y efectiva gobernanza de datos en la inteligencia artificial open source y aprovechar todas sus ventajas.

Los retos de la gobernanza de datos en la IA

A pesar de la gran cantidad de datos disponibles en la web, su acceso y uso para entrenar modelos de IA plantean importantes desafíos éticos, legales y técnicos. Por ejemplo:

  1. Equilibrio entre apertura y derechos: en línea con el Reglamento de Gobernanza de Datos (DGA), se debe garantizar un acceso amplio a los datos sin comprometer derechos de propiedad intelectual, privacidad y equidad.
  2. Falta de transparencia y estándares de apertura: es importante que los modelos etiquetados como “abiertos” cumplan con criterios claros de transparencia en el uso de datos.
  3. Sesgos estructurales: muchos conjuntos de datos reflejan sesgos lingüísticos, geográficos y socioeconómicos que pueden perpetuar desigualdades en los sistemas de IA.
  4. Sostenibilidad ambiental: el uso intensivo de recursos para entrenar modelos de IA plantea desafíos de sostenibilidad que deben abordarse con prácticas más eficientes.
  5. Involucrar a más actores: actualmente, los desarrolladores y las grandes corporaciones dominan la conversación sobre IA, dejando fuera a comunidades afectadas y organizaciones públicas.

Una vez identificados los retos, el informe propone una estrategia para alcanzar el objetivo principal: una gobernanza de datos adecuada en los modelos de IA de código abiertos. Este enfoque está basado en dos pilares fundamentales.

Hacia un nuevo paradigma de gobernanza de datos

En la actualidad, el acceso y la gestión de los datos para entrenar modelos de IA están marcados por una creciente desigualdad. Mientras algunas grandes corporaciones tienen acceso exclusivo a vastos repositorios de datos, muchas iniciativas de código abierto y comunidades marginadas carecen de los recursos para acceder a datos representativos y de calidad. Para abordar este desequilibrio es necesario un nuevo enfoque en la gestión y uso de los datos en la IA de código abierto. El informe destaca dos cambios fundamentales en la manera en que se concibe la gobernanza de datos:

Por un lado, adoptar un enfoque de data commons que no es más que un modelo de acceso que garantiza el equilibrio entre la apertura de datos y la protección de derechos. Para ello, sería importante utilizar licencias innovadoras que permitan compartir datos sin explotación indebida. También es relevante crear estructuras de gobernanza que regulen el acceso y uso de datos. Y, por último, implementar mecanismos de compensación para comunidades cuyos datos son utilizados en inteligencia artificial.

Por otro lado, es necesario trascender la visión centrada en desarrolladores de IA e incluir a más actores en la gobernanza de datos, como:

  • Propietarios de los datos y comunidades que generan contenido.
  • Instituciones públicas que pueden promover estándares de apertura.
  • Organizaciones de la sociedad civil que velen por la equidad y el acceso responsable a los datos.

Al adoptar estos cambios, la comunidad de IA podrá establecer un sistema más inclusivo, en el que los beneficios del acceso a datos se distribuyan de manera equitativa y respetuosa con los derechos de todas las partes interesadas. Según el informe, la implementación de estos modelos no solo aumentará la cantidad de datos disponibles para la IA de código abierto, sino que también fomentará la creación de herramientas más justas y sostenibles para la sociedad en su conjunto.

Consejos y estrategia

Para hacer efectiva una gobernanza de datos robusta en la IA de código abierto, el informe propone seis áreas de acción prioritarias:

  1. Preparación y trazabilidad de datos: mejorar la calidad y documentación de los conjuntos de datos.
  2. Mecanismos de licenciamiento y consentimiento: permitir a los creadores de datos definir su uso de manera clara.
  3. Custodia de datos: fortalecer la figura de intermediarios que gestionen datos de forma ética.
  4. Sostenibilidad ambiental: reducir el impacto del entrenamiento de IA con prácticas eficientes.
  5. Compensación y reciprocidad: garantizar que los beneficios de la IA lleguen a quienes contribuyen con datos.
  6. Intervenciones de política pública: promover regulaciones que incentiven la transparencia y el acceso equitativo a datos.

 ¿Cómo conseguir una correcta gobernanza de datos en IA de código abiertos?   1. Mejorar la calidad y trazabilidad de los datos  2. Permitir licenciamiento y consentimiento claro  3. Fortalecer la custodia de datos de los intermediarios  4. Reducir el impacto ambiental del entrenamiento de IA  5. Garantizar una correcta compensación de los beneficios de la IA  6. Promover políticas públicas que incentiven la transparencia y el acceso equitativo a los datos   Fuente: "Data Governance in Open Source AI". Open Source Initiative y Open Future. Disponible aquí : https://opensource.org/blog/reimagining-data-for-open-source-ai-a-call-to-action

La inteligencia artificial de código abierto puede impulsar la innovación y la equidad, pero para lograrlo es necesario un enfoque de gobernanza de datos más inclusivo y sostenible. Adoptar modelos de datos comunes y ampliar el ecosistema de actores permitirá construir sistemas de IA más justos, representativos y responsables con el bien común.

El informe que publican Open Future y Open Source Initiative hace una llamada a la acción a desarrolladores, legisladores y sociedad civil para establecer normas compartidas y soluciones que equilibren la apertura de datos con la protección de derechos. Con una gobernanza de datos sólida, la IA de código abierto podrá cumplir su promesa de servir al interés público.

calendar icon
Documentación

Los organismos del sector público deben ofrecer sus datos para que puedan ser reutilizados, haciéndolos accesibles en forma de datos abiertos, tal y como refiere el marco legislativo de España. El primer paso para ello es que cada entidad, tanto a nivel local, como autonómico y estatal, así como los organismos, entidades y sociedades mercantiles pertenecientes al sector público institucional, establezca una unidad responsable de garantizar la puesta a disposición de su información. Esta unidad estará encargada de promover que la información esté actualizada y sea provista en los formatos abiertos adecuados. También deberá coordinar las actividades de reutilización de la información, así como la promoción, concienciación y formación en materia de datos abiertos, entre otras funciones.

Una vez que se ha determinado quiénes son los responsables de garantizar la apertura de datos, es el momento de poner en marcha un plan de medidas de impulso de la apertura y reutilización de datos abiertos, de tal forma que todas las acciones a desarrollar se lleven a cabo de manera ordenada, coordinada y sujeta a una agenda viable de apertura.

Con el fin de ayudar a las unidades responsables en esta tarea, desde datos.gob.es se ha elaborado una plantilla para la formulación del Plan. El objetivo es orientar sobre los diferentes elementos que debe contener dicho plan con el fin de trazar una hoja de ruta factible de apertura de datos, así como permitir su seguimiento y evaluación.

La siguiente infografía recoge las categorías incluidas en la plantilla, junto con una breve definición (Haz clic en la imagen para acceder a la infografía). 

Captura de la infografía

Versión accesible en word

A la hora de elaborar el plan, es importante que cada una de estas categorías se cumplimente con el máximo detalle posible. A continuación, puedes descargar el documento con la plantilla, donde se detallan todos estos elementos.

También se ha elaborado un documento con orientaciones sobre cuestiones importantes para el desarrollo de la iniciativa de datos abiertos y que es conveniente tener en cuenta en el momento de definir el plan de medidas de impulso de la apertura y reutilización de datos abiertos. Entre ellas se incluyen indicaciones sobre:

  • La gobernanza de datos
  • El marco normativo de los datos abiertos
  • Las condiciones de reutilización más habituales
  • Los datos de alto valor
  • Los metadatos a considerar
  • Los indicadores de medición para la evaluación y seguimiento de una iniciativa de datos abiertos

Haz clic en el botón que acompaña a cada documento para su descarga.

calendar icon
Noticia

El Encuentro Nacional de Datos Abiertos (ENDA) es una iniciativa que nace en 2022 del esfuerzo conjunto de la Diputación de Barcelona, el Gobierno de Aragón y la Diputación de Castellón. Su objetivo es ser un espacio para el intercambio de ideas y reflexiones de las administraciones para identificar y elaborar propuestas concretas con el fin de fomentar una reutilización de los datos abiertos de calidad que permita aportar un valor concreto en la mejora de las condiciones de vida de los ciudadanos.

Una peculiaridad importante que hay que destacar de la iniciativa de Encuentros es que fomenta un ciclo anual de trabajo colaborativo, donde se plantean retos y se trabaja en conjunto para encontrar soluciones. Estos retos, propuestos por los organizadores, se desarrollan a lo largo del año de la mano de voluntarios ligados al ámbito de los datos, la mayoría pertenecientes al mundo académico y de la Administración pública.

Hasta el momento se han trabajado tres retos. Las conclusiones de los retos trabajados son presentadas durante cada evento anual y la documentación generada es pública.

RETO 1.- Generar intercambios de datos y facilitar su apertura

En el primer ENDA (celebrado en Barcelona, noviembre 2022) se realizó una votación sobre los datos cuya apertura debería ser prioritaria. A partir de los resultados de esta votación, el grupo de trabajo del Reto 1 realizó un esfuerzo para recoger estándares, normativas, fuentes de los datos y sus responsables, así como casos de publicación y reutilización.

El objetivo de este reto era favorecer la colaboración interadministrativa para generar intercambios de datos y facilitar su apertura, identificando conjuntos de datos sobre los que trabajar para impulsar su calidad, el uso de estándares y sus posibilidades de reutilización.

RETO 2.- Incrementar las capacidades para la apertura de datos

El Reto 2 tenía por objetivo conseguir que los trabajadores y trabajadoras del sector público desarrollen conocimientos y habilidades necesarias para impulsar la divulgación de los datos abiertos. El objetivo final era mejorar las políticas públicas incorporando a la ciudadanía y a las empresas en todo el proceso de apertura. 

Por ello, el grupo de trabajó definió perfiles y roles necesarios para la apertura de datos, recogiendo información sobre sus funciones y las capacidades y conocimientos necesarios.

Además, se recogió un listado de formaciones gratuitas en materia de datos abiertos y análisis de datos, enlazando estas con los perfiles para los que podrían estar orientadas.

RETO 3.- Cómo medir el impacto de los datos abiertos

El reto 3 quería dar respuesta a la necesidad de conocer el impacto de los datos abiertos. Por ello, a lo largo del año, se trabajó en una propuesta metodológica para la realización de un mapeo sistemático de iniciativas que traten de medir el impacto de los datos abiertos.

En el tercer ENDA (Peñíscola, mayo 2024) se presentó, como resultado del grupo de trabajo, un auto test para que las entidades locales midan el impacto de la publicación de datos abiertos.

Las respuestas a estos retos han sido posibles gracias a la colaboración y el trabajo conjunto, que ha dado como resultado documentos y herramientas concretas de gran ayuda para otros organismos públicos que quieran avanzar en su estrategia de datos abiertos. Durante los próximos años se seguirá trabajando en nuevos retos, con el fin de impulsar aún más la apertura de datos de calidad y su reutilización en beneficio de toda la sociedad.

calendar icon
Evento

Alicante acogerá los próximos días 9 y 10 de noviembre el Summit 2023 de Gaia-X, en el que se llevará a cabo un repaso sobre los últimos progresos realizados por esta iniciativa en la promoción de la soberanía de datos en Europa. La interoperabilidad, transparencia y el cumplimiento normativo adquieren una dimensión práctica a través del intercambio y explotación de datos articulados bajo un entorno de nube confiable.

También se abordarán las relaciones establecidas con líderes del sector, expertos, empresas, gobiernos, instituciones académicas y organizaciones varias, facilitando el intercambio de ideas y experiencias entre los diversos grupos de interés involucrados en la transformación digital europea. El evento contará con conferencias magistrales, talleres interactivos y mesas redondas, en las que se explorarán las posibilidades ilimitadas de los ecosistemas digitales cooperativos, y de un futuro próximo en el que los datos se hayan convertido en un activo de alto valor añadido.

Este evento está organizado por la asociación europea Gaia-X, en colaboración con el  Hub español de Gaia-X. Cuenta también con la participación de la Oficina del Dato, dependiente de la Secretaría de Estado de Digitalización e Inteligencia Artificial, y se desarrolla bajo los auspicios de la presidencia española del Consejo de la Unión Europea.

La iniciativa Gaia-X busca garantizar que los datos sean almacenados y procesados de manera segura y soberana, respetando las regulaciones europeas, además de fomentar la colaboración entre diferentes y heterogéneos actores, como empresas, gobiernos y organizaciones. Así, Gaia-X promueve la innovación y el desarrollo económico basado en datos en Europa. Por tanto, la relación abierta en colaboración con la Unión Europea resulta fundamental para la consecución de sus objetivos.

La soberanía digital: una Europa adaptada a la era de los datos

Como para Gaia-X, uno de los grandes objetivos de la Unión Europea es el de fomentar la soberanía digital a lo largo de todo su territorio. Para ello, promueve el desarrollo de industrias y tecnologías clave para su competitividad y seguridad, fortalece sus relaciones comerciales y cadenas de suministro, y mitiga dependencias externas, concentrándose en la reindustrialización de su territorio y en asegurar su autonomía digital estratégica.

El concepto de soberanía digital abarca distintas dimensiones: tecnológica, regulatoria y socioeconómica. La dimensión tecnológica se refiere al hardware, software, nube e infraestructura de redes utilizados para acceder, procesar y almacenar datos. Mientras, la dimensión regulatoria se refiere a las normas que proporcionan seguridad jurídica a los ciudadanos, empresas e instituciones que operan en un ámbito digital. Finalmente, la dimensión socioeconómica se enfoca en las iniciativas empresariales y los derechos individuales en el nuevo entorno digital global. Para avanzar en todas estas dimensiones, la UE se apoya en proyectos como Gaia-X.

La iniciativa busca crear ecosistemas federados, abiertos, seguros y transparentes, donde los conjuntos y servicios de datos cumplen una serie mínima de reglas comunes que les permiten así ser reutilizables bajo entornos de confianza y transparencia. A su vez, esto habilita la creación de ecosistemas de datos confiables de alta calidad, con que las organizaciones europeas podrán impulsar su proceso de digitalización, mejorando las cadenas de valor a lo largo de diferentes sectores industriales. Estas cadenas de valor, desplegadas digitalmente sobre entornos de nube federada y confiable (“Trusted Cloud”), gozan de trazabilidad y transparencia, y sirven por tanto para impulsar los esfuerzos de cumplimiento normativo y soberanía digital.

En resumen, este enfoque se basa en aprovechar y reforzar unos valores reflejados en un marco regulatorio en desarrollo que busca incorporar conceptos como la confianza y la gobernanza en los entornos de datos. Esto busca convertir la UE en líder de una sociedad y economía donde la digitalización sea vector para reindustrializarnos y prosperar, pero siempre bajo el marco de unos valores que nos definen.

Se puede acceder al programa completo de este Summit desde la página oficial de la asociación europea: https://gaia-x.eu/summit-2023/agenda/.

 

calendar icon
Blog

La administración pública trabaja para garantizar el acceso a los datos abiertos, y así, empoderar a la ciudadanía en su derecho a la información. En línea con este objetivo, el portal de datos abiertos europeo (data.europa.eu) referencia un gran volumen de datos de temáticas variadas.

Sin embargo, aunque los datos pertenecen a ámbitos de información diferentes o se encuentran en formatos diversos, resulta complejo explotarlos conjuntamente para maximizar su valor. Una forma de lograrlo es mediante el uso de RDF (Resource Description Framework), un modelo de datos que permite la interoperabilidad semántica de datos en la web, estándar del W3C, y destacado en los principios FAIR. RDF ocupa los niveles superiores del esquema de cinco estrellas en la publicación de datos abiertos, propuesto por Tim Berners-Lee, el padre de la web.

En RDF, se interconectan datos y metadatos de manera automática generando una red de datos abiertos enlazados (LOD, por sus siglas en inglés, Linked Open Data) aportando el contexto semántico necesario mediante relaciones explicitas entre datos procedentes de diferentes fuentes para facilitar su interconexión. Este modelo maximiza el potencial de explotación de los datos enlazados.

Se trata de un paradigma de compartición de datos que cobra especial relevancia dentro de la iniciativa de espacio de datos de la UE que explicamos en este post.

RDF ofrece grandes ventajas a la comunidad. Sin embargo, para poder maximizar la explotación de datos abiertos enlazados es necesario conocer el lenguaje de consulta SPARQL, un requerimiento técnico que puede dificultar el acceso público a los datos.

Un ejemplo del uso de RDF es el de los catálogos de datos abiertos disponibles en portales como datos.gob.es o data.europa.eu que están desarrollados siguiendo el estándar DCAT que es un modelo de datos en RDF para facilitar su interconexión. Estos portales disponen de interfaces para configurar consultas en lenguaje SPARQL, y recuperar los metadatos de los conjuntos de datos disponibles.

Una nueva aplicación para hacer accesibles los datos entrelazados: Vinalod

Ante esta situación y con el objetivo de facilitar el acceso a datos enlazados, Teresa Barrueco, científica de datos y especialista en visualización que participó en el EU Datathon de 2018, la competición de la UE para fomentar el diseño de soluciones y servicios digitales relacionadas con los datos abiertos, desarrolló junto a la Oficina de Publicaciones Europea una aplicación.

El resultado es una herramienta que permite explorar LOD sin necesidad de estar familiarizado con la sintaxis SPARQL bautizada con el nombre de Vinalod: Visualisation and navigation of linked open data. La aplicación, como indica su nombre, permite navegar y visualizar estructuras de datos en grafos de conocimiento que representan objetos de datos vinculados entre si mediante el uso de vocabularios que representan las relaciones existentes entre ellos. Así, mediante una interacción visual e intuitiva, el usuario puede acceder a diferentes fuentes de datos:

  • Vocabularios de la UE. Datos de referencia de la UE que contiene, entre otros, información de Digital Europa Thesaurus, clasificación NUTS (sistema jerárquico para dividir el territorio económico de la UE) y vocabularios controlados del Named Authority Lists.
  • Quién es quién en la UE. Directorio oficial de la UE para identificar a las instituciones que componen la estructura de la administración europea.
  • Datos de la UE. Conjuntos y visualizaciones de datos publicados en el portal de datos abiertos de la UE que pueden explorarse según origen y temática.
  • Publicaciones de la UE. Informes publicados por la Unión Europea clasificados según su temática.
  • Legislación de la UE. Tratados de la UE y su clasificación.

La buena noticia es que la versión BETA de Vinalod ya está disponible para su utilización, un avance que permite filtrar temporalmente conjuntos de datos por país o idioma.

Para poner a prueba a la herramienta, probamos a buscar catálogos de datos publicados en español, que han sido modificados en los últimos tres meses. La respuesta de la herramienta es la siguiente:

que se puede interpretar de la siguiente forma:

Por lo tanto, el portal data.europa.eu alberga (“has catalog”) varios catálogos que cumplen con los criterios definidos: están en idioma español y han sido editados en los últimos tres meses. El usuario puede profundizar en cada nodo (“to”) y conocer cuáles son los conjuntos de datos publicados en cada uno de los portales.

En el ejemplo anterior, hemos explorado el apartado ‘Datos de la UE’. Sin embargo, podríamos hacer un ejercicio similar con cualquiera de los otros apartados. Estos son: Vocabularios de la UE; Quién es quién en la UE; Publicaciones de la UE y Legislación de la UE.

Todos estos los apartados están relacionados entre sí, es decir, un usuario puede empezar navegando por los ‘Datos de la UE’, como sucede en el ejemplo anteriormente explicado, y acabar en ‘Quién es quién de la UE’ con el directorio de cargos públicos europeos.

Como puede deducirse de las pruebas anteriores, la navegación por Vinalod es un ejercicio práctico en sí mismo que animamos a probar a todos los usuarios interesados en la gestión, explotación y reutilización de los datos abiertos.

Para ello, en este enlace vinculamos la versión BETA de la herramienta que contribuye a hacer más accesibles los datos abiertos sin la necesidad de conocer SPARQL, lo que significa que cualquier persona con un mínimo conocimiento técnico pueda trabajar con los datos abiertos enlazados.

Se trata de un aporte de valor para la comunidad de desarrolladores y reutilizadores de datos abiertos porque es un recurso al que puede acceder cualquier perfil de usuario, independientemente de su formación técnica. En definitiva, Vinalod es una herramienta que empodera a la ciudadanía, respeta su derecho a la información y contribuye a la apertura aún mayor de los datos abiertos

calendar icon
Documentación

En este artículo recopilamos una serie de infografías dirigidas tanto a publicadores como reutilizadores que trabajen con datos abiertos. En ellas se muestras normas y buenas prácticas para facilitar tanto la publicación como el tratamiento de datos.

1. DCAT-AP-ES: Guías y materiales de apoyo para facilitar su uso

Publicada: agosto 2025

Este nuevo modelo de metadatos adopta las directrices del esquema europeo de intercambio de metadatos DCAT-AP (Data Catalog Vocabulary-Aplication Profile) con algunas restricciones y ajustes adicionales.

Accede aquí

2. Guía para el despliegue de portales de datos abiertos

Captura de la infografía "Guía para el despliegue de portales de datos abiertos"

Publicada: abril 2025

Esta infografía resume buenas prácticas y recomendaciones para diseñar, desarrollar y desplegar portales de datos abiertos en el ámbito municipal. En concreto recoge: marco estratégico, requisitos generales y pautas técnicas y funcionales.

Accede aquí

3. Ley de Datos (Data Act o DA)

Captura de la infografía "Reglamento europeo de gobernanza de datos (Data Governance Act o DGA)"

Publicada: febrero 2024

La Ley de Datos (Data Act) es una regulación de la Unión Europea para facilitar la accesibilidad de los datos de forma horizontal. Es decir, estableciendo principios y directrices para todos los sectores, haciendo hincapié en el acceso justo a los datos, los derechos de los usuarios y la protección de los datos personales. Descubre cuáles son sus claves en esta infografía.

También se ha creado una versión a una página para facilitar su impresión: accede aquí

Accede aquí

4. Reglamento europeo de gobernanza de datos (Data Governance Act o DGA)

Captura de la infografía "Reglamento europeo de gobernanza de datos (Data Governance Act o DGA)"

Publicada: enero 2024

El Reglamento europeo de gobernanza de datos (Data Governance Act o DGA) es un instrumento horizontal para regular la reutilización de datos e impulsar su intercambio bajo los principios y valores de la Unión Europea (UE). Descubre cuáles son sus claves en esta infografía.

Accede aquí

También se ha creado una versión a una página para facilitar su impresión: accede aquí

5. Las claves de las especificaciones UNE sobre el dato

Captura de la infografía "Las claves de las especificaciones UNE sobre el dato"

Publicada: septiembre 2023

Todo tipo de instituciones deben disponer de datos bien gobernados, gestionados y con niveles adecuados de calidad, siendo necesaria una metodología de evaluación común. La siguiente infografía resumen cuáles son las claves de las Especificaciones UNE sobre el dato y sus principales ventajas.

Accede aquí

6. Principales obligaciones de la Ley 37/2007

Captura de la infografía "Principales obligaciones de la Ley 37/2007"

Publicada: marzo 2023

En aplicación de la última Directiva europea de datos abiertos, se ha modificado la Ley 37/2007 para que incida en el concepto de los datos abiertos desde el diseño y por defecto. Esta infografía destaca los principales cambios de la normativa.

Accede aquí

7. Cómo crear un plan de medidas para impulsar la apertura y reutilización de datos abiertos

Captura de la infografía "Cómo crear un plan de medidas para impulsar la apertura y reutilización de datos"

Publicada: noviembre 2022

Esta infografía recoge los diferentes elementos que debe contener un Plan de medidas de impulso de la apertura y reutilización de datos abiertos. El objetivo es que las unidades responsables de la apertura puedan trazar una hoja de ruta factible de apertura de datos, que además permita su seguimiento y evaluación.

Accede aquí

8. 8 guías para mejorar la publicación y el tratamiento del dato

Captura de la infografía "8 guías para mejorar la publicación y el tratamiento del dato""

Publicada: octubre 2022

Desde datos.gob.es hemos elaborado diferentes guías para ayudar a publicadores y reutilizadores a la hora de preparar los datos datos para su publicación y/o análisis. En esta infografía te resumimos el contenido de ocho de ellas.

Accede aquí

9. Pautas generales para garantizar la calidad de los datos abiertos

Captura de la infografía "Pautas generales para garantizar la calidad de los datos abiertos"

Publicada: septiembre 2022

Esta infografía detalla una serie pautas generales para garantizar la calidad de los datos abiertos, como, por ejemplo, utilizar una codificación de caracteres estandarizada, evitar la duplicidad de registros o incorporar variables con información geográfica.

Accede aquí

10. Pautas para asegurar la calidad usando formatos específicos de datos

Captura de la infografía "Pautas para asegurar la calidad usando formatos específicos de datos”"

Publicada: septiembre 2022

Esta infografía recoge pautas concretas para asegurar la calidad de los datos abiertos según el formato de datos utilizado. Se han incluido pautas específicas para los formatos CSV, XML, JSON, RDF y APIs.

Accede aquí

11. Normas para un correcto gobierno del dato

Captura de la infografía "Normas UNE para un correcto gobierno del dato"

Publicada: mayo 2022

Esta infografía recoge la normas a tener en cuenta para un correcto gobierno del dato, según la Asociación Española de Normalización (UNE) . Estas normas se basan en 4 principios: Gobernanza, Gestión, Calidad y Seguridad y privacidad de datos.

Accede aquí

12. APIs para el acceso a datos abiertos

Captura de la infografía "APIs para el acceso a datos abiertos"

Publicada: enero 2022

Muchos portales de datos abiertos en España ya cuentan con sus propias APIs para facilitar el acceso a datos y metadatos. Esta infografía muestra algunos ejemplos a nivel nacional, autonómico y local, incluyendo información sobre la API de datos.gob.es.

Accede aquí

calendar icon
Blog

Para que un espacio de datos funcione correctamente, es necesario contar con actores suficientes para cubrir un conjunto de roles y una serie de componentes tecnológicos. Estos elementos permiten fijar un marco común de gobernanza para compartir los datos de manera segura, garantizando la soberanía de los participantes sobre sus propios datos. Este concepto, la soberanía de los datos, se puede definir como la capacidad del dueño de los datos para establecer las políticas de uso y acceso de los datos que va a intercambiar, y es el elemento nuclear de un espacios de datos.

En este sentido, el informe  “Principios de diseño para los espacios de datos” (abril 2021), financiado por la Unión Europea, ofrece los fundamentos que deben seguir los espacios de datos para actuar de acuerdo con los valores de la UE: descentralización, apertura, transparencia, soberanía e interoperabilidad. El informe fue elaborado por expertos de 25 compañías diferentes, por lo que da una visión consensuada con la industria.

A continuación se resumen algunas de las principales aportaciones del documento, tomando como referencia el artículo “Elementos de un espacio de datos” publicado en la revista Boletic, de la Asociación profesional de Cuerpos Superiores de Sistemas y Tecnologías de la Información. En dicho artículo, los elementos de un espacio de datos se dividen en dos categorías:

  • Roles y ámbitos de actuación
  • Componentes fundamentales

Roles

En un espacio de datos podemos encontrar diversos participantes, cada uno de ellos enfocados en un ámbito de actuación. Es lo que se conoce como roles:

Visual que muestra los roles involucrados en un espacio de datos, definidos a continuación.

  1. Proveedores y consumidores de datos

Son los participantes que proporcionan e interactúan con los datos. Dentro de esta categoría encontramos varios roles:

  • Productor de los datos: Genera los datos.
  • Dueño de los datos: Es el titular de los derechos de acceso y utilización de los datos.
  • Proveedor de datos: Capta los datos y los ofrece a través del catálogo del espacio de datos.
  • Consumidor de datos: Accede a los datos del catálogo.
  • Proveedor de aplicaciones: Proporciona aplicaciones que permiten trabajar con los datos ofreciendo valor añadido (por ejemplo, modelos de machine learning, visualizaciones, procesos de limpieza, etc.).
  1. Intermediarios

En este caso hablamos de terceros que ofrecen los servicios necesarios para la publicación, búsqueda de recursos y registro de transacciones. Algunos ejemplos de servicios que ofrecen los intermediarios son:

  • Vocabularios y ontologías, que permiten organizar, categorizar o etiquetar sistemáticamente la información, mejorando la interoperabilidad.
  • Tiendas de aplicaciones, donde figuran las herramientas ofrecidas por los proveedores de aplicaciones, garantizándose que han pasado un proceso de control de calidad.
  • Servicios de bróker de metadatos para la publicación de un catálogo de ofertas de recursos (datos y aplicaciones) con la máxima información posible.
  • Servicios de orquestación, que permiten automatizar diversas actividades.
  • Registros de transacciones (clearing house), que permiten mantener el control de las operaciones realizadas.
  1. Proveedores tecnológicos

Proporcionan componentes para que el espacio de datos opere correctamente, convirtiéndose en un entorno seguro y de confianza. Ejemplos de estos componentes son el conector -un elemento fundamental que veremos a continuación-, los sistemas de gestión de usuarios o los sistemas de supervisión.

No entrarían en esta categoría los servicios de intermediación ni las aplicaciones.

  1. Operadores del espacio de datos

Centrados en la gestión del espacio, realizan tareas como la tramitación de peticiones o incidencias, control de cambios, mantenimiento software, etc. Entre otras cuestiones, certifican a los participantes, ejercen la gobernanza del espacio de datos y definen el roadmap de funcionalidades.

Todos estos roles no son exclusivos, y un mismo usuario puede adoptar varios de ellos.

Componentes de un espacio de datos

Existen diferentes aproximaciones sobre los componentes que debe tener un espacio de datos. Se puede acudir a Gaia-X y/o tomar como referencia el modelo de arquitectura IDS-RAM (Reference Architecture model), caracterizado por presentar una arquitectura abierta, confiable y federada para un intercambio de datos intersectorial.

En todo caso, para que la actividad se desarrolle de una manera segura y controlada, son necesarios, al menos, los siguientes bloques:

  1. Componentes para el acceso al espacio de datos: conector

Uno de los principales elementos de los espacios de datos es el conector, mediante el cual los participantes acceden al espacio de datos y a los propios datos. Es el encargado de tratar los datos según las políticas de uso definidas por el dueño de los derechos de acceso y utilización, garantizando su soberanía. Para evitar su manipulación maliciosa, los conectores pueden ir firmados mediante un certificado suministrado por la gobernanza del espacio de datos, de forma que se garantice su integridad y  el cumplimiento de los derechos de uso establecidos por el dueño de los datos.

  1. Componentes para la intermediación

Permiten los servicios de intermediación antes mencionados, el bróker de metadatos, la tienda de aplicaciones, etc. De todos ellos, el más fundamental es el catálogo de recursos. Además de un listado con la oferta disponible, también es la herramienta que permite localizar al proveedor del recurso, las características del mismo y sus condiciones de uso.

  1. Componentes para la gestión de identidad y el intercambio seguro de datos

Estos componentes permiten garantizar la identidad de los participantes y la seguridad de las transacciones. Por ello se suele exigir a los participantes la presentación de credenciales (por ejemplo, vía certificados X.509)

  1. Componentes para la gestión del espacio de datos

Se trata de herramientas que permiten que el espacio de datos opere con normalidad, facilitando las operaciones diarias, la gestión de los participantes (alta, baja, revocación, suspensión), la supervisión de la actividad, etc.

¿Cómo interactúan todos estos elementos?

Todos estos roles y componentes interactúan entre sí. Primero, el proveedor de datos registra su oferta de datos en el catálogo, incluyendo metadatos relevantes, como las políticas de uso. El consumidor de datos busca en el catálogo los conjuntos de datos y aplicaciones de su interés. Una vez localizados, contacta con el proveedor, comunicándole cuáles son los recursos que quiere adquirir. En este proceso, puede producirse una negociación adicional de las condiciones. Una vez alcanzado el acuerdo, el consumidor puede descargar los datos.

La operación debe ser registrada tanto por el proveedor como por el consumidor.

Gráfica que muestra el escenario de intercambio de datos en un espacio de datos, descrito anteriormente..

Todos estos elementos (roles, componentes y procesos) permiten que el intercambio de datos se realice de manera segura y controlada, en un entorno gestionado de confianza. Con todo ello se busca que las empresas y organismos europeos puedan intercambiar informacion generando un mercado europeo de datos que de lugar a nuevos productos y servicios de valor, impulsando la economía europea.


Contenido elaborado por el equipo de datos.gob.es.

calendar icon
Blog

Los datos se han convertido en el presente y futuro, no sólo de las organizaciones privadas, sino también de las diferentes administraciones públicas. Es por ello que se pone de manifiesto el beneficio derivado de una compartición de los datos entre las diferentes administraciones. No obstante, no es extraño encontrar que cada una de ellas mantenga sus propios listados y, por tanto, que inevitablemente surjan inconsistencias. Para ello, surge la Gestión de Datos Maestros.

¿Qué son los datos maestros?

Los Datos Maestros son aquellos datos que proporcionan un contexto a los datos transaccionales, dotándoles de una descripción funcional y convirtiéndolos así en conocimiento. Por ejemplo, si hablamos de 37 millones, tenemos un dato transaccional que por sí solo no nos aporta nada. Sin embargo, si decimos que es el número de personas vacunadas y, además, lo aterrizamos al contexto de España, podemos saber que casi el 80% de la población española está vacunada, y de esta manera, convertimos un dato en bruto en conocimiento.

Su principal objetivo es gestionar la compartición de datos reduciendo los riesgos asociados a la redundancia de datos y asegurando así la calidad de los mismos.

¿Cómo afecta al sector público?

Cuando hablamos de datos asociados a organismos públicos, especialmente aquellos puestos a disposición de ciudadanos y otras administraciones a través de portales de datos abiertos, se hace más evidente la necesidad de una estandarización, es decir, la creación de una visión única y fiable de los datos sobre ciudadanos, programas, departamentos, proveedores, empleados…

En ese contexto, una de las misiones que se quiere abordar dentro del Plan de Recuperación, Transformación y Resiliencia anunciado por el Gobierno de España para la recuperación económica tras la pandemia, es la dinamización de la compartición de datos a lo largo de los sectores productivos de la economía y la sociedad, convirtiendo al dato en un pilar estratégico para la economía. Con ese objetivo, se ha creado la Oficina del Dato, ubicada en la Secretaría de Estado de Digitalización e IA, dependiente del Ministerio de Asuntos Económicos y Transformación Digital.

Para la consecución de este objetivo, los portales abiertos para la reutilización de la información pública, como pueda ser datos.gob.es, jugarán un papel fundamental. Pero antes, debemos asegurar que los datos maestros puestos a disposición tienen la calidad necesaria.

¿Por qué es necesario gestionar los datos maestros?

Con el avance de la era digital, los datos han ocupado un lugar fundamental en la sociedad, cuya presencia es exponencial en el tiempo. Hoy en día, se cuenta con innumerables instrumentos que permiten una correcta gestión de ellos. Sin embargo, esa transformación está siendo progresiva en el tiempo. Años atrás, las administraciones públicas comenzaron a recopilar los datos que utilizaban en sistemas específicos en base a las necesidades de cada una de ellas. Con el paso del tiempo, esto ha provocado que los datos que se manejan en la actualidad procedan de diversas fuentes origen y, en ocasiones, esta información sea aparentemente similar. Es decir, podemos encontrar distintas fuentes origen con la misma información sobre ciudadanos, servicios… que al comparar entre sí ofrecen ambigüedades y problemas de consistencia de los datos. Además, es un problema que no se da necesariamente al comparar diferentes administraciones, sino que, dentro de una misma administración, también suceden por diferentes razones, como puedan ser migraciones de datos entre sistemas realizadas sin control, procedencias diversas de datos (encuestas, alta manual, registro en un portal…), etc.

En definitiva, se pierde la confianza en lo que los datos nos dicen y consecuencia directa de ello es la pérdida de valor de nuestra información.

Además, este tipo de casuísticas puede llegar a generar riesgos de magnitudes inabarcables. Es una gran oportunidad para llevar a cabo acciones de fraude, puede provocar derroches innecesarios y, por tanto, un aumento de costes, filtraciones de datos, pérdidas reputacionales, dificultades para cumplir con normativas como pueda ser el Reglamento General de Protección de Datos, etc.

¿Cómo aplicar una herramienta de gestión de datos maestros?

Para lograr el objetivo final de compartir datos, previamente debemos disponer de la visión única y fiable de los datos, especialmente aquellos más críticos o prioritarios, que garantice, no solo la integridad y consistencia de los mismos, sino también la calidad y exactitud, al poder crear reglas de negocio en un único punto de la verdad.

Este proceso, frecuentemente puede realizarse a través de las siguientes etapas:

Etapas de la gestión de datos maestros: Gestión de modelo de datos, Adquisición de datos, Validación, estandarización y enriquecimiento, Resolución de entidad, Custodia y compartición de datos

  • Gestión de modelo de datos, mediante documentación que permita ubicar los diferentes orígenes para un mismo dominio de información.
  • Adquisición de datos desde las distintas fuentes para la centralización de todos los posibles valores.
  • Validación, estandarización y enriquecimiento de datos para la limpieza del maestro en base a las reglas de calidad definidas.
  • Resolución de entidades con el objetivo de determinar si dos referencias a objetos se refieren al mismo objeto o a dos objetos diferentes. Se trata de una etapa de toma de decisiones, generando el proceso de coincidencia y fusión de registros que permite la construcción del maestro.
  • Custodia del maestro y mantenimiento, así como compartición con terceros.

En resumidas cuentas, partiendo de los diversos orígenes de la información, se establece un registro único o Golden Record sobre el que aplicar las reglas que permitan la compartición segura.

De esta manera, las administraciones públicas pueden poner a disposición de terceros información garantizando su calidad, así como aprovecharse de la de otros organismos públicos, reduciendo esfuerzos y teniendo acceso ágil al conocimiento.

Ejemplo: certificación de eficiencia energética

Esta gestión adquiere una mayor relevancia en registros públicos, especialmente en aquellos vinculados a la Administración General del Estado (AGE) gestionados por diversas administraciones como, por ejemplo, los registros de certificación de eficiencia energética.

Se trata de un documento que proporciona información objetiva sobre las características energéticas de los edificios, a partir de una evaluación sobre diversos parámetros, como energía consumida o emisiones de CO2 generadas.

Sin embargo, aunque las exigencias para la tramitación fueron emitidas en el año 2002 por el Parlamento Europeo, las encargadas de otorgar las etiquetas de eficiencia energética son las Comunidades Autónomas, y por esta razón, existen disparidades según el territorio por diversas cuestiones.

Es en este caso, generar un maestro que unifique todos estos datos a nivel nacional, sería de gran utilidad, tanto para el conjunto de ciudadanos, como para cada autonomía en particular. Por ello, incluso ya se ha puesto en marcha durante el 2021 un procedimiento para la certificación de la eficiencia energética de los edificios.

Asimismo, podrían normalizarse otros datos públicos de la sociedad, estableciendo un único punto de referencia que interconecte los datos de una misma entidad y fomente la compartición de datos a través de ese único punto.

Otros ámbitos de potencial aplicación podemos encontrarlo en las diferentes consejerías, como pueda ser turismo o salud, adoptando todos los beneficios de una gestión centralizada para, posteriormente, adaptarlo a la vista que más se ajuste a los requerimientos o necesidades de cada organismo.

De hecho, el Gobierno de España ya ha impulsado la creación de un hub nacional de GAIA-X para desplegar la economía del dato y apostar por el liderazgo de espacios de datos, especialmente en sectores estratégicos como precisamente son turismo y salud.

Conclusiones

La compartición de datos en el sector público es una tendencia al alza que, previsiblemente, ocupará un papel fundamental en los próximos años. Prueba de ello es el esfuerzo que se está realizando desde la Administración, a través de, entre otros, la creación de la Oficina del Dato y la puesta en marcha del Plan de Recuperación, Transformación y Resiliencia.

Por ello, cada organismo debe gestionar sus datos maestros de tal forma que elimine ambigüedades en los mismos. De esta forma, podrá consolidarse una compartición de datos entre las distintas administraciones públicas que permitan acciones enfocadas a la mejora de los servicios al ciudadano, conociendo mejor las necesidades de la sociedad.


Contenido elaborado por Juan Mañes, experto en Data Governance.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon