La Unión Europea tiene como objetivo potenciar la Economía del Dato, impulsando el flujo libre de datos entre los estados miembros y entre sectores estratégicos, en beneficio de empresas, investigadores, administraciones públicas y ciudadanos. Sin duda, los datos son un factor crítico en la revolución industrial y tecnológica que estamos viviendo, y por ello una de las prioridades digitales de la UE pasa por capitalizar su valor latente, apoyándose para ello en un mercado único donde estos puedan compartirse bajo condiciones de seguridad, y sobre todo de soberanía, pues sólo así se garantizarán los indiscutibles valores y derechos europeos.
Así, la Estrategia Europea de Datos busca potenciar su intercambio a gran escala, bajo entornos distribuidos y federados, pero que sin embargo garanticen la ciberseguridad y la transparencia. Para lograr escala, y liberar todo el potencial de los datos en la economía digital, un elemento fundamental es la generación de confianza. Esta, como elemento basal que condiciona la liquidez del ecosistema, debe desarrollarse coherentemente a lo largo de diferentes ámbitos y entre diferentes actores (proveedores de datos, usuarios, intermediarios, plataformas de servicios, desarrolladores, …). Por ende, su articulación afecta a diferentes perspectivas, incluida la de negocio y funcional, la legal y regulatoria, la operacional, e incluso la tecnológica. Por tanto, el éxito en estos proyectos de alta complejidad pasa por desarrollar estrategias que busquen minimizar las barreras de entrada a los participantes, y maximizar la eficacia y sostenibilidad de los servicios ofrecidos. Esto a su vez se traduce en el desarrollo de infraestructuras y modelos de gobernanza para los datos que sean fácilmente escalables, y que sirvan de base para un intercambio efectivo de datos con que generar valor para todos sus participantes.
Una metodología para impulsar los espacios de datos
España ha hecho suyo el cometido de llevar a la práctica esa estrategia europea, y desde hace años se trabaja en crear el entorno propicio para facilitar el despliegue y asentamiento de una Economía del Dato Soberana, apoyándose, entre otros instrumentos, en el Plan de Recuperación, Transformación y Resiliencia. En este sentido, y desde su papel coordinador y posibilista, la Oficina del Dato ha desplegado esfuerzos en el diseño de una metodología conceptual general, agnóstica a un sector concreto. Esta configura la creación de ecosistemas de datos alrededor de proyectos prácticos que aporten valor a los miembros de dicho ecosistema.
Por ello, la metodología consta de varios elementos, siendo la experimentación uno de ellos. Esto es así debido a que, por su naturaleza flexible, los datos pueden ser tratados, modelizados, y por ende interpretados, desde distintas perspectivas. Por este motivo, la experimentación resulta clave para calibrar adecuadamente aquellos procesos y tratamientos necesarios para llegar al mercado con pilotos o casos de negocio ya cercanos a las industrias, de modo que estén más cerca a generar un impacto positivo. En este sentido, se hace necesario demostrar el valor tangible y apuntalar su sostenibilidad, lo que implica contar, como mínimo, con:
- Marcos de referencia para una gobernanza efectiva de datos
- Actuaciones para mejorar la disponibilidad y la calidad de los datos, buscando también incrementar su interoperabilidad por diseño
- Herramientas y plataformas de intercambio y explotación de datos.
Así mismo, y dado que cada sector tiene su propia especificidad en lo que respecta a tipos y semánticas de datos, modelos de negocio, y necesidades de los participantes, la creación de comunidades de expertos, representando la voz del mercado, es otro elemento fundamental de cara a generar proyectos de utilidad. En base a esta escucha activa, que conduzca a la compresión de las dinámicas del dato en cada sector, se logra caracterizar las condiciones de mercado y de gobernanza necesarias para el despliegue de los espacios de datos en sectores estratégicos como el turismo, la movilidad, agroalimentación, comercio, salud o la industria.
En este proceso de generación de comunidad, las cooperativas de datos juegan un papel fundamental, así como la figura más general del intermediario de datos, que sirve para sensibilizar sobre la oportunidad existente y favorecer la creación y consolidación efectiva de estos nuevos modelos de negocio.
Todos estos elementos son distintas piezas de un puzle con que explorar nuevas oportunidades de desarrollo de negocio, así como para el diseño de proyectos tangibles con que demostrar el valor diferencial que la compartición de datos aportará a la realidad de las industrias. Así, y desde la perspectiva operativa, el último elemento de la metodología es el desarrollo de casos de uso concretos. Estos también permitirán desplegar iterativamente un catálogo de experiencias y recursos de datos reutilizables en cada sector, con que facilitar la construcción de nuevos proyectos. Este catálogo se convierte así en la pieza central de una plataforma común sectorial y federada, y cuya arquitectura distribuida facilita también la interconexión intersectorial.
Sobre hombros de gigantes
Hay que destacar que España no parte de cero, pues cuenta ya con un potente ecosistema de innovación y experimentación en datos, que ofrece servicios avanzados. Creemos por tanto interesante progresar en la armonización o complementariedad de sus objetivos, así como en la difusión de sus capacidades para ganar capilaridad. Además, la metodología planteada refuerza el alineamiento con los proyectos europeos del mismo ámbito, lo que servirá para conectar los aprendizajes y avances desde la escala nacional a los realizados a nivel UE, así como para poner en práctica las tareas de diseño de los "cianotipos" promulgados por la Comisión Europea a través del Data Spaces Support Centre.
Por último, el impulso de proyectos experimentales o piloto permite también el desarrollo de estándares para tecnologías innovadoras de datos, guardando una estrecha relación con el proyecto Gaia-X. Así, el Hub Gaia-X España cuenta con un nodo de interoperabilidad, que sirve para certificar el cumplimiento de las reglas prescritas por cada sector, y por ende para generar la citada confianza digital en base a sus necesidades específicas.
Desde la Oficina del Dato, creemos que la interconexión y la escalabilidad a futuro de los proyectos de datos se encuentran en el centro del esfuerzo de implementación de la Estrategia Europea de Datos, y resultan cruciales para alcanzar una Economía del Dato dinámica y rica, pero a su vez garante de los valores europeos y donde la trazabilidad y la transparencia ayuden a colectivizar el valor del dato, catalizando una economía más fuerte y cohesionadora.
Bajo la Presidencia española del Consejo de la Unión Europea, el Gobierno de España ha liderado la cumbre Gaia-X Summit 2023 que se ha celebrado en Alicante durante los días 9 y 10 de noviembre. El evento tenía como objetivo repasar los últimos avances de Gaia-X en la promoción de la soberanía de datos en Europa. Tal y como presentamos en datos.gob.es, Gaia-X es una iniciativa europea del sector privado para la creación de una infraestructura de datos que sea federada, abierta, interoperable y reversible, y que sirve por tanto fomenta la soberanía digital y la disponibilidad de los datos.
La cumbre ha servido también ha servido como espacio para el intercambio de ideas entre las voces líderes de la comunidad europea de espacios de datos, y ha culminado con la presentación de un comunicado para impulsar la autonomía estratégica en la nube, los datos y la inteligencia artificial, elemento considerado crítico para la competitividad de la UE. El documento, fomentado por la Secretaría de Estado de Digitalización e Inteligencia Artificial, constituye un llamamiento conjunto para una respuesta “más coherente y coordinada” en el desarrollo de programas y proyectos, tanto europeos como a nivel de estados miembro, relacionados con los datos y las tecnologías del sector.
Para ello, el comunicado aboga por la interoperabilidad respaldada por una infraestructura sólida de servicios en la nube y por el desarrollo de una inteligencia artificial basada en datos de alta calidad, con una gobernanza sólida que cumpla con los marcos normativos europeos. En concreto, se resaltan las posibilidades que ofrecen las redes neuronales profundas (Deep Neural Networks), cuyo éxito recae en tres factores principales: algoritmos, capacidad de cálculo y acceso a grandes cantidades de datos. En este sentido, el documento resalta la necesidad de apostar por este último factor, impulsando un paradigma de red neuronal basado en datos de alta calidad, bien parametrizados y en infraestructuras compartidas, que no sólo ahorren un tiempo valioso a los investigadores, sino que también eviten la degradación medioambiental, dado que limita las necesidades de cómputo de estos sistemas al trabajar más allá del paradigma de fuerza bruta.
Por este motivo, otro de los aspectos abordados por el documento es la dinamización del acceso a fuentes de datos de diferentes dominios complementarios. Eso permitiría una economía de datos “flexible, dinámica y altamente escalable” que sirva para optimizar procesos, innovar y/o crear nuevos modelos de negocio.
El llamamiento se muestra optimista con la iniciativas y programas europeos existentes, empezando por el propio proyecto de Gaia-X. También se resaltan otros proyectos como son el IPCEI-CIS o proyecto Simpl europeo. Asimismo, subraya la necesidad de “una coordinación más amplia y efectiva para impulsar proyectos industriales, avanzar en la estandarización de etiquetas de nube y datos confiables, lo que sirve para garantizar unos niveles altos de ciberseguridad, protección de datos, transparencia algorítmica y portabilidad”.
El comunicado destaca la importancia de lograr un mercado único de datos que incluya procesos de intercambios de datos bajo un marco común de gobernanza. Así, valora el novedoso conjunto de legislación digital y de datos, como la ley de datos (Data Act), entre cuyos objetivos se encuentra el impulso de la disponibilidad de datos en el conjunto de la Unión. El comunicado está abierto a la adhesión de nuevos miembros que busquen avanzar en el fomento de una economía del dato flexible, dinámica y altamente escalable.
La confianza, como factor clave para liberar el potencial de los datos en la economía digital, es un elemento cada vez más central en todas las regulaciones sobre datos. El Reglamento General de Protección de Datos, en 2016 ya reconocía que si las personas físicas tienen un mayor control de sus propios datos personales se producirá una mejora de la confianza que contribuirá al impacto positivo en el desarrollo de la economía digital. La propuesta de Ley europea de Datos de la Comisión Europea de 2022 pone incluso un mayor énfasis desde los propios objetivos y afirma que “la escasa confianza impide sacar pleno provecho del potencial de la innovación basada en los datos”.
Entre las conclusiones de la Encuesta Mundial sobre Regulación de Datos, que publicó el Banco Mundial en 2021, se destaca la necesidad de reforzar los marcos normativos en el mundo para generar una mayor confianza de los ciudadanos. Esto contribuiría a una mayor eficacia de las iniciativas gubernamentales que utilizan datos y que tienen, en muchos casos, el objetivo de generar valor para la sociedad. Como ejemplo cita el efecto limitado que tuvieron las aplicaciones de rastreo de contactos en todo el mundo durante la pandemia por COVID-19, en gran medida debido a la falta de confianza de la ciudadanía en el potencial uso de los datos aportados.
Si realmente consideramos que la confianza en los datos es tan decisiva para crear valor para la sociedad y la economía, debemos prestar mucha atención, tanto a los mecanismos de los que disponemos para mejorar esa confiabilidad, como a las estrategias para construir y mantener esa confianza, más allá de los propios marcos normativos.
Calidad y transparencia
La confianza en los datos comienza con la calidad y la transparencia. Cuando los usuarios comprenden cómo se recopilan, procesan y mantienen los datos, es más probable que confíen en ellos para utilizarlos, e incluso estén más dispuestos a contribuir con sus propios datos.
Un mecanismo fundamental para garantizar la calidad y la transparencia es la implementación de estándares rigurosos, como las especificaciones UNE de Gobierno del dato UNE 0077:2023, Gestión del dato UNE 0078:2023, y Gestión de la calidad del dato UNE 0079:2023 en cada etapa del ciclo de vida de los datos. Por una parte, se consigue reforzar la calidad mediante el despliegue de prácticas robustas de validación y verificación que garantizan la precisión y la integridad de los datos, y por otra, se mejora la transparencia con, por ejemplo, metadatos descriptivos que proporcionen información detallada sobre los datos, incluyendo su origen, metodología de recopilación y cualquier transformación a la que hayan sido sometidos.
Espacios Europeos de Datos
Los Espacios Europeos de Datos[5] son una ambiciosa iniciativa de la Unión Europea destinada a fomentar la confianza y facilitar el intercambio y la utilización de datos entre países y sectores en un entorno seguro y regulado. La idea central detrás de los Espacios Europeos de Datos es la de crear entornos en los que la disponibilidad, la accesibilidad y la interoperabilidad de los datos se maximicen, mientras que los riesgos asociados con el manejo de datos se minimicen. Inicialmente la Estrategia Europea de datos previó 10 espacios de datos en áreas estratégicas como la salud, la energía o la administración pública. Desde entonces este número ha crecido y se han lanzado otros espacios de datos en importantes áreas como los medios de comunicación y el patrimonio cultural, o en sectores estratégicos para España como el turismo.
Para apostar por el liderazgo en espacios de datos en sectores estratégicos para España, el gobierno impulsa el Hub español de Gaia-X, integrado por empresas de todos los tamaños, y dirigido a desplegar un ecosistema sólido en el ámbito de la compartición de datos industriales
Mejora de la ciberseguridad
El creciente número de incidentes de ciberseguridad que llegan a las cabeceras de los medios de comunicación, algunos de los cuales han llegado a paralizar empresas privadas y organismos públicos, ha convertido la ciberseguridad en una preocupación primordial para los usuarios y las organizaciones en la era digital.
Una robusta ciberseguridad implica que las organizaciones desplieguen tecnologías avanzadas y prácticas adecuadas para proteger los sistemas y los datos de accesos no autorizados y manipulaciones malintencionadas a través de medidas como firewalls, encriptación, autenticación de dos factores, y monitorización y detección de amenazas en tiempo real. Sin embargo, la mejora de la educación y la conciencia sobre ciberseguridad de los usuarios también son vitales para ayudarles a reconocer y evitar amenazas potenciales.
Identidad digital europea
La Identidad Digital Europea se está desarrollando en el marco de la Unión Europea con el objetivo de proporcionar a los ciudadanos y empresas una forma segura y unificada de acceder a servicios, públicos y privados, en línea o fuera de línea, en toda la UE. La idea es que, con una identidad digital europea, las personas podrían identificarse o confirmar datos en servicios como la banca, la educación o la salud, entre otros, de manera segura y sin fricciones, proporcionando un alto nivel de seguridad y protección de la privacidad.
De este modo, se profundiza en el marco de confianza creado por el Reglamento eIDAS sobre identificación electrónica y servicios de confianza para las transacciones electrónicas en el mercado interior, que ya contribuye notablemente a aumentar la confianza de los consumidores phishing o mejorando la confianza en el origen de los documentos.
Construir una cultura de confianza y responsabilidad en el manejo de datos y en las infraestructuras digitales, está en el foco de las acciones de los gobiernos de la UE, incluyendo a España. En este contexto, la intersección entre la calidad y la transparencia de los datos, una ciberseguridad robusta que reduzca la ciberdelincuencia, los Espacios Europeos de Datos, y la identidad digital europea destacan como mecanismos fundamentales para cultivar esta confianza y proponen una ruta hacia una mayor innovación que en última instancia genere valor social y económico a través de los datos.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El pasado 11 de septiembre se celebró un webinar en el que se llevó a cabo un repaso sobre Gaia-X, desde sus fundamentos, encarnados por su arquitectura y modelo de confianza denominado Trust Framework, pasando por los Servicios de Federación con los que se trata de facilitar y agilizar el acceso a la infraestructura, hasta el catálogo de servicios que unos usuarios (proveedores) podrán poner a disposición de otros (consumidores).
El webinar dirigido por la gerente del Hub español de Gaia-X, estuvo protagonizado por dos de los expertos de la Oficina del Dato, que a través de sus ponencias guiaron a la audiencia hacia un mayor conocimiento de los que es la iniciativa Gaia-X. Al final de la sesión. se contó con una dinámica de preguntas y respuestas en la que se pudo profundizar en detalle. Se puede acceder a la grabación de este seminario desde la página oficial del Hub: [Forjando el Futuro de los Espacios de Datos Federados en Europa | Gaia-X (gaiax.es)
Gaia-X como pieza clave para forjar los Espacios de Datos europeos
Gaia-X surge como un innovador paradigma con el que facilitar la integración de los recursos informáticos. En base a modelos tecnológicos de la Web 3.0, se habilita la identificación y trazabilidad de diferentes recursos de datos, desde conjuntos de datos, algoritmos, diferentes modelos semánticos o de otra índole conceptual, a incluso infraestructura tecnológica subyacente (recursos de nube). Esto sirve para visibilizar el origen y el funcionamiento de estas entidades, lo que permite facilitar la transparencia y el cumplimiento de normativas y los valores europeos.
Más concretamente, Gaia-X proporciona diferentes servicios encargados de verificar automáticamente el cumplimiento de unas reglas mínimas de interoperabilidad, lo que permite después definir reglas más abstractas con un foco de negocio, o incluso como base para definir e instanciar la Nube Confiable y los espacios soberanos de datos. Estos servicios se operacionalizarán mediante diferentes nodos de interoperabilidad de Gaia-X, o Gaia-X Digital Clearing Houses.
Con Gaia-X como herramienta podremos publicar, encontrar y explotar un catálogo de servicios que cubrirá diferentes servicios según los requerimientos del usuario. Por ejemplo, para infraestructura cloud estos pueden ser características como la residencia en territorio europeo o el cumplimiento de normativas UE (como el eIDAS o el RGPD, o las normas de intermediación de datos presentes en el Reglamento de Gobernanza de Datos), y también crear servicios combinables, agregando piezas de diferentes proveedores (algo complejo en estos momentos). También se encontrarán conjuntos de datos específicos con los que entrenar modelos de Inteligencia Artificial, y sobre los cuales su propietario tendrá control gracias a la trazabilidad habilitada, hasta la ejecución de algoritmos y apps sobre datos propios del consumidor, de forma que se preserve en todo momento la privacidad de los mismos.
Como vemos, esta novedosa capacidad de trazabilidad, basada en tecnologías punteras, sirve como acicate del Compliance, y por ello es una pieza fundamental en el despliegue de los espacios de datos interoperables a nivel europeo y el mercado único digital.
Apúntatelos en el calendario, toma nota en tu agenda o establece recordatorios en tu móvil para no olvidarte de esta lista de eventos sobre datos y gobierno abierto que se celebrará este otoño. Esta época del año viene cargada de oportunidades para aprender sobre innovación tecnológica y debatir acerca del poder transformador de los datos abiertos en la sociedad.
Desde talleres prácticos hasta congresos y conferencias magistrales. En este post, te presentamos algunos de los eventos más destacados que se celebraran durante octubre y noviembre. ¡Apúntate antes de que se agoten las plazas!
Espacios de datos en la UE: sinergias entre la protección de datos y los espacios de datos
A principios del décimo mes del año, la Agencia Española de Protección de Datos (AEPD) y la Agencia Europea de Ciberseguridad (ENISA) celebrarán un evento en inglés para abordar los desafíos y oportunidades de implementar las disposiciones del Reglamento General de Protección de Datos (GDPR) en los espacios de datos de la UE.
Durante la conferencia, se repasarán buenas prácticas de los espacios de datos existentes en la UE, se analizará la interacción entre la legislación y las políticas de la UE sobre intercambio de datos y se presentará la ingeniería de protección de datos como un elemento integral en la estructura de los espacios de datos, así como sus implicaciones jurídicas.
- ¿A quién va dirigido? Este evento promete ser una plataforma de conocimiento y colaboración de interés para toda persona interesada en el futuro de los datos en la región.
- ¿Cuándo y dónde es? El 2 de octubre en Madrid de 9:30 a 18:00 y en streaming con registro previo hasta las 14:45.
- Inscripción:(enlace ya no disponible)
Conferencia SEMIC ‘Europa interoperable en la época de la IA’
También en octubre regresa la conferencia anual SEMIC organizada por la Comisión Europea en colaboración con la Presidencia Española del Consejo de la Unión Europea. Este año el evento se celebra en Madrid y explorará cómo la interoperabilidad en el sector público y la inteligencia artificial pueden beneficiarse mutuamente a través de casos de usos concretos y proyectos exitosos.
Las sesiones abordarán las últimas tendencias en espacios de datos, gobernanza digital, garantía de calidad de los datos e inteligencia artificial generativa, entre otros. Además, se presentará una propuesta para una Ley sobre Europa Interoperable.
- ¿A quién va dirigido? Profesionales del sector público o privado que trabajen con datos, gobernanza y/o tecnología. La edición del año pasado atrajo a más de 1.000 profesionales de 60 países.
- ¿Cuándo y dónde es? El 18 de octubre se celebra la conferencia en el Hotel Riu Plaza de Madrid, también se podrá seguir online. El 17 de octubre tendrán lugar los talleres previos a la conferencia en el Instituto Nacional de Administración Pública.
- Inscripción: https://semic2023.eu/registration/

Data e IA en acción: impacto sostenible y realidades futuras
Del 25 al 27 de octubre se celebra en Valencia un evento sobre el valor de los datos en la inteligencia artificial que cuenta con la colaboración de la Comisión Europea y la Presidencia Española del Consejo de la Unión Europea, entre otros.
A lo largo de las tres jornadas, se presentarán ponencias de una hora aproximadamente sobre temáticas variadas como espacios de datos sectoriales, economía del dato o ciberseguridad.
- ¿A quién va dirigido? Los miembros del European Big Data Value Forum recibirán un descuento a la entrada y los miembros asociados cuentan con tres tickets por organización. El precio de la entrada varía de 120 a 370 euros.
- ¿Cuándo y dónde es? El 25, 26 y 27 de octubre en Valencia.
- Inscripción: bipeek
Webinars europeos: datos abiertos para investigación, crecimiento regional con datos abiertos y espacios de datos
El portal europeo de datos abiertos organiza de manera periódica seminarios online sobre proyectos y tecnologías relacionadas con datos abiertos. En datos.gob.es nos hacemos eco de ello en publicaciones resumen sobre cada sesión o en redes sociales. Además, una vez concluido el evento, se publican los materiales que se han utilizado para llevar a cabo la sesión didáctica. Ya está disponible el calendario de eventos de octubre en la web del portal. Inscríbete para recibir un recordatorio del webinar y, posteriormente los materiales utilizados.
-
Espacios de datos: Descubriendo la arquitectura de bloques
-
¿Cuándo? El 6 de octubre de 10:00 a 11:30 horas
-
Inscripción: data.europa academy 'Data spaces: Discovering the building blocks' (clickmeeting.com)
-
-
¿Cómo utilizar datos abiertos en tu investigación?
-
¿Cuándo? El 19 de octubre de 10:00 a 11:30
-
Inscripción: How to use open data for your research (clickmeeting.com)
-
-
Open Data Maturity Report: La dimensión de impacto en profundidad
-
¿Cuándo? El 27 de octubre de 10:00 a 11.30
-
Inscripción: data.europa academy 'Open Data Maturity 2022: Diving deeper into the impact dimension' (clickmeeting.com)
-
ODI SUMMIT 2023: Cambios en los datos
El mes de noviembre empieza con un evento del Instituto Open Data (ODI, por sus siglas en inglés) que plantea la siguiente pregunta a modo de presentación: ¿Cómo impactan los datos en el desarrollo tecnológico para abordar desafíos globales? Para que la sociedad pueda beneficiarse de tecnologías tan innovadoras como la inteligencia artificial, hacen falta datos.
En esta edición, ODI SUMMIT cuenta con ponentes del calibre del fundador de la World Wide Web, Tim Berners-Lee, la cofundadora de Women Income Network, Alicia Mbalire o la CEO de ODI Louise Burke. Es un evento gratuito previo registro.
- ¿A quién va dirigido? Profesores, estudiantes, profesionales del sector o investigadores son bienvenidos al evento.
- ¿Cuándo y dónde es? El 7 de noviembre Online
- Inscripción: Form (hsforms.com)
Estos son algunos de los eventos que están agendados para este otoño. De todas formas, no olvides seguirnos en redes sociales para no perderte ninguna novedad sobre innovación y datos abiertos. Estamos en Twitter y LinkedIn, también nos puedes escribir a dinamizacion@datos.gob.es si quieres que incluyamos algún otro evento a la lista o si necesitas información extra.
La Oficina del Dato elabora dos guías de ayuda para la concepción eficaz de espacios de datos
El concepto de espacio de datos, entendido como un ecosistema de compartición voluntaria de datos en un entorno de confianza, seguridad y soberanía, se va a desplegar con todo su potencial a lo largo de los próximos años, como apuesta clave de la Unión Europea para impulsar la economía del dato y preservar su soberanía digital. Dichos espacios se construyen alrededor de casos de uso concretos de compartición y explotación de datos donde satisfacer necesidades de negocio concretas, un proceso para el que no resulta sencillo descubrir dichas necesidades, ni su óptimo diseño, al estar presentes diversas consideraciones y áreas de conocimiento.
Para rebajar las barreras de entrada ligadas a su concepción, la Oficina del Dato, dependiente de la Secretaría de Estado de Digitalización e Inteligencia Artificial, ejerciendo su función de dinamizar el gobierno, gestión, compartición y el uso de datos, ha publicado sendas guías que facilitarán la puesta en marcha de casos de uso de compartición de datos: la Guía de evaluación de viabilidad de casos de uso y la Guía de diseño de casos de uso.
Ambos documentos tienen como objetivo ayudar a los potenciales creadores de espacios de datos a superar los desafíos propios de la puesta en marcha de un caso de uso de compartición de datos. En este sentido, las guías orientan paso a paso y en las sucesivas etapas del proceso, proporcionando plantillas con preguntas concretas a las diferentes situaciones que se irán presentando en su diseño. El uso de estas guías debe entenderse de forma iterativa, permitiendo un proceso de refinamiento; así, una vez establecida la viabilidad de un determinado escenario, se abordará su diseño detallado, en un proceso en el que la propia dinámica puede llevar a provocar un replanteamiento de la etapa original de viabilidad. De igual forma, las preguntas presentes en cada paso pueden provocar matizaciones en los pasos anteriores, permitiendo en todo momento una progresiva mejora.
Las guías tienen como origen el contenido de los trabajos realizados desde la iniciativa Data Sharing Coalition. Trabajos en los que, compartiendo experiencia y conocimiento, las organizaciones abordaron el desafío que supuso iniciar el camino de crear en la práctica casos de uso de compartición y explotación de datos. Tomando como base esta referencia, las guías que aquí presentamos han ido evolucionando y han sido particularizadas para el contexto español, siendo enriquecidas igualmente con las aportaciones de los participantes a los eventos de dinamización de espacios de datos organizados por la Oficina del Dato.
Guía de evaluación de viabilidad de casos de uso
La Guía de evaluación de viabilidad de casos de uso permite generar, describir y evaluar ideas de casos de uso escalables de compartición de datos. Con el objetivo final de tomar una decisión acerca de la viabilidad del escenario propuesto, la guía plantea una metodología estructurada a lo largo de cinco pasos: generación del caso de uso, definición de su alcance, evaluación del potencial, estudio de la complejidad de la interacción y toma de decisión final de viabilidad.
Guía de diseño de casos de uso
Una vez abordada la viabilidad del escenario planteado, y si ésta se estimase afirmativa, la Guía de diseño de casos de uso ofrece el soporte necesario para su puesta en marcha. En este punto, se incide tanto en su escalabilidad como en la reutilización de los datos más allá del ámbito inicial. A la hora de diseñar de forma óptima un caso de uso de intercambio y explotación de datos, creemos que las cuestiones de implementación técnica representan tan sólo uno de los factores a tomar en cuenta, resaltando también la criticidad de consideraciones tales como su gobernanza, el modelo de negocio, la experiencia de usuario y los diversos aspectos regulatorios sobre los que se articula y opera.
La Guía, a lo largo de diferentes etapas, aborda la definición detallada del caso de uso, fijando el objetivo y alcance, identificando las funcionalidades que permiten habilitar la compartición de datos, y detallando qué habilitadores permiten el desarrollo de dichas funcionalidades. Gracias al enfoque práctico de la guía, en ella se incluyen útiles plantillas de preguntas-clave que permiten descubrir fácilmente los diversos aspectos a considerar, abordando temas como los principios rectores del caso de uso, el modelo de iteración, los componentes funcionales, las reglas y regulaciones, los contratos, la privacidad, la gestión de la información y los riesgos, las herramientas de apoyo, o incluso los acuerdos de nivel de servicio o la planificación del proyecto.
Los documentos base de ambas guías, las plantillas de preguntas en formato de hoja de cálculo para facilitar su cumplimentación, así como un ejemplo relativo a la viabilidad del proyecto “Caminos de pasión” facilitado por la Fundación Santa María la Real, se encuentran disponibles a través de los siguientes enlaces.
Un espacio de datos es un marco de desarrollo que permite la creación de un ecosistema completo proporcionando una estructura organizativa, normativa, técnica y de gobernanza con el objetivo de facilitar el intercambio confiable y seguro de distintos activos de datos para el beneficio común de todos los actores implicados y asegurando que se cumpla con toda la normativa y leyes aplicables. Los espacios de datos son, además, un elemento clave de la nueva estrategia de datos de la Unión Europea y una pieza imprescindible a la hora de materializar el objetivo del mercado único de datos europeo.
Como parte de esta estrategia, la Unión Europea está actualmente explorando la creación de varios pilotos de espacios de datos en algunos sectores y dominios estratégicos: sanidad, industria, agricultura, finanzas, movilidad, Pacto Verde, energía, Administración pública y competencias. Estos espacios de datos ofrecen un gran potencial a la hora de ayudar a las organizaciones a mejorar en la toma de decisiones, aumentar la innovación, desarrollar nuevos productos, servicios y modelos de negocio, reducir costes y evitar duplicar esfuerzos. Sin embargo, la creación de un espacio de datos exitoso no es una actividad trivial y requiere analizar cuidadosamente los casos de uso primero y enfrentarse después a grandes desafíos en los ámbitos de negocio, legal, operativo, funcional, tecnológico y de gobernanza.
Es por ello que, como medida de apoyo, se ha creado también el Centro de Soporte para los Espacios de Datos (Data Spaces Support Centre o DSSC), un órgano que se encarga de proporcionar orientación, herramientas y recursos a todas aquellas organizaciones interesadas en crear nuevos espacios de datos o participar en ellos. Uno de los primeros recursos elaborados por el DSSC ha sido precisamente el kit de iniciación a los espacios de datos, cuya versión final se ha publicado recientemente y que proporciona una guía inicial básica para entender cuáles son los elementos básicos de un espacio de datos y cómo afrontar los diferentes desafíos que se plantean a la hora de construirlos. Repasamos a continuación algunas de las principales pautas y recomendaciones que nos ofrece este kit de iniciación.
El valor de los espacios de datos y sus modelos de negocio
Los espacios de datos pueden resultar una alternativa real a las plataformas unidireccionales actuales, generando modelos de negocio basados en los efectos de red que dan respuesta tanto a la oferta como a la demanda de datos. Entre los distintos patrones de modelo de negocio existentes en los espacios de datos podemos encontrar:
- Reparto de costes: todos los participantes ahorran tiempo y dinero al compartir los datos con un objetivo común, como por ejemplo la red inteligente de proveedores conectados SCSN.
- Innovación conjunta: la innovación sólo es posible si se comparten los datos al no disponer ninguno de los participantes de los datos completos de forma individual, como por ejemplo en la plataforma Eona-X de movilidad, transporte y turismo.
- Fuerzas combinadas: distintos actores se unen para evitar que un único agente pueda dominar un determinado espacio, como en la red de datos de fabricación EuPro Gigant.
- Mercado compartido: actores que tienen intereses comunes comparten datos entre sí para poder beneficiarse mutuamente, como por ejemplo la red de automoción Catena-X.
- Mayor bien común: cuando los sectores público y privado comparten datos con una finalidad social, como por ejemplo en el espacio de datos de movilidad que en España se desarrolla a través del Grupo de Trabajo de Movilidad del Hub Gaia-X.
Los aspectos legales
La parte legal de los espacios de datos puede constituir un gran desafío al moverse estos necesariamente entre múltiples marcos legales y regulaciones, tanto nacionales como europeos. Para afrontar este reto, el Data Spaces Support Centre propone la elaboración de un marco de referencia compuesto de tres instrumentos principales:
- Los marcos jurídicos transversales que serán de aplicación a todos los espacios de datos, como la ley contractual, la protección de datos, la propiedad intelectual, las leyes de competencia o las de ciberseguridad.
- Los aspectos organizativos a considerar a la hora de establecer modelos y mecanismos para la gobernanza de los datos en cada caso específico.
- La dimensión contractual a tener en cuenta a la hora de intercambiar datos y los acuerdos y términos de uso que se deben establecer para que eso sea posible.
Las actividades operativas
El diseño de las actividades operativas deberá abordar los acuerdos que posibiliten el funcionamiento organizativo del espacio de datos, como por ejemplo pautas para la incorporación de nuevos participantes, sobre la toma de decisiones y para la resolución de conflictos.
Además, se deberán también tener en cuenta las operaciones de carácter empresarial, como la racionalización y automatización de procesos, las tareas de marketing y las actividades de sensibilización, que son también componentes importantes de las actividades operativas.
Funcionalidad de los espacios de datos
Los espacios de datos compartirán una serie de componentes básicos (o building blocks) que serán los que ofrezcan la funcionalidad mínima esperada de los mismos, incluyendo al menos los siguientes elementos:
- Interoperabilidad: modelos de datos y formatos, interfaces de intercambio de datos y origen y trazabilidad.
- Confianza: gestión de la identidad, control de acceso y uso e intercambios de datos seguros.
- Valor del dato: metadatos y protocolos de localización, contabilidad del uso de los datos y servicios de publicación y comerciales.
- Gobernanza: acuerdos de cooperación y de nivel de servicio y modelos de continuidad.
Si bien cabe esperar que estos componentes sean comunes a todos los espacios de datos y ofrezcan una funcionalidad similar, cada espacio de datos en particular podrá tomar las decisiones de diseño que estime más oportunas a la hora de implementarlos y llevarlos a cabo.
Aspectos tecnológicos
Los espacios de datos están diseñados de manera que sean agnósticos en cuanto a la tecnología, es decir, que se definen únicamente en términos de funcionalidad y con libertad en cuanto a la elección de las tecnologías específicas para su implementación. En este escenario será importante establecer referencias claras en cuanto a:
- Una base formal de estándares de facto que se deberán seguir.
- Especificaciones que sirvan como referencia para las distintas implementaciones.
- Implementaciones de código abierto de los componentes básicos llevadas a cabo por otros agentes.
Gobernanza de los espacios de datos
Para diseñar, poner en marcha y mantener un espacio de datos es necesario que múltiples organizaciones colaboren de forma conjunta y en diferentes funciones. Esto requiere que estas entidades construyan una visión común de los aspectos clave de dicha colaboración a través de un marco de gobernanza.
Para ello, se deberá llevar a cabo un ejercicio de diseño conjunto a través del cual los actores interesados lleguen a la formalización de una serie de acuerdos que definan los aspectos estratégicos y operativos clave, como las cuestiones legales, la descripción de la red de participantes, el código de conducta, los términos y condiciones de uso, los acuerdos de constitución y adhesión al espacio de datos o el modelo de gobierno.
En un futuro próximo el centro de soporte DSSC identificará los componentes básicos de cada una de las dimensiones descritas anteriormente y proporcionará orientación adicional para cada uno de ellos a través de la elaboración de un plan común (o blueprint) para los espacios de datos. Así pues, si os estáis planteando participar en alguna de las iniciativas de espacios de datos que se están poniendo en marcha, pero no tenéis muy claro por dónde empezar, entonces este kit básico de iniciación os resultará sin duda un recurso valioso a la hora de comprender los conceptos básicos – junto con el glosario que explica toda la terminología relacionada. Tampoco olvidéis subscribiros al boletín de noticias del centro de soporte para estar al tanto de todas las novedades, documentación y los servicios de apoyo que ofrece.
Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Vivimos en la era de los datos, palanca de transformación digital y un activo estratégico para la innovación y el desarrollo de nuevas tecnologías y servicios. Los datos, más allá de las habilidades que aportan al generador y/o dueño de los mismos, tienen además la peculiaridad de ser un activo no-rival. Esto quiere decir que pueden ser reutilizados sin que ello suponga un detrimento para el dueño de los derechos originales, lo que los convierte en un recurso con un alto grado de escalabilidad en su compartición y explotación.
Esta posibilidad de compartición no-rival, además de abrir potenciales nuevas líneas de negocio a los dueños originales, conlleva también un ingente valor latente para el desarrollo de nuevos modelos de negocio. Y aunque la compartición no es algo novedoso, ésta se encuentra todavía muy limitada a contextos nicho de especialización sectorial, mediados bien por la confianza entre partes (generalmente forjada de antemano), o tediosas y disciplinadas condiciones contractuales. Es por ello que surge el innovador concepto de espacio de datos, que en su acepción más simplificada no es más que la modelización de las condiciones generales con que desplegar una compartición voluntaria, soberana y segura de datos. Una vez modelizadas, la prescripción de consideraciones y metodologías (tanto tecnológicas, como organizativas y operativas) permite hacer tangible esa compartición en base a interacciones punto a punto, que conjuntamente dan forma a ecosistemas federados de conjuntos y servicios de datos.
Por ello, y dada la naturaleza distribuida de los espacios de datos (no son un sistema informático monolítico, ni una plataforma centralizada), una manera óptima de aproximarse de su construcción es a través de la creación y despliegue de casos de uso.
La Oficina del Dato ha creado esta infografía de un ‘Modelo de desarrollo de casos de uso dentro de los espacios de datos’, con el objetivo de definir sintéticamente las fases de ese viaje iterativo, que progresivamente va dando forma a un espacio de datos. Este modelo sirve además de marco general para otros entregables técnicos y metodológicos venideros, como por ejemplo la ‘Guía de Evaluación de Viabilidad de Casos de Uso’, o la ‘Guía de Diseño de Casos de Uso’, elementos con que facilitar la puesta en marcha de experiencias prácticas (y escalables por diseño) de compartición de datos, condición sine qua non para articular el ansiado mercado único de datos europeo.
El reto de construir un espacio de datos
Para hacer más accesible el proceso de desarrollar un espacio de datos, podríamos asimilar la definición y construcción de un caso de uso como un proyecto de construcción, en el que desde un problema de negocio inicial (necesidades o retos, deseos, o problemas a resolver) se llega a una meta en la que se aporta valor al negocio, dando solución a esas necesidades iniciales. Esta infografía ofrece una síntesis de ese viaje.
Estas son las fases del modelo:
- FASE 1: Definición del problema de negocio. En esta fase un grupo de potenciales participantes detecta una oportunidad alrededor de la compartición de sus datos (hasta ahora en silos) y su correspondiente explotación. Esta oportunidad puede ser nuevos productos o servicios (innovación), mejoras de eficiencia, o la resolución de un problema de negocio. Es decir, existe un objetivo de negocio que el grupo es capaz de resolver de forma conjunta, compartiendo datos.
- FASE 2: Modelización data-driven. En esta fase se identificarán aquellos elementos que sirvan para estructurar y organizar los datos para la toma de decisiones estratégicas en base a su explotación. Implica definir un modelo que posiblemente emplee herramientas multidisciplinarias para conseguir resultados de negocio. Es la parte que tradicionalmente se asocia a tareas de la ciencia de datos.
- FASE 3: Consenso en la especificación de requisitos. Aquí, los actores que auspician el caso de uso deben establecer el modelo de relación a tener durante este proyecto colaborativo alrededor de los datos. Dicha fórmula debe: (i) definir y establecer las reglas de participación, (ii) definir un conjunto común de políticas y modelo de gobierno, y (iii) definir un modelo de confianza que actúe como raíz de dicha relación.
- FASES 4 y 5: Plano del caso de uso. Como en un proyecto de construcción, el plano es el medio de expresión de las ideas de quienes han definido y acordado el caso de uso, y debe recoger de forma explícita las soluciones planteadas para cada una de las partes del desarrollo del mismo. Ese plano es único para cada caso de uso, y la fase 5 corresponde a su construcción. Sin embargo, no se crea desde la nada, sino que existen múltiples referencias que permiten utilizar materiales y técnicas previamente identificadas. Por ejemplo, modelos, metodologías, artefactos, plantillas, componentes tecnológicos o soluciones como servicio. Así, al igual que un arquitecto proyectando un edificio puede reutilizar estándares reconocidos, en el mundo de los espacios de datos también existen modelos sobre los que pintar los componentes y procesos de un caso de uso. El análisis y síntesis de esas referencias es la fase 4.
- FASE 6: Selección, parametrización y/o desarrollo tecnológico. La tecnología habilita el despliegue de la transformación y explotación del dato, favoreciendo todo el ciclo de vida, desde su recopilación hasta su puesta en valor. En esta fase se implementa la infraestructura que da soporte al caso de uso, entendida ésta como la colección de herramientas, plataformas, aplicaciones y/o piezas de software necesarias para la operación del aplicativo.
- FASE 7: Integración, test y despliegue. Como todo proceso de construcción tecnológico, el caso de uso pasará por las fases de integración, prueba y despliegue. Los trabajos de trabajos de integración y las pruebas funcionales, de usabilidad, de carácter exploratorio, de aceptación, etc. nos ayudarán a alcanzar la configuración deseada para el despliegue operativo del caso de uso. En el caso de desear la incorporación de un caso de uso a un espacio de datos preexistente, la integración buscaría encaje dentro de su estructura, lo que supone modelizar los requisitos de dicho caso de uso dentro de los procesos y bloques constructivos del espacio de datos.
- FASE 8: Espacio de datos operativo. El punto de llegada de este viaje es el caso de uso en funcionamiento, que empleará servicios digitales desplegados por encima de la estructura del espacio de datos, y cuya arquitectura da soporte a diferentes recursos y funcionalidades federada por diseño. Esto implica que se habría articulado eficientemente el ciclo de vida de creación de valor en base a los datos compartidos, y se obtiene rédito de negocio según el planteamiento original. Sin embargo, esto no impide que el espacio de datos pueda seguir evolucionando a posteriori, ya que su vocación es crecer bien con la entrada de nuevos retos, o actores a casos de uso ya existentes. De hecho, la escalabilidad del modelo es una de sus bondades singulares.
En esencia, los datos compartidos por medio de un ecosistema federado e interoperable son la entrada que alimenta una capa de servicios que generará valor y resolverá las necesidades y retos originales planteados, en un viaje que va desde la definición de un problema de negocio hasta su resolución.
Los datos abiertos suponen el nivel más alto de intercambio de datos, ya que están disponibles de manera gratuita y son accesibles para todos. Procesados de manera adecuada y garantizando un pleno respeto a la protección de datos personales, pueden ayudar a los ciudadanos, empresas y sector público a tomar mejores decisiones.
Los datos abiertos, junto con el resto de datos, juegan un papel clave la creación de espacios de datos, tal y como refiere la Estrategia Europea de Datos. Como recoge el documento, la puesta en marcha de espacios de datos comunes e interoperables en sectores estratégicos se constituye con el objetivo de “superar los obstáculos técnicos y jurídicos a la puesta en común de datos entre organizaciones, combinando las herramientas e infraestructuras necesarias y abordando cuestiones de confianza”, por ejemplo, mediante normas comunes desarrolladas para el espacio”.
Teniendo en cuenta su relevancia, la Academia del Portal de Datos Europeo ha organizado una serie de seminarios web sobre espacios de datos. El primero de ellos se celebró el pasado 12 de mayo en formato online y se puede ver aquí. En él, se mencionaron las novedades y progresos que se están llevando a cabo respecto a los data spaces, avances que en España se vienen realizando desde la Oficina del Dato.
Resumimos a continuación los principales aspectos abordados en este primer seminario, en el que participaron Daniele Rizzi, Principal administrator and policy officer y Johan Bodenkamp, Policy and project officer en la Dirección General de Redes de Comunicación, Contenido y Tecnologías de la Comisión Europea, con la moderación de Giulia Carsaniga, Research and Policy Lead Consultant en Capgemini.
Los espacios de datos y la estrategia digital de la UE
En la primera parte del seminario, que se celebró de manera online, se destacó cómo la transformación digital es una de las grandes prioridades de la Unión Europea. De hecho, Europa cuenta con una estrategia específica para avanzar en este aspecto, es decir, lograr ‘Una Europa adaptada a la era digital’, y es una de las seis prioridades 2019-24 de la Comisión Europea.
La estrategia digital de la Unión Europea tiene como objetivo hacer que la trasformación digital beneficie a las personas y las empresas, contexto en el que se enmarca la Estrategia Europea de Datos de febrero de 2020, que recoge una serie de medidas para el impulso de un mercado europeo del dato, a semejanza del Mercado Común Europeo, germen de la actual UE.
La creación de este mercado europeo del dato requiere del establecimiento de una serie de acciones y estándares con un enfoque basado en los datos, la tecnología y la infraestructura. A ello, contribuye además el esfuerzo colectivo, en el que se encuadran programas públicos como DIGITAL Europe o privados como Gaia-X.
Un año después de la aprobación de la Estrategia Europea del Dato, el Consejo Europeo reconocía, en marzo de 2021, “la necesidad de acelerar la creación de espacio de datos comunes y asegurar el acceso e interoperabilidad de los datos” e invitaba a la Comisión a “presentar el progreso realizado y las medidas restantes necesarias para establecer los espacios de datos sectoriales anunciados en la Estrategia Europea de Datos de febrero de 2020”. Posteriormente, en febrero de 2022 la Comisión Europea publicó un documento de trabajo sobre el mercado europeo del dato.
Tras contextualizar en el marco europeo el desarrollo del concepto de espacios de datos, los ponentes del webinar pasaron a explicar aquellas piezas fundamentales que formarán parte de los espacios de datos, algunas de ellas ya están operativas y otras se encuentran en desarrollo. En el seminario se dio una visión general de cómo se espera que sea el espacio de datos europeo, y se destacaron las siguientes partes:
En primer lugar, se habló sobre los datasets de alto valor del sector público. En enero de este año la Comisión Europea publicó el listado de conjuntos de datos de alto valor entendido como aquellos que aportan valor añadido e importantes beneficios para la sociedad. Existe una amplia variedad de datos de alto valor englobados en diferentes áreas (salud, agricultura, movilidad, energía, etc.) que las partes interesadas ponen a disposición con diferentes grados de apertura. Tal y como se explicó en el webinar, la idea es comenzar a crear espacios de datos de alto valor comunes en áreas más homogéneas, aunque el objetivo final es que en ese mercado europeo se compartan datos entre todas ellas, ya que la mayoría de las aplicaciones requerirán datos de diferentes ámbitos.
Para apoyar la creación de esos espacios de datos, la primera iniciativa que se ha puesto en marcha en Europa es la creación del Data Spaces Support Centre. Este centro explora las necesidades de las iniciativas de los espacios de datos, define requisitos comunes, establece las mejores prácticas para acelerar la formación de espacios de datos soberanos como un elemento crucial de la transformación digital en todas las áreas y se encarga de garantizar su interoperabilidad mediante el cumplimiento de unos estándares comunes.
Para que todo esto se pueda desarrollar, es necesario contar con una infraestructura técnica para los espacios de datos, que se encarga de facilitar servicios cloud y edge-cloud, soluciones de middleware inteligente (Simpl), mercado digital, computación de alto rendimiento, plataforma de inteligencia artificial bajo demanda e instalaciones de prueba y experimentación de IA.
Diferencias y similitudes entre los espacios de datos y los datalakes
Tras repasar la visión general de los espacios de datos en Europa, en el seminario se abordaron sus principales características. De esta forma, se presentó un espacio de datos como una infraestructura de TI segura y respetuosa con la privacidad para agrupar, acceder, procesar, usar y compartir datos. Además, se definió como un mecanismo de gobernanza de datos que comprende un conjunto de reglas de naturaleza administrativa y contractual que determinan los derechos de acceso, procesamiento, uso y compartición de datos de manera confiable, transparente y en cumplimiento de la legislación vigente.
Una de las características que se destacaron en el webinar sobre este tipo de infraestructura es que en ella los titulares de los datos tienen el control sobre quién puede acceder a qué datos, con qué propósito y bajo qué condiciones pueden ser utilizados, Además, hay una gran cantidad de datos disponibles de forma voluntaria que pueden ser reutilizados de forma gratuita o a cambio de una remuneración, dependiendo de la decisión de los titulares de los datos.
Finalmente, se subrayó el hecho de que los espacios de datos cuentan con la participación de un número abierto de organizaciones/individuos, respetando las normas de competencia y garantizando un acceso no discriminatorio para todos los participantes.
Otro de los conceptos que se abordó en el seminario fue el de datalake, para compararlo con el de un espacio de datos. Así, se definieron los lagos de datos como repositorios que permiten almacenar datos estructurados y no estructurados a cualquier escala. En un datalake, según explicaron en el seminario, es posible almacenar datos tal y como están, sin necesidad de estructurarlos previamente y ejecutar diferentes tipos de análisis, desde paneles de control y visualizaciones hasta realizar procesamiento de big data, análisis en tiempo real y aprendizaje automático para tomar decisiones más acertadas. El acceso al datalake implica la posibilidad de acceder a todos los datos contenidos que se albergan en él, no necesariamente de manera ordenada.
Por otra parte, un espacio de datos, en palabras de los ponentes, se puede definir como un ecosistema de datos federado basado en políticas y reglas compartidas. Los usuarios de dichos espacios de datos tienen la capacidad de acceder a los datos de manera segura, transparente, confiable, fácil y unificada. En un espacio de datos los titulares de los datos tienen el control sobre el acceso y uso de sus datos. Desde una perspectiva técnica, se puede ver un espacio de datos como un concepto de integración de datos que no requiere esquemas de bases de datos comunes ni integración física de datos, sino que se basa en almacenes de datos distribuidos e integrados según sea necesario.
Haciendo un símil con la acción de conseguir peces, en el datalake el usuario tiene que pescarlos por sí mismo, y un espacio de datos sería como ir a un mercado de peces.
Próximos pasos: Marco de gobernanza y actores europeos
Una vez presentada la diferencia entre dataspaces y datalakes, en el webinar se abordó el cambio de paradigma de intercambio de datos que está sucediendo en la actualidad. Hasta ahora, se empleaba un intercambio bilateral de datos basado en acuerdos contractuales, sin embargo, va tomando fuerza un nuevo modelo de infraestructuras de intercambio de datos con alojamiento centralizado de datos y/o mercados de datos que permiten reducir los costes de transacción cuando los datos no se mantienen en un repositorio central.
El siguiente paso en la evolución de los espacios de datos sería, según los ponentes, la creación de enlaces entre los participantes, en un modelo en el que los datos se federasen y se almacenasen de manera distribuida con herramientas que permitan la búsqueda, el acceso y el análisis en múltiples industrias, empresas y entidades.
Para que este proceso ocurra, tal y como los ponentes explicaron, es necesario el apoyo y trabajo coordinado de diferentes actores. Por un lado, sería fundamental establecer unas normas comunes que faciliten el intercambio de datos y acercar a los diferentes actores implicados a una política común de datos en la UE. Igualmente es indispensable ofrecer soluciones técnicas y apoyo financiero.
En esta línea, en el webinar se destacó un importante hito: la puesta en marcha del European Data Innovation Board (EDIB) que apoyará a la Comisión en la publicación de directrices para facilitar el desarrollo de los espacios comunes europeos de datos y la identificación de las normas y los requisitos de interoperabilidad necesarios para el intercambio de datos.
Como se indicó anteriormente, la puesta en marcha del espacio de datos precisa de arquitectura técnica, por lo que en el webinar se destacaron dos soluciones técnicas gratuitas:
- Los Building Blocks: Soluciones digitales abiertas y reutilizables basadas en estándares que permiten funcionalidades básicas, como la autenticación confiable y el intercambio seguro de datos.
- Simpl: El middleware inteligente que permitirá federaciones basadas en la nube y nube en el borde. Apoyará las principales iniciativas de datos financiadas por la Comisión Europea, como los espacios de datos europeos comunes.
El papel clave del Data Spaces Support Centre
Al final del seminario se presentó con más detalle la iniciativa Data Spaces Support Centre (DSCC). Este centro, creado en octubre de 2022, da apoyo a las diferentes iniciativas en la creación de espacios de datos y está previsto que finalice su actividad en marzo de 2026. Está formado por doce socios y cuenta además con dieciséis socios colaboradores, entre los que se encuentran importantes asociaciones y empresas con experiencia en el ámbito del intercambio de datos.
El DSCC tiene como misión principal la creación de una red de socios y una comunidad, a la que proporciona las herramientas para la creación de los espacios de datos. Se centra de manera especial en la interoperabilidad y pretende generar sinergias a nivel europeo para el desarrollo de espacios de datos.
En el webinar se hizo un repaso de las colaboraciones y las iniciativas en las que participa el Data spaces support centre y se destacó que en su web está disponible el kit de inicio, un punto de partida para la construcción de los espacios de datos.
En la recta final del seminario, para dar una visión general de los espacios de datos, se detallaron cuáles son los actores relevantes del espacio común de datos europeo:
- Data Spaces Support Centre (DSSC): Encargado de coordinar las acciones relevantes en los espacios de datos.
- Data Space Coordination and Support Actions (CSAs): Se centra en los espacios de datos sectoriales.
- European Data Innovation Board: A partir de septiembre de 2023, se ocupará de fijar las directrices para lograr la interoperabilidad en los espacios de datos.
Si quieres saber más sobre el concepto de los espacios de datos y su relevancia en la actualidad, puedes ver el seminario completo en el siguiente vídeo:
Los materiales formativos están disponibles en https://data.europa.eu/en/academy:
- La sesión grabada: https://www.youtube.com/watch?v=L9U-eKVtspA
- La presentación de apoyo del webinar: https://data.europa.eu/en/academy/role-dataeuropaeu-eu-data-spaces
Con el avance que la tecnología y la conectividad han venido experimentando durante los últimos años hemos entrado de lleno en una nueva era en la que los datos nunca duermen y la cantidad de datos circulando es mayor que nunca. En la actualidad, podríamos decir que vivimos encerrados en una esfera rodeados de datos y eso nos ha ido haciendo cada vez más dependientes de ellos. Por otro lado, nos hemos ido también transformando poco a poco en seres tanto productores como recolectores de datos.
El término datasfera se ha venido utilizado históricamente para definir el conjunto de toda la información existente en los espacios digitales, incluyendo también otros conceptos relacionados como los flujos de datos y las plataformas implicadas. Pero este concepto ha ido desarrollándose y cobrando cada vez más relevancia de forma paralela al creciente peso de los datos en nuestra sociedad actual, convirtiéndose en un concepto importante a la hora de definir el futuro de las relaciones entre tecnología y sociedad.
En los inicios de la era digital podíamos considerar que vivíamos en nuestras propias burbujas de datos que íbamos alimentando poco a poco a lo largo de nuestras vidas hasta acabar totalmente inmersos en los datos del mundo online, donde la distinción entre lo real y lo virtual es cada vez más irrelevante. Hoy en día vivimos en una sociedad interconectada a través de los datos y también mediante algoritmos que nos unen y establecen relaciones entre nosotros. Todos aquellos datos que compartimos de forma más o menos consciente ya no nos afectan únicamente a nosotros mismos como individuos, sino que pueden tener también su efecto en el resto de la sociedad, incluso de forma a veces totalmente imprevisible – como en una versión digital del efecto mariposa.
Por tanto, los modelos de gobernanza que se basen en trabajar con los datos y su relación con las personas, como si se tratasen simplemente de instancias aisladas con las que podemos trabajar individualmente, ya no nos serán de utilidad en este nuevo entorno.
La necesidad de una aproximación a los datos basada en sistemas
En la actualidad, ese concepto relativamente simple de la dataesfera ha ido evolucionando hasta convertirse en un ecosistema digital completo, altamente interconectado y complejo – compuesto por una amplia gama de datos y tecnologías – que nosotros habitamos y que afecta a la forma en la que vivimos nuestras vidas. Es un sistema en el que los datos tienen valor solo en el contexto de su relación con otros datos, con las personas y con las normas que regulan esas relaciones.
Por lo tanto, para una gestión eficaz de este nuevo ecosistema, será necesaria una mejor comprensión de cómo los diferentes componentes de la dataesfera se relacionan entre sí, de cómo los datos fluyen a través de estos componentes y de cuáles serán las normas adecuadas necesarias para que este sistema interconectado funcione.
Los datos como componente activo del sistema
En una aproximación basada en sistemas, los datos se consideran un componente activo dentro del ecosistema. Esto significa que los datos ya no son sólo información estática, sino que también tienen la capacidad de influir en el funcionamiento del propio ecosistema y, por tanto, serán un componente más a tener en cuenta para la gestión eficaz del mismo.
Por ejemplo, los datos pueden utilizarse para ajustar el funcionamiento de los algoritmos, mejorando la precisión y la eficiencia de los sistemas de inteligencia artificial y de aprendizaje automático. De forma similar, también podrían utilizarse para ajustar la forma en que se toman decisiones y se aplican políticas en diferentes sectores, como la atención médica, la educación y la seguridad.
La dataesfera y la evolución del gobierno de los datos
Por lo tanto, será necesario explorar nuevos marcos colectivos de gobernanza de datos que tengan en consideración a todos los elementos del ecosistema en su diseño, controlando la forma en que se accede, se utiliza y se protege la información en el conjunto de la dataesfera.
Así se podría garantizar que los datos sean utilizados de manera segura, ética y responsable para el conjunto del ecosistema y no sólo en casos individuales o aislados. Por ejemplo, algunas de las nuevas herramientas de gobernanza de datos que hace ya tiempo que se están experimentando y nos pueden servir a la hora de gestionar la dataesfera de forma colectiva son los data commons o bienes digitales de datos, los data trusts o fideicomisos de datos, las cooperativas de datos, o los data collaboratives o colaboraciones de datos, entre otros.
El futuro de la dataesfera
La dataesfera seguirá creciendo y evolucionando en los próximos años, impulsada una vez más por los nuevos avances tecnológicos y el aumento de la conectividad y la ubicuidad de los sistemas. Será importante que los gobiernos y las organizaciones se mantengan al día de estos cambios y adapten sus estrategias de gobierno y gestión de datos en consecuencia mediante marcos regulatorios sólidos, acompañados de pautas éticas y prácticas responsables que aseguren que los beneficios que nos prometen la explotación de los datos se puedan finalmente materializar al mismo tiempo que se minimizan los riesgos.
Para poder atender adecuadamente estos desafíos, y aprovechar así todo el potencial de la dataesfera para un cambio positivo y por el bien común, será esencial dejar de pensar en los datos como algo que podamos tratar de forma aislada y adoptar un enfoque basado en sistemas que reconozca la naturaleza interconectada de los datos y su impacto en el conjunto de la sociedad.
Hoy en día, podríamos considerar que los espacios comunes de datos (data spaces), que la Comisión Europea lleva ya algún tiempo desarrollando como parte clave de su nueva estrategia de datos, son precisamente una evolución lógica del concepto de la dataesfera adaptada a las necesidades particulares de nuestro tiempo y actuando sobre todos los componentes del ecosistema simultáneamente: técnico, funcional, operacional, legal y de negocio.
Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.