En la era digital actual, la compartición de datos y los datos abiertos (open data) han emergido como pilares fundamentales para la innovación, la transparencia y el desarrollo económico. Diversas compañías y organizaciones alrededor del mundo están adoptando estos enfoques para fomentar el acceso abierto a la información y potenciar la toma de decisiones basada en datos. A continuación, exploramos algunos ejemplos internacionales y nacionales de cómo estas prácticas están siendo implementadas.
Casos de éxito globales
Uno de los referentes globales en la compartición de datos es LinkedIn con su programa Data for Impact. Este programa facilita a gobiernos y organizaciones el acceso a datos económicos agregados y anonimizados, basados en el Economic Graph de LinkedIn, el cual representa la actividad profesional global. Es importante aclarar que los datos solo pueden utilizarse con fines de investigación y desarrollo. El acceso debe solicitarse vía email, adjuntando una propuesta para su evaluación, y se priorizan propuestas de gobiernos y organizaciones multilaterales. Estos datos han sido utilizados por entidades como el Banco Mundial y el Banco Central Europeo para informar de políticas y decisiones económicas clave. El enfoque de LinkedIn en la privacidad y la calidad de los datos asegura que estas colaboraciones beneficien tanto a las organizaciones como a los ciudadanos, promoviendo un crecimiento económico inclusivo, verde y alineado con las tecnologías digitales.
Por otro lado, el Registry of Open Data on AWS (RODA) es un repositorio gestionado Amazon Web Services (AWS) que alberga conjuntos de datos públicos. Los datasets no son proporcionados directamente por AWS, sino que son mantenidos por organizaciones gubernamentales, investigadores, empresas y particulares. Podemos encontrar, en el momento de escribir este post, más de 550 conjuntos de datos publicados por diferentes organizaciones, incluyendo algunas como el Allen Institute for Artificial Intelligence (AI2) o la propia NASA. Esta plataforma facilita que los usuarios aprovechen los servicios de computación en la nube de AWS para su análisis.
En el ámbito del periodismo de datos, FiveThirtyEight, propiedad de ABC News, ha adoptado un enfoque de transparencia radical al compartir públicamente los datos y códigos detrás de sus artículos y visualizaciones. Estos se encuentran accesibles a través de GitHub en formatos fácilmente reutilizables como CSV. Esta práctica no solo permite la verificación independiente de su trabajo, sino que también impulsa la creación de nuevas historias y análisis por parte de otros investigadores y periodistas. FiveThirtyEight se ha convertido en un modelo a seguir en lo relativo a cómo los datos abiertos pueden mejorar la calidad y la credibilidad del periodismo.
Casos de éxito en España
España no se queda atrás en cuanto a iniciativas de compartición de datos y open data por parte de compañías privadas. Varias empresas españolas están liderando iniciativas que promueven la accesibilidad y transparencia de los datos en diferentes sectores. Veamos algunos ejemplos.
Idealista, uno de los portales inmobiliarios más importantes del país, ha publicado un conjunto de datos abiertos que incluye información detallada sobre más de 180,000 viviendas en Madrid, Barcelona y Valencia. Este conjunto de datos proporciona las coordenadas geográficas y los precios de venta de cada propiedad, junto con sus características internas y la información oficial del catastro español. Este conjunto de datos está disponible para su acceso a través de GitHub como un paquete en R y se ha convertido en una gran herramienta para el análisis del mercado inmobiliario, permitiendo a investigadores y profesionales del sector desarrollar modelos de valoración automática y realizar estudios detallados sobre la segmentación del mercado. Cabe destacar que Idealista también reutiliza datos públicos de organismos como el catastro o el INE para ofrecer servicios de datos que dan soporte a las decisiones en el mercado inmobiliario, como contratación de hipotecas, estudios de mercado, valoración de carteras, etc.Por su parte BBVA, a través de su Fundación, ofrece acceso a un extenso fondo estadístico con bases de datos que incluyen cuadros, tablas y gráficos dinámicos. Estas bases de datos, de descarga libre, cubren temas como la productividad, la competitividad, el capital humano o la desigualdad en España, entre otros. Además, proporcionan series históricas sobre la economía española, inversiones, actividades culturales y gasto público. Estas herramientas están diseñadas para complementar publicaciones impresas y ofrecer una visión profunda sobre la evolución económica y social del país.
Además, Esri España habilita su Portal de Datos Abiertos, que pone a disposición de los usuarios una amplia variedad de contenidos que pueden ser consultados, analizados y descargados. Este portal incluye datos gestionados por Esri España, junto con una recopilación de otros portales de datos abiertos desarrollados con tecnología Esri. Esto amplía significativamente las posibilidades para investigadores, desarrolladores y profesionales que buscan aprovechar los datos geoespaciales en sus proyectos. Podemos encontrar conjuntos de datos en las categorías de salud, ciencia y tecnología o economía, entre otros.
En el ámbito de las empresas públicas, España también cuenta con ejemplos destacados de compromiso con los datos abiertos. Renfe, la principal operadora ferroviaria, y Red Eléctrica Española (REE), la entidad responsable de la operación del sistema eléctrico, han desarrollado programas de open data que facilitan el acceso a información relevante para la ciudadanía y para el desarrollo de aplicaciones y servicios que mejoren la eficiencia y la sostenibilidad. Destaca, en el caso de REE, la posibilidad de consumo de los datos disponibles a través de APIs REST, que facilitan la integración de aplicaciones sobre conjuntos de datos que reciben continuas actualizaciones sobre el estado de los mercados eléctricos.
Conclusión
La compartición de datos y el open data representan una evolución crucial en la forma en que las organizaciones gestionan y aprovechan la información. Desde gigantes tecnológicos internacionales como LinkedIn y AWS hasta innovadores nacionales como Idealista y BBVA, están proporcionando acceso abierto a los datos con el fin de impulsar un cambio significativo en cómo se toman decisiones, el desarrollo de políticas y la creación de nuevas oportunidades económicas. En España, tanto las empresas privadas como las públicas están mostrando un fuerte compromiso con estas prácticas, posicionando al país como un líder en la adopción de modelos de datos abiertos y de compartición de datos que beneficien a toda la sociedad.
Contenido elaborado por Juan Benavente, ingeniero superior industrial y experto en Tecnologías ligadas a la economía del dato. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Los datos son una pieza clave en la economía digital europea. Así lo reconoce la Estrategia de Datos cuyo objetivo es crear un mercado único que permita su libre circulación para fomentar así la transformación digital y la innovación tecnológica. No obstante, alcanzar este objetivo conlleva superar diferentes obstáculos. Uno de los más destacados es la desconfianza que la ciudadanía puede sentir respecto al proceso.
Como respuesta ante esta necesidad, surge la Ley de Gobernanza del Dato o Data Governance Act (DGA), un instrumento horizontal que busca regular la reutilización de datos sobre los que concurren derechos de terceros, e impulsar su intercambio bajo los principios y valores de la Unión Europea. Entre los objetivos de la DGA se encuentra reforzar la confianza de ciudadanos y empresas en que sus datos se reutilicen bajo su control, conforme a unos mínimos estándares jurídicos.
Entre otras cuestiones, la DGA profundiza en el concepto de los intermediarios de datos, para quienes establece un marco de notificación y supervisión.
¿Qué son los intermediarios de datos?
El concepto de intermediario de datos es relativamente nuevo en la economía de datos, así que existen múltiples definiciones. Si nos centramos en el contexto de la DGA, los proveedores de servicios de intermediación de datos (Data Intermediation Services Providers o DISPs) son aquellos “cuyo objeto sea establecer relaciones comerciales para el intercambio de datos entre un número indeterminado de interesados y titulares de datos, por una parte, y usuarios de datos, por otra”.
La Data Governance Act también diferencia entre los Proveedores de servicios de intermediación de datos de las Organizaciones de gestión de datos con fines altruistas reconocidas en la Unión (Data Altruism Organisations Recognised in the Union o RDAOs). Este último concepto describe una relación de intercambio de datos, pero sin buscar un rédito por ello, de forma altruista.
¿Qué tipos de servicios de intermediación de datos existen según la DGA?
Los servicios de intermediarios de datos son una pieza más en la compartición de datos, ya que facilitan a los titulares compartir sus datos para que puedan ser reutilizados. También pueden proporcionar infraestructura técnica y experiencia para respaldar la interoperabilidad entre conjuntos de datos, o actuar como mediadores que negocian acuerdos de intercambio entre partes interesadas en compartir, acceder o agrupar datos.
En el Capítulo III de la Data Governance Act se explican tres tipos de servicios de intermediación de datos:
- Servicios de intermediación entre titulares de datos y sus posibles usuarios, incluyendo la facilitación de los medios técnicos o de otro tipo para habilitar dichos servicios. Podrán comprender el intercambio bilateral o multilateral de datos, así como la creación de plataformas, bases de datos o infraestructuras que posibiliten su intercambio o uso común.
- Servicios de intermediación entre personas físicas que deseen poner a disposición sus datos, ya sean o no personales, con posibles usuarios, incluyendo también los medios técnicos. Estos servicios deben posibilitar el ejercicio de los derechos de los interesados previstos en el Reglamento general de protección de datos (Reglamento 2016/679).
- Cooperativas de datos. Son estructuras organizativas constituidas por sujetos de datos, empresas unipersonales o pymes. Estas entidades ayudan a los miembros de la cooperativa a ejercer sus derechos sobre sus datos.
En resumen, el primer tipo de servicio puede facilitar el intercambio de datos industriales, el segundo se centra principalmente en el intercambio de datos personales y el tercero abarca el intercambio colectivo de datos y los esquemas de gobernanza relacionados.
Categorías de intermediarios de datos en detalle:
Para profundizar en estos conceptos, la Comisión Europea ha publicado el informe ‘Mapping the landscape of data intermediaries’, donde se profundiza en los tipos de intermediación de datos existentes. Los hallazgos del informe resaltan la fragmentación y heterogeneidad del campo.
Los tipos de intermediarios de datos van desde los individualistas y orientados a los negocios hasta modelos más colectivos e inclusivos que respaldan una mayor participación en la gobernanza de datos por parte de comunidades y sujetos de datos individuales. Teniendo en cuenta las categorías que se incluyen en la DGA, se describen seis tipos de intermediarios de datos:
Tipos de servicios de intermediación de datos según al DGA |
Equivalencia en el informe “Mapping the landscape of data intermediaries” |
---|---|
Servicios de intermediación entre titulares de datos y posibles usuarios de datos (I) |
|
Servicios de intermediación entre sujetos de datos o individuos y usuarios de datos (II) |
|
Cooperativas de datos (III) |
|
Fuente: Traducción del box 4 del informe Mapping the landscape of data intermediaries publicado por la Comisión Europea
A continuación, se describe cada uno de ellos:
- Sistemas de Gestión de Información Personal (PIMS): proporciona herramientas a individuos para que controlen y dirijan el tratamiento de sus datos.
- Cooperativas de datos: fomentan la gobernanza democrática a través de acuerdos entre los miembros. Los individuos gestionan sus datos en favor de toda la comunidad.
- Fideicomisos de datos: establecen mecanismos jurídicos específicos para garantizar la gestión responsable e independiente de los datos entre dos entidades, un intermediario que administra los datos y sus derechos, y un beneficiario y propietario de los datos.
- Sindicatos de datos: son uniones sectoriales o territoriales entre distintos propietarios de datos que gestionan y protegen los derechos sobre los datos personales generados a través de plataformas tanto por usuarios como por trabajadores.
- Mercados de datos: impulsan plataformas que permiten poner en contacto la oferta y la demanda de datos o productos/servicios basados en ellos.
- Grupos de intercambio de datos: son alianzas entre partes interesadas en la compartición de datos para mejorar sus activos (productos de datos, procesos y servicios) aprovechando la complementariedad de los datos puestos en común.
Los tipos de intermediarios de datos difieren según varios parámetros, pero son complementarios y pueden superponerse en ciertos aspectos. Para cada tipo de intermediario de datos presentado, el informe proporciona información sobre cómo funciona, sus características principales, ejemplos seleccionados y consideraciones sobre el modelo de negocio.
Requisitos para los intermediarios de datos en la Unión Europea
La DGA establece reglas de juego para garantizar que los proveedores de servicios de intercambio de datos realizan sus servicios bajo los principios y valores de la Unión Europea (UE). Los proveedores estarán sometidos al ordenamiento jurídico del Estado miembro donde tenga su sede principal. Si se trata de un proveedor no establecido en la UE, debe designar un representante legal en uno de los Estados miembros en los que se ofrezca sus servicios.
Todo proveedor de servicios de intermediación de datos que opere en la UE deberá notificarlo a la autoridad competente. Dicha autoridad será designada por cada Estado y velará porque el proveedor realice su actividad bajo el cumplimiento de las leyes. La notificación incluirá información sobre el nombre del proveedor, naturaleza jurídica (incluyendo información sobre la estructura y las filiales), dirección, sitio web con información sobre sus actividades, persona de contacto y estimación de la fecha de inicio de la actividad. Además, deberá incluir una descripción del servicio de intermediación de datos que lleva a cabo, indicando a la categoría detallada en la DGA a la que pertenecen, es decir, servicios de intermediación entre titulares de datos y usuarios, servicios de intermediación entre sujetos de datos o individuos y usuarios de datos o cooperativas de datos.
Además, en su artículo 12, la DGA estable una serie de condiciones para la prestación de servicios de intermediación de datos. Por ejemplo, los proveedores no podrán utilizar los datos en relación con los que presten sus servicios, sino que se limitarán a su puesta a disposición. Así mismo, deberán respetar los formatos originales y solo podrán hacer transformaciones para mejorar su interoperabilidad. También deberán disponer procedimientos para impedir prácticas fraudulentas o abusivas de los usuarios. Con todo ello se busca garantizar que los servicios sean neutrales, transparentes y no discriminatorios.
Escenarios futuros para los intermediarios de datos
De acuerdo con el informe “Mapping the landscape of data intermediaries”, en el horizonte, el escenario previsto para los intermediarios de datos conlleva superar diversos desafíos:
- Identificar modelos de negocio adecuados que garanticen la sostenibilidad económica.
- Ampliar la demanda de los servicios de intermediación de datos.
- Comprender el requisito de neutralidad establecido por la DGA y cómo podría implementarse.
- Alinear los intermediarios de datos con otros instrumentos de la política de datos de la UE.
- Considerar las necesidades de los desarrolladores y emprendedores.
- Suplir la demanda de los intermediarios de datos.
Para consolidar los intermediarios de datos habrá que seguir realizando más investigaciones que ayuden a definir más profundamente el concepto de intermediarios de datos. Este proceso conllevará evaluar las necesidades de desarrolladores y empresarios sobre asuntos económicos, legales y técnicos que desempeñan un papel en el establecimiento de intermediarios de datos, los incentivos tanto para el lado de la oferta como de la demanda de intermediarios de datos, y las posibles conexiones de estos con otros instrumentos de políticas de datos de la UE.
Navarra ha sido la sede escogida para reunir, por primera vez, a representantes de Oficinas del Dato de las comunidades autónomas en torno la centralidad del dato en la gestión pública. El encuentro, impulsado por la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA) y el Gobierno de Navarra, ha tenido como objetivo poner en común los avances en el mundo de los datos a nivel autonómico, así como la asunción de compromisos para sentar las bases de un futuro digital ligado a los datos y a su poder transformador.
Foco en el poder transformador del dato
El consejero de Universidad, Innovación y Transformación Digital del Gobierno de Navarra, Juan Cruz Cigudosa García fue el encargado de la apertura de la jornada haciendo hincapié en la necesidad de fortalecer la respuesta a los desafíos sociales y estimular la innovación y el desarrollo económico a través de los datos, resaltando el ineludible compromiso con la innovación mediante el uso de tecnologías disruptivas como la Inteligencia Artificial, siempre bajo un prisma ético y de respeto a los valores y principios europeos. En esta última línea de acción, se anunció la puesta en marcha de un Comité de Ética para la Oficina del Dato de Navarra. Este comité, enmarcado la Estrategia España Digital y la Estrategia Digital Navarra 2030
, se encuentra alineado con las políticas activas y el liderazgo nacional e internacional de la SEDIA, reflejada en su carta de derechos digitales.
A continuación, el Chief Data Officer del Gobierno de España, Alberto Palomo, resaltó la estrategia que se había diseñado a nivel europeo en relación con el dato y su gestión soberana. También señaló el poder transformador del dato, un elemento clave en la transformación digital y en la entrada de tecnologías como la inteligencia artificial. Asimismo, informó del reciente comunicado publicado a raíz de la actual Presidencia Española del Consejo de la Unión Europea, que se firmó a inicios del mes de noviembre durante el encuentro Gaia-X Summit bajo el nombre “The Trinity of Trusted Cloud, Data and AI as Gateway to EU´s competitiveness". Este documento constituye una declaración que pone de manifiesto el compromiso de los participantes en dicho encuentro para impulsar los espacios de datos en Europa a través de la autonomía estratégica en la nube, los datos y la inteligencia artificial. En él se acuerda, entre otros puntos, ampliar y mejorar la coordinación en el desarrollo de las iniciativas europeas de nube y datos, propugnando la interoperabilidad como elemento vertebrador y abogando por el desarrollo de una Inteligencia Artificial basada en datos de alta calidad y con una sólida gobernanza. También resalta la necesidad de homogeneizar las fuentes de datos para modelar mejor las relaciones, optimizar los procesos e innovar y crear nuevos modelos de negocio.
La jornada se desarrolló como un foro de comunicación, en el que, a modo de ejemplo, se pudieran compartir experiencias directas de los participantes, creando así un espacio para la reflexión y el diálogo. La jornada se estructuró a través de tres bloques temáticos, acerca del quién, el cómo y el para qué, siendo contextualizado cada bloque, antes de las presentaciones específicas, por la Oficina del Dato de la SEDIA y aterrizado en la práctica por el Gobierno de Navarra.
-
El primer bloque temático fue “El ecosistema del dato: quién”. En él se abordaron algunas de las estrategias en torno al dato desde la Generalitat de Cataluña y desde el Gobierno Vasco.
-
A continuación, se realizaron presentaciones en un segundo bloque titulado “Modelo de gobernanza, ética y cultura: cómo”. Los gobiernos de Aragón, Andalucía, Canarias, Valencia y la Federación Española de Municipios y Provincias hicieron presentaciones de sus casos de éxito en la materia.
-
En un último bloque titulado “Servicio al ciudadano, innovación y espacios de datos: para qué” se expusieron presentaciones por parte de Andalucía, el Instituto Nacional de Estadística, Castilla-la Mancha y la Secretaría General de Administración Digital, y Red.es, esta última presentando los servicios que desde la plataforma datos.gob.es se ofrece a las comunidades autónomas.
Siete principios clave para impulsar la economía del dato
El encuentro culminó con la presentación de siete principios para avanzar en la formulación conjunta de estrategias y políticas relacionadas con el manejo de los datos y el futuro digital. Estos son:
-
Establecer un gobierno efectivo del dato fijando políticas, normas y procedimientos para la gestión, explotación y compartición efectiva de los datos, implementado a su vez controles y evaluaciones para asegurar su cumplimiento.
-
Realizar un tratamiento ético del dato, debiéndose evaluar la licitud y legitimidad de toda práctica alrededor del dato, buscando minimizar cualquier impacto adverso en las personas y la sociedad.
-
Primar la tramitación administrativa confiable centrada en el dato, priorizando la transición del documento al dato, capaz de habilitar y catalizar el uso de tecnologías y herramientas avanzadas de analítica descriptiva, predictiva y prescriptiva (BI, big data, machine learning, deep learning), algoritmos generativos (LLM, GPT) y automatización de procesos (RPA).
-
Despliegue de la compartición soberna del dato por ser un recurso cuyo valor aumenta con su difusión, fijando quién puede acceder a qué datos y en qué condiciones de uso, seguridad y confianza.
-
Favorecer la difusión abierta de la información, impulsando su reutilización efectiva y publicación acorde a los principios FAIR, esto es, asegurar que los datos son encontrables, accesibles, interoperables y reutilizables.
-
Diseñar y analizar políticas públicas basadas en las evidencias, para así tomar decisiones informadas que deriven en servicios eficaces y en innovación pública.
-
Fomento de la cultura del dato, impulsando la creación de nuevos perfiles, puestos y responsabilidades relativos al trabajo con el dato, sin descuidar la formación y transmisión de conocimiento alrededor del dato.
El éxito de participación, las intervenciones y reflexiones planteadas evidencian el consenso acerca de avanzar en la consecución de una Administración orientada al dato, capaz de sacar partido, mediante el uso de medios tecnológicos innovadores, del potencial del dato, habilitando el diseño, ejecución y evaluación de políticas públicas centradas en el ciudadano, generadoras de una economía orientada al dato, sostenible, inclusiva y generadora de valor social.
El Foro se constituye así en punto de encuentro y generación de sinergias entre las diferentes administraciones públicas. La interoperabilidad entre los distintos organismos del sector público y entre los distintos niveles de gobierno en la elaboración y el intercambio de información impulsa la cohesión territorial y habilita el aprovechamiento efectivo de las tecnologías disponibles en la búsqueda de satisfacer el bien común.
El Instituto Canario de Estadística (ISTAC) ha añadido a su catálogo más de 500 activos semánticos y más de 2100 cubos estadísticos. Esta inmensa cantidad de información representa lustros de trabajo del ISTAC en materia de normalización y adaptación a estándares internacionales punteros, que habilitan una mejor compartición de datos y metadatos entre productores y consumidores de información nacionales e internacionales.
El incremento de conjuntos de datos mejora no solo cuantitativamente el directorio de datos.canarias.es y datos.gob.es, sino que amplía los usos que éste ofrece gracias al tipo de información añadida.
Nuevos activos semánticos
Los recursos semánticos, a diferencia de los estadísticos, no presentan datos numéricos cuantificables, como pueden ser datos de desempleo o el PIB, sino que proporcionan homogeneidad y reproducibilidad.
Estos activos suponen un paso adelante en materia de interoperabilidad, según lo dispuesto tanto a escala nacional con el Esquema Nacional de Interoperabilidad (artículo 10, activos semánticos), como a escala europea con el Marco Europeo de Interoperabilidad (artículo 3.4, interoperabilidad semántica). En ambos documentos se expone la necesidad y el valor de utilizar recursos comunes para el intercambio de información, máxima que se está implantando de manera transversal en el Gobierno de Canarias. Estos activos semánticos ya se están usando en los formularios de la sede electrónica y se espera que en el futuro sean los activos semánticos que use todo el Gobierno de Canarias.
Concretamente en esta carga de datos hay 4 tipos de activos semánticos:
- Clasificaciones (404 cargadas): Listados de códigos que se utilizan para representar los conceptos asociados a las variables o categorías que forman parte de los conjuntos de datos normalizados, como por ejemplo la Clasificación Nacional de Actividades Económicas (CNAE), clasificaciones de países como la M49, o clasificaciones de sexo y edad.
- Esquemas de conceptos (100 cargados): Los conceptos son las definiciones de las variables en las que se desagregan los datos y que finalmente se representan con una o varias clasificaciones. Pueden ser transversales como “Edad”, “Lugar de nacimiento” y “Actividad de la empresa” o específicos para cada operación estadística como “Tipo de tareas del hogar” o “Índice de confianza del consumidor”.
- Esquemas de temas (2 cargados): Incorporan listas de temas que pueden corresponder a la clasificación temática de las operaciones estadísticas o al registro de temas INSPIRE.
- Esquemas de organizaciones (4 cargados): Se incluyen esquemas de entidades como unidades organizativas, universidades, agencias mantenedoras o proveedores de datos.
Todos estos tipos de recursos forman parte del estándar internacional SDMX (Statistical Data and Metadata Exchange), que se utiliza para el intercambio de datos y metadatos estadísticos. El estándar SDMX proporciona un formato y estructura común para facilitar la interoperabilidad entre diferentes organizaciones que producen, publican y utilizan datos estadísticos.
Este estándar es promovido por organizaciones como el Banco Central Europeo (BCE), Naciones Unidas, la Oficina Estadística de la Unión Europea (Eurostat), el Fondo Monetario Internacional (FMI) o la Organización para la Cooperación y el Desarrollo Económico (OCDE).
Con la inclusión de estos conjuntos de datos, datos.canarias.es y datos.gob.es entrarían a formar parte de un selecto grupo de organizaciones que también ponen a disposición de la sociedad diversos recursos estructurales para fines estadísticos en los siguientes registros públicos:
- SDMX Global Registry
- Euro SDMX Registry
- United Nations Statistical Division
- UNICEF Indicator Data Warehouse
- IMF SDMX Central
Nuevos recursos estadísticos
Dada la creciente necesidad de compartir, procesar y comparar datos, se hace indispensable la aplicación de estándares internacionales para la publicación e intercambio de datos y metadatos. El ISTAC se encuentra inmerso en un proceso de revisión y actualización de sus publicaciones para adaptarlas al estándar internacional SDMX, empezando por el análisis de la información publicada, pasando por la definición de activos semánticos y recursos estructurales en general, hasta llegar a la publicación de recursos estadísticos como los cubos o tablas de datos.
Como parte de este objetivo y tras años de trabajo armonizando y estandarizando datos, el ISTAC ha cargado en su catálogo 2196 cubos estadísticos que hacen uso de los activos semánticos antes descritos y que se basan en el estándar SDMX.
Esto permite mejorar el uso y compartición de datos tanto para el usuario de a pie como de manera programática gracias al uso estandarizado de recursos semánticos. En definitiva, la incorporación al catálogo de esta relevante información, supone un paso muy importante en la interoperabilidad de los datos y, por tanto, en su reutilización.
El pasado 20 de octubre, Madrid acogió una nueva edición del Data Management Summit Spain, una cumbre internacional que este año también tuvo lugar en Italia (7 de julio) y Latam (20 de septiembre). La cita reunió a CiOs, CTOs, CDOs, Directores de Sistemas, Responsables de Inteligencia de Negocio y Científicos de Datos encargados de implementar tecnologías emergentes con el fin de resolver nuevos retos tecnológicos y alinearse con nuevas oportunidades de negocio.
Este evento fue precedido de un prólogo celebrado la tarde anterior, en colaboración con DAMA España y la Oficina del Dato. Se trataba de una sesión dirigida exclusivamente a representantes de los distintos niveles de la administración pública y centrado en los datos abiertos y el intercambio de información entre administraciones. Durante la jornada se debatió el papel transformador del dato y cómo su uso intensivo y puesta en valor son fundamentales para lograr la transformación digital de las administraciones públicas.
Tal y como se refirió en la sesión, el dato tiene un papel esencial en el desarrollo de tecnologías disruptivas como la Inteligencia Artificial, y supone un factor diferencial a la hora de poner en marcha una revolución industrial y tecnológica que permita consolidar una economía digital más justa, inclusiva y en línea con los ODS y la Agenda 2030. Una auténtica economía del dato con la vocación de nutrir con todas las garantías el desarrollo de dos procesos clave y estratégicos para la reconstrucción de nuestro país: la transformación digital y la transición ecológica.
Los espacios de datos y los datos abiertos, claves para conseguir una administración orientada al dato
La apertura institucional corrió a cargo de Carlos Alonso, director de la División Oficina del Dato. Su intervención se centró en resaltar cómo la consecución de una administración orientada al dato, parte inseparable de su proceso de transformación digital, pasa por el desarrollo de los espacios de datos del sector público, los cuales habilitan la compartición de datos con soberanía y su explotación a gran escala. El dato es un bien público, a conservar y tratar en aras de una aplicación de servicios y políticas públicas de calidad. El objetivo es conseguir una administración orientada al dato, centrada en la ciudadanía, abierta, transparente, inclusiva participativa e igualitaria, asegurando un uso ético, seguro y responsable de los datos.
En este proceso de concepción de los espacios de datos del sector público y privado son fundamentales los datos abiertos, como resaltó Carlos Alonso durante su intervención: “Los espacios de datos son grandes consumidores y generadores de datos abiertos, debiéndose asegurar su disponibilidad. Esto es, se precisa fijar unos determinados acuerdos de nivel de servicio que aseguren el acceso”.
Compartición de experiencias entre administraciones
Tras esta apertura institucional, la jornada ha abordado la oportunidad que suponen la creación de espacios de compartición y explotación de datos en las administraciones públicas, y ha permitido difundir diferentes proyectos en torno al dato por parte de representantes de los diferentes niveles administrativos, incluyendo también Comunidades Autónomas y entidades locales.
Andreu Francisco, Director General del Consorcio local Localret, formado por las administraciones locales de Cataluña para el desarrollo de los servicios y redes de telecomunicaciones y la aplicación de las TIC, presentó un metamodelo digital, cuyo fin es estructurar la arquitectura tecnológica y de servicios necesarios en una ciudad digital. Se trata de una solución integral, que puede ser implementada en distintos territorios y personalizada en función de las singularidades de cada ciudad, facilitando que los habitantes de los 877 municipios catalanes puedan desarrollarse a nivel profesional y personal.
César Priol, Director General de Digitalización y Atención Ciudadana, de Bizkaiko Foru Aldundia (País Vasco) compartió su experiencia en la creación de la Oficina de Datos, resaltando la importancia de organizarse tanto a nivel organizativo como normativo y legal para tener la capacidad de transformar con los datos no solo la organización, sino también el territorio.
Magda Lorente, Jefa de la Sección de Asistencia en Sistemas de Información Local, y Sara Aguilar, Jefa del Servicio del Boletín Oficial de la Provincia de Barcelona y otras Publicaciones Oficiales de la Diputación de Barcelona, hablaron de buenas prácticas en la gestión de datos. Magda Lorente resaltó la importancia de que las diputaciones se orienten al dato para así poder asumir su papel relevante en el impulso del gobierno del dato municipal. Según un estudio realizado por la Diputación de Barcelona, que verá la luz a finales de noviembre, el 85% de los municipios podrían quedarse al margen de la inteligencia artificial y de la administración inteligente debido a que sus capacidades técnicas no permiten materializar la orientación al dato que se precisa.
Sara Aguilar, por su parte, presentó un ejemplo de cómo las administraciones están consolidando el camino en la toma de decisiones en base al dato de calidad: el CIDO, un buscador de información y documentación oficial. Esta herramienta nació en el año 2000 con el fin de acercar la información de las administraciones a la ciudadanía de forma amigable. Desde él se puede acceder, por ejemplo, a más de 2.600 procesos selectivos con convocatoria abierta y a 1.600 subvenciones abiertas, gracias a los datos abiertos ofrecidos por los distintos municipios de Cataluña. CIDO se basan en un modelo de lector de etiquetas y en el uso de algoritmos de inteligencia artificial, que clasifican la información recogida de los municipios. Disponen de más de 2 millones de anuncios, datos abiertos estructurados y documentados que sirven a través de una API que se puede integrar en cualquier plataforma.
Mesas redondas y dinámicas de grupo para promover el debate
Durante el desarrollo de la jornada los asistentes pudieron participar en diferentes dinámicas de intercambio de experiencias. La primera dinámica estuvo centrada en los datos abiertos y la segunda en la interoperabilidad.
Además, se celebraron dos mesas redondas que han permitido abordar la materia desde diferentes prismas de opinión:
- La primera mesa redonda, moderada por Carlos Alonso, se centró en los retos y barreras para el intercambio de datos en el sector públicos. En ella se proyectaron a mayor escala las actuales metodologías, especificaciones y prácticas relacionadas con el tratamiento de la información, para conseguir un intercambio de datos fluido y continuo entre administraciones, sectores industriales y ciudadanos. La mesa conto con la participación de: Carlos Alonso, Jose Antonio Eusamio (Secretaría General de Administración Digital), César Priol (Diputación de Vizcaya), Miguel Angel Martinez Vidal (INE) y Magda Lorente.
- La segunda mesa redonda se centró en cómo acelerar la adopción de Open Linked Data en el dominio de la administración pública, moderada en este caso por Oscar Alonso (IBM Consulting & DAMA España). En ella participaron Sara Aguilar (Diputación de Barcelona), Oscar Alonso (DAMA España e IBM), Sonia Castro (datos.gob.es), Juan José Alonso (Orange) y Olga Quiros (ASEDIE) La conversación giró en torno a las iniciativas de la UE, como la Ley de gobernanza de datos, que están actuando como punto de inflexión en las políticas de datos. Dicha ley busca establecer mecanismos sólidos para facilitar la reutilización de ciertas categorías de datos protegidos del sector público, aumentar la confianza en los servicios de intermediación de datos y promover el altruismo de datos en toda la UE. Con ello se pone de manifiesto como desde UE está trabajando para reforzar diversos mecanismos de intercambio de datos con el objetivo de fomentar su disponibilidad y que puedan utilizarse para impulsar aplicaciones y soluciones avanzadas en inteligencia artificial, medicina personalizada, movilidad ecológica, fabricación inteligente y muchos otros ámbitos. Durante el debate también se resaltó la importancia que tiene la ética del dato.
Materiales disponibles sobre la jornada
Si te perdiste la sesión, el video de la misma está disponible en Youtube. También se ha hecho pública la grabación de la cumbre del día 20, una jornada que contó con un enfoque más empresarial, con ponencias de expertos y dinámicas de grupo centradas en la gobernanza de datos, su calidad, los datos maestros y la arquitectura de datos, entre otros temas. También está disponibles las fotos del evento.
Además, en la página web de la cumbre se han ido publicando entrevistas a algunos de los ponentes, que permiten profundizar un poco más en los proyectos que llevan a cabo.
La Estrategia europea de datos persigue la creación de un mercado único donde los datos fluyan entre países y sectores. En este sentido, el sector público atesora gran cantidad de datos de valor para la ciudadanía. Muchos de ellos se ofrecen en abierto a través de distintas plataformas de datos abiertos. Sin embargo, existen datos sobre los que aplican derechos de terceros que limitan su apertura. Estos datos también pueden ser de gran interés para fines de investigación científica.
La existencia de numerosos registros administrativos y bases de datos públicas, así como la evolución de las tecnologías que permiten su manejo, han propiciado la disponibilidad de grandes cantidades de información en todos los ámbitos susceptible de ser utilizada en beneficio de la sociedad, aumentando la demanda de su acceso por parte de los investigadores.
En este sentido, el pasado 3 de junio, se publicó en el Boletín Oficial de la Unión Europea la Ley de Gobernanza de datos, que busca incentivar el intercambio de datos en la UE, impulsando la llamada Economía del Dato. Entre otras cuestiones, la nueva ley contempla la necesidad de desarrollar mecanismos que faciliten la reutilización de este tipo de datos, sobre los que aplican derechos de terceros, con todas las garantías legales.
Uno de estos mecanismos son las llamadas Safe Reading Rooms o Salas Seguras, mencionadas durante la evaluación de impacto previa a la aprobación de la Ley.
¿Qué son las Salas Seguras?
Las Salas Seguras se conciben como punto de contacto único de apoyo a los investigadores para la reutilización de determinadas categorías de datos protegidas en poder del sector público. Permiten un tratamiento controlado de los datos, preservando la privacidad u otros derechos vinculados a los datos.
En Europa existen distintas iniciativas de este tipo como son el CASD (Centre d’Accès Sécurisé aux Données) y el Health Data Hub de Francia o el Laboratorio de investigación de Microdatos de Portugal. También en España contamos con varias organizaciones que ya han puesto a disposición de los investigadores Safe Reading Rooms. Veamos 3 ejemplos.
3 ejemplos de Salas Seguras para compartir datos en España
Laboratorio de datos del Banco de España (BELab)
El Banco de España facilita el acceso a microdatos de alta calidad, garantizado su confidencialidad a través de Salas Seguras. Algunos de los datos que ofrece son los microdatos de empresas individuales de entidades Fintech o de la Encuesta de Competencias Financieras.
Los usuarios pueden acceder a la información tanto in situ (en Madrid y Barcelona) como en remoto, según el grado de sensibilidad de la información objeto de estudio. Los puestos del laboratorio in situ, que se encuentran aislados sin acceso a internet, cuentan con Stata, R, Python y Octave para el tratamiento de los datos.
Para acceder, los investigadores deben enviar su currículum vitae y un formulario de solicitud explicando el propósito de la investigación. Esta solicitud es valorada por un Comité de Evaluación Técnica de Investigación. En caso de aceptarse, se fijan una serie de reglas y restricciones (horario, acceso sin dispositivo móvil, etc.).
Para garantizar el buen uso de los microdatos, BELab elabora y suministra la documentación metodológica. Además, técnicos expertos revisan los trabajos para avalar el cumplimiento de las correspondientes cláusulas de confidencialidad.
Una vez finalizado el trabajo, el investigador está obligado a mencionar la fuente de los datos y enviar una copia del estudio realizado. También se compromete a no realizar ninguna tentativa de reidentificación de las personas físicas o jurídicas ligadas a los datos objeto de estudio.
Salas de investigación de la Seguridad Social
Los investigadores y académicos interesados en bases de datos y microdatos de la Seguridad Social tienen a su disposición tres Salas Seguras en Madrid, Barcelona y Albacete, a las que solo puede acceder personal autorizado, sin dispositivos electrónicos. Estas salas cuentan con herramientas tales como SAS, STATA, R, Python y Microsoft Office. También se permite el acceso remoto a través de dispositivos seguros (llamados “dispositivos bastionados”) que se distribuyen entre los investigadores.
Algunos de los datos a los que se puede acceder son las Muestra Continua de Vidas Laborales, la Afiliación mensual o los ERTEs por COVID-19, entre otros.
Al igual que en el caso del Banco de España, el interesado tendrá que enviar una solicitud a través del correo electrónico solicitudes.sala-investigacion@seg-social.es. Un Comité de Expertos evaluará la solicitud. En caso de que se apruebe, se prepararán los datos necesarios, cuyo acceso se permitirá a través de una carpeta personal privada.
El Comité de Expertos también evaluará el resultado de la investigación, para garantizar el cumplimiento normativo. Si todo está correcto, el estudio se publicará en el Portal del Dato de la Seguridad Social.
Instituto Nacional de Estadística (INE)
El Instituto Nacional de Estadística es uno de los principales publicadores de datos abiertos de nuestro país, pero también atesora datos sensibles de valor que deben ser tratados con las correspondientes medidas de confidencialidad. Para el acceso a esta finformación con fines de investigación científica se sigue el protocolo previsto en el Reglamento (Ce) No 223/2009 relativo a la estadística europea y en el Código de Buenas Prácticas de las Estadísticas Europeas.
Este servicio está dirigido a investigadores que trabajen o colaboren en entidades de investigación reconocidas. El proceso es similar a los casos anteriores. Hay que enviar una solicitud que será evaluada por el INE. Esta solicitud debe de ser lo más detallada posible, indicando las variables a consultar, el nivel geográfico-temporal y la justificación de la necesidad de esta información. Algunos de estos datos podrán incurrir en costes, según lo fijado en el Boletín Oficial del Estado.
Estos tres ejemplos son exponentes de la importancia de las Salas Seguras para permitir la reutilización de datos de valor garantizando la confidencialidad y privacidad de la información. Gracias a ello se pueden realizar investigaciones más profundas, que pueden generar un bien económico y social. Un uso intensivo de datos permite impulsar la innovación en la actuación del sector público, facilitando el contraste de ideas, promoviendo la creatividad y el máximo aprovechamiento de los recursos en el marco general de una gestión pública moderna, participativa, abierta y útil para solucionar o mejorar los problemas y retos sociales.
Contenido elaborado por el equipo de datos.gob.es.
En el contexto actual, la digitalización se ha expandido de forma exponencial, llegando a traspasar las fronteras del sector privado y consolidándose como uno de los grandes retos en todos los sectores productivos de la sociedad. Este proceso ha traído consigo la generación masiva de datos de los que extraer valor. Sin embargo, según un estudio de IDC/EMC se cree que, pese a que el volumen de datos se multiplicará exponencialmente en el corto plazo, únicamente el 1% de los datos generados se utiliza, se procesa y se aprovecha. Una de las razones la encontramos en la incoherencia y poca flexibilidad de los modelos de datos, que bloquean la integración de los mismos.
En este sentido, en el Plan de Recuperación, Transformación y Resiliencia del Gobierno de España, que detalla la estrategia española para canalizar los fondos destinados por la Unión Europea a reparar los daños provocados por la pandemia, hace hincapié en las reformas tecnológicas e inversiones enfocadas a construir un futuro más sostenible. Uno de los principales retos en este ámbito es dinamizar la compartición de datos, principalmente en aquellos sectores con más impacto en la sociedad, como la salud y el turismo.
Para ello, los modelos de datos inteligentes o smart data models juegan un papel fundamental. Pero, ¿qué son exactamente?
¿Qué son los Smart Data Models?
Un modelo de datos tradicional es la representación de los elementos de un conjunto de datos y de sus relaciones y conexiones entre sí. Los modelos de datos inteligentes van un paso más allá. Son modelos de datos comunes y compatibles, con el objetivo de sustentar un mercado digital de soluciones inteligentes interoperables y replicables en múltiples sectores, de forma que se homogenice la disponibilidad de datos en ámbitos determinados.
Estos modelos proponen una visión común que proporciona una base técnica para lograr la apertura de la innovación.
Iniciativa SDM
La Fundación FIWARE, TM Forum, IUDX y OASC se han unido para liderar una iniciativa de colaboración conjunta que permita agrupar los modelos de datos inteligentes por dominios, poniéndolos a disposición de las organizaciones y de cualquier usuario que lo desee. Es lo que se conoce como iniciativa SDM (Smart data models) y, en ella, todos los modelos de datos son de carácter público.
De esta manera, se da respuesta a las nuevas necesidades de modelado de datos a la velocidad que requiere el mercado, reaprovechando modelos ya probados en escenarios reales.
¿Cómo funciona?
El objetivo fundamental de SDM se basa en que las organizaciones puedan evolucionar su visión de intercambio de datos hacia una compartición que dé soporte tanto a la llamada Economía del Dato como a los espacios de datos. La Economía del Dato, no es más que el conjunto de actividades e iniciativas cuyo modelo de negocio se basa en el descubrimiento y explotación de los datos, para la identificación de oportunidades que generen productos y servicios.
SDM clasifica la información por dominios o sectores industriales, creando un repositorio para cada uno de ellos. Además, cada dominio contiene submódulos con los temas relevantes para ese dominio y, dentro de cada tema, los modelos de datos relacionados. No obstante, también se dispone de elementos transversales compartidos para todos los dominios. Para cada uno de estos repositorios, se pueden extraer los modelos de forma gratuita. También se puede contribuir con la iniciativa mediante la cumplimentación de un formulario de colaboración que permita crear nuevos.
Para facilitar la compartición y el entendimiento común, cada modelo incluye tres elementos:
- La representación técnica propia del modelo que define los datos y sus relaciones, mediante estructuras JSON.
- La especificación o manual con las descripciones funcionales de cada uno de los elementos contenidos.
- Ejemplos que aseguren su comprensión.
Además de su carácter público y uso gratuito, cuenta con una licencia que permite a los usuarios realizar modificaciones en caso que lo consideren necesario, así como compartir dichas modificaciones con el resto de usuarios. Con esa finalidad, se define un flujo de trabajo de acuerdo a las fases del ciclo de vida de los modelos de datos, que presenta tres etapas:
- Oficial: los modelos de datos ya han sido aceptados y están totalmente a disposición de los usuarios con los tres elementos descritos anteriormente.
- En armonización: los modelos ya han sido aceptados, pero todavía se encuentran en progreso para completar los elementos.
- En incubación: los modelos están siendo elaborados y cuentan con el apoyo de la organización para lograr un modelo oficial.
Gracias a esta iniciativa, se pretende dinamizar la compartición de modelos de datos en todos los ámbitos. Por el momento, ya se han conseguido homogeneizar modelos en los dominios de ciudades inteligentes, sector agroalimentario, tratamiento del agua, energía, medio ambiente, sensórica, robótica, aeronáutica, destinos turísticos, salud e industria manufacturera, además de algunos transversales como puedan ser redes sociales o monitorización de incidencias, aunque no todos en la misma medida, tal y como muestra la siguiente imagen con el número de modelos incluidos en cada dominio.
Se trata, sin duda, de una iniciativa que facilita el camino hacia la transformación data driven de productos y servicios, proporcionando la apertura de modelos como la base técnica sobre la que se sustentará la adopción de arquitecturas de referencia. Si quieres profundizar más, la propia SDM contiene un apartado de “Learning zone” para facilitar el aprendizaje sobre la iniciativa y fomentar su uso, incluyendo videos auto explicativos.
También hay toda una serie de herramientas para aquellos usuarios que, siendo expertos en su sector de actividad, no lo son en la generación de modelos de datos. Bajo el elemento de menú tools, se encuentran servicios que permiten desde generar un borrador de un modelo de datos con un ejemplo, un editor de modelso de datos asistido y en línea, opciones para generar ejemplos desde modelos de datos existentes, y otras para incorporar el elemento @context que permite la conexión con soluciones linked data.
Iniciativas globales como la de SDM adquieren gran importancia a la hora de acordar referencias que permitan optimizar los servicios al ciudadano. Constituyen un paso más en el objetivo de conseguir espacios de datos comunes, poniendo a disposición modelos de datos contrastados. Este hito, supone un gran acelerador por su trascendencia, incluso a nivel europeo, con grandes iniciativas ya en curso como la de GAIA-X.
Contenido elaborado por Juan Mañes, experto en Data Governance.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Los datos son fundamentales para resolver los retos sociales y económicos a los que nos enfrentamos en la actualidad. Gracias a ellos podemos conocer las causas detrás de una determinada situación y los factores que influyen en ella, hacer estimaciones de su evolución y tomar decisiones informadas encaminadas al cambio.
El problema está en que para resolver este tipo de retos suele ser necesario combinar datos procedentes de diversas fuentes:
- Datos ofrecidos por el sector público
- Datos de múltiples compañías del sector privado
- Datos generados por la ciudadanía
Pero, ¿cómo se puede lograr esa colaboración? Esta es la pregunta que se plantea el informe “Cómo facilitar la colaboración en torno a los datos para resolver problemas de la sociedad”, elaborado por Jose Luis Marín en el marco de la Iniciativa Aporta.
El informe comienza con una breve introducción donde se esboza la situación actual de la apertura de datos en los sectores público y privado, así como en la ciudanía. A continuación, se abordan cuáles son las principales barreras que dificultan la cesión de datos por parte de empresas y ciudadanos, los beneficios tanto individuales como colectivos que pueden motivar estas prácticas en aras del interés público, y las políticas que se pueden poner en marcha desde las administraciones públicas para compensar e incentivar la colaboración.
Una vez que tenemos claro el contexto, es el momento de analizar algunos de los mecanismos existentes de colaboración para la recopilación, intercambio o procesamiento de datos con el fin de abordar un desafío social. Aunque no existen análisis sistematizados de las formas ideales de gobernanza, para este informe se han determinados 4 fórmulas:
Con el fin de ilustrar y conocer mejor cada fórmula, el informe incluye múltiples ejemplos de casos de éxito internacionales, como Accelerating Medicines Partnership (AMP), enfocada en transformar el modelo actual de desarrollo de nuevos diagnósticos y tratamientos, u Open Apparel Registry (OAR) cuyo objetivo es contribuir a la mejora de los derechos humanos y las condiciones medioambientales en torno a las fábricas.
El informe finaliza con una serie de recursos para ayudar a las organizaciones a colaborar de forma exitosa y a reducir las barreras, donde se incluyen redes de colaboración, marcos de colaboración, cursos y formaciones.
A continuación, puedes descargar el informe, así como acceder a los materiales complementarios (resumen ejecutivo, video-entrevista y presentación resumen).
En el marco de la estrategia europea de datos, una de las cuestiones en las que está trabajando la Comisión Europea es en facilitar el intercambio de datos en poder de las empresas con las administraciones para mejorar los servicios públicos y guiar las decisiones políticas. De acuerdo con la definición de la propia Comisión el intercambio de datos B2G es una colaboración en la que una empresa, u otra organización privada, pone a disposición del sector público (local, regional, nacional o de la UE) sus datos (o conocimientos) con un propósito de interés público.
Con el fin de obtener asesoramiento legal, identificar buenas prácticas y recabar recomendaciones para sus políticas, la Comisión Europea designó en 2018 un grupo de expertos independientes de alto nivel con experiencia en el sector público y privado en el ámbito del intercambio de datos B2G. Las conclusiones y recomendaciones del grupo a la Comisión se incluyeron en un informe final que se ha utilizado para asesorar las iniciativas de la Comisión sobre este tema.
El informe reconoce que gran parte del potencial de los datos y del conocimiento, para que puedan ser utilizados en beneficio de la sociedad, sigue sin explotarse. Entre las causas que hacen que la mayor parte de las colaboraciones actuales sean puntuales se encuentran obstáculos organizativos, técnicos y legales, así como la falta general de una cultura de intercambio de datos. El informe proporciona una descripción detallada de las barreras a la colaboración y propone un marco integral de recomendaciones políticas, legales y de financiación para permitir el intercambio de datos B2G escalable, responsable y sostenible para el interés público. También se incluyen un buen número de ejemplos de colaboraciones B2G europeas que se ha utilizado en la metodología de análisis y que en general son poco conocidas incluso para el público más especializado.
La parte más interesante quizá resida en las recomendaciones clave que se realizan a la Comisión Europea y a los Estados miembros para que consideren los datos como una infraestructura pública crítica para el futuro de la UE y, en consecuencia, adopten medidas para facilitar el uso de datos privados para el interés público. Esta cuestión sin duda está en el germen de los espacios de datos cuyas primeras implementaciones están comenzando ya a desplegarse.
Estas recomendaciones se estructuran en tres grandes categorías que se refieren a la gobernanza de los intercambios, a la transparencia de dichos intercambios y a las herramientas que facilitan los intercambios. Para cada una de ellas se sugieren medidas concretas.
Gobernanza del intercambio de datos B2G en toda la UE
La primera recomendación que realiza el informe es que todos los Estados miembros se doten de estructuras de gobernanza que puedan supervisar y brindar asesoramiento sobre prácticas responsables de intercambio de datos B2G. Adicionalmente, y con el fin de respaldar esta idea, se recomienda que las organizaciones privadas, públicas y de la sociedad civil promuevan la función de administrador de datos (data stewards) y que la Comisión Europea fomente la creación de una red de tales administradores de datos, como una comunidad de práctica en este área.
Se pide además a la Comisión Europea que explore la creación de un marco regulatorio de la UE para facilitar la reutilización por parte del sector público de datos de propiedad privada para el interés público. Se propone que este marco incluya requisitos de intercambio de datos, requisitos de transparencia y salvaguardas, sin imponer nuevas obligaciones al sector privado para recopilar datos adicionales.
También se hacen recomendaciones respecto a la aplicación de condiciones de referencia (incluidas, en algunos casos, condiciones gratuitas) aplicables para la adquisición de datos de propiedad privada para fines de interés público de acuerdo con los principios de intercambio de datos B2G.
Transparencia, participación ciudadana y ética en el intercambio de datos B2G
La primera recomendación en esta categoría es que las colaboraciones de datos B2G entre organizaciones públicas, privadas y de la sociedad civil deben ser transparentes incluso en lo referente a los datos utilizados y el impacto de las colaboraciones.
Las recomendaciones ponen el foco también en la necesidad de que los Estados miembros y la Comisión Europea fomenten la conciencia pública de los ciudadanos en los beneficios sociales de los datos (por ejemplo, iniciando programas de alfabetización de datos) e involucren al público en general en la elección de los desafíos sociales que deben abordarse. En esta línea de acción se pide que los Estados miembros promuevan mecanismos de donación de datos fáciles de usar y alienten a la ciudadanía a compartir sus datos para los fines de interés público de su elección. En este sentido, el propio portal de datos de la UE reconoce en un informe publicado recientemente las enormes carencias, así como las grandes oportunidades existentes, en relación con la publicación de datos generados por los ciudadanos.
Los expertos no se olvidan de recordar a la Comisión Europea la necesidad de desarrollar pautas éticas sobre el uso de datos, incluso para el interés público y, cuando corresponda, teniendo en cuenta las pautas éticas de la Unión Europea para la Inteligencia Artificial.
Por último, se pide a los Estados miembros que inviertan en la formación, educación y actualización de las competencias de los responsables políticos y los trabajadores del sector público para aumentar la preparación y la capacidad operativa de dicho sector para utilizar y actuar sobre los datos.
Modelos operativos, estructuras y herramientas técnicas para facilitar el intercambio de datos
Los expertos proponen que la Comisión Europea y los Estados miembros pongan en funcionamiento incentivos para el intercambio de datos B2G y mecanismos que aseguren el reconocimiento público de empresas privadas y organizaciones de la sociedad civil que participan en el intercambio de datos B2G.
Los expertos consideran los programas del marco financiero 2021-2027 y en particular el Programa Europa Digital, y el Programa Horizonte Europa como piezas clave para implementar las recomendaciones. En primer lugar, para financiar el desarrollo y el despliegue de las tecnologías (preservación de la privacidad, tecnologías de seguridad y tecnologías de control de acceso) que favorezcan el intercambio de datos B2G a escala y de manera responsable y sostenible. Pero también para promover la creación de una estructura de gobernanza ligera que priorice los estándares que permitan reducir los costes de transacción del intercambio de datos B2G y garantizar la interoperabilidad.
Por último, se pide a la Comisión Europea que realice estudios para obtener una mayor evidencia empírica de los beneficios macroeconómicos y sociales del intercambio de datos B2G para el interés público.
En definitiva, la UE parece decidida a impulsar las colaboraciones B2G mediante la creación de un marco común que permita el desarrollo de un intercambio de datos B2G rápido, responsable y sostenible. Y es que la lista de las áreas en las que el intercambio de datos B2G puede tener un gran impacto en las vidas de los ciudadanos es interminable: hacer que los servicios de salud sean más eficientes, mejorar el diagnóstico de las enfermedades de la población, reaccionar más rápido en emergencias y desastres naturales o humanitarios, permitir el acceso a los datos a institutos públicos de investigación para el desarrollo de servicios de inteligencia artificial éticos, ahorrar energía por una sociedad más sostenible, mejorar la movilidad, desarrollar ciudades más inteligentes, etc.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
La Secretaría de Estado de Digitalización e Inteligencia Artificial, en colaboración con SEGITTUR y como parte de la feria internacional FITUR, organizó el pasado 19 de diciembre el primer taller del Hub español de Gaia-X, centrado en avanzar la creación del espacio de datos de la industria del Turismo.
Los datos son una palanca de transformación digital del mundo, así como un elemento habilitador para la innovación y el desarrollo de nuevas tecnologías y servicios. Sin embargo, los datos por sí solos no generan ningún valor, y es clave ponerlos en contexto para obtener beneficios tangibles. Para ello, generalmente se hace necesario compartir y relacionar distintos conjuntos de datos, a menudo de distintas disciplinas o dominios.
En este contexto de necesidad de compartición es donde surge el concepto de los espacios de datos. Estos son estructuras (tecnológicas y de gobernanza) que proporcionan confianza y seguridad en torno a la compartición voluntaria de datos entre sus participantes. Son ecosistemas donde se articulan y gestionan las voluntades, funciones y procesos necesarios para compartir datos, a través de mecanismos de consenso, bajo un contexto de soberanía y control, y en base a una arquitectura de sistemas federada.
Este primer taller colaborativo se ha centrado en el uso de los datos en la industria del Turismo, uno de los sectores clave para España. Su objetivo es conformar una visión para este espacio de datos. Para ello, se analizaron los retos y oportunidades en materia de gobernanza del espacio, las tecnologías y arquitecturas disponibles para facilitar la compartición de datos, así como casos de uso tractores para el sector. El taller tuvo forma híbrida (presencial + online) y contó con la participación de diferentes representantes de la política, de oficinas técnicas gubernamentales, de empresas a lo largo de toda la cadena de valor del Turismo, universidades e institutos tecnológicos, así como integradores del mundo TI. Se contó además con ponentes de cada una de estas clases de organizaciones, queriendo así reflejar que la construcción y operación de los espacios de datos necesita de la involucración de un ecosistema variado y multidisciplinar.
El Hub español de Gaia-X
El Gobierno de España está trabajando en promover el entorno propicio para la creación de espacios de datos sectoriales, a través de las distintas iniciativas en materia de datos que se detallan en la Agenda España Digital 2025, y aprovechando la excepcional oportunidad que ofrecen los fondos NextGenEU. Bajo este marco, se ha impulsado la creación del Hub español de Gaia-X, que busca que sectores de todos los tamaños creen comunidad en torno al dato. El objetivo es que sirva para desarrollar e implantar nuevas soluciones innovadoras basadas en datos e Inteligencia Artificial, e impulsen la competitividad de las empresas. Estos espacios son además tractores para generar beneficios a lo largo de toda la cadena transformativa del dato, y se presta especial atención a que en la misma estén también representadas PYMEs y microPYMEs.
Gaia-X es una iniciativa europea del sector privado cuyo objetivo es la creación de una infraestructura de datos abierta, federada e interoperable, constituida sobre los valores de la disponibilidad y el control de los datos, y para el fomento de la Economía del Dato. Su principal objetivo es apoyar la respuesta europea en materia de compartición de datos a lo largo de distintos sectores y geografías de la Unión, y en base a un modelo federado que garantice la confianza y la soberanía digital. La iniciativa logra la capilaridad en el territorio de los diferentes estados miembro a través de 15 hubs nacionales de Gaia-X, incluido el de España.
Desarrollo de la jornada de trabajo
Durante la jornada de trabajo, se señaló que España será el primer país en liderar un espacio de datos en la industria del Turismo, que desarrollará estándares y maneras para compartir datos en la práctica, aportando de esa manera su capacitación y experiencia al resto de Europa. Esto supondrá a su vez una gran oportunidad dentro del proceso de transformación digital que ya vive la economía española.
La puesta en marcha de este proyecto conlleva una serie de retos relativos a la generación de confianza, la reducción de costes en la interoperabilidad, el establecimiento de semánticas y estándares, la creación de modelos de negocio generadores de valor, así como el logro de un modelo de gobernanza práctico que garantice la soberanía y control de los partícipes sobre sus datos y lo qué se hace con ellos. Éstas, consideraciones comunes a la creación de todo espacio de datos, se agudizan en este caso por la alta fragmentación y atomización del sector, así como su incompleta digitalización. La solución pasa por la implantación de una cadena de valor digitalizada de extremo a extremo, que englobe a todos los intervinientes en un modelo de compartición de datos que permita una visión holística, dando respuesta a las cuestiones relativas a la gestión de la privacidad, el mantenimiento de las ventajas competitivas, y la fijación de modelos de recompensa.
Para ello, durante la sesión de trabajo se evidenció la necesidad de avanzar en un enfoque de casos de uso: desde una necesidad de negocio concreta se abordan requerimientos y necesidades, fijándose así las condiciones básicas que garanticen su viabilidad y sostenibilidad. De esta manera, se dota además de escalabilidad al espacio de datos, que permite desplegarlo de manera ágil e incremental, contando con un producto inicial y que puede ampliarse fácilmente en sucesivas etapas con más funcionalidades y roles, según vayan incorporándose al espacio de datos nuevos participantes y casos de uso.
Estos casos de uso son la base para fijar los requisitos de la arquitectura del ecosistema de compartición de datos, incluyendo los estándares semánticos, modelos y vocabularios de datos concretos, la fijación de los roles y funciones de los participantes, así como los requisitos de los diferentes componentes software necesarios. La infraestructura de datos y de los sistemas es abierta y federada, goza de la escalabilidad y flexibilidad que ofrece el modelo de referencia de IDS (International Data Spaces), y cumple con los criterios de Gaia-X. De esa manera, tanto el espacio de datos del Turismo, como los futuros espacios sectoriales que se vayan generando, no sólo cumplen su función habilitadora para la Economía del Dato, sino que además lo hacen en base a los principios europeos básicos de soberanía digital, transparencia y transversalidad e igualdad.