espacios de datos

Los espacios europeos comunes de datos en el ámbito del sector público

Blog

La decidida apuesta por los espacios comunes de datos a nivel europeo es uno de los ejes principales de la Estrategia Europea de Datos aprobada en 2020. En dicho documento ya se anunciaba este planteamiento como base para, por una parte, dar soporte al impulso de las políticas públicas y, por otra, facilitar el desarrollo de productos y servicios innovadores a partir de la inteligencia de datos y el aprendizaje automático.

Ahora bien, la disponibilidad de grandes conjuntos de datos sectoriales precisaba, como presupuesto ineludible, un marco normativo adecuado de carácter transversal que permitiera establecer las condiciones de viabilidad y seguridad desde la perspectiva jurídica. A este respecto, una vez consolidada la reforma de la regulación sobre reutilización de la información del sector público con novedades de gran calado como los datos de alto valor, en 2022 se aprobó la regulación sobre gobernanza de datos y posteriormente, ya en 2023, la denominada Ley de Datos. Con estas iniciativas ya aprobadas y la reciente publicación oficial del Reglamento sobre Inteligencia Artificial, el impulso de los espacios de datos adquiere una especial trascendencia, en particular en el ámbito del sector público, con el fin de garantizar la disponibilidad de datos suficientes y de calidad.

Los espacios de datos: diversidad en su configuración y regulación

En la Estrategia Europea de Datos ya se contemplaba la creación de espacios comunes europeos de datos en una serie de sectores y ámbitos de interés público, si bien al mismo tiempo no se descartaba que se pusieran en marcha otros nuevos. De hecho, en los últimos años se han anunciado nuevos espacios, con lo que el número actual se ha ampliado notablemente como veremos más adelante.

La razón principal de los espacios de datos consiste en facilitar la puesta en común y el intercambio de datos fiables y seguros en sectores económicos estratégicos y ámbitos de interés público. Así pues, no se trata simplemente de promover grandes conjuntos de datos sino, sobre todo, de apostar por iniciativas que ofrezcan la accesibilidad de los datos según modelos de gobernanza idóneos que, en última instancia, permitan la interoperabilidad de aquellos en el conjunto de la Unión Europea a partir de infraestructuras tecnológicas adecuadas.

Aunque se puedan ofrecer caracterizaciones generales de los espacios de datos a partir de una serie de notas comunes, lo cierto es que existe una gran diversidad desde la perspectiva jurídica en cuanto a los fines que persiguen, las condiciones en las que se comparten los datos y, en particular, los sujetos que participan.

Esta heterogeneidad también se encuentra presente en los espacios relacionados con el sector público, es decir, aquellos en los que existe un protagonismo destacado de los datos generados por Administraciones y otras entidades públicas en el ejercicio de sus funciones a los que, por tanto, resulta de plena aplicación la regulación sobre reutilización y datos abiertos aprobada en 2019.

¿Cuáles son los espacios europeos de datos relativos al sector público?

A principios de 2024 se hizo pública la segunda versión de un documento de trabajo de la Comisión Europea con el doble objetivo de ofrecer una visión actualizada del marco normativo europeo para los espacios de datos y, asimismo, identificar las iniciativas europeas sobre espacios de datos para evaluar su grado de madurez y los principales desafíos de futuro que plantea cada una de ellas.

En concreto, por lo que se refiere a las Administraciones públicas se contemplan cuatro espacios de datos: el espacio de datos jurídicos, el relativo a la contratación pública, el vinculado al sistema técnico “una sola vez” en el contexto de la Administración electrónica y, finalmente, el espacio de datos de seguridad para la innovación. Se trata de iniciativas muy diversas que, además, presentan un grado de madurez desigual, de manera que algunas cuentan con un nivel de desarrollo ciertamente avanzado y un sólido soporte institucional, mientras que otros casos simplemente están esbozados inicialmente y tienen por delante un esfuerzo considerable para su diseño e implementación.

Analicemos más en profundidad cada uno de estos espacios a los que se refiere el citado documento de trabajo.

1. Espacio de datos jurídicos

Se trata de un espacio de datos vinculado con la legislación y la jurisprudencia generadas tanto por la Unión Europea como por los Estados miembros. Con esta iniciativa se pretende apoyar al colectivo de las profesiones jurídicas, a las Administraciones públicas y, en general, facilitar a la sociedad el acceso con el fin de reforzar los mecanismos del Estado de Derecho. Este espacio se ha fundamentado hasta ahora en dos iniciativas concretas:

Una relativa a la información sobre la normativa publicada oficialmente, que se ha articulado a través del Identificador Europeo de Legislación-ELI (European Legislation Identifier). Se trata de un estándar europeo que facilita la identificación de las normas de manera estable y fácilmente reutilizable ya que describe la legislación con un conjunto de metadatos procesables automáticamente, de acuerdo con una ontología recomendada.
La segunda, por su parte, se refiere a las decisiones adoptadas por los órganos judiciales, cuya accesibilidad se ha facilitado mediante un sistema europeo de identificador único denominado ECLI (European Case Law Identifier) que se asigna a las decisiones de los órganos judiciales tanto europeos como estatales.

Estas dos relevantes iniciativas, que facilitan el acceso y el tratamiento automatizado de la información jurídica, han exigido pasar de un modelo de gestión basada en documentos (boletín oficial, resoluciones judiciales) a un modelo basado en datos. Y ha sido precisamente este cambio de paradigma el que permite ofrecer servicios avanzados de información que van más allá de los límites jurídicos y lingüísticos que plantean la diversidad regulatoria e idiomática existente a lo largo de la Unión Europea.

En todo caso, aun reconociendo el importante avance que suponen, todavía restan importantes retos a los que hacer frente, como podría ser el caso de facilitar el acceso por preceptos concretos y no por documentos normativos o, entre otros, la disponibilidad de los documentos judiciales a partir de las normas que aplican y, asimismo, la vinculación de las normas con su interpretación judicial por los diversos órganos judiciales de todos los Estados. En el caso de estos dos últimos supuestos el desafío es incluso mayor, ya que exigirían el enlace automatizado de ambos identificadores.

2. Espacio de datos de contratación pública

Se trata, sin duda, de uno de los espacios con un mayor impacto potencial por cuanto en el conjunto de la Unión Europea se calcula que las entidades públicas invierten unos dos billones de euros (casi el 14% del PIB) en la compra de servicios, obras y suministros. Así pues, con este espacio se pretende no sólo facilitar el acceso al mercado de la contratación pública en toda la Unión Europea sino también reforzar la transparencia y la rendición de cuentas en el gasto público asociado a dicha actividad, lo que resulta esencial en la lucha contra la corrupción y en la mejora de la eficiencia.

La relevancia práctica de este espacio viene reforzada por el hecho de que disponga de un documento oficial específico que respalda decididamente el proyecto y donde se establece una precisa hoja de ruta con el objetivo de asegurar su despliegue en unos plazos razonables. Además, a pesar de las limitaciones en su ámbito de aplicación (no se contempla ampliar la obligación de publicación a los contratos que se encuentran por debajo de los umbrales establecidos a nivel europeo, ni tampoco los anuncios relativos a la finalización de los contratos), se encuentra en un estado muy avanzado, en particular por lo que se refiere a la disponibilidad de una ontología específica que facilita la accesibilidad de la información y su reutilización al reforzar las condiciones de interoperabilidad.

En definitiva, con este espacio se está facilitando el tratamiento automatizado de los datos relativos a la contratación pública partiendo de la interconexión de los conjuntos de datos existentes, lo que facilita una visión más completa de la contratación pública en el conjunto de la Unión Europea, a pesar de que se ha calculado que existen más de 250.000 poderes adjudicadores de contratos públicos.

3. Sistema Técnico Único (Administración electrónica)

Con este nuevo espacio se pretende dar soporte a la necesidad que existe en los procedimientos administrativos de recopilar información emitida por Administraciones de otros Estados, sin que se le requiera directamente a los interesados. Se trata, por tanto, de recopilar de forma automática y segura las pruebas requeridas en un ámbito formalizado a partir de la interconexión directa entre las diversas entidades públicas que, de esta manera, actuarán como fuentes auténticas de la información requerida.

Esta iniciativa está vinculada con el objetivo de abordar la simplificación administrativa y, en concreto, con la aplicación de:

Reglamento de Ejecución (UE) 2022/1463 de la Comisión, de 5 de agosto de 2022, por el que se establecen las especificaciones operativas y técnicas del sistema técnico para el intercambio automatizado transfronterizo de pruebas y la aplicación del principio de «solo una vez».
Reglamento (UE) del Parlamento Europeo y del Consejo, de 13 de marzo de 2024, por el que se establecen medidas a fin de garantizar un alto nivel de interoperabilidad del sector público en toda la Unión (Reglamento sobre la Europa Interoperable), con el que se pretende establecer una sólida estructura de gobernanza de la interoperabilidad en el sector público.

4. Espacio de datos de seguridad para la innovación

En este caso el objetivo consiste en mejorar el acceso de las autoridades policiales a los datos necesarios para entrenar y validar algoritmos con el objetivo de reforzar el uso de la inteligencia artificial y, de este modo, reforzar el cumplimiento normativo con pleno respeto de las normas éticas y jurídicas.

Aunque se parte de una ineludible necesidad de facilitar el intercambio de datos entre las autoridades policiales de los Estados miembros, sin embargo, el documento de trabajo enfatiza que no se trata de una prioridad en las estrategias sobre Inteligencia Artificial en este ámbito, destacándose asimismo que el uso avanzado de datos en este área desde la perspectiva de la innovación es relativamente bajo en la actualidad.

A este respecto es oportuno destacar la iniciativa para el desarrollo del sandbox de Europol, proyecto que fue auspiciado por la decisión del Comité Permanente de Cooperación Operativa en materia de Seguridad Interior (COSI) al apostar por la creación de un espacio aislado que permita a los Estados desarrollar, entrenar y validar modelos de inteligencia artificial y aprendizaje automático.

Ahora que ya se encuentra en gran medida consolidado el proceso de digitalización de las entidades públicas, el principal reto para los espacios de datos en este ámbito consiste en ofrecer condiciones técnicas, jurídicas y organizativas adecuadas para facilitar la disponibilidad de los datos y su interoperabilidad. En este sentido, convendría tener en cuenta estos espacios de datos a la hora de ampliar el listado de datos de alto valor, en la línea ya adelantada por el estudio publicado por la Comisión Europea en 2023, donde se enfatiza que los conjuntos de datos con mayor potencial son los relativos a Gobierno y administración pública, los vinculados a Justicia y asuntos jurídicos, así como los datos financieros.

Contenido elaborado por Julián Valero, catedrático de la Universidad de Murcia y Coordinador del Grupo de Investigación “Innovación, Derecho y Tecnología” (iDerTec). Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

10/10/2024

Data Sandboxes: Explorando el potencial de los datos abiertos en un entorno seguro

Blog

Los data sandboxes son herramientas que nos proporcionan entornos donde poder probar nuevas prácticas y tecnologías relacionadas con los datos, lo que los convierte en poderosos instrumentos a la hora de gestionar y utilizar los datos de manera segura y eficaz. Estos espacios donde operar de forma segura con los datos son de gran utilidad a la hora de determinar si es viable abrir los datos y bajo qué condiciones. Algunos de los beneficios que nos ofrecen son:

Entornos controlados y seguros: proporcionan un espacio de trabajo donde poder explorar la información y evaluar su utilidad y calidad antes de comprometerse a compartirlos de manera más amplia. Esto resulta particularmente importante en sectores sensibles, donde la privacidad y seguridad de los datos son primordiales.
Facilitan la innovación: ofrecen un espacio seguro para la experimentación y el prototipado rápido, permitiendo iterar rápidamente, probando y perfeccionando nuevas ideas y soluciones basadas en datos a modo de banco de pruebas antes de lanzarlas al público.
Colaboración multisectorial: facilitan la colaboración entre diversos actores, incluyendo entidades gubernamentales, empresas privadas, el entorno académico y la sociedad civil. Este enfoque multisectorial ayuda a romper los silos de datos y promueve el intercambio de conocimientos y buenas prácticas entre sectores.
Uso adaptable y escalable: pueden ajustarse para adaptarse a diferentes tipos de datos, casos de uso y sectores, lo que los convierte en una herramienta versátil para diversas iniciativas basadas en datos.
Intercambio de datos transfronterizo: aportan una solución viable para gestionar los desafíos del intercambio de datos entre distintas jurisdicciones, especialmente en lo que respecta a las normativas internacionales de privacidad.

El informe "Data Sandboxes: Managing the Open Data Spectrum" explora el concepto de los data sandboxes como una herramienta para conseguir un equilibrio adecuado entre los beneficios de los datos abiertos y la necesidad de proteger la información sensible.

Propuesta de valor para la innovación

Además de todos los beneficios anteriormente vistos, cabe destacar que los data sandboxes ofrecen también una sólida propuesta de valor para las organizaciones que buscan innovar de manera responsable. Estos entornos nos ayudan a mejorar la calidad de los datos al facilitar que los usuarios puedan identificar inconsistencias y poder así llevar a cabo las mejoras necesarias. También contribuyen a reducir los riesgos al proporcionar entornos seguros para permitir el trabajo con datos sensibles. Al fomentar la experimentación interdisciplinaria, la colaboración y la innovación, contribuyen a aumentar la capacidad de uso de los datos y a desarrollar una cultura impulsada por los datos dentro de las organizaciones. Además, los data sandboxes ayudan a reducir las barreras de acceso a los datos, mejorando la transparencia y la rendición de cuentas, lo que fortalece la confianza de los ciudadanos y da lugar a una expansión en los intercambios de datos.

Tipos de data sandboxes y características

Dependiendo del principal objetivo que tengamos a la hora de implantar un sandbox podemos encontrarnos con tres tipologías distintas:

Regulatory sandboxes, que permiten a las empresas y organizaciones poner a prueba servicios innovadores bajo la estrecha supervisión de los reguladores de un sector o área específico.
Innovation sandboxes, que son frecuentemente utilizados por los desarrolladores a la hora de probar nuevas funcionalidades y obtener una retroalimentación rápida sobre su trabajo.
Research sandboxes, los cuales facilitan que tanto el mundo académico como la industria puedan probar de manera segura nuevos algoritmos o modelos centrándose en el objetivo de sus pruebas, sin tener que preocuparse por incumplir las normativas establecidas.

En cualquier caso, independientemente del tipo de sandbox con el que estemos trabajando, todos ellos se caracterizan por los siguientes aspectos clave comunes:

Características de un data sandbox: adaptable y escalable, controlado, seguro, multisectorial y colaborativo, alta capacidad de computación, temporal. Fuente: adaptado de The Govlab.

Figura 1. Características de un data sandbox. Adaptación de un visual de The Govlab.

A continuación, se describe cada una de ellas:

Controlados: son entornos restringidos donde se puede acceder a los datos sensibles y analizados de manera segura, asegurando el cumplimiento de las regulaciones pertinentes.
Seguros: protegen la privacidad y seguridad de los datos, a menudo utilizando datos anonimizados o sintéticos.
Colaborativos: facilitan la colaboración entre diferentes regiones, sectores y roles, fortaleciendo los ecosistemas de datos.
Alta capacidad de computación: proporcionan recursos computacionales avanzados capaces de realizar tareas complejas con los datos cuando sea necesario.
Temporales: están diseñados para un uso temporal y con un ciclo de vida corto, permitiendo una experimentación rápida y enfocada que o bien concluye una vez logrado su objetivo o se convierte en un nuevo proyecto a largo plazo.
Adaptables: son lo suficientemente flexibles para personalizarse y escalar según las necesidades y los diferentes tipos de datos, casos de uso y contextos.

Ejemplos de data sandboxes

Los data sandboxes llevan ya mucho tiempo implantándose con éxito en múltiples sectores a lo largo de Europa y todo el mundo, por lo que podemos encontrar fácilmente varios ejemplos de su implementación en nuestro continente:

Laboratorio de ciencia de datos en Dinamarca: proporciona acceso a datos administrativos sensibles de utilidad para la investigación, fomentando la innovación bajo estrictas políticas de gobernanza de datos.
TravelTech en Lituania: un sandbox de acceso abierto que ofrece datos turísticos para mejorar el desarrollo empresarial y de la fuerza laboral en el sector.
Sandbox para datos abiertos de la iniciativa INDIGO: promueve el intercambio de datos entre sectores para mejorar las políticas sociales, enfocándose en crear un entorno seguro para las iniciativas de intercambio de datos bilaterales.
Sandbox de ciencia de datos de salud en Dinamarca: una plataforma de formación para investigadores que permite practicar análisis de datos utilizando datos biomédicos sintéticos sin tener que preocuparse por la estricta regulación.

Dirección futura y desafíos

Como hemos visto, los data sandboxes pueden resultar una herramienta poderosa a la hora de fomentar la apertura de datos, la innovación y la colaboración, asegurando al mismo tiempo la privacidad y seguridad de la información. Gracias a que proporcionan un entorno controlado para la experimentación con datos, permiten que los todos aquellos interesados puedan explorar nuevas aplicaciones y conocimientos de manera fiable y segura. Los sandboxes pueden por tanto ayudar a superar las barreras iniciales de acceso a los datos y contribuir a fomentar un uso más informado y con un propósito mejor definido de los mismos, promoviendo así el uso de soluciones basadas en datos para los problemas de ámbito público.

Sin embargo, a pesar de sus múltiples beneficios, los data sandboxes presentan también varios desafíos a la hora de su implementación. Los principales problemas con los que nos podríamos encontrar a la hora de llevarlos a la práctica incluyen:

Relevancia: conseguir que el sandbox contenga datos de alta calidad y relevantes, y que estos se mantengan actualizados.
Gobernanza: establecer reglas claras y protocolos para el acceso, uso y compartición de datos, así como los mecanismos de monitorización y cumplimiento de los mismos.
Escalabilidad: exportar con éxito las soluciones desarrolladas dentro del sandbox y poder trasladarlas a aplicaciones prácticas dentro del mundo real.
Gestión de riesgos: abordar de forma integral todos los riesgos asociados con la reutilización de datos a lo largo de su ciclo de vida y sin comprometer su integridad.

No obstante, a medida que las tecnologías y políticas continúan evolucionando, está claro que los data sandboxes están llamados a ser una herramienta útil y representar un papel relevante en la gestión del espectro de apertura de los datos, impulsando así el uso de los datos para la resolución de problemas cada vez más complejos. Así mismo, el futuro de los data sandboxes estará influenciado por los nuevos marcos regulatorios (como los Reglamentos de Datos y Gobernanza de Datos) que refuerzan la seguridad de los datos y promueven su reutilización, y por la integración con las tecnologías de preservación y mejora de la privacidad que nos permiten utilizar los datos sin necesidad de exponer ninguna información sensible. Juntas, estas tendencias impulsarán una innovación de datos más segura dentro de los entornos proporcionados por los data sandboxes.

Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

27/09/2024

IMPaCT-Data, integración de datos médicos para impulsar la medicina de precisión

Blog

IMPaCT, la Infraestructura de Medicina de Precisión asociada a la Ciencia y la Tecnología, es un programa innovador que busca revolucionar la atención médica. Coordinado y financiado por el Instituto de Salud de Carlos III su objetivo es impulsar el despliegue efectivo de la medicina personalizada de precisión.

La medicina personalizada es un enfoque médico que reconoce que cada paciente es único. A través del análisis de las características genéticas, fisiológicas y de estilo de vida de cada persona, se realizan tratamientos a medida más eficientes y seguros, con menos efectos secundarios. El acceso a esta información, además, es clave para avanzar en prevención y detección temprana, así como en investigación y avances médicos.

IMPaCT consta de 3 ejes estratégicos:

Eje 1 Medicina predictiva: Programa COHORTE. Es un proyecto de investigación epidemiológica que consiste en el desarrollado y puesta en marcha de una estructura para el reclutamiento de 200.000 personas para que participen en un estudio prospectivo.
Eje 2 Ciencia de datos: Programa DATA. Es un programa enfocado en el desarrollo de un sistema común, interoperable e integrado, de recogida y análisis de datos clínicos y moleculares. A través de él se elaboran criterios, técnicas y buenas prácticas para la recolección de información de historias clínicas electrónicas, imágenes médicas y datos genómicos.
Eje 3 Medicina genómica: Programa GENÓMICA. Es una infraestructura cooperativa para el diagnóstico de enfermedades raras y genéticas. Entre otras cuestiones, elabora procedimientos normalizados para el correcto desarrollo de los análisis genómicos y la gestión de los datos obtenidos, así como para la estandarización y homogeneización de la información y los criterios empleados.

Además de estos ejes, existen dos líneas estratégicas transversales: una centrada en la ética e integridad científica y otra en la internacionalización, como se resume en el siguiente visual.

Fuente: IMPaCT-Data

A continuación, nos vamos a centrar en el funcionamiento y resultados de IMPaCT-Data, el proyecto ligado al eje 2.

IMPaCT-Data, un entorno integrado para el análisis de datos interoperables

IMPaCT-Data se orienta al desarrollo y validación de un entorno de integración y análisis conjunto de datos clínicos, moleculares y genéticos, para su uso secundario, con el objetivo final de facilitar la implementación eficaz y coordinada de la medicina personalizada de precisión en el Sistema Nacional de Salud. Actualmente está formado por un consorcio de 45 entidades asociadas por un convenio con vigencia hasta el 31 de diciembre de 2025.

A través de este programa, se busca la creación de una infraestructura en la nube de datos médicos para investigación, así como de los protocolos necesarios para coordinar, integrar, gestionar y analizar dichos datos. Para ello se sigue una hoja de ruta con los siguientes objetivos técnicos:

Fuente: IMPaCT-Data.

Resultados de IMPaCT-Data

Como vemos, esta infraestructura, aún en desarrollo, ofrecerá un entorno de investigación virtual para el análisis de los datos a través de diversos servicios y productos:

Nube federada IMPaCT-Data. Incluye el acceso a datos públicos y de acceso controlado, así como herramientas y flujos de trabajo para el análisis de datos genómicos, historias clínicas e imágenes. En este vídeo se muestra cómo se realiza el acceso de usuarios federado y la ejecución de trabajos mediante el uso de recursos computacionales compartidos. Esto permite visualizar y acceder a los resultados en formato HTML y en crudo, así como a sus metadatos. Aquellos que quieran profundizar en las opciones de acceso de usuario, pueden ver este otro vídeo, donde se muestra la vinculación de las cuentas institucionales a la cuenta IMPaCT-Data y el uso de pasaportes y visados para el acceso local a datos protegidos.
Recopilación de herramientas software para el análisis de los datos de IMPaCT-Data. Estas herramientas son de acceso público a través del dominio IMPaCT-Data en bio.tools, un registro de componentes software y bases de datos dirigido a investigadores en el campo de las ciencias biológicas y biomédicas. Incluye herramientas muy diversas. Por un lado, encontramos soluciones generales, por ejemplo, enfocadas en la privacidad a través de acciones relacionadas con la desidentificación y anonimización de datos (FAIR4Health Data Privacy Tool). Por otro, hay herramientas concretas, centradas en cuestiones muy específicas, como el metaanálisis de la expresión génica (ImaGEO).
Guías con recomendaciones y buenas prácticas para la recolección de información médica. Actualmente hay tres guías disponibles: “Recomendaciones de IMPaCT-Data sobre datos y software”, “Consideraciones adicionales de IMPaCT-Data a la convocatoria para proyectos IMPaCT 2022” y “Recomendaciones de IMPaCT-Data sobre datos y software”.

A ellos hay que sumar diversos entregables relacionados con aspectos técnicos del proyecto, como comparaciones de técnicas o pruebas de concepto, así como publicaciones científicas.

Impulsando casos de uso a través de demostradores

Uno de los objetivos de IMPaCT-Data es contribuir a la evaluación de tecnologías asociadas a los desarrollos del proyecto, a través de un ecosistema de demostradores. Con ello se busca favorecer las aportaciones de empresas, entidades y grupos académicos para impulsar mejoras y conseguir la implementación del proyecto a gran escala.

Para cumplir este objetivo, se organizan distintas actividades donde se evalúan componentes concretos en colaboración con miembros de IMPaCT-Data. Un ejemplo es el servidor de terminologías ORBITS para la codificación de fenotipos clínicos en códigos HPO (Human Phenotype Ontology), dirigido a extraer y codificar de manera automática información contenida en reportes clínicos no estructurados usando procesamiento del lenguaje natural. Para ello utiliza la terminología HPO, cuyo objetivo es estandarizar la recopilación de datos fenotípicos, haciéndolos accesibles para el posterior análisis.

Otro ejemplo de demostradores hace referencia a la compartición de datos médicos virtualizados entre diferentes centros para proyectos de investigación, dentro de un entorno gobernado, eficiente y seguro, donde se cumplen todos los estándares de calidad de datos definidos por cada entidad.

Un proyecto estratégico alineado con Europa

IMPaCT-Data se enmarca directamente en la Estrategia nacional para el uso secundario de los datos del sistema de salud nacional, descrita en el PERTE de salud (Proyectos estratégicos para la recuperación y transformación económica), siendo sus conocimientos, experiencia y aportaciones muy valiosa de cara al desarrollo del Espacio Nacional de datos de Salud.

Además, los desarrollos de IMPaCT-Data está directamente alineados con las líneas maestras propuestas por GAIA-X, tanto a nivel general como en el entorno específico de salud.

El impacto del proyecto en Europa queda patente, también, en su participación en el proyecto Europeo GDI (Genomic Data Infrastructure), que busca facilitar el acceso a datos genómicos, fenotípicos y clínicos en toda Europa, donde se está usando IMPaCT-Data como instrumento a nivel nacional.

Todo ello pone de manifiesto que gracias a IMPaCT-Data se podrán impulsar proyectos de investigación en biomedicina no solo en España, sino también en Europa, contribuyendo de este modo a la mejorar la salud pública y el tratamiento individualizado de los pacientes.

20/08/2024

La singular relevancia de la interoperabilidad en el Reglamento de Datos (Data Act)

Blog

Uno de los principales objetivos de Reglamento (UE), del Parlamento Europeo y del Consejo de 13 de diciembre de 2023 sobre normas armonizadas para un acceso justo a los datos y su utilización (Reglamento de Datos) consiste en promover el desarrollo de criterios de interoperabilidad en los espacios de datos, los servicios de tratamiento de datos y los contratos inteligentes. A este respecto, el Reglamento entiende la interoperabilidad como:

La capacidad de dos o más espacios de datos o redes de comunicación, sistemas, productos conectados, aplicaciones, servicios de tratamiento de datos o componentes para intercambiar y utilizar datos con el fin de desempeñar sus funciones.

Según afirma expresamente dicha norma “los datos interoperables y de alta calidad de diferentes ámbitos incrementan la competitividad y la innovación, y garantizan un crecimiento económico sostenible”, para lo cual resulta necesario que “los mismos datos pueden utilizarse y reutilizarse para diversos fines y de modo ilimitado, sin pérdida de calidad o cantidad”. Así pues, considera que resulta imprescindible “un enfoque regulador para la interoperabilidad que sea ambicioso y que inspire la innovación para superar la dependencia de un solo proveedor, que obstaculiza la competencia y el desarrollo de nuevos servicios”.

Interoperabilidad y espacios de datos

Esta preocupación ya existía en la Estrategia Europea de Datos, donde la interoperabilidad se consideraba un elemento clave para poner en valor los datos y, de manera singular, para el despliegue de la Inteligencia Artificial. De hecho, la interoperabilidad es una premisa inexcusable para los espacios de datos, de modo que el establecimiento de protocolos adecuados se convierte en esencial para garantizar su potencial, tanto por lo que se refiere a cada uno de los espacios de datos a nivel interno como, asimismo, a la hora de facilitar una integración transversal de varios de ellos.

En este sentido, son frecuentes las iniciativas de estandarización y los encuentros para tratar de establecer unas condiciones específicas de interoperabilidad en este tipo de escenarios, caracterizados por la diversidad de las fuentes de datos. Aunque supone una dificultad añadida, lo cierto es que un enfoque transversal, que integre varios espacios de datos, proporciona un mayor impacto en la generación de servicios de valor añadido y permite crear las condiciones jurídicas adecuadas para la innovación.

Según establece el Reglamento de Datos quienes participen en los espacios de datos y ofrezcan datos o servicios de datos a otros actores que intervengan en los mismos habrán de cumplir una serie de requisitos encaminados, precisamente, a garantizar unas condiciones adecuadas de interoperabilidad y que, de este modo, los datos puedan tratarse conjuntamente. Para ello, se proporcionará una descripción del contenido, la estructura, el formato y otras condiciones de uso de los datos, de manera que se facilite el acceso a los mismos y su compartición de manera automatizada, incluso en tiempo real o permitiendo la descarga masiva cuando proceda.

Conviene tener en cuenta que para los espacios de datos es esencial cumplir con los estándares técnicos y semánticos de interoperabilidad, puesto que una mínima normalización de las condiciones jurídicas facilita enormemente su funcionamiento. En concreto, es de gran importancia asegurar que quien aporte los datos es titular de los derechos necesarios para compartirlos en dicho entorno y, asimismo, poder acreditarlo de manera automatizada.

Interoperabilidad en los servicios de tratamiento de datos

El Reglamento de Datos presta una especial atención a la necesidad de mejorar la interoperabilidad entre los distintos proveedores de servicios de tratamiento de datos, de manera que los clientes puedan beneficiarse de la interacción entre cada uno de ellos, reduciendo así la dependencia de proveedores concretos.

Para ello, en primer lugar, refuerza la obligación de informar que tienen los proveedores que prestan este tipo de servicios, a las que deberán añadirse aquellas derivadas de la regulación general en materia de suministro de contenidos y servicios digitales. En particular, deberán constar por escrito:

Las condiciones contractuales relativas a los derechos del cliente, sobre todo en situaciones relacionadas con un posible cambio a otro proveedor o infraestructura.
Una indicación completa de los datos que podrán exportarse durante el proceso de cambio de proveedor, de manera que el alcance de la obligación de interoperabilidad habrá de estar previamente fijado. Además, dicha información tiene que ofrecerse a través de un registro en línea actualizado que ofrecerá el proveedor de servicios.

El Reglamento pretende garantizar que el derecho de los clientes a la libre elección del proveedor de los servicios de datos no se vea afectado por barreras y dificultades derivados de la falta de interoperabilidad. Incluso, la regulación contempla una obligación de proactividad para que el cambio de proveedor tenga lugar sin incidencias en la prestación del servicio al cliente, por lo que les obliga a adoptar aquellas medidas que sean razonables para asegurar una “equivalencia funcional” e, incluso, a ofrecer de manera gratuita interfaces abiertas que faciliten dicho proceso. No obstante, en algún caso –en concreto, cuando se pretenda utilizar en paralelo dos servicios–, se permite al antiguo proveedor repercutir ciertos costes que se le puedan haber generado.

En última instancia, la interoperabilidad de los servicios de tratamiento de datos va más allá de simples aspectos técnicos o semánticos, de manera que se convierte en una premisa inexcusable para asegurar la portabilidad de los activos digitales, garantizar las condiciones de seguridad e integridad de los servicios y, entre otros objetivos, no interferir en la incorporación de las innovaciones tecnológicas, todo ello con un marcado protagonismo de los servicios en la nube.

Contratos inteligentes e interoperabilidad

El Reglamento de Datos también presta una especial atención a las condiciones de interoperabilidad que permitan la ejecución automatizada de los intercambios de datos, para lo cual resulta esencial fijarlas de manera predeterminada. De lo contrario, se verían afectadas las condiciones óptimas de funcionamiento que requiere el entorno digital, especialmente desde el punto de vista de la eficiencia.

La nueva regulación contempla obligaciones específicas para los proveedores de contratos inteligentes y, asimismo, para quienes desplieguen este tipo de herramientas al llevar a cabo su actividad comercial, empresarial o profesional. A tal efecto, se entiende por contrato inteligente aquel

programa informático utilizado para la ejecución automatizada de un acuerdo o de parte de este, que utiliza una secuencia de registros electrónicos de datos y garantiza su integridad y la exactitud de su orden cronológico.

Dichos sujetos han de garantizar que los contratos inteligentes cumplen con las obligaciones que contempla el Reglamento por lo que se refiere a la puesta a disposición de datos y, entre otros aspectos, será imprescindible garantizar “la coherencia con las condiciones del acuerdo de intercambio de datos que ejecuta el contrato inteligente”. En consecuencia, serán responsables del efectivo cumplimiento de tales exigencias, para lo cual deberán llevar a cabo una evaluación de conformidad y expedir una declaración relativa a la observancia de tales requisitos.

Para facilitar el cumplimiento de estas garantías, el Reglamento contempla una presunción de cumplimiento cuando se respeten las normas armonizadas publicadas en el Diario Oficial de la Unión Europea, para lo cual se autoriza a la Comisión a fin de que solicite a organizaciones europeas de normalización la elaboración de disposiciones específicas.

En los últimos cinco años y, en particular desde la Estrategia de 2020, se ha producido un importante avance en la regulación europea que permite afirmar que existen unas condiciones jurídicas adecuadas para garantizar la disponibilidad de los datos de calidad para impulsar la innovación tecnológica. Por lo que se refiere a la interoperabilidad, ya se han dado pasos muy relevantes, especialmente en el sector público, donde podemos encontrar tecnologías disruptivas que pueden resultar de enorme utilidad. Sin embargo, todavía está pendiente el desafío de concretar de manera precisa el alcance de las obligaciones establecidas legalmente.

Por ello el propio Reglamento de Datos habilita a la Comisión para que pueda adoptar especificaciones comunes que garanticen el efectivo cumplimiento de las medidas que contempla si fuera necesario. No obstante, se trata de una medida de carácter subsidiario, ya que previamente se han de intentar otras vías para conseguir la interoperabilidad, como es el caso de la elaboración de normas armonizadas a través de organizaciones de normalización.

En definitiva, a la hora de regular la interoperabilidad se requiere un planteamiento ambicioso, tal y como reconoce el propio Reglamento de Datos, si bien se trata de un proceso complejo que precisa de medidas de ejecución en diferentes niveles que van más allá de la simple aprobación de normas jurídicas, aun cuando dicha legislación suponga un importante avance para dinamizar la innovación en condiciones adecuadas, esto es, más allá de las simples premisas tecnológicas.

01/08/2024

Gobernar los datos para gobernar la inteligencia artificial

Blog

La publicación el viernes 12 de julio de 2024 del Reglamento de Inteligencia Artificial (RIA o AIA en sus siglas en inglés) abre una nueva etapa en el marco regulatorio europeo y global. La norma se caracteriza por tratar de conjugar dos almas. De un lado se trata de asegurar que la tecnología no genere riesgos sistémicos para la democracia, la garantía de nuestros derechos y el ecosistema socioeconómico en su conjunto. De otro lado, se busca un enfoque orientado al desarrollo de producto de modo que responda a los altos estándares de fiabilidad, seguridad y cumplimiento normativo definidos por la Unión Europea.

Ámbito de aplicación de la norma

La norma permite diferenciar entre sistemas de bajo y medio riesgo, sistemas de alto riesgo y modelos de IA de uso general. Para calificar los sistemas, el RIA define criterios relacionados con el sector regulado por la Unión Europea (Anexo I) y define el contenido y alcance de aquellos sistemas que por su naturaleza y finalidad podrían generar riesgos (Anexo III). Los modelos son altamente dependientes del volumen de datos, sus capacidades y la carga operacional.

El RIA solo afecta a los dos últimos casos: sistemas de alto riesgo y modelos de IA de uso general. Los sistemas de alto riesgo exigen la evaluación de la conformidad a través de organismos notificados. Estos son entidades ante las que se presentan evidencias de que el desarrollo se ajusta al RIA. En este sentido, los modelos están sujetos a fórmulas de control por la Comisión que aseguran la prevención de riesgos sistémicos. No obstante, estamos ante un marco normativo flexible que favorece la investigación, relajando su aplicación en entornos de experimentación, así como mediante el despliegue de sandboxes para el desarrollo.

La norma establece una serie de “requisitos de los sistemas de IA de alto riesgo” (sección segunda del capítulo tercero) que deberían constituir un marco de referencia para el desarrollo de cualquier sistema e inspirar los códigos de buenas prácticas, normas técnicas y esquemas de certificación. Entre ellos, ocupa un lugar central el artículo 10 sobre “datos y gobernanza de datos”. Este proporciona indicaciones muy precisas sobre las condiciones de diseño de los sistemas de IA, particularmente cuando supongan tratar datos personales o cuando se proyecten sobre personas físicas.

Esta gobernanza debería considerarse por quienes proporcionen la infraestructura básica y/o los conjuntos de datos, gestionen espacios de datos o los llamados Digital Innovation Hubs, que ofrezcan servicios de soporte. En nuestro ecosistema, caracterizado por una alta prevalencia de PYMEs y/o equipos de investigación, la gobernanza de datos se proyecta sobre la calidad, seguridad y fiabilidad en sus acciones y resultados. Por ello es necesario asegurar los valores que el RIA impone a los conjuntos de datos de entrenamiento, validación y prueba en sistemas de alto riesgo y, en su caso, cuando se empleen técnicas que impliquen el entrenamiento de modelos de IA.

Estos valores pueden alinearse con los principios del artículo 5 del Reglamento General de Protección de Datos (RGPD) y los enriquecen y complementan. A ellos se añade el enfoque de riesgo y la protección de datos desde el diseño y por defecto. Relacionar unos y otros constituye un ejercicio sin duda interesante.

Garantizar el origen legítimo de los datos: Lealtad y licitud

Junto a la referencia común a la cadena de valor asociada a los datos, hay que referirse a una cadena de custodia que garantice la legalidad en los procesos de recogida de datos. El origen de los datos, particularmente en el caso de los datos personales, debe ser lícito, legítimo y su uso coherente con la finalidad original de su recogida. Por ello es indispensable una adecuada catalogación de los conjuntos de datos en origen que asegure una correcta descripción de su legitimidad y condiciones de uso.

Esta es una cuestión que afecta a los entornos de open data, a los organismos y servicios de acceso a datos detallados en el Reglamento de gobernanza de datos (DGA en sus siglas en inglés) o el Espacio Europeo de Datos de Salud (EHDS) y a buen seguro inspirará futuras regulaciones. Lo usual será combinar fuentes externas de datos con la información que maneja la PYME.

Minimización de los datos, exactitud y limitación de finalidad

El RIA ordena, de una parte, realizar una evaluación de la disponibilidad, la cantidad y la adecuación de los conjuntos de datos necesarios. De otra, exige que los conjuntos de datos de entrenamiento, validación y prueba sean pertinentes, suficientemente representativos y posean las propiedades estadísticas adecuadas. Esta tarea es muy relevante para los derechos de las personas o los colectivos afectados por el sistema. Además, en la mayor medida posible, carecerán de errores y estarán completos en vista de su finalidad prevista. RIA predica estas propiedades para cada conjunto de datos individualmente o para una combinación de estos.

Para la consecución de tales objetivos resulta necesario asegurar el despliegue de las técnicas adecuadas:

Realizar las operaciones de tratamiento oportunas para la preparación de los datos, como la anotación, el etiquetado, la depuración, la actualización, el enriquecimiento y la agregación.
Formular supuestos, en particular en lo que respecta a la información que se supone que miden y representan los datos. O, dicho en un lenguaje más coloquial, definir los casos de uso.
Tener en cuenta, en la medida necesaria para la finalidad prevista, las características o elementos particulares del entorno geográfico, contextual, conductual o funcional específico en el que está previsto que se utilice el sistema de IA de alto riesgo.

Gestionar el riesgo: evitar el sesgo

En el ámbito de la gobernanza de los datos se atribuye un papel esencial a la evitación del sesgo cuando pueda generar riesgos para la salud y la seguridad de las personas, afectar negativamente a los derechos fundamentales o dar lugar a algún tipo de discriminación prohibida por el Derecho de la Unión, especialmente cuando las salidas de datos influyan en las informaciones de entrada de futuras operaciones. Para ello procede adoptar las medidas adecuadas para detectar, prevenir y mitigar posibles sesgos detectados.

El RIA habilita excepcionalmente el tratamiento de categorías especiales de datos personales siempre que ofrezcan las garantías adecuadas en relación con los derechos y las libertades fundamentales de las personas físicas. Pero impone condiciones adicionales:

que el tratamiento de otros datos, como los sintéticos o los anonimizados, no permita efectuar de forma efectiva la detección y corrección de sesgos;
que las categorías especiales de datos personales estén sujetas a limitaciones técnicas relativas a la reutilización de los datos personales y a medidas punteras en materia de seguridad y protección de la intimidad, incluida la seudonimización;
que las categorías especiales de datos personales estén sujetas a medidas para garantizar que los datos personales tratados estén asegurados, protegidos y sujetos a garantías adecuadas, incluidos controles estrictos y documentación del acceso, a fin de evitar el uso indebido y garantizar que solo las personas autorizadas tengan acceso a dichos datos personales con obligaciones de confidencialidad adecuadas;
que las categorías especiales de datos personales no se transmitan ni transfieran a terceros y que estos no puedan acceder de ningún otro modo a ellos;
que las categorías especiales de datos personales se eliminen una vez que se haya corregido el sesgo o los datos personales hayan llegado al final de su período de conservación, si esta fecha es anterior;
que los registros de las actividades de tratamiento con arreglo a los Reglamentos (UE) 2016/679 y (UE) 2018/1725 y la Directiva (UE) 2016/680 incluyan las razones por las que el tratamiento de categorías especiales de datos personales era estrictamente necesario para detectar y corregir sesgos, y por las que ese objetivo no podía alcanzarse mediante el tratamiento de otros datos.

Las previsiones normativas resultan extraordinariamente interesantes. RGPD, DGA o EHDS apuestan por tratar datos anonimizados. RIA establece una excepción en aquellos casos en los que se generan conjuntos de datos inadecuados o de baja calidad desde el punto de vista del sesgo.

Tanto los desarrolladores individuales, como los espacios de datos y los servicios de intermediación que proporcionen conjuntos de datos y/o plataformas para el desarrollo deben ser particularmente diligentes a la hora de definir su seguridad. Esta previsión es coherente con la exigencia de disponer de espacios seguros de procesamiento en EHDS, implica una apuesta por estándares certificables en seguridad, públicos o privados, y aconseja una relectura de la disposición adicional decimoséptima sobre tratamientos de datos en nuestra Ley orgánica de protección de datos en materia de seudonimización, en la medida en la que añade garantías éticas y jurídicas a las propiamente técnicas. Además, se subraya la necesidad de garantizar una adecuada trazabilidad en los usos. Adicionalmente será necesario integrar en el registro de actividades de tratamiento una mención específica a este tipo de usos y a su justificación.

Aplicar las lecciones aprendidas desde la protección de datos, desde el diseño y por defecto

El artículo 10 de RIA obliga a documentar las decisiones pertinentes relativas al diseño y a detectar lagunas o deficiencias pertinentes en los datos que impidan el cumplimiento del RIA y la forma de subsanarlas. En resumen, no basta con garantizar la gobernanza de datos, también es necesario proporcionar evidencia documental y mantener una actitud proactiva y vigilante durante todo el ciclo de vida de los sistemas de información.

Estas dos obligaciones integran la clave de bóveda del sistema. Y su lectura debería ser incluso mucho más amplia en la dimensión jurídica. Las lecciones aprendidas en el RGPD enseñan que existe una doble condición para la responsabilidad proactiva y la garantía de los derechos fundamentales. La primera es intrínseca y material: el despliegue de la ingeniería de la privacidad al servicio de la protección de datos desde el diseño y por defecto asegura el cumplimiento del RGPD. La segunda es contextual: los tratamientos de datos personales no se dan en el vacío, sino en un contexto amplio y complejo regulado por otros sectores del Ordenamiento.

La gobernanza de datos opera estructuralmente desde los cimientos a la bóveda de los sistemas de información basados en IA. Asegurar que exista, sea adecuada y funcional es esencial. Así lo ha entendido la Estrategia de Inteligencia Artificial 2024 del Gobierno de España que trata de dotar al país de esas palancas que dinamicen nuestro desarrollo.

RIA plantea un salto cualitativo y subraya el enfoque funcional desde el que deben leerse los principios de protección de datos subrayando la dimensión poblacional. Ello obliga a repensar las condiciones en las que se ha venido cumpliendo el RGPD en la Unión Europea. Urge abandonar los modelos basados en plantillas que la empresa de consultoría copia-pega. Es evidente que las listas de control y la estandarización son imprescindibles. Sin embargo, su efectividad es altamente dependiente del ajuste fino. Y ello obliga a apelar particularmente a los profesionales que soportan el cumplimiento de este objetivo a dedicar sus mayores esfuerzos para dotar de sentido profundo al cumplimiento del Reglamento de Inteligencia Artificial.

Puedes ver un resumen del reglamento en la siguiente infografía:

Puedes accerder a la versión accesible e interactiva aquí

Contenido elaborado por Ricard Martínez Martínez, Director de la Cátedra de Privacidad y Transformación Digital, Departamento de Derecho Constitucional de la Universitat de València. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

24/07/2024

El convenio para proporcionar datos estadísticos a investigadores, en el contexto del Reglamento de gobernanza de datos

Blog

La Unión Europea ha diseñado una estrategia fundamental para garantizar la existencia de datos accesibles y reutilizables al servicio de la investigación, de la innovación y del emprendimiento. Se han tomado decisiones estratégicas tanto desde el punto de vista de la regulación, como en sentido material, para construir espacios para la compartición de datos y potenciar la aparición de intermediarios con la capacidad de procesar la información.

Las políticas europeas dan lugar a un ecosistema muy diverso que conviene diferenciar. De una parte, se profundiza en las políticas de reutilización de datos abiertos. De otra se trata de cubrir un espacio hasta hoy inaccesible. Nos referimos a aquellos datos que, debido a la garantía del derecho fundamental a la protección de datos, la propiedad intelectual o el secreto empresarial resultaban inaccesibles. Hoy las tecnologías de anonimización, y también las de intermediación de datos, hacen posible su tratamiento con las debidas garantías. Por último, se busca proporcionar recursos mediante el impulso de espacios de datos, las iniciativas que proponen modelos federativos, como Gaia X, o las infraestructuras europeas digitales (EDIC) impulsadas por la Comisión Europea y los Digital Innovation Hub dirigidos a impulsar la empresa y la Administración en este ámbito. Este escenario dinamizará distintos tipos de uso en la investigación, la invocación y el emprendimiento.

Este artículo se centra en el convenio celebrado por el Instituto Nacional de Estadística (INE), la Agencia Estatal de Administración Tributaria (AEAT), distintas instancias de la Seguridad Social, el Servicio Público de Empleo Estatal (SEPE) y el Banco de España para dinamizar el acceso a datos, que se enmarca en esta estrategia de la UE cuyos principios, reglas y condiciones deben exponerse para situarla en el contexto, subrayar su importancia y entender las implicaciones del convenio.

Competir desde la garantía de nuestros derechos

La UE compite con cierta desventaja estructural respecto de Estados Unidos o la República Popular China. En el lado norteamericano, los procesos de desarrollo de tecnologías disruptivas en el contexto de Internet y, particularmente, el despliegue de buscadores, redes sociales y aplicaciones móviles han favorecido el nacimiento de un mercado de data broking en el que unas pocas empresas poseen un poder casi monopolístico sobre los datos. Los grandes campeones del mundo digital manejan información prácticamente sobre todos los sectores de actividad, gracias a un modelo de negocio basado en la capitalización o la mercantilización de nuestra privacidad y su entrada en sectores como la salud o las pulseras de actividad. Cada vez que un usuario hizo una búsqueda, envió un mensaje de correo electrónico, comentó en una red social o dictó un mensaje al móvil, alimentó esa posición de dominio y sustentó el desarrollo de grandes modelos de lenguaje en inteligencia artificial o el despliegue de herramientas algorítmicas vinculadas al marketing neuroemocional.

Del lado chino, existe un modelo de Internet cerrado bajo control estatal, con una posición de participación y vigilancia sobre las grandes multinacionales locales del sector y se apunta un dominio global sobre el tráfico de las redes 5G. Se trata de un Estado vigilante que se ha convertido en la primera potencia en el despliegue de la inteligencia artificial mediante videovigilancia y reconocimiento facial y que maneja una política de Estado muy clara en materia de despliegue de la Inteligencia artificial (IA), generando ventajas para competir en esta carrera.

La UE parte de una posición aparentemente desventajosa. No se trata en absoluto de carencia de talento o altas capacidades. Gran parte del ecosistema de Internet y de las tecnologías de la información ha sido desarrollado en Europa o por talento europeo. Sin embargo, nuestro mercado no ha sido capaz de generar condiciones que permitieran la aparición de grandes campeones tecnológicos capaces de soportar el conjunto de la cadena de valor, desde infraestructuras en cloud a la disponibilidad de grandes volúmenes de datos que alimentan este ecosistema. Por otra parte, la UE adoptó un compromiso ético, político y jurídico con las libertades, la equidad y la democracia. Esta posición, que ha operado como una suerte de barrera en términos de costes y procesos, integra en su seno los requerimientos esenciales que requiere una transformación digital democrática, inclusiva y garante de las libertades.

La apuesta de Data Governance Act

El sustrato jurídico de la compartición de datos se integra por una compleja estructura modular que integra el Reglamento General de Protección de Datos (RGPD), la Directiva de datos abiertos y reutilización de información del sector público, la Data Governance Act (DGA), la Data Act (DA) y, en el futuro inmediato, la ley sobre Inteligencia Artificial (RIA) y el Reglamento sobre el Espacio Europeo de Datos Sanitarios (EHDS en sus siglas en inglés). Las normas deben facilitar la reutilización de los datos, incluidos aquellos bajo el alcance de la protección de datos, la propiedad intelectual y el secreto empresarial. Para hacerlo posible deben operar varios factores, que se exponen a continuación:

La compartición de datos desde la Administración debe crecer exponencialmente y generar un mercado de datos hoy por hoy monopolizado por compañías foráneas.
La soberanía digital en términos jurídicos será también un elemento dinamizador del crecimiento en la medida en la que define reglas de mercado basadas en la filosofía de la Unión Europea centradas en la garantía de los derechos fundamentales. Ello debería tener una consecuencia inmediata a la hora de definir procesos orientados a generar productos seguros y confiables.
La soberanía digital tendrá a su vez consecuencias tecnológicas relevantes. Los espacios de datos ya sea públicos, ya sea promovidos desde digital hubs o federaciones de nodos, como Gaia X, deben poner los datos al alcance del investigador individual o la start up, incluyendo los dashboard de aplicaciones y el soporte técnico.
El resultado de la normativa no es otro que acelerar e incrementar las posibilidades de liberar y compartir datos. La UE y el convenio que analizamos buscan liberar datos sujetos a deberes de secreto comercial, propiedad intelectual o, singularmente, la protección de los datos de carácter personal, de modo seguro a través de procesos de intermediación en entornos de datos seguros. Esta materia ha ocupado entre otros a la Agencia Española de Protección de Datos o a la Agencia Europea de Ciberseguridad (ENISA, en sus siglas en inglés). Ello implica apostar por la anonimización y/o por entornos de cuasi-anonimización a través de tecnologías como la privacidad diferencial, la encriptación homomórfica o la computación multi-parte.

Y todo ello desde la garantía de los derechos fundamentales y el empoderamiento de las personas. RGPD, DGA, DA y EHDS deberían permitir alcanzar el doble objetivo de generar un mercado europeo de libre circulación y reutilización de datos protegidos. Se garantiza así que las personas y entidades ejerzan sus derechos de control y, a la vez sea posible compartirlos fomentando además el altruismo de datos. Por otra parte, RGPD, DGA, EHDS y RIA definen límites precisos mediante prohibiciones de uso, condiciones de acceso regladas y procedimientos de diseño ética y jurídicamente garantizados. Con una idea que debe considerarse central, hay una dimensión del interés público o común que, más allá de las batallas épicas de COVID, alcanza a las pequeñas pero esenciales aspiraciones del investigador individual, del emprendedor disruptivo, de la PYME que trata de mejorar su cadena de valor o de la Administración innovando procesos al servicio de las personas.

España apuesta por la transformación digital de los espacios de datos

El Plan 2025, la Estrategia de Inteligencia Artificial, el esfuerzo de los fondos Next Generation a través de sus Proyectos Estratégicos para la Recuperación y Transformación Económica (PERTES), las Misiones de IA y la Carta de Derechos Digitales ejemplifican el alineamiento y liderazgo de España en este ámbito. Para hacer viables estas estrategias, es fundamental disponer de datos y entornos seguros de proceso. Ahora, al Espacio Nacional de Datos de Salud, se une el convenio celebrado entre el INE, la AEAT, distintas instancias de la Seguridad Social, el SEPE y el Banco de España. Como declara su exposición de motivos, constituye un primer y esperanzador paso para el despliegue de DGA en nuestro país.

Estas entidades entienden no solo el valor científico y empresarial de la información estadística que manejan, sino también el significativo crecimiento de su demanda y necesidad. Por otra parte, asumen una cuestión cualitativamente relevante: el interés que deriva de la interconexión de conjuntos de datos desde el punto de vista del valor que aportan. Por ello declaran su voluntad de maximizar el valor añadido de sus datos permitiendo el cruce o integración cuando la investigación se realice con fines científicos de interés público.

Las claves del convenio para proporcionar datos estadísticos a investigadores con fines científicos de interés público

A continuación, se resuelven algunas de las dudas que puedan surgir con respecto a este convenio.

¿Cómo se puede acceder a los datos?

El acceso a los datos pasa por una solicitud de acceso a información cruzada que debe ser individualmente aceptada por cada institución. Para ello se tienen en cuenta ciertos criterios de valoración que atienden a la naturaleza de los datos y al interés de la propuesta.

Facilitar este acceso implica para las instituciones firmantes un esfuerzo de desidentificación y cruce realizado por cada una de ellas directamente o a través de terceros de confianza. El resultado, “dependiendo del nivel de seguridad del fichero resultante”, implicará:

Un acceso directo y autónomo.
Un proceso de los datos en uno de las salas o centros seguros que pongan a disposición las entidades firmantes.

Algunas de las salas actualmente disponibles son:

También cabe destacar la creacion de ES_DataLab, que facilita el acceso a microdatos, en un entorno que garantiza la confidencialidad de la información. Permite cruzar datos de distintas instituciones participantes, como el INE, la AEAT, la Secretaría de Estado de Seguridad Social y Pensiones, la Tesorería General de la Seguridad Social (TGSS), el Instituto Nacional de la Seguridad Social (INSS), el Instituto Social de la Marina (ISM), la Gerencia de Informática de la Seguridad Social (GISS), el Servicio Público de Empleo Estatal y el Banco de España.

Además, en ejecución de las previsiones de la DGA se ha habilitado el “Punto Único de Información Nacional” (NSIP por sus siglas en inglés), gestionado por la Dirección General del Dato, desde donde ciudadanos, empresarios o investigadores, puedan localizar información sobre datos protegidos del sector público. Este punto se encuentra disponible en datos.gob.es.

¿Qué datos se comparten?

El volumen y las tipologías de datos que manejan son realmente significativos. La nota de prensa de presentación del convenio señalaba que se podrá acceder a "las bases de microdatos de las que son titulares el INE, la AEAT, la SS y el BE, con las necesarias garantías de seguridad, secreto estadístico, protección de datos personales y sometimiento a la Ley vigente. Además de las bases de datos estadísticas procedentes de sus encuestas, el INE también podrá dar acceso a registros administrativos, tanto a los elaborados o coordinados por él, como a los de otra titularidad pero que el INE utiliza para elaborar sus estadísticas (consultando en este último caso todas las solicitudes de acceso a los titulares de los correspondientes registros)".

¿Quién puede acceder a los datos?

Para conceder el acceso a los datos, se tendrán en cuenta, entre otros aspectos, el régimen de confidencialidad aplicable a los datos solicitados y su marco legal, el interés social de los resultados que se pretenden obtener en la investigación, el perfil, trayectoria y publicaciones científicas del investigador principal y de los investigadores asociados o el historial de proyectos de investigación de la entidad que avala el proyecto.

Una de las cuestiones que ha previsto la DGA en esta materia consiste en posibilitar el establecimiento de contraprestaciones económicas que aseguren la sostenibilidad del sistema. En cualquier caso, la cláusula tercera del convenio ha previsto la posibilidad de percibir contraprestaciones económicas de los solicitantes por los servicios de preparación y puesta a disposición de los datos contenidos en las bases que son de su titularidad, según lo previsto en la legislación estadística (artículo 21.3 de la Ley 12/1989, de 9 de mayo, de la Función Estadística Pública - LFEP) y en la normativa reguladora de cada institución.

¿Qué retos afrontan los solicitantes de acceso a datos y los firmantes?

Con independencia de las condiciones científicas de la propuesta de investigación, es fundamental apelar a las instituciones que la despliegan para crecer de modo significativo en la calidad de sus procesos de cumplimiento en materia de protección de datos y seguridad de la información. Pero no bastará con ello, el despliegue de la inteligencia artificial obliga a incorporar procesos adicionales que podemos encontrar en el documento de la Conferencia de Rectores de Universidades Españolas CRUE TIC 360º, abordado en 2023 para el supuesto de la universidad. Si bien es cierto que RIA propone un escenario de menor regulación en la investigación básica, también obliga a un despliegue ético de alto nivel. Y para ello, será esencial aplicar principios de ética de la inteligencia artificial, con el modelo ALTAI (Assessment List for Trustworthy Artificial Intelligence) u otro alternativo, y al Análisis de Impacto en los derechos fundamentales (FRAIA). Ello sin descuidar los altos requerimientos legales para el desarrollo de sistemas orientados al mercado. Más allá, de las declaraciones formales del Convenio, las lecciones aprendidas en proyectos europeos nos hacen afirmar la necesidad de un entramado procedimental de verificación jurídica y ética, basada en la evidencia, sobre los proyectos de investigación y las capacidades de las instituciones que soliciten acceso a datos.

Desde el punto de vista de las instituciones firmantes, además del reto de la sostenibilidad económica del modelo, prevista y regulada en el convenio, parece evidente la necesidad de una estrategia de inversión regulatoria. No nos cabe duda que cada repositorio de datos y los procesos que los sostienen han contado con una evaluación de impacto relativa a la protección de datos y con las metodologías de seguridad vinculadas al Esquema Nacional. La protección de datos desde el diseño y por defecto o el cumplimiento de las recomendaciones sobre anonimización y gestión de espacios de datos arriba citadas serán otros elementos considerados. Y ello se traduce en procesos, pero también en personas, -chief data officers, analistas de datos, otros mediadores como personas delegadas de protección de datos… -, junto a un alto nivel de exigencia en seguridad. Por otra parte, el deber de transparencia respecto de la ciudadanía obligará a disponer de canales eficientes y un modelo muy preciso de gestión del riesgo ante un eventual ejercicio masivo de un derecho de oposición al tratamiento, sin perjuicio de su viabilidad.

Por último, la Agencia Española de Protección de Datos debería aproximarse a este proceso de modo proactivo y promocional sin renunciar a su rol de garante de derechos fundamentales, pero contribuyendo al desarrollo de soluciones funcionales. Este no es un convenio cualquiera sino un banco de pruebas esencial para el futuro de la investigación con datos en España.

A nuestro juicio, la declaración más ilusionante de estas instituciones consiste en entender el convenio "como el embrión del futuro Sistema de acceso a datos para la investigación con fines científicos de interés público, que deberá ser conforme a la estrategia española y europea sobre datos y a la legislación sobre su gobernanza, en un marco de desarrollo de espacios de datos del sector público, y respetar en todo caso la autonomía y el régimen legal aplicable al Banco de España".

29/05/2024

Espacio Nacional de Datos de Salud: un proyecto estratégico para el país

Blog

Construir el Espacio Europeo de Datos de Salud constituye uno de los retos de nuestra generación. La pandemia de COVID 19 nos sitúo frente al espejo y nos devolvió al menos dos imágenes. La primera no era otra que el resultado de la aplicación de modelos formalistas, burocratizados y avejentados a la hora de gestionar los datos. La segunda, el enorme potencial que ofrece la compartición de datos, la colaboración de equipos interdisciplinares y el uso de la información sanitaria al servicio del bien común. La Unión Europea apuesta claramente por la segunda estrategia. En este artículo se examinan desde diversos enfoques los retos que plantea la construcción de un Espacio Nacional de Datos de Salud como instrumento que potencie la reutilización de dichos datos para usos secundarios.

El error de apostar por visiones formalistas

El escenario de tratamiento y compartición de datos anterior al despliegue de la estrategia europea del dato y su apuesta por los espacios de datos produjo efectos no sólo contraintuitivos, también contrafactuales. El marco del Reglamento General de Protección de Datos (RGPD) en lugar de favorecer el tratamiento operó como barrera. Se optó por una aplicación estricta, basada en la prevalencia de la privacidad. En lugar de buscar cómo gobernar el riesgo mediante soluciones jurídicas y técnicas se decidió por no tratar datos o por anonimizaciones técnicamente complejas e inviables en la práctica.

Este modelo no es sostenible. La aceleración tecnológica obliga a trasladar el centro de gravedad de la prohibición a la gestión del riesgo y a la gobernanza de los datos. Y esta es la apuesta del Reglamento del Parlamento Europeo y del Consejo sobre el Espacio Europeo de Datos de Salud (EHDS): encontrar soluciones y definir garantías para proteger a las personas. Y esta transformación encuentra al sector sanitario de España ante una situación inmejorable desde cualquier punto de vista, aunque no exenta de riesgos.

España, pionera en el cambio de enfoque

Nuestro país hizo los deberes con la Disposición adicional decimoséptima sobre tratamientos de datos de salud de la Ley Orgánica 3/2018, de 5 de diciembre, de Protección de Datos Personales y garantía de los derechos digitales (LOPDGDD). La regulación soslayó la mayor parte de problemas que afectan al uso secundario de datos de salud y lo hizo con la metodología que deriva del RGPD y la jurisprudencia del Tribunal Constitucional. Para ello apostó por:

Una clara sistematización y predeterminación normativa de los casos de uso.
Una definición precisa de las habilitaciones para el tratamiento.
Unas garantías procedimentales, contractuales y de seguridad.

La Disposición se adelantó cinco años al EHDS en cuanto a sus fines, objetivos y garantías. Y no sólo esto, sitúa a nuestro sistema sanitario en una posición de ventaja competitiva desde un punto de vista jurídico y material.

Desde este punto de vista el Espacio Nacional de Datos de Salud como eje vertebrador es un proyecto tan imprescindible como inaplazable, tal y como refleja la estrategia de Salud Digital del Sistema Nacional de Salud y el Plan de Recuperación, Transformación y Resiliencia. Sin embargo, esta afirmación no puede sustentarse en un entusiasmo acrítico. Queda mucho trabajo por hacer.

Lecciones aprendidas y retos a superar

Los proyectos europeos de investigación gestionados por el ecosistema de fundaciones sanitarias en el Instituto Carlos Tercero, la universidad y la empresa, proporcionan lecciones interesantes. En nuestro país se trabaja en medicina de precisión, en la construcción de data lakes, en aplicaciones móviles, en altas capacidades de seudonimización y anonimización, en imagen médica, en inteligencia artificial predictiva …, y podríamos seguir. Este ecosistema necesita una capa de innovación en materia de gobernanza. Una parte de ella será proporcionada directamente por el EHDS. Los organismos de acceso a datos, la autoridad de control y las estructuras de acceso transfronterizo asegurarán el ciclo de vida desde la conformación de conjuntos de datos catalogados y confiables a su tratamiento efectivo. Estas infraestructuras de gobierno requieren de un despliegue organizativo y humano que los soporte. La experiencia previa ayuda a prever los riesgos que pueden suponer una prueba de esfuerzo para el conjunto de la cadena de valor:

La formación de los recursos humanos en aspectos cruciales en materia de protección de datos, seguridad de la información y nuevas exigencias éticas no es siempre la adecuada ni en su formato, ni en su volumen, ni en la segmentación de perfiles. No se forma al 100% de la plantilla, mientras la formación continua voluntaria para profesionales de la salud es de alto nivel jurídico, causando un efecto tan contraproducente como perverso: cercenar la capacidad de innovar. Si en lugar de empoderar y generar compromiso ofrecemos una interminable lista de obligaciones del RGPD, el personal investigador acaba por autocensurar su capacidad de imaginar. Se confunde el contenido y el target formativo. La formación de alto nivel debería centrarse en los project manager y en el personal de soporte técnico y jurídico. Y en estos, cumplen una función vehicular, la persona delegada de protección de datos que es quien debe prestar un asesoramiento no binario, - del tipo legal o no legal-, y no puede trasladar toda la responsabilidad al equipo investigador.
La gobernanza de los recursos de tratamiento y de los procesos debe mejorar. En determinadas áreas de investigación, y las universidades son el mejor ejemplo de ello, los sistemas de información se segmentan y manejan en el nivel más reducido de proyecto o equipo de investigación. Son recursos insuficientes, con escaso nivel de control en la gestión del riesgo y la monitorización de la seguridad, incluido el soporte a la gestión y mantenimiento del entorno de tratamiento. Por otra parte, los procedimientos de acceso a los datos se basan en modelos rígidos, anclados en el estudio de caso o el ensayo clínico. Así, en no pocas ocasiones, manejamos conjuntos de datos en entornos muy específicos ajenos a los centros de proceso de datos principales. Ello multiplica el riesgo, y los costes en materias como las evaluaciones de impacto relativas a la protección de datos o el despliegue de medidas de seguridad.
La carencia de personas expertas puede plantear riesgos sistémicos. Para empezar, los Comités de Ética se enfrentan a cuestiones de protección de datos y ética de la inteligencia artificial que desbordan sus hábitos, costumbres y conocimientos, y apolillan sus procesos. De otro, lo que vulgarmente hemos denominado big data no es algo que se realice por arte de magia. La seudonimización o la anonimización, la anotación, el enriquecimiento y la validación del conjunto de datos y de los procesos que sobre ellos se implementan, exigen profesionales con altas capacidades.

Efectos del EHDS

Deberíamos reflexionar si nuestra posición destacada en digitalización pudiera a la vez ser nuestro talón de Aquiles. Pocos países poseen un alto grado de digitalización de cada uno de los niveles de atención sanitaria, de la primaria a la hospitalaria. Prácticamente ninguno ha regulado el uso de datos seudonimizados sin consentimiento, ni tampoco el modelo de consentimiento amplio de nuestra LOPDGDD. En este sentido, bajo el paraguas del EHDS podrían producirse dos efectos que debemos manejar:

Nuevas oportunidades en proyectos de investigación. En primer lugar, tan pronto como las instituciones sanitarias españolas publiquen sus catálogos de datos a nivel europeo, las peticiones de acceso desde otros países podrían multiplicarse. Y con ello las oportunidades de participación en proyectos de investigación como proveedores de información, data holders, o como usuarios de datos.
Impulso del ecosistema de empresas innovadoras. Por otra parte, el amplio abanico de usos secundarios que prevé el EHDS, ampliará el perfil de los agentes que presentarán solicitudes de acceso a datos. Ello apunta la posibilidad de alumbrar un ecosistema propio de empresas innovadoras para el despliegue de soluciones de salud desde el wellness (bienestar) al diagnóstico médico asistido por una inteligencia artificial.

Esto obliga a los responsables del sistema público de salud a hacerse una pregunta más bien sencilla: ¿qué nivel de disponibilidad, capacidad de proceso, seguridad e interoperabilidad pueden ofrecer los sistemas de información disponibles? No olvidemos que detrás de muchos proyectos de investigación transeuropeos, o del despliegue de herramientas de Inteligencia Artificial en el sector sanitario, existen presupuestos millonarios. Y ello presenta enormes oportunidades para profundizar en el despliegue de nuevos modelos de prestación de servicios de salud que, además, retroalimenten la investigación, la innovación y el emprendimiento. Pero también el riesgo de no ser capaces de aprovechar los recursos disponibles por carencias en el diseño de los repositorios y de sus capacidades de proceso.

¿Qué modelo de espacio de datos perseguimos?

La respuesta a esta pregunta se encuentra de modo muy claro tanto en la estrategia de espacios de datos de la Unión Europea, como en la propia estrategia del Gobierno de España. La tarea que el EHDS atribuye a los organismos de acceso a datos, más allá de la mera concesión de un permiso de acceso, es la de soporte y apoyo al desarrollo del tratamiento. Y para ello, se necesita de un Espacio Nacional de Datos de Salud que asegure el nivel de servicio, los estándares de anonimización o seudonimización, la interoperabilidad y la seguridad de la información.

En este contexto, los investigadores individuales en entornos ajenos a la salud, pero sobre todo las pequeñas y medianas empresas innovadoras, no poseen el músculo y la experiencia necesaria para satisfacer los requerimiento éticos y normativos. Por ello, no debería desdeñarse la necesidad de proporcionarles apoyo desde el punto de vista del diseño de modelos de compliance normativo y ético, si no se desea que estos operen como barrera de entrada o exclusión.

Y ello no excluye ni precluye los esfuerzos autonómicos, los que realizan fundaciones u hospitales de referencia o las infraestructuras de datos nacientes en el ámbito de la imagen médica de cáncer o la genómica. Precisamente, la idea de federación de espacios de datos que inspira la legislación europea puede rendir aquí frutos de una altísima calidad. El Ministerio de Sanidad y las Consejerías de Salud deben avanzar en esa dirección, con el apoyo del nuevo Ministerio de Transformación Digital y Función Pública. En las comunidades autónomas se reflexiona y actúa para el desarrollo de modelos gobernables y se participa, junto con el Ministerio de Sanidad, en el modelo de gobernanza que debe regir en el marco nacional. Reguladores como la Agencia Española de Protección de Datos están ofreciendo marcos de referencia viables para el desarrollo de los espacios de datos. Hospitales enteros diseñan, implementan y despliegan sistemas de información que buscan la integración de centenares de fuentes de datos y la generación de data lakes para la investigación. Infraestructuras de datos como EUCAIM abren el camino y generan know how de alta calidad en ámbitos altamente especializados.

Los trabajos para el despliegue de un Espacio Nacional de Datos de Salud, y todas y cada una de las iniciativas singulares en marcha, nos muestran un camino a seguir en el que la federación del esfuerzo, la solidaridad y la compartición de datos aseguren que nuestra posición de privilegio en digitalización sanitaria estimule el liderazgo en la investigación, la innovación y el emprendimiento digital en la salud. El Espacio Nacional de Datos de Salud podrá ofrece un valor diferencial a los partícipes. Proporcionará calidad y volumen de datos, soportará herramientas avanzadas de analítica de datos e IA intensivas en cómputo y podrá proveer seguridad en los procesos de intermediación de software para el tratamiento de datos seudonimizados con altos requerimientos.

Es necesario recordar un valor central para la Unión Europea: la garantía de los derechos fundamentales y el enfoque centrado en el ser humano. La Carta de derechos Digitales impulsada por el Gobierno de España propone sucesivamente el derecho de acceso a datos con fines de investigación científica, innovación y desarrollo, así como el derecho a la protección de la salud en el entorno digital. El Espacio Nacional de Datos de Salud está llamado a ser el instrumento indispensable para alcanzar una salud digital sostenible, inclusiva y al servicio del bien común, que a la vez impulse esta dimensión de la economía del dato, promoviendo la investigación y el emprendimiento en nuestro país.

18/04/2024

Impulso a la promoción de los datos abiertos a través del Proyecto de Ley de Movilidad Sostenible

Noticia

El Consejo de Ministros aprobó en febrero de este año el Proyecto de Ley (PL) de Movilidad Sostenible, una apuesta por un sistema de transporte digital e innovador en el que los datos abiertos de movilidad tendrán un papel fundamental.

La norma, además de regular soluciones innovadoras como el transporte a demanda, los coches compartidos o el uso temporal de vehículos, fomentará la promoción de los datos abiertos de administraciones, gestores de infraestructura y operadores públicos y privados. Todo ello, tal y como se puntualiza en el Capítulo III título V del Proyecto de Ley “reportará enormes beneficios a la ciudadanía, por ejemplo, para la nueva movilidad y su contribución al Pacto Verde Europeo”.

Este Proyecto de Ley está alineado con la Estrategia Europea de Datos, que tiene entre sus objetivos crear un mercado único de datos que garantice la competitividad global y la soberanía de los datos de Europa a través de la creación de espacios de datos europeos comunes en nueve sectores estratégicos. En concreto, se prevé la creación y desarrollo de un espacio común europeo de datos relativos a la movilidad para situar a Europa en la vanguardia del desarrollo de un sistema de transportes inteligente, incluidos los automóviles conectados y otros modos de transporte. En esta línea, la Comisión Europea presentó su Estrategia de movilidad sostenible e inteligente, que incluye una acción dedicada a la innovación, datos e inteligencia artificial para una movilidad más inteligente. Siguiendo la estela europea, España ha lanzado este Proyecto de Ley de Movilidad Sostenible.

En este post analizamos las ventajas que el uso de los datos abiertos puede ofrecer al sector, aquellas obligaciones que marca el PL y que afectarán a los datos, y los próximos pasos para constituir el Espacio de Datos Integrado de Movilidad.

Ventajas del uso de datos abiertos sobre movilidad sostenible

El Ministerio de Transporte y Movilidad Sostenible en el apartado web creado para la Ley, identifica algunos beneficios que el acceso y uso de los datos abiertos de transporte y movilidad pueden ofrecer tanto al entramado empresarial como a las administraciones públicas y el conjunto de la ciudadanía en general:

Favorecer el desarrollo de aplicaciones que permitan a los ciudadanos la adopción de decisiones sobre la planificación de sus viajes y durante el desarrollo de estos.
Mejorar las condiciones de prestación de los servicios y de la experiencia durante el viaje.
Incentivar la investigación, crear nuevos desarrollos y negocios a partir de los datos generados en el ecosistema del transporte y la movilidad.
Posibilitar que las administraciones públicas tengan un mayor conocimiento del sistema de transportes y movilidad para mejorar así la definición de las políticas públicas y la gestión del sistema.
Impulsar el uso de estos datos para otros fines de interés público que puedan surgir.

Ventajas del uso de datos abiertos sobre movilidad sostenible

Asegurar el acceso a datos abiertos de movilidad

Para hacer buen uso de estos datos y aprovechar así todas las ventajas que ofrecen, el Proyecto de Ley determina una estrategia que garantiza la disponibilidad de datos abiertos en el ámbito del transporte y la movilidad. Esta estrategia afecta a:

las empresas de transporte y los gestores de infraestructuras, que deben impulsar la digitalización y proporcionar parte importante de los datos, con unas características y funcionalidades específicas.
las administraciones y entidades públicas ya estaban obligados a garantizar la apertura de sus datos desde el diseño, así como su reutilización en base a la ya existe.

En resumen, se respetan las pautas de reutilización que ya define la Ley 37/2007 para el sector pública y además se recoge la necesidad de regular el acceso a esta información y el modo de utilización de estos datos por parte de terceros, es decir, empresas del sector.

Espacio de Datos Integrado de Movilidad

Acorde a la Estrategia Europea de Datos que mencionábamos al inicio del post, el PL determina la obligatoriedad de crear el Espacio de Datos Integrado de Movilidad (EDIM) bajo la dirección del Ministerio de Transportes y Movilidad Sostenible, en coordinación con la Secretaría de Estado de Digitalización e Inteligencia Artificial. En el EDIM compartirán sus datos las ya mencionadas empresas de transporte, los gestores de infraestructuras y las administraciones, algo que permitirá optimizar la toma de decisiones de todos los actores a la hora de planificar la ejecución de nuevas infraestructuras y la puesta en marcha de nuevos servicios.

El Proyecto de Ley define algunas características del Espacio de Datos Integrado de Movilidad como la estructura modular, que incluirá información de manera sistemática de distintas áreas de movilidad urbana, metropolitana e interurbana, tanto de personas como de mercancías.

En concreto, el EDIM, según el artículo 14, recogería datos “en soporte digital de forma gratuita, no discriminatoria y actualizada” sobre:

Oferta y demanda de los diferentes modos de transporte y movilidad, información sobre los servicios de transporte público y servicios de movilidad competencia de las administraciones
Situación financiera y costes de prestación de los servicios de todos los modos de transporte público, inversiones en infraestructuras de transporte, inventario de infraestructuras y terminales de transporte, condiciones y grado de accesibilidad.
Otros datos que se acuerden en la Conferencia Sectorial de Transportes.

En el se identifican ejemplos de este tipo de datos e información sobre la responsabilidad de su suministro, formato, frecuencia de actualización y otras características.

Tal y como refiere el PL, los datos y la información gestionada por el EDIM aportarán una visión integrada para analizar y facilitar la gestión de la movilidad, mejorando el diseño de soluciones sostenibles y eficientes, y la transparencia en el diseño de las políticas públicas de transportes y movilidad. Además, la Ley promoverá la creación de un sandbox o entorno de pruebas que sirva de incubadora para proyectos innovadores sobre movilidad. El resultado de las pruebas permitirá tanto al promotor como a la administración adquirir un aprendizaje observando el mercado en un entorno controlado.

Punto de Acceso Nacional de Transporte Bimodal

Por otro lado, el Proyecto de Ley también contempla la creación de un Punto de Acceso Nacional de Transporte Bimodal que recogerá la información comunicada al Ministerio de Transportes y Movilidad Sostenible en el marco de la acción prioritaria “Suministro de servicios de información sobre desplazamientos multimodales en toda la Unión” de la Directiva 2010/40/UE que hace referencia al transporte de mercancías y/o personas en más un medio de transporte.

Esta información será de acceso libre y gratuito y servirá también para nutrir al EDIM en el área relativa a la caracterización de transporte y movilidad de personas, así como al Catálogo nacional de Información Pública mantenido por la Administración General del Estado.

El Proyecto de Ley define que la prestación de servicios a la ciudadanía en los que se utilicen datos sobre transporte y movilidad del Punto de Acceso Nacional de Transporte Multimodal deberá hacerse de forma justa, neutra, imparcial, no discriminatoria y transparente. Y añade que el Ministerio de Transportes y Movilidad Sostenible propondrá unas reglas de uso de dichos datos en un plazo de 12 meses tras la entrada en vigor de esta Ley.

El Proyecto de Ley de Movilidad Sostenible está actualmente en trámite parlamentario, ya que se ha remitido a las Cortes para su tramitación urgente y aprobación en 2024.

15/04/2024

Convocatoria de ayudas para la creación de demostradores y casos de uso de espacios de datos

Noticia

Entre el 2 de abril y el 16 de mayo se podrán presentar solicitudes en la sede electrónica del Ministerio para la Transformación Digital y de la Función Pública, para concurrir a la convocatoria de ayudas para la transformación digital de sectores productivos estratégicos. La Orden TDF/1461/2023, del 29 de diciembre, modificada por la Orden TDF/294/2024, regula ayudas por un total de 150 millones de euros para la creación de demostradores y casos de uso, como parte de una iniciativa más general de espacios de datos sectoriales, promovida por la Secretaría de Estado de Digitalización e Inteligencia Artificial y enmarcada en el Plan de Recuperación, Transformación y Resiliencia (PRTR). El objetivo es financiar el desarrollo de espacios de datos y el fomento de la innovación disruptiva en sectores estratégicos de la economía, acorde con las líneas estratégicas recogidas en la Agenda España Digital 2026.

Líneas, sectores y beneficiarios

La convocatoria actual incluye líneas de financiación para proyectos de desarrollo experimental en dos áreas de actuación complementarias: la creación de centros demostradores (desarrollo de plataformas tecnológicas de espacios de datos); y el fomento de casos de uso concretos de dichos espacios. Esta convocatoria se dirige a todos los sectores salvo al de turismo ya que este cuenta con una convocatoria propia. Podrán obtener la condición de beneficiarios las entidades únicas con personalidad jurídica propia, domicilio fiscal en la Unión Europea, y establecimiento o sucursal ubicado en España. En el caso de la línea destinada a centros demostradores deberán además tener carácter asociativo o representativo de las cadenas de valor de los sectores productivos en ámbitos territoriales, o con dominios científicos o tecnológicos.

Infografías-resumen

Las siguientes infografías muestra la información clave sobre esta convocatoria de ayudas:

¿Quieres más información?

Acceso al portal de ayudas de la convocatoria desde en el siguiente enlace. En el portal encontrarás las bases reguladoras y la convocatoria, un resumen de su contenido, documentación y material divulgativo con presentaciones y vídeos, así como una completa lista de preguntas y respuestas. En el buzón de correo espaciosdedatos@digital.gob.es obtendrás ayuda sobre la convocatoria y el procedimiento de tramitación. Desde este portal se accede a la sede electrónica para poder hacer la solicitud
Guía rápida para la convocatoria de ayudas en pdf + Infografías descargables (sobre el Programa de Datos Sectoriales y la Información Técnica)
Enlace a otros documentos de interés:
- Plan de actuación para el despliegue de espacios de datos de la Oficina del Dato.
- Cómo evaluar y diseñar ‘casos de uso’ para espacios de datos: guías para facilitar el camino
Información adicional sobre el concepto de espacio de datos

14/04/2024

El reto de impulsar la Economía del Dato desplegando la diplomacia digital de la UE a nivel global

Blog

La creciente importancia que día a día adquieren los datos supera ya los ámbitos económicos y sociales a nivel de Estados, para alcanzar una dimensión multinacional que eleva a escala global los retos, oportunidades, amenazas e incertidumbres que rodean el desarrollo de la Economía del Dato. En el caso de la Unión Europea, la cuestión ha estado en los últimos años en la agenda institucional, como demuestran la profusión de regulación específica y transversal ya adoptada o que está en curso; o el impulso de iniciativas multilaterales tanto en el marco de la Unión como más allá de sus fronteras. En julio de 2022, esa dimensión política global dio un salto cualitativo de envergadura con la adopción, por parte del Consejo de la UE, de lo que denominó ‘Conclusiones sobre la diplomacia digital de la UE’ cuyo objetivo era el de establecer acciones prioritarias para reforzar la acción de la UE en los asuntos digitales internacionales.

Dichas conclusiones ––actualizadas en julio de 2023–– suponen, de algún modo, un hito al dar carta de naturaleza al concepto de “diplomacia digital”. Reconocían, por un lado, la necesidad de una política y una acción de la UE “más firmes, estratégicas, coherentes y eficaces” en asuntos digitales; y detallaban, por otro lado, las acciones prioritarias para dar respuesta a aquella necesidad.

Tres vías para relacionarse con terceros países

Bajo el título de ‘La Estrategia europea del dato desde una perspectiva multidimensional’ la red de think tanks PromethEUs1 publicó en junio de 2023 un análisis que desgrana dicha Estrategia desde dos enfoques principales: los aspectos políticos y regulatorios, y los aspectos geopolíticos. El análisis de este último fue elaborado por Raquel Jorge Ricart, del Real Instituto Elcano, y en el que se explica que la UE ha estado abordando el modo en que sus bienes, servicios, activos y datos personales se relacionan con terceros países a través de varias vías:

La vía regulatoria, que, como afirman, “ha sido seguida de cerca por la mayor parte de los stakeholders”.
A través de las iniciativas multilaterales, las "coaliciones de voluntarios" y las reuniones internacionales.
“A través de la importancia de la diplomacia digital, como un área de la política para institucionalizar la geopolítica de los datos, junto con otros desafíos tecnológicos”. En este sentido, el vocablo ‘diplomacia digital, se utiliza para agrupar en una sola ‘caja’ todas las iniciativas que, de forma independiente, se habrían llevado a cabo hasta la fecha.

A continuación, se amplía la información sobre cada una de estas vías.

Vía regulatoria

En relación con el enfoque normativo, el principal reto para que la UE despliegue la herramienta reguladora como baza geopolítica reside, según los investigadores de Elcano, en conseguir influir en otros países para que sigan el mismo planteamiento. “No se trata sólo de imponer normas a los que ya interactúan con la UE, sino de animar a otros a hacer lo mismo con las suyas”, aseguran. Igualmente, añaden, “otro reto para la instrumentalización geopolítica de estas regulaciones es comprender que las estrategias geopolíticas deben variar en función del país y del tipo de empresa tecnológica”, ya que pueden tener enfoques geopolíticos diferentes.

Pero, según concluyen los autores, la regulación, aunque es importante, no es el único enfoque sobre el que la UE debería construir su geopolítica de los datos. Los otros dos enfoques son tan importantes como estratégicos.

Iniciativas multilaterales

Respecto a los foros de interlocución internacionales, se destacan:

Los mantenidos a través de organizaciones y espacios institucionalizados y veteranos, como por ejemplo G7, ONU, OCDE, etc.
Las coaliciones de más reciente creación para aspectos concretos, como Quadrilateral Security Dialogue (que integra a EE UU, Australia, India y Japón), Digital Economy Partnership Agreement (con Chile, Nueva Zelanda y Singapur) o la propuesta Data Free Flow with Trust DFFT-2019 (impulsada por Japón).

Diplomacia digital

En cuanto a la tercera de las aproximaciones ––relativa al impulso de la diplomacia digital–– los analistas de Elcano resaltan como positivas las diversas iniciativas regionales de partenariado tecnológico que la UE ha desplegado en los últimos años, y resalta que ya en 2019 “la UE empezó a ver la tecnología a través de la lente de la ética” y como un asunto político y geopolítico. En este sentido, resaltan que las Conclusiones del Consejo Europeo sobre diplomacia digital (julio 2022) son el hito de partida “con el cual la UE institucionalizó todos los aspectos relacionados con la agenda externa en terceros países y política digital, como un aspecto singularizado dentro de la política exterior de la UE”. Y, por ello, el objetivo de la diplomacia digital desplegada por la UE a través de su Servicio de Acción Exterior no es otro que el de “asegurar el papel global de la Unión en el mundo digital, proteger sus intereses estratégicos y promover su marco regulador dinámico y centrado en el ser humano para una transformación digital integradora”.

Este último aspecto es, por otro lado, un factor crucial, como revelan las acciones prioritarias establecidas en la reunión inicial del Consejo Europeo en julio de 2022, revisadas en julio de 2023. La UE, afirma el Consejo, debe promover una transformación digital basada en los derechos humanos y centrada en las personas, algo que se traduce, por ejemplo, en:

Prácticas de diligencia debida y evaluaciones de impacto en materia de derechos humanos “periódicas y exhaustivas”.
Prestar especial atención a la protección de los derechos de personas vulnerables o marginadas.
Reducir la brecha digital de género.
Promocionar una Internet abierta, libre, neutral, mundial, interoperable, fiable y segura.

La Carta de Derechos Digitales de España, presentada en julio de 2021, y la Declaración Europea sobre los Derechos y Principios Digitales para la Década Digital, son un claro ejemplo de la vocación con la que la Unión Europea quiere dotarse de un referente interno o doméstico, a la vez que establece un marco compartido para su acción en el campo de la diplomacia digital.

Los retos de la UE

En cualquier caso, del análisis de las distintas acciones establecidas por la UE en la materia, los investigadores del Instituto Elcano avanzan a la identificación de tres grandes retos:

Cómo abordar el rol de los Estados miembro en la geopolítica de los datos de la UE, toda vez que la mayoría de las disposiciones de política exterior y de seguridad dependen de la unanimidad de los 27 países, y ello “puede dificultar la forma en que sean aprobadas ciertas actividades relacionadas con la gobernanza de datos”.
Cómo asociarse con los países en desarrollo “o, particularmente, con los no alineados”, concepto que podría estar teniendo cierta revitalización y sobre el que, aseguran, “debería ser un área en la que profundizar”. La iniciativa Global Gateway de la UE estaría en este ámbito y, de hecho, es una de las que la UE quiere impulsar ampliando también la participación del sector privado.
Cómo “prestar atención a ciertas tecnologías aún poco desarrolladas, no demasiado comercializadas o no implantadas, pero que podrían generar una gran competencia entre países”.

En definitiva, el desarrollo de la diplomacia digital es ya un vector crucial en el desarrollo de la Economía del Dato y, de hecho, el Consejo de la UE volverá a tratar esta cuestión antes del verano de 2024, cuando se cumplirán dos años de la emisión de las Conclusiones y uno desde la primera revisión. De hecho, hasta entonces, el Consejo “invita al Alto Representante, a la Comisión y a los Estados miembros a que evalúen los avances periódicamente y sigan informando con regularidad al Consejo sobre la aplicación de la diplomacia digital”. Y es que, según subrayan, para llevar su diplomacia a un nivel superior, “la UE debe actuar con un planteamiento de Equipo Europa ––es decir, las instituciones de la UE y los Estados miembros de la UE, junto con otros actores asociados––, protegiendo conjuntamente sus intereses estratégicos y promoviendo su enfoque de la transición digital centrado en las personas”.

Seguridad económica

La vinculación señalada entre diplomacia digital, intereses estratégicos de la Unión, y Economía del Dato, está en el trasfondo de la Estrategia Europea de Seguridad Económica una comunicación conjunta que adoptaron la Comisión y el alto representante el 20 de junio de 2023. Dicha Estrategia se basa en un enfoque fundado en tres pilares:

La promoción de la base económica y la competitividad de la UE
La protección frente a los riesgos
La asociación con el mayor número posible de países para abordar preocupaciones e intereses comunes.

Fomentar (la competitividad); preservar (la seguridad económica); y cooperar (entre sí y con otros), son los vectores que la Estrategia define para hacer frente a los cuatro riesgos que señala. A saber:

Riesgos relativos a la resiliencia de las cadenas de suministro.
Riesgos para la seguridad física y cibernética de las infraestructuras críticas.
Riesgos relacionados con la seguridad tecnológica y las filtraciones de tecnología.
Riesgos de que se utilicen las dependencias económicas como arma o de coerción económica.

Como primera consecuencia de la Estrategia, el 3 de octubre de 2023 la Comisión adoptó una Recomendación sobre ámbitos tecnológicos críticos para la seguridad económica de la UE, en la que señala diez áreas tecnológicas críticas, cuatro de las cuales son señaladas como “altamente probables”: semiconductores avanzados, inteligencia artificial, tecnologías cuánticas y biotecnologías.

Con el fin de hacer inmediatas evaluaciones de riesgos sobre esas áreas, la Comisión desplegará un intenso diálogo con los Estados miembro con resultados previstos para la primavera de 2024. Un diálogo en el que la Economía del dato, con un peso cada vez más relevante en los ecosistemas productivos europeos, estará omnipresente. Y España, como hub internacional y destino seguro para los flujos de información y almacenamiento de datos, deberá prestar especial atención a aspectos como garantizar la correcta integración de las diferentes infraestructuras de datos; garantizar la interoperabilidad entre los diferentes actores; y reforzar su ciberseguridad, especialmente ante la vulnerabilidad de la cadena de suministro y la necesidad de garantizar la competencia efectiva y la diversidad de proveedores.

1 PromethEUs es una red de think tanks compuesto por el Institute of Public Policy (Portugal); el Real Instituto Elcano (España); el Istituto per la Competitività I-Com (Italia); y la Foundation for Economic & Industrial Research - IOBE (Grecia).

21/02/2024