La Estrategia europea de datos persigue la creación de un mercado único donde los datos fluyan entre países y sectores. En este sentido, el sector público atesora gran cantidad de datos de valor para la ciudadanía. Muchos de ellos se ofrecen en abierto a través de distintas plataformas de datos abiertos. Sin embargo, existen datos sobre los que aplican derechos de terceros que limitan su apertura. Estos datos también pueden ser de gran interés para fines de investigación científica.
La existencia de numerosos registros administrativos y bases de datos públicas, así como la evolución de las tecnologías que permiten su manejo, han propiciado la disponibilidad de grandes cantidades de información en todos los ámbitos susceptible de ser utilizada en beneficio de la sociedad, aumentando la demanda de su acceso por parte de los investigadores.
En este sentido, el pasado 3 de junio, se publicó en el Boletín Oficial de la Unión Europea la Ley de Gobernanza de datos, que busca incentivar el intercambio de datos en la UE, impulsando la llamada Economía del Dato. Entre otras cuestiones, la nueva ley contempla la necesidad de desarrollar mecanismos que faciliten la reutilización de este tipo de datos, sobre los que aplican derechos de terceros, con todas las garantías legales.
Uno de estos mecanismos son las llamadas Safe Reading Rooms o Salas Seguras, mencionadas durante la evaluación de impacto previa a la aprobación de la Ley.
¿Qué son las Salas Seguras?
Las Salas Seguras se conciben como punto de contacto único de apoyo a los investigadores para la reutilización de determinadas categorías de datos protegidas en poder del sector público. Permiten un tratamiento controlado de los datos, preservando la privacidad u otros derechos vinculados a los datos.
En Europa existen distintas iniciativas de este tipo como son el CASD (Centre d’Accès Sécurisé aux Données) y el Health Data Hub de Francia o el Laboratorio de investigación de Microdatos de Portugal. También en España contamos con varias organizaciones que ya han puesto a disposición de los investigadores Safe Reading Rooms. Veamos 3 ejemplos.
3 ejemplos de Salas Seguras para compartir datos en España
Laboratorio de datos del Banco de España (BELab)
El Banco de España facilita el acceso a microdatos de alta calidad, garantizado su confidencialidad a través de Salas Seguras. Algunos de los datos que ofrece son los microdatos de empresas individuales de entidades Fintech o de la Encuesta de Competencias Financieras.
Los usuarios pueden acceder a la información tanto in situ (en Madrid y Barcelona) como en remoto, según el grado de sensibilidad de la información objeto de estudio. Los puestos del laboratorio in situ, que se encuentran aislados sin acceso a internet, cuentan con Stata, R, Python y Octave para el tratamiento de los datos.
Para acceder, los investigadores deben enviar su currículum vitae y un formulario de solicitud explicando el propósito de la investigación. Esta solicitud es valorada por un Comité de Evaluación Técnica de Investigación. En caso de aceptarse, se fijan una serie de reglas y restricciones (horario, acceso sin dispositivo móvil, etc.).
Para garantizar el buen uso de los microdatos, BELab elabora y suministra la documentación metodológica. Además, técnicos expertos revisan los trabajos para avalar el cumplimiento de las correspondientes cláusulas de confidencialidad.
Una vez finalizado el trabajo, el investigador está obligado a mencionar la fuente de los datos y enviar una copia del estudio realizado. También se compromete a no realizar ninguna tentativa de reidentificación de las personas físicas o jurídicas ligadas a los datos objeto de estudio.
Salas de investigación de la Seguridad Social
Los investigadores y académicos interesados en bases de datos y microdatos de la Seguridad Social tienen a su disposición tres Salas Seguras en Madrid, Barcelona y Albacete, a las que solo puede acceder personal autorizado, sin dispositivos electrónicos. Estas salas cuentan con herramientas tales como SAS, STATA, R, Python y Microsoft Office. También se permite el acceso remoto a través de dispositivos seguros (llamados “dispositivos bastionados”) que se distribuyen entre los investigadores.
Algunos de los datos a los que se puede acceder son las Muestra Continua de Vidas Laborales, la Afiliación mensual o los ERTEs por COVID-19, entre otros.
Al igual que en el caso del Banco de España, el interesado tendrá que enviar una solicitud a través del correo electrónico solicitudes.sala-investigacion@seg-social.es. Un Comité de Expertos evaluará la solicitud. En caso de que se apruebe, se prepararán los datos necesarios, cuyo acceso se permitirá a través de una carpeta personal privada.
El Comité de Expertos también evaluará el resultado de la investigación, para garantizar el cumplimiento normativo. Si todo está correcto, el estudio se publicará en el Portal del Dato de la Seguridad Social.
Instituto Nacional de Estadística (INE)
El Instituto Nacional de Estadística es uno de los principales publicadores de datos abiertos de nuestro país, pero también atesora datos sensibles de valor que deben ser tratados con las correspondientes medidas de confidencialidad. Para el acceso a esta finformación con fines de investigación científica se sigue el protocolo previsto en el Reglamento (Ce) No 223/2009 relativo a la estadística europea y en el Código de Buenas Prácticas de las Estadísticas Europeas.
Este servicio está dirigido a investigadores que trabajen o colaboren en entidades de investigación reconocidas. El proceso es similar a los casos anteriores. Hay que enviar una solicitud que será evaluada por el INE. Esta solicitud debe de ser lo más detallada posible, indicando las variables a consultar, el nivel geográfico-temporal y la justificación de la necesidad de esta información. Algunos de estos datos podrán incurrir en costes, según lo fijado en el Boletín Oficial del Estado.
Estos tres ejemplos son exponentes de la importancia de las Salas Seguras para permitir la reutilización de datos de valor garantizando la confidencialidad y privacidad de la información. Gracias a ello se pueden realizar investigaciones más profundas, que pueden generar un bien económico y social. Un uso intensivo de datos permite impulsar la innovación en la actuación del sector público, facilitando el contraste de ideas, promoviendo la creatividad y el máximo aprovechamiento de los recursos en el marco general de una gestión pública moderna, participativa, abierta y útil para solucionar o mejorar los problemas y retos sociales.
Contenido elaborado por el equipo de datos.gob.es.
EL Instituto Nacional de Estadística, INE, es el órgano central de la estadística oficial en España y el principal productor y difusor de estadísticas para fines estatales. Se encarga, así pues, de la realización de operaciones estadísticas de gran envergadura como: los censos demográficos y económicos, las cuentas nacionales, las estadísticas demográficas y sociales, los indicadores económicos y sociales, la coordinación y mantenimiento de los directorios de empresas, la formación del Censo Electoral...
Dado el volumen de datos con los que opera para la realización de sus funciones encomendadas, el INE es, sin duda alguna, una fuente principal de datos públicos reutilizables, y como tal, no podía faltar en datos.gob.es.
Desde ahora, muchos de las colecciones de datos, estadísticos principalmente, se encuentran catalogados como datos públicos reutilizables en el Catálogo de datos de datos.gob.es. Entre ellos, se encuentra colecciones de datos sobre demografía y economía principalmente, además de datos sobre la industria, ciencia y tecnología, empleo, entre otros.
Los registros de estos datos reutilizables se reciben desde el INE en el Catálogo de datos de datos.gob.es a través de la federación de datos, lo que asegura la integridad de los mismos (o de dichos datos). Con la federación de datos públicos se sincroniza de forma automatizada los registros de datos reutilizables de catálogos del sector público en el Catálogo de datos, de este modo se favorece el acceso a los datos públicos reutilizables a infomediarios y ciudadanos.
La Asociación Multisectorial de la Información ASEDIE organizó el 24 de junio de 2010 en Madrid el segundo encuentro entre Administraciones Públicas y empresas infomedarias en torno a la reutilización de la información del sector público.
Estos encuentros organizados por ASEDIE tienen el objetivo de ofrecer un foro de diálogo entre Administraciones y empresas, en el que las primeras puedan mostrar la información que tienen disponible para su reutilización y las segundas puedan conocerla directamente, realizar preguntas, sugerencias y aportaciones al respecto.
Este segundo encuentro, que tuvo como moderador al Vicepresidente de ASEDIE, se celebró en la Oficina Española de Patentes y Marcas (OEPM), y contó con 25 asistentes del sector privado y con las ponencias de la OPM, el Instituto Nacional de Estadística (INE), el Ministerio de Medio Ambiente y Medio Rural y Marino, y el Ministerio de Vivienda.
ASEDIE aglutina a empresas cuyo objeto es el uso, reutilización y distribución de la información, conformando la Industria de la Información y contribuyendo con ello a dar una mayor seguridad al tráfico mercantil global mediante la aplicación de métodos que favorezcan la fiabilidad y transparencia de las transacciones comerciales en el ámbito empresarial.
La OEPM describió los distintos tipos de información con los que trabaja, como las patentes, las marcas comerciales, los modelos de utilidad o los diseños industriales, y cómo se estructura el buscador de su portal web. Se destacaron asimismo los servicios de información gratuita de los que dispone (búsqueda de marcas, patentes, invenciones y diseños, situación de expedientes, boletines informativos...) y la oficina virtual desde la que se pueden realizar numerosos trámites.
A continuación, el INE estableció en su intervención que uno de sus objetivos principales es “aumentar el conocimiento y el uso de la información estadística por todo tipo de usuarios”. Es por ello que su política de difusión de la información se articula en torno a este fin. Actualmente el INE se encuentra trabajando en el desarrollo de distintos proyectos para facilitar el uso de su información, mediante el desarrollo de feeds y gadgets, y trabajos de mejora en lo referente a la presentación y el acceso a la información, la importancia de los metadatos y la posibilidad de incluir nuevos formatos.
En la presentación del Ministerio de Medio Ambiente y Medio Rural y Marino se destacó la cuantiosa información con la que cuenta el Ministerio, que atesora, ademá, una larga tradición sobre recopilación y difusión de su información.
Prueba de ello es la Plataforma de Conocimiento, herramienta puesta en marcha para “servir conocimiento a los sectores agroalimentarios y pesquero y a toda la sociedad”. De la misma manera, existen otros contenidos sujetos a reutilización, como pueden ser las publicaciones, bases de datos ambientales, los contenidos audiovisuales de la Mediateca MARM, la información estadística y cartografía digital de sus sistemas de información geográfica, así como archivos documentales de gran valor histórico.
Finalmente, el Ministerio de Vivienda presentó los datos con los que trabaja (estadísticas, información geográfica urbana, información sobre ayudas y subvenciones, informes, estudios...) y su categorización en función del grado de reutilización. Se señaló su política de reutilización en la que se distingue entre la información no reutilizable por contener datos de carácter personal, la información reutilizable gratuita (noticias, notas de prensa, estadísticas, guías, estudios e informes, imágenes y folletos), y la que tiene una contraprestación económica, como son las publicaciones.
El Ministerio destacó, además la evolución del Atlas Digital, que ofrece información sobre la ocupación del suelo, su población, la tipología edificatoria, el planteamiento urbanístico y demás datos relacionados. Esta aplicación da lugar a la elaboración de informes predefinidos, y permite la creación de mapas personalizados.
Por último, se presentó el Portal del Suelo y Políticas Urbanas, que pretende ofrecer información sobre la realidad urbana en España desde diferentes ópticas, no solo como base para la investigación y el conocimiento urbano sino también como una herramienta de utilidad para la toma de decisiones sobre políticas urbanas y territoriales. Este portal sigue la normativa INSPIRE, y su contenido será ampliado próximamente con indicadores de sostenibilidad.
Desde el Proyecto Aporta queremos destacar la gran calidad y valor del diálogo y su utilidad para promover la cooperación público-privada, y esperamos con gran interés la celebración del tercer encuentro que tendrá lugar durante el próximo mes de septiembre.