El próximo 2 de marzo, tendrá lugar la presentación del proyecto ‘Datos abiertos y mujeres’, impulsado por el Observatorio Valenciano de Datos Abiertos y Transparencia, fruto de la colaboración entre la Conselleria de Participació, Transparencia, Cooperación y Calidad Democrática de la Generalitat y la Universidad Politécnica de València.
El evento que ha sido organizado por la profesora de la Universidad de Sevilla, Lorena R. Romero-Domínguez y la técnica audiovisual de la Universidad Politécnica de Valencia, Lucía García Robledo, con el apoyo de Antonia Ferrer Sapena, directora del Observatorio, y Eloína Coll Aliaga, directora de la Càtedra de Governança de la Ciutat de València, se llevará a cabo en el Salón de actos de Rectorado en la Universitat Politècnica de València.
Desde un inicio, el objetivo de este proyecto ha sido poner el foco en el rol que distintas mujeres del sector profesional desempeñan en el contexto de los datos y, en especial, de los datos abiertos. Así, mediante una serie de entrevistas, las profesionales seleccionadas comparten el transcurso de su trayectoria, explican cómo han crecido profesionalmente en el mundo de los datos y, también, cómo han abordado algunos de los proyectos más significativos de sus carreras a este respecto.
Las entrevistas, que fueron grabadas meses atrás, están disponibles para su visionado desde el canal de Youtube del Observatorio, donde podemos ver cómo cada una de las profesionales interpeladas reflexiona sobre los retos más importantes que afronta el sector, prestando especial atención a la inclusión de la perspectiva de género en los datos.
Presentación del proyecto y mesa redonda con algunas de las protagonistas
En la sesión de presentación del próximo 2 de marzo, se contará con Andrés Gomis, Director General de Transparencia, Atención a la Ciudadanía y Buen Gobierno de la Conselleria de Participación, Transparencia, Cooperación y Calidad Democrática de la Generalitat Valenciana y Elisa Valía, Tenienta Alcalde Participación, Derechos e Innovación de la Democracia. Concejala de Transparéncia y Gobierno Abierto del Ajuntament de València.
Además, también tendrá lugar una mesa de redonda sobre los datos con perspectiva de género que estará moderada por Carmen Montalbá, profesora de la Universitat de València, y en la que participarán las siguientes profesionales cuyas entrevistas forman parte del proyecto:
- Lorena R. Romero, profesora de la Universidad de Sevilla y autora del proyecto.
- Ana Tudela, Cofundadora de Datadista y miembro de la Oxford Climate Journalism Network.
- Silvia Rueda, Directora Territorial en la Conselleria de Innovación, Universidades, Ciencia y Sociedad Digital.
Junto a las ponentes anteriores que estarán presentes en la mesa redonda, el proyecto ‘Datos abiertos y mujeres’ recoge también las entrevistas de Lourdes Muñoz Santamaría, Fundadora y Directora de la Iniciativa Barcelona Open Data; Laura Castro, Diseñadora de visualización de datos en Affective Advisory; Zynnia del Villar, Directora de Investigación de Ciencias de Datos en Data-Pop Alliance; Thais Ruiz de Alda, Fundadora y CEO de Digital Fems. Tech Advisor&Consultant Digital Business; Sonia Castro-García Muñoz, Coordinadora de datos.gob.es (Red.es); Ana Tudela, Cofundadora de Datadista y Eva Méndez Rodríguez, Profesora Titular y Vicerrectora Adjunta de Política Científica de la Universidad Carlos III.
En definitiva, ‘Datos abiertos y mujeres’ es un proyecto que surge de la necesidad de incentivar un debate sobre la incorporación de la perspectiva de género a los datos, una práctica prioritaria para establecer políticas públicas que sean eficientes para combatir las desigualdades que se plantean entre hombres y mujeres.
Precisamente por esta razón, en las entrevistas, se ofrece una gran diversidad de visiones sobre el papel de los datos en los distintos campos profesionales, entre los que destacan, el periodismo de datos, el ámbito científico-tecnológico, el administrativo o las organizaciones internacionales, entre otros.
Por último, las personas interesadas en asistir presencialmente a la presentación del proyecto deberán inscribirse previamente en este formulario y, una vez confirmada su asistencia, acudir al Salón de actos de Rectorado UPV, en el edificio 3ª.
La Estrategia europea de datos persigue la creación de un mercado único donde los datos fluyan entre países y sectores. En este sentido, el sector público atesora gran cantidad de datos de valor para la ciudadanía. Muchos de ellos se ofrecen en abierto a través de distintas plataformas de datos abiertos. Sin embargo, existen datos sobre los que aplican derechos de terceros que limitan su apertura. Estos datos también pueden ser de gran interés para fines de investigación científica.
La existencia de numerosos registros administrativos y bases de datos públicas, así como la evolución de las tecnologías que permiten su manejo, han propiciado la disponibilidad de grandes cantidades de información en todos los ámbitos susceptible de ser utilizada en beneficio de la sociedad, aumentando la demanda de su acceso por parte de los investigadores.
En este sentido, el pasado 3 de junio, se publicó en el Boletín Oficial de la Unión Europea la Ley de Gobernanza de datos, que busca incentivar el intercambio de datos en la UE, impulsando la llamada Economía del Dato. Entre otras cuestiones, la nueva ley contempla la necesidad de desarrollar mecanismos que faciliten la reutilización de este tipo de datos, sobre los que aplican derechos de terceros, con todas las garantías legales.
Uno de estos mecanismos son las llamadas Safe Reading Rooms o Salas Seguras, mencionadas durante la evaluación de impacto previa a la aprobación de la Ley.
¿Qué son las Salas Seguras?
Las Salas Seguras se conciben como punto de contacto único de apoyo a los investigadores para la reutilización de determinadas categorías de datos protegidas en poder del sector público. Permiten un tratamiento controlado de los datos, preservando la privacidad u otros derechos vinculados a los datos.
En Europa existen distintas iniciativas de este tipo como son el CASD (Centre d’Accès Sécurisé aux Données) y el Health Data Hub de Francia o el Laboratorio de investigación de Microdatos de Portugal. También en España contamos con varias organizaciones que ya han puesto a disposición de los investigadores Safe Reading Rooms. Veamos 3 ejemplos.
3 ejemplos de Salas Seguras para compartir datos en España
Laboratorio de datos del Banco de España (BELab)
El Banco de España facilita el acceso a microdatos de alta calidad, garantizado su confidencialidad a través de Salas Seguras. Algunos de los datos que ofrece son los microdatos de empresas individuales de entidades Fintech o de la Encuesta de Competencias Financieras.
Los usuarios pueden acceder a la información tanto in situ (en Madrid y Barcelona) como en remoto, según el grado de sensibilidad de la información objeto de estudio. Los puestos del laboratorio in situ, que se encuentran aislados sin acceso a internet, cuentan con Stata, R, Python y Octave para el tratamiento de los datos.
Para acceder, los investigadores deben enviar su currículum vitae y un formulario de solicitud explicando el propósito de la investigación. Esta solicitud es valorada por un Comité de Evaluación Técnica de Investigación. En caso de aceptarse, se fijan una serie de reglas y restricciones (horario, acceso sin dispositivo móvil, etc.).
Para garantizar el buen uso de los microdatos, BELab elabora y suministra la documentación metodológica. Además, técnicos expertos revisan los trabajos para avalar el cumplimiento de las correspondientes cláusulas de confidencialidad.
Una vez finalizado el trabajo, el investigador está obligado a mencionar la fuente de los datos y enviar una copia del estudio realizado. También se compromete a no realizar ninguna tentativa de reidentificación de las personas físicas o jurídicas ligadas a los datos objeto de estudio.
Salas de investigación de la Seguridad Social
Los investigadores y académicos interesados en bases de datos y microdatos de la Seguridad Social tienen a su disposición tres Salas Seguras en Madrid, Barcelona y Albacete, a las que solo puede acceder personal autorizado, sin dispositivos electrónicos. Estas salas cuentan con herramientas tales como SAS, STATA, R, Python y Microsoft Office. También se permite el acceso remoto a través de dispositivos seguros (llamados “dispositivos bastionados”) que se distribuyen entre los investigadores.
Algunos de los datos a los que se puede acceder son las Muestra Continua de Vidas Laborales, la Afiliación mensual o los ERTEs por COVID-19, entre otros.
Al igual que en el caso del Banco de España, el interesado tendrá que enviar una solicitud a través del correo electrónico solicitudes.sala-investigacion@seg-social.es. Un Comité de Expertos evaluará la solicitud. En caso de que se apruebe, se prepararán los datos necesarios, cuyo acceso se permitirá a través de una carpeta personal privada.
El Comité de Expertos también evaluará el resultado de la investigación, para garantizar el cumplimiento normativo. Si todo está correcto, el estudio se publicará en el Portal del Dato de la Seguridad Social.
Instituto Nacional de Estadística (INE)
El Instituto Nacional de Estadística es uno de los principales publicadores de datos abiertos de nuestro país, pero también atesora datos sensibles de valor que deben ser tratados con las correspondientes medidas de confidencialidad. Para el acceso a esta finformación con fines de investigación científica se sigue el protocolo previsto en el Reglamento (Ce) No 223/2009 relativo a la estadística europea y en el Código de Buenas Prácticas de las Estadísticas Europeas.
Este servicio está dirigido a investigadores que trabajen o colaboren en entidades de investigación reconocidas. El proceso es similar a los casos anteriores. Hay que enviar una solicitud que será evaluada por el INE. Esta solicitud debe de ser lo más detallada posible, indicando las variables a consultar, el nivel geográfico-temporal y la justificación de la necesidad de esta información. Algunos de estos datos podrán incurrir en costes, según lo fijado en el Boletín Oficial del Estado.
Estos tres ejemplos son exponentes de la importancia de las Salas Seguras para permitir la reutilización de datos de valor garantizando la confidencialidad y privacidad de la información. Gracias a ello se pueden realizar investigaciones más profundas, que pueden generar un bien económico y social. Un uso intensivo de datos permite impulsar la innovación en la actuación del sector público, facilitando el contraste de ideas, promoviendo la creatividad y el máximo aprovechamiento de los recursos en el marco general de una gestión pública moderna, participativa, abierta y útil para solucionar o mejorar los problemas y retos sociales.
Contenido elaborado por el equipo de datos.gob.es.
BiodivERsA es una red de organizaciones enfocada en la investigación sobre la biodiversidad y los ecosistemas en los países y territorios europeos, para impulsar su conservación y gestión sostenible. Entre otras acciones, esta red ha publicado una guía sobre gestión de datos, datos abiertos y elaboración de planes de gestión de los mismos en el marco de la investigación científica.
El documento se ha desarrollado en el contexto de Horizon 2020, con el objetivo de orientar a los equipos de proyectos financiados mediante convocatorias conjuntas de investigación transnacionales en la redacción y desarrollo de su Plan de Gestión de Datos, con un enfoque centrado en hacer que sus datos y publicaciones sean lo más abiertos posibles.
El informe comienza con una introducción sobre la importancia de los datos científicos y su gestión, los principios de ciencia abierta, los datos abiertos y los principios FAIR. A continuación, analiza los conceptos y necesidades de gestión de datos en el contexto de este tipo de proyectos financiados a nivel internacional, y finaliza resaltando una serie de herramientas y recursos de interés.
La importancia de los datos científicos y su gestión
Organizar y lograr que los datos sean accesibles es algo que cada vez adquiere mayor relevancia en el mundo de la ciencia, con el objetivo de mejorar la trazabilidad y fomentar el intercambio de datos. De esta forma se mejora la transparencia de los estudios, pero también se impulsa la reutilización de los datos en nuevas investigaciones que generen conocimiento en beneficio de la sociedad.
La guía hace referencia a una encuesta realizada por CrowdFlower, donde se recoge que, lejos de lo que se puede imaginar, los científicos de datos no invierten la mayor parte de su tiempo en la construcción de algoritmos, la exploración de datos o la realización de análisis predictivos. Por el contrario, la realidad refleja que la mayor parte de su tiempo está destinado a la limpieza y organización de los datos. Por tanto, una mejora en este aspecto supondría un gran avance en eficiencia, optimización de recursos y reducción de costes.
Los autores de la guía destacan que la ciencia requiere hoy en día un acceso abierto más sistemático a los datos científicos y, para ello, se paran a analizar conceptos como el data sharing, el open access o los principios FAIR que deben cumplir los datos científicos para poder ser compartidos con todo su potencial.
Claves y beneficios de desarrollar un Data Management Plan (DMP)
Un Plan de gestión de datos o Data Management Plan (DMP) es un documento que describe el ciclo de la gestión de los datos que se recopilarán y procesarán a la hora de generar un proyecto de investigación. El informe se basa en este informe para destacar los principales beneficios que reporta la creación y desarrollo de un DMP:
- Incrementa la eficiencia durante el proyecto
- Permite recopilar y almacenar datos de una manera más estructurada
- Evita o minimiza el riesgo de pérdida de datos
- Permite compartir y reutilizar datos con garantías
- Incrementa la verificabilidad de la investigación
- Aumenta la longevidad del proyecto al hacer los datos estén disponibles incluso después de que el proyecto finalice
Estructura de un Plan de Gestión de datos
Los DMP son únicos: su contenido, composición y estructura pueden variar enormemente ya que dependen del proyecto y los datos generados. Sin embargo, para garantizar que todos los aspectos se cubren, en el informe se propone una estructura genérica para un DMP que puede modificarse o adaptarse según las necesidades de cada proyecto. Esta estructura se encuentra organizada en nueve secciones, con una serie de preguntas para facilitar su redacción. A continuación se incluyen algunos ejemplos de dichas preguntas:
- Gestores de los datos. ¿Quién se encarga de gestionar los datos? ¿Cuenta el equipo de investigación con un experto en datos?
- Identificación y descripción de datos. ¿Cuál es el propósito de la investigación? ¿Qué datos se utilizan y en qué formato? ¿Cada cuánto tiempo se recopilan?
- Organización e intercambio de datos. ¿Cómo es la gestión de los datos? ¿Dónde se guardan? ¿Quién tiene acceso a ellos?
- Almacenamiento y back-up. ¿Cuál es la estrategia de back-up y almacenamiento de datos? ¿Con qué frecuencia se hacen copias de seguridad?
- Intercambio de datos, estándares y metadatos. ¿Se está utilizando un estándar de datos? ¿Qué herramientas se requieren para leerlos? ¿Se está generando documentación de soporte?
- Restricciones de datos. ¿Qué grado de apertura tendrán los datos? ¿Existe un plan para proteger o anonimizar los datos si fuera necesario?
- Licencias y publicaciones de datos. ¿Dónde y cómo se publicarán los datos? ¿Bajo qué licencias?
- Archivo de datos. ¿Cómo se gestionarán los datos cuando termine el proyecto para asegurar su disponibilidad a largo plazo? ¿Se publicarán con un Identificador Digital de Objetos (DOI)?
- Costes. ¿Cuáles son los costes estimados de la gestión de los datos? ¿Cómo se han contabilizado dichos costos?
El informe también recoge una serie de recomendaciones generales y prácticas que se aplican a todos los tipos de proyectos y sus planes de gestión, como por ejemplo que deben utilizarse, en la medida de lo posible, herramientas de la Ciencia Abierta de libre y fácil acceso o que datos generados por el proyecto deben figurar en una sola página web.
Herramientas y recursos
El informe finaliza con una serie de herramientas y recursos, como repositorios de datos o los estándares de datos de biodiversidad más importantes.
Repositorios de datos
Los proyectos de investigación financiados deben almacenar y poner a disposición de otros usuarios los datos de sus proyectos a través de los principales archivos y servicios de almacenamiento nacionales e internacionales.
El informe divide los repositorios en dos grandes grupos. Por una parte, los repositorios generales, que se encuentran abiertos a todos los campos de investigación, y por otra, los repositorios específicos, enfocados en materias concretas. El siguiente cuadro muestra algunos ejemplos de repositorios de datos de investigación generalistas.
Puedes acceder a estos repositorios a través de los siguientes enlaces:
- Data Archiving and Networked Services
- Datahub
- Dataverse
- Dryad Digital Repository
- EUDAT
- Figshare
- Mendeley data
- OpenAire
- Registry of Research Data Repositories
- Zenodo
El informe también muestra ejemplos de repositorios específicos en el área de la biodiversidad como Arctic Biodiversity Data Service o Dynamic Ecological Information Management System.
Estándares y licencias
El uso de normas y estándares por parte de la comunidad de investigadores de la biodiversidad mejora enormemente la interoperabilidad de los conjuntos de datos publicados. En esta web se pueden encontrar algunos de los principales.
Por su parte las licencias impulsan la visibilidad, sobre todo cuando se usan las de atribución. En este sentido, el informe recoge una lista de recursos para comprender y abordar mejor el tema de la concesión de licencias y otras consideraciones relativas a la publicación.
Como conclusión final podemos establecer la importancia capital que tiene la realización de un plan de gestión de datos en el ámbito científico y su posterior almacenamiento en los repositorios correspondientes para fomentar la reutilización de esa información y con ello el desarrollo de nuevas investigaciones que impulsen el saber de la humanidad. Este informe ofrece las claves necesarias para desarrollarlo paso a paso de una manera práctica y sencilla.