El plan de gestión de datos: una oportunidad de la ciencia abierta para seguir avanzando

Fecha de la noticia: 17-01-2018

Plan de gestión de datos

Las agencias que financian la investigación pública y privada están interesadas en que los resultados se difundan lo máximo posible. Por ello, y siguiendo la corriente de la ciencia abierta (Open Science), fueron las propias financiadoras las que crearon la demanda de obligar a disponer en acceso abierto las publicaciones científicas creadas durante una investigación. En la era de los datos abiertos, esta demanda se ha extendido para que, de igual manera, los datos que subyacen en las publicaciones (los datos de investigación) sean difundidos y gestionados apropiadamente.

Y para que los datos sean gestionados de forma apropiada, es fundamental la planificación. Por este motivo, las agencias financiadoras están obligando a que las propuestas de proyecto contengan un Plan de Gestión de Datos - PGD (o en inglés, Data Management Plan - DMP). Un PGD es un documento formal, normalmente redactado de manera previa al inicio del proyecto, donde se detalla el tratamiento que van a recibir los datos de investigación recopilados o generados durante el curso del proyecto.

Algunos de los elementos más interesantes que pueden incluir un PGD serían:

  • La relación de datos que se producirán durante la investigación y aquellos que se recolectarán previamente.

  • La relación de los estándares que se usarán para generar los metadatos.

  • La relación de datos que se ofrecerán en abierto, con una descripción detallada de los mismos.

  • Las políticas de acceso y reutilización de datos, indicando cómo se facilitará el acceso a los datos, para su posible verificación y reutilización.

  • Las medidas para proteger la privacidad, la seguridad, la confidencialidad y la propiedad intelectual, detallando cómo serán conservados y preservados los datos, o el nombre y tipo de repositorio donde serán depositados.

Para el personal investigador, son múltiples los beneficios de un PGD, como, por ejemplo:

  • Asegurar la difusión, integridad y reproducibilidad de los datos.

  • Preservar los datos, evitando posibles pérdidas.

  • Aumentar la diseminación del proyecto, así como su impacto.

A la hora de crear un PGD, son varias las herramientas que se han creado para facilitar esta tarea. DMPonline, creada por el Digital Curation Centre (DCC), permite editar y exportar los planes de forma colaborativa, así como hacerles seguimiento, además de disponer de una plantilla particular para los proyectos europeos H2020. PaGoDA es la traducción al español de DMPonline realizada por parte del Consorcio Madroño. DMPTool, desarrollado por la Universidad de California, permite compartir, editar y exportar el PGD cuando sea necesario, aunque no dispone de plantilla para proyectos H2020.

El programa de financiación de proyectos de investigación de la Unión Europea H2020, también solicita la presencia de un plan de gestión de datos. Al inicio del programa, solo era obligatorio en las áreas que formaban parte del programa piloto Open Research Data. Pero desde el año 2017, esta obligación se extendió a todas las áreas temáticas del programa H2020, haciendo de que los datos de investigación sean abiertos por defecto. Los planes se incluyen en la información técnica de las propuestas de proyectos H2020 y son evaluados bajo el criterio del impacto, puesto que con la liberación de datos se espera acelerar la innovación y construir la ciencia sobre resultados previos, evitando la duplicación de esfuerzos, así como el fomento de la cultura de la reutilización y de la ciencia abierta.

El acto de crear un plan de gestión de datos beneficia a la investigación en general, puesto que demanda una reflexión previa que afecta al diseño del propio experimento. El estudio de los datos existentes previamente evita duplicar esfuerzos y promociona la colaboración con otros grupos de investigación. Además, documentar cuales van a ser los datos que va a generar un proyecto lo dota de un punto de sostenibilidad, en el caso de producirse variaciones en el personal del proyecto. Por tanto, redactar (aún en el caso de que el financiador no lo solicite) un plan de gestión de datos es la oportunidad de demostrar al financiador que una investigación es viable.