Data sharing: recomendaciones en el ámbito de la investigación científica

Fecha de la noticia: 15-04-2020

Investigación

La Sociedad Española de Documentación e Información Científica (SEDIC) dedica el número 7 de su revista Documentos de trabajo al data sharing, con el monográfico titulado "Data sharing: qué son y cómo se pueden compartir los datos de investigación. Manual de recomendación para gestores de la información".

Se trata de una guía elaborada por Andrea Sixto-Costoya, Rafael Aleixandre-Benavent, Antonio Vidal Infer, Rut Lucas Domínguez y Lourdes Castellón Cogollos; donde los autores analizan, desde una perspectiva amplía, diversos aspectos relacionados con los datos de investigación y su uso compartido.

En concreto, el manual recopila algunas de las principales iniciativas institucionales en el ámbito del data sharing a nivel mundial y en el contexto de la Unión Europea; describe las infraestructuras necesarias y analiza los aspectos más técnicos relacionados con formatos y protocolos; muestra las diferentes tecnologías disponibles, así como las características de los datos de investigación y de los planes de gestión de los datos; y reflexiona sobre el papel de las revistas científicas. El monográfico también recoge las principales ventajas y las perspectivas de futuro en el ámbito del data sharing.

En este post resumimos algunas de los aportes principales de este trabajo.

¿Qué es el “data sharing”?

El “data sharing” o el uso compartido de datos es la acción de compartir con el resto de la comunidad científica el material sin procesar (los datos brutos de la investigación) generado durante el curso de la investigación que sirve para extraer y validar resultados. Como se indica en el documento, actualmente el data sharing se engloba dentro de la filosofía de acceso abierto (open access), entendiéndose el compartir datos como una práctica que favorece que la ciencia sea más abierta y accesible. Desde esta perspectiva del acceso abierto, el data sharing promueve que los datos sin procesar puedan tener una “segunda vida” y se puedan utilizar más allá del fin para el que fueron generados en un principio. Estos usos pueden ir desde la reutilización de los datos para producir nuevos estudios, a servir como verificadores de resultados de investigación.

Para poder ser compartidos en todo su potencial los datos de investigación tienen que cumplir cuatro condiciones conocidas como Principios FAIR: Findable, Accessible, Interoperable, Reusable (Encontrables, Accesibles, Interoperables y Reutilizables).

Los Principios FAIR cuyo lema es “tan abiertos como sea posible, tan cerrados como sea necesario” no implican que todos los datos deban tener el mismo nivel de apertura; ni que todos los datos, de todas las disciplinas científicas sigan las mismas reglas. Lo que aportan estos principios es más bien un cambio de paradigma, que persigue el objetivo de que los datos estén abiertos por defecto, en vez de cerrados, como venía sucediendo hasta ahora.

Políticas sobre datos abiertos en el ámbito de la investigación científica

A nivel internacional, los autores destacan una serie de iniciativas institucionales implementadas en Australia, EEUU, América Latina y Canadá, indicando que éstas sirven como referencia para mostrar las tendencias de uso compartido de datos de investigación a nivel mundial. El Australian National Data Service; el Repositorio Nacional Digital de Ciencia, Tecnología e Innovación en Perú o el Canadian Institutes of Health Research, son algunas de las iniciativas más destacables.

En cuanto a la Unión Europea, su postura sobre el uso compartido de datos es clara: se defiende y se promueve, aunque no es un mandato obligatorio. Para el análisis de las iniciativas a nivel comunitario los autores han tomado como referencia las bases que estipula la Comisión para los proyectos Horizon 2020 (H2020), ya que es en ellos donde la UE engloba la mayoría de su actividad investigadora.

En la UE las directrices sobre el uso compartido de datos en investigación siguen la misma tendencia que sobre el acceso abierto en general, es decir, debe hacerse por sistema y por defecto, ya que no debería ser necesario pagar por la información financiada con fondos públicos cada vez que se accede o se utiliza la misma. En el caso de las publicaciones finales de los artículos, esto significa que debe hacerse siempre por alguna de las dos opciones disponibles, que son la vía verde o dorada, y solo en el caso de los estudios que implican patentes pueden guardarse el derecho de no publicar en abierto.

En cuanto a la situación por países del ámbito comunitario el monográfico, siguiendo el informe “An Analysis of Open Science Policies in Europe”  publicado en 2019 por SPARC Europe y el Digital Curation Center (DCC) indica que 14 de 28 países tienen políticas vigentes relacionadas con los datos abiertos de investigación. Además, destaca la Directiva (UE) 2019/1024 del Parlamento Europeo y del Consejo de 20 de junio de 2019, relativa a los datos abiertos y la reutilización de la información del sector público, como una herramienta clave para promover el acceso abierto a los datos, no solo de investigación, sino también los datos generados por sectores empresariales o gubernamentales.

Finalmente en cuanto a España, sería el Plan Estatal de Investigación Científica y Tecnológica y de Innovación 2017-2020 donde se articula la política de datos abiertos en el ámbito de la investigación.

Los autores afirman que el acercamiento de España con respecto al uso compartido de datos en ciencia es todavía tímido y algo ambiguo” sin embargo el camino estaría trazado de forma positiva. El Plan Estatal recoge claramente el objetivo de impulsar el acceso a datos de investigación, pero considera como optativo incluir un plan de gestión de los datos en los proyectos de I+D+i financiados con fondos públicos. Al mismo tiempo se señala que cuando los datos sean compartidos, se tendrá en cuenta para la evaluación curricular de los investigadores.

El siguiente cuadro recopila las iniciativas públicas internacionales identificadas en el manual.

Poltíticas sobre datos abiertos: Internacional, UE y España
Australia
América Latina
Canadá
Estados Unidos
Unión Europea
España

 

Tecnologías para compartir datos.

Las tecnologías para compartir datos incluyen toda la infraestructura digital necesaria para subir, almacenar, preservar, buscar y descargar datos de investigación. Dentro de las infraestructuras, los repositorios de datos y las plataformas de las editoriales son actualmente la máxima referencia en cuanto a datos de investigación compartidos. El informe analiza las características de ambos tipos de infraestructuras y ofrece ejemplos que sintetizamos a continuación:

Repositorios de datos para la investigación científica
Temáticos
Multidisciplinares
Institucionales
Buscadores

 

El papel de las revistas científicas en el uso compartidos de datos

Al igual que sucede con el acceso abierto a las publicaciones, los autores señalas que en los últimos años algunas revistas y editoriales han tomado conciencia y han desarrollado políticas y directrices sobre el uso compartido de datos que normalmente se plasman en las “Author guidelines”. Dentro de las revistas y de las editoriales que apuestan por el uso compartido de datos, se distinguen dos grupos: las que sugieren y las que obligan a su uso. Además existirían tres modalidades para indicar a los autores (bien por obligación, o por recomendación) como compartir sus datos:

  1. El primer nivel, que no implican ni obligación ni exigencia, permite al autor poner una indicación de que los datos pueden ser solicitados al autor o autores, normalmente indicando alguna forma de contacto, y éstos los facilitarán si lo consideran oportuno.
  2. El segundo nivel, que implica más apertura de los datos, es el que ofrece la posibilidad de que vayan adjuntos como material suplementario al artículo. En este caso, la revista puede optar porque este sea un requisito o no. En caso de que lo sea, los autores deben subir un adjunto donde se encuentren los datos brutos que sustentan los resultados del trabajo, lo que es muy positivo ya que se permite tanto la verificación como la reutilización. Esta modalidad hace que las revistas y las editoriales puedan ejercer de plataformas digitales en las que se almacenan los datos, ya que, junto con el pdf del artículo, estarían adjuntos los datos.
  3. El tercer nivel, es en el que los datos están más abiertos. La revista obliga o da la posibilidad de subir los datos a un repositorio de datos como los que se han visto en el apartado referente a repositorios. De esta forma, los datos estarían guardados con una modalidad que ofrece muchas más garantías tanto de preservación como de accesibilidad. Dependiendo de las revistas y de las editoriales a las que pertenecen, pueden variar sobre todo dos cuestiones. La primera es si se trata de una obligación o de una recomendación. La segunda, el tipo de instrucciones que se detallen, por ejemplo, si se da libertad al autor para que escoja el repositorio o si la revista ya tiene una lista cerrada de repositorios para elegir.

¿Por qué compartir datos de la investigación científica?

Los autores del manual siguen en este punto a la Red Española sobre Datos de Investigación en Abierto quien señala los principales puntos a favor de la práctica de compartir datos en el ámbito de la investigación y que pueden resumirse en los siguientes: 

  • Incrementa la transparencia y la credibilidad de los estudios
  • Se puede comprobar la validez de los resultados.
  • Permite replicar y verificar
  • Fomenta la participación y la colaboración.
  • Reduce costes y tiempo.
  • Permite descubrimientos múltiples
  • En el caso de investigaciones con animales, permite ahorrar el sufrimiento y la pérdida innecesaria de vidas.
  • En el caso de las investigaciones con humanos ayudar a evitar duplicidades en estudios que, en ocasiones, son muy invasivos e incómodos para los sujetos que forman parte de la muestra.
  • Incrementa la visibilidad.

Conclusiones

Los autores concluyen el monográfico señalando que es importante visibilizar y promover que el compartir datos es una práctica que puede y debe adaptarse a las necesidades y peculiaridades de los investigadores, grupos y disciplinas.

Las entidades financiadoras y las instituciones que se encargan de evaluar la ciencia tienen un papel fundamental en cuanto a la gestión de incentivos para favorecer esta práctica entre el personal investigador. En este sentido, es muy importante que se sigan desarrollando métricas que sirvan para la evaluación de las publicaciones y reutilización de datos y, sobre todo, incluir los datos abiertos en los indicadores de evaluación de la actividad científica. Resultaría más eficaz pedir a los investigadores que compartan sus datos si la petición viene acompañada tanto de este tipo de incentivos, como de ayuda material, económica y humana para hacerlo.

Finalmente, desde el punto de vista de los documentalistas y profesionales de la información, el data sharing constituye un terreno de trabajo que está en una coyuntura muy favorable y con un amplio potencial, que podría brindar oportunidades comparables a las que el acceso abierto brindó a las bibliotecas universitarias.

Ficheros Adjuntos:

  • Data Sharing: qué son y cómo se pueden compartir los datos de investigación. Manual de recomendaciones para gestores de la información.
    pdf