Data Sandboxes: Explorando el potencial de los datos abiertos en un entorno seguro

Fecha de la noticia: 27-09-2024

Portada del informe "Data Sandboxes: Managing the Open Data Spectrum"

Los data sandboxes son herramientas que nos proporcionan entornos donde poder probar nuevas prácticas y tecnologías relacionadas con los datos, lo que los convierte en poderosos instrumentos a la hora de gestionar y utilizar los datos de manera segura y eficaz. Estos espacios donde operar de forma segura con los datos son de gran utilidad a la hora de determinar si es viable abrir los datos y bajo qué condiciones. Algunos de los beneficios que nos ofrecen son:

  • Entornos controlados y seguros: proporcionan un espacio de trabajo donde poder explorar la información y evaluar su utilidad y calidad antes de comprometerse a compartirlos de manera más amplia. Esto resulta particularmente importante en sectores sensibles, donde la privacidad y seguridad de los datos son primordiales.
  • Facilitan la innovación: ofrecen un espacio seguro para la experimentación y el prototipado rápido, permitiendo iterar rápidamente, probando y perfeccionando nuevas ideas y soluciones basadas en datos a modo de banco de pruebas antes de lanzarlas al público.
  • Colaboración multisectorial: facilitan la colaboración entre diversos actores, incluyendo entidades gubernamentales, empresas privadas, el entorno académico y la sociedad civil. Este enfoque multisectorial ayuda a romper los silos de datos y promueve el intercambio de conocimientos y buenas prácticas entre sectores.
  • Uso adaptable y escalable: pueden ajustarse para adaptarse a diferentes tipos de datos, casos de uso y sectores, lo que los convierte en una herramienta versátil para diversas iniciativas basadas en datos.
  • Intercambio de datos transfronterizo: aportan una solución viable para gestionar los desafíos del intercambio de datos entre distintas jurisdicciones, especialmente en lo que respecta a las normativas internacionales de privacidad.

El informe "Data Sandboxes: Managing the Open Data Spectrum" explora el concepto de los data sandboxes como una herramienta para conseguir un equilibrio adecuado entre los beneficios de los datos abiertos y la necesidad de proteger la información sensible.

Propuesta de valor para la innovación

Además de todos los beneficios anteriormente vistos, cabe destacar que los data sandboxes ofrecen también una sólida propuesta de valor para las organizaciones que buscan innovar de manera responsable. Estos entornos nos ayudan a mejorar la calidad de los datos al facilitar que los usuarios puedan identificar inconsistencias y poder así llevar a cabo las mejoras necesarias. También contribuyen a reducir los riesgos al proporcionar entornos seguros para permitir el trabajo con datos sensibles. Al fomentar la experimentación interdisciplinaria, la colaboración y la innovación, contribuyen a aumentar la capacidad de uso de los datos y a desarrollar una cultura impulsada por los datos dentro de las organizaciones. Además, los data sandboxes ayudan a reducir las barreras de acceso a los datos, mejorando la transparencia y la rendición de cuentas, lo que fortalece la confianza de los ciudadanos y da lugar a una expansión en los intercambios de datos.

Tipos de data sandboxes y características

Dependiendo del principal objetivo que tengamos a la hora de implantar un sandbox podemos encontrarnos con tres tipologías distintas:

  1. Regulatory sandboxes, que permiten a las empresas y organizaciones poner a prueba servicios innovadores bajo la estrecha supervisión de los reguladores de un sector o área específico.
  2. Innovation sandboxes, que son frecuentemente utilizados por los desarrolladores a la hora de probar nuevas funcionalidades y obtener una retroalimentación rápida sobre su trabajo.
  3. Research sandboxes, los cuales facilitan que tanto el mundo académico como la industria puedan probar de manera segura nuevos algoritmos o modelos centrándose en el objetivo de sus pruebas, sin tener que preocuparse por incumplir las normativas establecidas.

En cualquier caso, independientemente del tipo de sandbox con el que estemos trabajando, todos ellos se caracterizan por los siguientes aspectos clave comunes:

Características de un data sandbox: adaptable y escalable, controlado, seguro, multisectorial y colaborativo, alta capacidad de computación, temporal. Fuente: adaptado de The Govlab.

Figura 1. Características de un data sandbox. Adaptación de un visual de The Govlab.

A continuación, se describe cada una de ellas:

  1. Controlados: son entornos restringidos donde se puede acceder a los datos sensibles y analizados de manera segura, asegurando el cumplimiento de las regulaciones pertinentes.
  2. Seguros: protegen la privacidad y seguridad de los datos, a menudo utilizando datos anonimizados o sintéticos.
  3. Colaborativos: facilitan la colaboración entre diferentes regiones, sectores y roles, fortaleciendo los ecosistemas de datos.
  4. Alta capacidad de computación: proporcionan recursos computacionales avanzados capaces de realizar tareas complejas con los datos cuando sea necesario.
  5. Temporales: están diseñados para un uso temporal y con un ciclo de vida corto, permitiendo una experimentación rápida y enfocada que o bien concluye una vez logrado su objetivo o se convierte en un nuevo proyecto a largo plazo.
  6. Adaptables: son lo suficientemente flexibles para personalizarse y escalar según las necesidades y los diferentes tipos de datos, casos de uso y contextos.

Ejemplos de data sandboxes

Los data sandboxes llevan ya mucho tiempo implantándose con éxito en múltiples sectores a lo largo de Europa y todo el mundo, por lo que podemos encontrar fácilmente varios ejemplos de su implementación en nuestro continente:

  • Laboratorio de ciencia de datos en Dinamarca: proporciona acceso a datos administrativos sensibles de utilidad para la investigación, fomentando la innovación bajo estrictas políticas de gobernanza de datos.
  • TravelTech en Lituania: un sandbox de acceso abierto que ofrece datos turísticos para mejorar el desarrollo empresarial y de la fuerza laboral en el sector.
  • Sandbox para datos abiertos de la iniciativa INDIGO: promueve el intercambio de datos entre sectores para mejorar las políticas sociales, enfocándose en crear un entorno seguro para las iniciativas de intercambio de datos bilaterales.
  • Sandbox de ciencia de datos de salud en Dinamarca: una plataforma de formación para investigadores que permite practicar análisis de datos utilizando datos biomédicos sintéticos sin tener que preocuparse por la estricta regulación.

Dirección futura y desafíos

Como hemos visto, los data sandboxes pueden resultar una herramienta poderosa a la hora de fomentar la apertura de datos, la innovación y la colaboración, asegurando al mismo tiempo la privacidad y seguridad de la información. Gracias a que proporcionan un entorno controlado para la experimentación con datos, permiten que los todos aquellos interesados puedan explorar nuevas aplicaciones y conocimientos de manera fiable y segura. Los sandboxes pueden por tanto ayudar a superar las barreras iniciales de acceso a los datos y contribuir a fomentar un uso más informado y con un propósito mejor definido de los mismos, promoviendo así el uso de soluciones basadas en datos para los problemas de ámbito público.

Sin embargo, a pesar de sus múltiples beneficios, los data sandboxes presentan también varios desafíos a la hora de su implementación. Los principales problemas con los que nos podríamos encontrar a la hora de llevarlos a la práctica incluyen:

  • Relevancia: conseguir que el sandbox contenga datos de alta calidad y relevantes, y que estos se mantengan actualizados.
  • Gobernanza: establecer reglas claras y protocolos para el acceso, uso y compartición de datos, así como los mecanismos de monitorización y cumplimiento de los mismos.
  • Escalabilidad: exportar con éxito las soluciones desarrolladas dentro del sandbox y poder trasladarlas a aplicaciones prácticas dentro del mundo real.
  • Gestión de riesgos: abordar de forma integral todos los riesgos asociados con la reutilización de datos a lo largo de su ciclo de vida y sin comprometer su integridad.

No obstante, a medida que las tecnologías y políticas continúan evolucionando, está claro que los data sandboxes están llamados a ser una herramienta útil y representar un papel relevante en la gestión del espectro de apertura de los datos, impulsando así el uso de los datos para la resolución de problemas cada vez más complejos. Así mismo, el futuro de los data sandboxes estará influenciado por los nuevos marcos regulatorios (como los Reglamentos de Datos y Gobernanza de Datos) que refuerzan la seguridad de los datos y promueven su reutilización, y por la integración con las tecnologías de preservación y mejora de la privacidad que nos permiten utilizar los datos sin necesidad de exponer ninguna información sensible. Juntas, estas tendencias impulsarán una innovación de datos más segura dentro de los entornos proporcionados por los data sandboxes.


Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.