Los data sandboxes son herramientas que nos proporcionan entornos donde poder probar nuevas prácticas y tecnologías relacionadas con los datos, lo que los convierte en poderosos instrumentos a la hora de gestionar y utilizar los datos de manera segura y eficaz. Estos espacios donde operar de forma segura con los datos son de gran utilidad a la hora de determinar si es viable abrir los datos y bajo qué condiciones. Algunos de los beneficios que nos ofrecen son:
- Entornos controlados y seguros: proporcionan un espacio de trabajo donde poder explorar la información y evaluar su utilidad y calidad antes de comprometerse a compartirlos de manera más amplia. Esto resulta particularmente importante en sectores sensibles, donde la privacidad y seguridad de los datos son primordiales.
- Facilitan la innovación: ofrecen un espacio seguro para la experimentación y el prototipado rápido, permitiendo iterar rápidamente, probando y perfeccionando nuevas ideas y soluciones basadas en datos a modo de banco de pruebas antes de lanzarlas al público.
- Colaboración multisectorial: facilitan la colaboración entre diversos actores, incluyendo entidades gubernamentales, empresas privadas, el entorno académico y la sociedad civil. Este enfoque multisectorial ayuda a romper los silos de datos y promueve el intercambio de conocimientos y buenas prácticas entre sectores.
- Uso adaptable y escalable: pueden ajustarse para adaptarse a diferentes tipos de datos, casos de uso y sectores, lo que los convierte en una herramienta versátil para diversas iniciativas basadas en datos.
- Intercambio de datos transfronterizo: aportan una solución viable para gestionar los desafíos del intercambio de datos entre distintas jurisdicciones, especialmente en lo que respecta a las normativas internacionales de privacidad.
El informe "Data Sandboxes: Managing the Open Data Spectrum" explora el concepto de los data sandboxes como una herramienta para conseguir un equilibrio adecuado entre los beneficios de los datos abiertos y la necesidad de proteger la información sensible.
Propuesta de valor para la innovación
Además de todos los beneficios anteriormente vistos, cabe destacar que los data sandboxes ofrecen también una sólida propuesta de valor para las organizaciones que buscan innovar de manera responsable. Estos entornos nos ayudan a mejorar la calidad de los datos al facilitar que los usuarios puedan identificar inconsistencias y poder así llevar a cabo las mejoras necesarias. También contribuyen a reducir los riesgos al proporcionar entornos seguros para permitir el trabajo con datos sensibles. Al fomentar la experimentación interdisciplinaria, la colaboración y la innovación, contribuyen a aumentar la capacidad de uso de los datos y a desarrollar una cultura impulsada por los datos dentro de las organizaciones. Además, los data sandboxes ayudan a reducir las barreras de acceso a los datos, mejorando la transparencia y la rendición de cuentas, lo que fortalece la confianza de los ciudadanos y da lugar a una expansión en los intercambios de datos.
Tipos de data sandboxes y características
Dependiendo del principal objetivo que tengamos a la hora de implantar un sandbox podemos encontrarnos con tres tipologías distintas:
- Regulatory sandboxes, que permiten a las empresas y organizaciones poner a prueba servicios innovadores bajo la estrecha supervisión de los reguladores de un sector o área específico.
- Innovation sandboxes, que son frecuentemente utilizados por los desarrolladores a la hora de probar nuevas funcionalidades y obtener una retroalimentación rápida sobre su trabajo.
- Research sandboxes, los cuales facilitan que tanto el mundo académico como la industria puedan probar de manera segura nuevos algoritmos o modelos centrándose en el objetivo de sus pruebas, sin tener que preocuparse por incumplir las normativas establecidas.
En cualquier caso, independientemente del tipo de sandbox con el que estemos trabajando, todos ellos se caracterizan por los siguientes aspectos clave comunes:
Figura 1. Características de un data sandbox. Adaptación de un visual de The Govlab.
A continuación, se describe cada una de ellas:
- Controlados: son entornos restringidos donde se puede acceder a los datos sensibles y analizados de manera segura, asegurando el cumplimiento de las regulaciones pertinentes.
- Seguros: protegen la privacidad y seguridad de los datos, a menudo utilizando datos anonimizados o sintéticos.
- Colaborativos: facilitan la colaboración entre diferentes regiones, sectores y roles, fortaleciendo los ecosistemas de datos.
- Alta capacidad de computación: proporcionan recursos computacionales avanzados capaces de realizar tareas complejas con los datos cuando sea necesario.
- Temporales: están diseñados para un uso temporal y con un ciclo de vida corto, permitiendo una experimentación rápida y enfocada que o bien concluye una vez logrado su objetivo o se convierte en un nuevo proyecto a largo plazo.
- Adaptables: son lo suficientemente flexibles para personalizarse y escalar según las necesidades y los diferentes tipos de datos, casos de uso y contextos.
Ejemplos de data sandboxes
Los data sandboxes llevan ya mucho tiempo implantándose con éxito en múltiples sectores a lo largo de Europa y todo el mundo, por lo que podemos encontrar fácilmente varios ejemplos de su implementación en nuestro continente:
- Laboratorio de ciencia de datos en Dinamarca: proporciona acceso a datos administrativos sensibles de utilidad para la investigación, fomentando la innovación bajo estrictas políticas de gobernanza de datos.
- TravelTech en Lituania: un sandbox de acceso abierto que ofrece datos turísticos para mejorar el desarrollo empresarial y de la fuerza laboral en el sector.
- Sandbox para datos abiertos de la iniciativa INDIGO: promueve el intercambio de datos entre sectores para mejorar las políticas sociales, enfocándose en crear un entorno seguro para las iniciativas de intercambio de datos bilaterales.
- Sandbox de ciencia de datos de salud en Dinamarca: una plataforma de formación para investigadores que permite practicar análisis de datos utilizando datos biomédicos sintéticos sin tener que preocuparse por la estricta regulación.
Dirección futura y desafíos
Como hemos visto, los data sandboxes pueden resultar una herramienta poderosa a la hora de fomentar la apertura de datos, la innovación y la colaboración, asegurando al mismo tiempo la privacidad y seguridad de la información. Gracias a que proporcionan un entorno controlado para la experimentación con datos, permiten que los todos aquellos interesados puedan explorar nuevas aplicaciones y conocimientos de manera fiable y segura. Los sandboxes pueden por tanto ayudar a superar las barreras iniciales de acceso a los datos y contribuir a fomentar un uso más informado y con un propósito mejor definido de los mismos, promoviendo así el uso de soluciones basadas en datos para los problemas de ámbito público.
Sin embargo, a pesar de sus múltiples beneficios, los data sandboxes presentan también varios desafíos a la hora de su implementación. Los principales problemas con los que nos podríamos encontrar a la hora de llevarlos a la práctica incluyen:
- Relevancia: conseguir que el sandbox contenga datos de alta calidad y relevantes, y que estos se mantengan actualizados.
- Gobernanza: establecer reglas claras y protocolos para el acceso, uso y compartición de datos, así como los mecanismos de monitorización y cumplimiento de los mismos.
- Escalabilidad: exportar con éxito las soluciones desarrolladas dentro del sandbox y poder trasladarlas a aplicaciones prácticas dentro del mundo real.
- Gestión de riesgos: abordar de forma integral todos los riesgos asociados con la reutilización de datos a lo largo de su ciclo de vida y sin comprometer su integridad.
No obstante, a medida que las tecnologías y políticas continúan evolucionando, está claro que los data sandboxes están llamados a ser una herramienta útil y representar un papel relevante en la gestión del espectro de apertura de los datos, impulsando así el uso de los datos para la resolución de problemas cada vez más complejos. Así mismo, el futuro de los data sandboxes estará influenciado por los nuevos marcos regulatorios (como los Reglamentos de Datos y Gobernanza de Datos) que refuerzan la seguridad de los datos y promueven su reutilización, y por la integración con las tecnologías de preservación y mejora de la privacidad que nos permiten utilizar los datos sin necesidad de exponer ninguna información sensible. Juntas, estas tendencias impulsarán una innovación de datos más segura dentro de los entornos proporcionados por los data sandboxes.
Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
Una de las acciones clave que destacamos recientemente como necesarias para construir el futuro de los datos abiertos en nuestro país es la implantación de procesos para mejorar la gestión y gobernanza de los datos. No en vano, el llevar a cabo una gestión adecuada de los datos en nuestras organizaciones se está convirtiendo en una tarea cada vez más compleja y demandada. Buena muestra de ello es, por ejemplo, que los especialistas en data governance están cada vez más demandados – con más de 45.000 ofertas de empleo activas en Estados Unidos para un rol que hace no mucho era prácticamente inexistente – y docenas de plataformas de gestión de datos ahora se anuncian como data governance platforms.
¿Pero qué es lo que hay realmente detrás de esas palabras clave? ¿Qué es lo que debemos entender realmente por gobernanza de los datos? En realidad, de lo que estamos hablando es de una serie de procesos de transformación bastante complejos que afectan al conjunto de la organización.
Esa complejidad queda perfectamente reflejada en el framework que nos proponen desde el Open Data Policy Lab, donde podemos observar claramente las diferentes capas superpuestas del modelo y cuáles son sus principales características – dando lugar a un recorrido a través de la elaboración de los datos, la colaboración con los datos como herramienta principal, la generación de conocimiento, el establecimiento de las condiciones habilitadoras necesarias y la creación de valor añadido.
Pasemos entonces a continuación a pelar esa cebolla y observemos más en detalle qué es lo que encontraremos en cada una de esas capas:
El ciclo de vida de los datos
Nunca deberíamos considerar los datos como elementos aislados, sino como parte de un ecosistema mayor, que se encuentra inmerso en un ciclo continuo con las siguientes fases:
- Recolección o recopilación de los datos procedentes de distintas fuentes.
- Procesamiento y transformación de los datos para conseguir que sean utilizables.
- Compartición e intercambio de datos entre los distintos miembros de la organización.
- Análisis para extraer el conocimiento que se está buscando.
- Uso de los datos de acuerdo al conocimiento obtenido.
La colaboración a través de los datos
No es extraño que el ciclo de vida de los datos transcurra únicamente dentro de la organización donde se originan. Sin embargo, podremos aumentar el valor de esos datos exponencialmente, simplemente exponiéndolos a la colaboración con otras organizaciones a través de diversos mecanismos, añadiendo así una nueva capa de gestión:
- Interfaces públicos que ofrecen un acceso selectivo a los datos, habilitando nuevos usos y funciones.
- Intermediarios confiables que funcionan como agentes independientes de datos. Estos agentes coordinan el uso de los datos por parte de terceros, garantizando su seguridad e integridad en todo momento.
- Colecciones de datos que ofrecen una visión común, conjunta, completa y coherente de los datos a través de la agregación de porciones procedentes de distintas fuentes.
- Acuerdos para la investigación y el análisis, por los que se garantiza el acceso a ciertos datos con el objetivo de generar un conocimiento específico.
- Concursos y retos que dan acceso a datos específicos durante un periodo limitado de tiempo para promover nuevos usos innovadores de los mismos.
- Generación de inteligencia, mediante la cual se comparten también los conocimientos adquiridos por la organización a través de los datos y no solo la materia prima.
La generación de conocimiento
Gracias a las colaboraciones establecidas en la capa anterior será posible realizar nuevos estudios de los datos que nos permitirán tanto analizar el pasado como tratar de extrapolar el futuro mediante diversas técnicas como:
- Análisis de la situación, conociendo lo que está pasando en el entorno de los datos.
- Causa y efecto, buscando una explicación al origen de lo que está pasando.
- Predicción, intentando inferir que será lo siguiente que va a pasar.
- Evaluación del impacto, estableciendo lo que esperamos que debería suceder.
Condiciones facilitadoras
Existen una serie de procedimientos que cuando se aplican por encima de un ecosistema de datos colaborativo ya existente pueden dar lugar a un uso todavía más efectivo de los datos mediante técnicas como:
- Publicar con un propósito, con el objetivo de coordinar la oferta y la demanda de datos de la forma más eficiente posible.
- Establecer alianzas, incluyendo en nuestros análisis a aquellos grupos de personas y organizaciones que nos puedan ayudar a entender mejor las necesidades reales.
- Potenciar el fortalecimiento de fuentes de datos alternativas proporcionando los recursos necesarios para crear nuevas fuentes de datos en las áreas aún por explotar.
- Establecer un marco de responsabilidad en torno a los datos que tenga en cuenta los principios de equidad, compromiso y transparencia.
Generación de valor
La ampliación del ecosistema y el establecimiento de las condiciones adecuadas para que ese ecosistema florezca pueden dar lugar a economías de datos de escala de las que podremos obtener nuevos beneficios como:
- Mejorar la gobernanza y la operativa de la propia organización gracias a las mejoras generales en transparencia y eficiencia que acompañan a los procesos de apertura.
- Potenciar a las personas proporcionándoles las herramientas que necesitan para realizar sus tareas de la forma más adecuada y tomar las decisiones correctas.
- Crear nuevas oportunidades para la innovación, la creación de nuevos modelos de negocio y la elaboración de políticas públicas dirigidas por la evidencia.
- Solucionar problemas optimizando los procesos y servicios y las intervenciones dentro del sistema en el que operamos.
Como podemos observar, el concepto de gobernanza de los datos es en realidad mucho más amplio y complejo de lo que en principio uno podría esperar y abarca una serie de actuaciones clave y tareas que en la mayoría de organizaciones será prácticamente imposible tratar de centralizar en un único rol o a través de una única herramienta. Por tanto, a la hora de establecer un sistema de gobernanza de datos en una organización deberíamos afrontar el reto como un proceso de transformación integral o un cambio de paradigma en el que prácticamente todos los miembros de la misma deberán estar implicados en mayor o menor medida. Una buena forma de afrontar este reto con mayor facilidad y mejores garantías sería a través de la adopción e implementación de algunos de los marcos y estándares de referencia que se han ido creando al respecto y que se corresponderías con distintas partes de este modelo.
Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
“La información y los datos son más valiosos cuando se comparten y la apertura de los datos de la administración podría permitir […] examinar y utilizar la información pública de forma más transparente, colaborativa, eficaz y productiva”. Esta fue, en términos generales, la idea que revolucionó hace ya más de diez años a una sociedad para la que la apertura de los datos gubernamentales era una acción totalmente desconocida. Es a partir de este momento cuando comienzan a presentarse diferentes tendencias que irán marcando la evolución del movimiento de los datos abiertos en todo el mundo.
A lo largo de este informe, elaborado por Carlos Iglesias, se analizan las principales tendencias de la aún incipiente historia del open data mundial, prestando especial atención a los datos abiertos dentro de las administraciones públicas. Para ello, este análisis refleja los principales problemas y oportunidades que se han ido presentando a lo largo de estos años, así como las tendencias que ayudarán a seguir impulsando el movimiento:
Para la elaboración de este informe se ha tomado como referencia el informe “The Emergence of a Third Wave of Open Data”, que analiza la nueva etapa que se abre en el mundo de los datos abiertos, publicado por el Open Data Policy Lab. Este análisis sirve como referencia para presentar tanto las tendencias actuales, como los desafíos asociados más destacados de los datos abiertos.
En la parte final de este informe, se presentan algunas labores que jugarán un papel fundamental a la hora de reforzar y consolidar el futuro de los datos abiertos a lo largo de los próximos diez años. Estas acciones se han adaptado al entorno de la Unión Europea, y específicamente al de España (incluyendo su marco normativo).
A continuación, puedes descargar el informe completo, así como su resumen ejecutivo y una presentación resumen en formato power point.
Los planteamientos actuales para la elaboración de políticas públicas que respondan de forma ágil al ritmo de evolución de las tendencias en el ámbito tecnológico resultan con demasiada frecuencia infructuosos. Los encargados de la formulación de dichas políticas se ven a menudo presionados a elaborar y adoptar leyes o directrices sin contar con la evidencia necesaria para poder hacerlo con garantías y sin tener la oportunidad de consultar a los expertos y usuarios afectados —lo que significa que no se diseñarán teniendo en cuenta las necesidades de quienes se verán directamente afectados por ellos posteriormente.
Este problema es particularmente acuciante en el caso de las tecnologías emergentes, donde además algunas empresas suelen resistirse activamente a la reglamentación usando sus propios grupos de presión, o simplemente ocupando el espacio vacío de regulación estableciendo normas de facto mediante sus propias prácticas.
Por todo lo anterior, los responsables políticos están empezando a adoptar algunos enfoques alternativos para la elaboración de políticas públicas en el entorno tecnológico. Entre estas alternativas destaca el auge de los laboratorios de innovación en políticas públicas, cuyo principal objetivo es el de ofrecer una herramienta que facilite la creación ágil de dichas políticas garantizando la orientación al interés público al mismo tiempo que permite la innovación y el desarrollo de las empresas.
¿Qué es un laboratorio de políticas públicas?
Un laboratorio de políticas —o Policy Lab en inglés— es un espacio en el que los distintos grupos interesados son invitados a trabajar en conjunto aportando cada uno sus competencias particulares para encontrar soluciones a problemas comunes. Para ello se trabaja mediante un proceso abierto e iterativo en el que se experimenta con las posibles soluciones que se vayan encontrando, pero manteniendo un foco permanente en las necesidades y expectativas de los individuos afectados. El trabajo de estos laboratorios se basa en la evidencia para abordar cuestiones que resultan de particular relevancia social, a menudo en áreas muy dinámicas y en pleno crecimiento como por ejemplo la tecnología, el cambio climático o las finanzas.
Así pues, los laboratorios de políticas se están convirtiendo en mecanismos cada vez más populares para trazar puentes entre expertos, administración pública y sociedad, y poder así resolver los desafíos pendientes aprovechando a su vez las oportunidades que ofrecen las áreas de conocimiento emergentes. Este tipo de laboratorios han estado floreciendo de forma profusa últimamente, tanto en Europa como en Estados Unidos. Los laboratorios de políticas tecnológicas en particular tienen como objetivo hacer avanzar las políticas aplicables en el sector tecnológico a través de la investigación, la educación y el co-liderazgo de pensamiento, consiguiendo así restablecer la confianza en los mecanismos de diseño y decisión necesarios para que dichas políticas tengan éxito. Algunos ejemplos actuales son:
- El Laboratorio de Políticas Tecnológicas de la Universidad de Washington centrado en la Inteligencia Artificial y que influye tanto en la legislación estatal como en la federal.
- El Laboratorio de Políticas de Tecnologías Digitales, de la University College London (UCL), cuyos proyectos actuales abordan el Internet de las Cosas y la privacidad online.
- El Laboratorio de Políticas de la Unión Europea, de la Comisión Europea, que experimenta con el diseño de servicios en áreas temáticas prioritarias para la UE —como la economía compartida, las tecnologías blockchain o la salud.
Laboratorios de políticas de datos abiertos
Dentro de los laboratorios de políticas tecnológicas es también frecuente encontrar algunos especializados en temáticas más específicas, como es el caso de los Laboratorios de Políticas de Datos Abiertos. El objetivo en este caso es apoyar a los responsables de la toma de decisiones en su labor de acelerar la reutilización y el intercambio responsable de datos en beneficio de la sociedad y la difusión equitativa de las oportunidades sociales y económicas asociadas a esos datos.
Un claro ejemplo lo tenemos en el Open Data Policy Lab, puesto en marcha recientemente por Microsoft y el GovLab con el objetivo de ayudar a los organismos gubernamentales de todos los niveles a identificar las mejores prácticas para mejorar la disponibilidad, la reutilización y la utilidad de los datos que gestionan —desde la elaboración de modelos legislativos eficaces hasta la forma en la que abordar el reto de identificar y publicar conjuntos de datos de alto valor necesarios para ayudar a hacer frente a los desafíos críticos de la sociedad.
Su labor consiste en facilitar la colaboración entre los gobiernos, el sector privado y la sociedad para abordar una serie de obstáculos que actualmente se interponen en el camino del acceso a los datos de forma responsable —entre ellos la ausencia de un modelo de gobernanza propicio, la falta de capacidad interna o el acceso limitado a los conocimientos y recursos externos. Para ello el Open Data Policy Lab se centra en cuatro actividades principales:
- Análisis: mediante investigaciones para identificar las mejores prácticas en el campo de los datos abiertos e informar sobre el desarrollo de iniciativas de datos que contribuyan al desarrollo económico y social.
- Guía: desarrollando metodologías, directrices, conjuntos de herramientas y otros materiales que sirvan para facilitar un intercambio de datos más eficaz y fomentar la toma de decisiones basada en los datos a la hora de abordar cuestiones de política pública.
- Redes comunitarias: construyendo una comunidad de gestores de datos y responsables de la toma de decisiones en los sectores público y privado para compartir conocimientos, llevar a cabo una labor de colaboración y estimular el intercambio de datos.
- Acción: identificando los desafíos clave de la sociedad que puedan beneficiarse de la apertura de datos y a implementar iniciativas de prueba de concepto que demuestren cómo aprovechar el poder de los datos abiertos para resolver esos retos.
En definitiva, los laboratorios de políticas públicas son herramientas prometedoras que pueden contribuir definitivamente a dar el paso hacia la esperada tercera ola en el movimiento de los datos abiertos, ya que cuentan con todos los elementos necesarios para afrontar y dar solución de forma ágil a las limitaciones en los modelos de gobernanza de datos actuales mediante una apertura respetuosa con los datos, basada en los intereses públicos y construida sobre la acción colaborativa.
Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.