Fórmulas para acelerar la colaboración en torno a los datos
Fecha de la noticia: 24-11-2021

Después de una etapa en la que los esfuerzos se centraron en liberar datos, principalmente del sector público, en unas condiciones en las que pudieran ser reutilizados para crear valor en sus diferentes formas (económico, social, cultural, etc.), estamos encontrando una creciente actividad en torno a la colaboración entre organizaciones para resolver grandes problemas utilizando datos. No existe aún un consenso en torno a estas iniciativas diversas, pero observamos que se van popularizando una serie de conceptos entre los que existen muchas similitudes y que tratan de caracterizar una realidad que se ha identificado como de gran importancia para el desarrollo de las estrategias de datos de gobiernos e instituciones.
Por ejemplo, la Comisión Europea ha introducido recientemente junto con los conceptos de espacios de datos e intermediarios de datos, el de “organización de gestión de datos con fines altruistas reconocida en la Unión” en su propuesta de Ley de Gobernanza de Datos. Esta figura, aún por desarrollar, estaría en relación con los mecanismos que se prevén para regular la cesión altruista de datos y tendría la posibilidad de inscribirse en un registro como mecanismo voluntario para reforzar la confianza de los usuarios.
El propio plan España Digital 2025, aunque no les da un nombre específico, prevé entre sus objetivos en materia de Economía de datos e Inteligencia Artificial la creación de mecanismos de colaboración fuerte entre el sector público y el privado, el impulso público a la compartición de datos y al desarrollo de proyectos faro para usar los datos tanto públicos como privados para el bien común. Todo ello entre las diferentes medidas para convertir a España en un referente en la transformación hacia una Economía del Dato.
Organizaciones gestoras de datos
Aunque el término pueda ser nuevo, y aún esté por consolidarse, las “organizaciones gestoras de datos” existen en los sectores público y privado y en el tercer sector desde hace mucho tiempo. Asumiendo que no es la mejor traducción posible y a falta de una denominación mejor en español, en el presente artículo vamos a referirnos como “organizaciones gestoras de datos” (del inglés “data institutions”) a aquellas “organizaciones cuyo propósito principal es la administración de datos en nombre de otros, a menudo con fines públicos, educativos o sin ánimo de lucro”. Esta definición es la que ha propuesto el Open Data Institute (ODI), que es el organismo que actualmente está liderando los esfuerzos más importantes para caracterizar este tipo de organizaciones y establecer un marco común para que podamos comunicarnos al respecto.
En la definición, el término "organización" podría interpretarse de diferentes formas: fundación, asociación, institución, organismo público o similar, ya que son múltiples las fórmulas que pueden adoptar según países y marcos jurídicos. Por otra parte, en la definición el término “administración de datos” se refiere a las actividades que conducen a recopilar, mantener y compartir datos y, por supuesto, a determinar quién tiene acceso a los datos, cómo se accede a los datos, con qué propósito y en beneficio de quién. Por tanto, las organizaciones gestoras de datos se situarían en la primera de las tres principales actividades que crean valor a partir de los datos en crudo y que de acuerdo con el propio son ODI:
- Administrar datos: recopilarlos, mantenerlos y compartirlos, esto es, las actividades propias de crear los conjuntos de datos, almacenarlos, curarlos o enriquecerlos y gestionar el gobierno y el acceso a los mismos.
- Crear información a partir de esos datos, en forma de productos y servicios, análisis y descubrimientos, o historias y visualizaciones. En este caso entraríamos en las primeras capas de la analítica de datos, esto es la analítica exploratoria, descriptiva y diagnóstica de los conjuntos de datos.
- Decidir qué hacer, tomando las decisiones con información que sirva para apoyar la experiencia y la propia comprensión del contexto. Dicho de otro modo, lo que se caracteriza en otros marcos como las fases más complejas y de mayor valor de la analítica de datos, esto es la analítica predictiva y prescriptiva.
Colaboraciones de datos
Desde GovLab, también se define la más conocida figura de las “colaboraciones de datos” (“data collaboratives”) como un conjunto de nuevas formas de colaboración, más allá del clásico modelo de asociación público-privada, en la que participantes de diferentes sectores, empresas, instituciones de investigación o agencias gubernamentales, intercambian sus datos para solucionar problemas de interés público. GovLab también pretende acelerar la creación y el uso de "colaboraciones de datos" con el fin de aprovechar el potencial de los datos para mejorar la vida de las personas. Un ejemplo de este tipo de colaboraciones podría ser Global Fishing Watch en el que Google, Oceana y Sky Truth unen datos, esfuerzos y recursos con el objetivo de detener la pesca ilegal rastreando el movimiento de más de 35.000 embarcaciones.
Algunos modelos de colaboración y gobernanza
Independientemente de los diferentes matices en las definiciones y sin ánimo de ser exhaustivos, podemos identificar algunos patrones en la forma en la que las diferentes fórmulas de colaboración interactúan entre ellas, con las personas y sus derechos sobre los datos. Estos modelos no se refieren al modelo de negocio, sino más bien a las diferentes formas en las que se establece la gobernanza sobre los datos:
- Las personas aportan sus datos a la organización y, caso por caso, las personas pueden optar por permitir que terceras partes accedan a esos datos. Un ejemplo de este modelo es HealthBank que permite a las personas subir sus historiales clínicos para compartirlos con médicos o "seres queridos", o los bancos de información de Japón que pretenden que los propios usuarios puedan rentabilizar económicamente sus datos.
- Las personas aportan sus datos a la organización y, caso por caso, las personas pueden elegir si esos datos se comparten con terceros como parte de conjuntos de datos agregados. Otra variante es la que se da cuando las decisiones sobre qué terceras partes pueden acceder se toman de forma colectiva. Un buen ejemplo de este último caso sería The Good Data, una especie de cooperativa que pretende vender datos de navegación por internet generados por sus usuarios donde ellos mismos pueden participar en la decisión de las normas.
- La organización provee una plataforma para recopilar o crear nuevos conjuntos datos con el trabajo voluntario de las personas. En esta categoría encontramos algunas plataformas ya muy consolidadas como OpenStreetMap que mantiene de forma colaborativa mapas gratuitos del mundo o la propia Wikipedia.
- La organización combina o enlaza datos de múltiples fuentes y proporciona información y otros servicios a aquellos que han contribuido con datos. En el sector marítimo, HiLo agrega datos generados por alrededor de 3.500 barcos en todo el mundo para generar análisis de riesgo y seguridad relacionados con accidentes marítimos.
- La organización actúa como guardián de los datos en poder de otras organizaciones. Por ejemplo, Social Science One de la universidad de Harvard trata de liberar datos generados por Facebook para el bien público permitiendo que estén disponibles para nuevas investigaciones en el ámbito de las ciencias sociales.
Aunque los límites entre los diferentes enfoques en muchos casos no están claros y algunos de los modelos pueden superponerse entre ellos, lo que parece claro es que se están explorando nuevas fórmulas para permitir que los datos se compartan de formas más flexibles e innovadoras, respetando la autonomía individual y generando beneficios sociales más amplios. Lo cual es una excelente noticia en un momento en que no podemos olvidar que las compañías más grandes del mundo por capitalización de mercado son empresas de tecnología que ofrecen servicios basados en la recopilación, el uso y el intercambio de datos. Gracias a las organizaciones gestoras de datos es posible avanzar hacia un futuro en el que los datos contribuyan de forma más decisiva a resolver grandes retos de la humanidad y no solo para crear valor privado.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.