4 ejemplos de proyectos de empresas privadas que apuestan por la compartición de datos en abierto
Fecha de la noticia: 04-01-2022

La Comisión Europea estima que la economía del dato -aquella cuyo modelo de negocio se basa en la explotación de datos para generar productos y servicios- alcanzará un valor de 550.000 millones de euros en la UE27 en 2025. Esta cifra significa que pasará de ocupar el 2,8% del PIB a suponer el 4%. Solo en nuestro país, se apunta que generará más de 50.000 millones de euros y 750.000 puestos de trabajo.
En el mismo informe, la Comisión también indica que, para alcanzar un escenario de crecimiento alto, es necesario que disminuya la concentración de los datos en manos de unos pocos y se apueste por políticas de compartición de datos que fomenten la innovación y el avance de la sociedad. Por ello, entre otras acciones, la Comisión lanzó el Support Centre for Data Sharing (SCDS), enfocado en investigar e informar sobre las prácticas de compartir datos y aquellos elementos que influyen en su éxito.
La compartición de datos impulsa la colaboración entre los investigadores, desarrolladores y creadores de productos y servicios, lo que puede dar lugar a nuevos e importantes descubrimientos, además de repercutir en la reputación positiva de las compañías que ceden datos. Las empresas empiezan a ser conscientes de esta situación, lo que está llevando a que cada vez veamos más ejemplos de iniciativas privadas de intercambio y compartición de datos. Esto afecta a organizaciones de todo tipo, incluyendo grandes empresas que atesoaran, gestionan o tienen acceso a grandes volúmenes de datos. Veamos algunos ejemplos de compartición:
HealthData 29
La Fundación 29, junto a Microsoft, ha puesto en marcha Health29, una plataforma para compartir conjuntos de datos abiertos para fines de investigación. En el proyecto también han participado Garrigues y la Cátedra de Privacidad y Transformación Digital de la Universidad de Valencia.
Las organizaciones que lo deseen se pueden registrar como publicadores y empezar a compartir datos anonimizados, garantizando la privacidad y seguridad. Actualmente hay 3 organizaciones publicadoras. Todas ellas comparten datos relacionados con la COVID-19:
- HM Hospitales comparte datos clínicos relacionados con el tratamiento del COVID-19, incluyendo diagnósticos, tratamientos, ingresos, pasos por UCI, pruebas diagnósticas por imagen, resultados de laboratorio, alta o deceso, entre otros.
- LaLiga provee datos relativos a pruebas PCR y de antígenos realizadas a los jugadores y al personal de los clubes de LaLiga Santander y LaLiga SmartBank.
- Sanitas, como parte de su proyecto Data4good, proporciona a los investigadores datos demográficos e información clínica (medicamentos, constantes vitales, información de laboratorios y diagnóstico) de los pacientes con COVID-19 que han sido ingresados en sus centros médicos.
Estos datos pueden utilizarse para comprender mejor el comportamiento de esta enfermedad y su tratamiento, pero también para realizar modelos predictivos de la evolución de la enfermedad o modelos epidemiológicos. Los investigadores que quieran acceder a estos datos necesitan rellenar una solicitud, que el publicador deberá aprobar.
En el contexto del proyecto también se ha creado una guía con el marco técnico y legal para crear un repositorio público de datos procedentes de los sistemas de salud.
Cabe destacar que Microsoft engloba esta acción en su iniciativa de impulso de la compartición de datos, Open Data Campaign, como nos explicó Belén Gancedo, Directora de Educación en Microsoft Ibérica, en esta entrevista.
Data for Good
Data for Good es el nombre que lleva la iniciativa de compartición de datos de Meta, la compañía de Mark Zuckerberg, antes llamada Facebook, igual que la red social -la cual sí mantiene el nombre-. Facebook cuenta con tres mil millones de usuarios. Data for Good pretende utilizar información anonimizada sobre esta comunidad para “ayudar a las organizaciones a prestar mejores servicios”.
En la web se ofrecen diversos datos y herramientas, incluyendo mapas. También cuenta con una sección de impacto con ejemplos de uso de los datos. Mientras algunos productos requieren la firma de un acuerdo de intercambio de datos, otros son públicos y open source, como por ejemplo:
- High Resolution Settlement Layer: se trata de un mapa de densidad poblacional que utiliza datos censales, imágenes satelitales y algoritmos de machine learning para detectar estructuras. Ha sido utilizado, por ejemplo, para analizar el acceso a centros de salud en España.
- Movement Range Maps: consiste en un mapa con datos de movilidad actualizados diariamente (aquí hay un artículo sobre la metodología). Han sido utilizados por gobiernos y agencias alrededor del mundo para medir los efectos de las restricciones en movilidad durante la pandemia de COVID-19 o el nivel de actividad económica.
- Social Connectedness Index: mapa que mide los niveles de amistad en Facebook entre países y regiones en el mundo. Este índice ayuda a predecir patrones económicos, de migración o salud, entre otros. Ha sido utilizado por la Universidad de Nueva York, por ejemplo, para predecir intercambios comerciales entre unidades geográficas en Europa.
- Commuting Zones: mapea las áreas donde vive y trabaja la ciudadanía, en base a traslados, y utilizando algoritmos de machine learning. Esta información solo es accesible, de momento, para instituciones académicas, think-tank u ONGs.
Además, también ofrecen resultados de encuestas sobre el impacto económico en Pymes alrededor del mundo, el cambio climático, la igualdad en el hogar o las tendencias e impacto de la COVID-19 .
Estas herramientas están también disponibles a través del Humanitarian Data Exchange Portal de la Organización de las Naciones Unidas.
Google Health
Google Health tiene el objetivo organizar la información de salud del mundo y hacerla universalmente accesible y útil. Dentro del proyecto se ofrecen tanto servicios para todos los usuarios, como específicos para médicos.
En la parte de servicios generales, podemos encontrar:
- Repositorio de datos abiertos de COVID-19. Agrega datos de más de 20.000 fuentes para ayudar a conocer mejor el comportamiento del virus. Los usuarios pueden descargar los conjuntos de datos sin procesar o visualizarlos a través de mapas y tablas.
- Google Health Studies. Los usuarios pueden unirse a estudios y responder encuestas para ayudar a instituciones e investigadores a comprender mejor los problemas y las necesidades sanitarias específicas de una comunidad. Los datos particulares se encriptan para su posterior agregación y análisis de tal forma que ni Google ni los investigadores reciben ningún dato privado.
Google también desarrolla soluciones tecnológicas dirigidas a mejorar la atención médica. Uno de los campos donde están más enfocado es en los trabajos con Inteligencia Artificial con distintos fines como ayudar a diagnosticar el cáncer o prevenir la ceguera.
Uber Movement
La empresa de movilidad Uber también proporciona datos y herramientas, en este caso, para comprender cómo y por qué se mueven los ciudadanos. A través de la web Uber Movement se pueden visualizar, filtrar y descargar datos gratuitos, agregados y anonimizados de viajes realizados a través de su app. El servicio solo está disponible de momento para algunas ciudades, entre las que se encuentran Madrid y Barcelona.
En concreto cuenta con 3 servicios de datos:
- Travel Times. Proporciona el tiempo medio de viaje entre dos "zonas" de una ciudad para una hora y fecha determinadas.
- Speed. Ofrece datos sobre la velocidad media derivada de las lecturas de vehículos que proporcionan los servicios de Uber, agregadas por segmentos de calles y con una granularidad horaria.
- Mobility HeatMap. Se trata de un mapa de calor que muestra la densidad del tráfico en distintas zonas de cada ciudad.
Gracias a estos datos se pueden comparar los tiempos de traslado y comprender el impacto de diversos eventos en la ciudad. Son de gran utilidad para la toma de decisiones relacionadas con los retos del transporte urbano, desde reducir los embotellamientos y las emisiones hasta mejorar la seguridad vial. Todos los datos están disponible a través de una visualización interactiva, aunque también se puede descargar en formato CSV. Estos datos cuentan con una licencia Creative Commons, Attribution Non-Commercial.
En definitiva, estamos ante 4 ejemplos diferentes de compartición de datos, pero con un fin común: impulsar avances en la sociedad a través de la mejora del conocimiento. Todos estos datos son fundamentales para impulsar nuevas investigaciones, mejorar la toma de decisiones e incluso generar nuevos productos y servicios.
Contenido elaborado por el equipo de datos.gob.es.