Argitalpen data 30/06/2026
Ilustración 3D abstracta sobre big data, inteligencia artificial, aprendizaje automático y análisis de datos.
Azalpena

Vivimos en la era de la digitalización y de la datificación. Cada vez se generan más datos y observamos el mundo a través de ellos. Imágenes satelitales, datos de telefonía móvil, transacciones comerciales, sensores ambientales o redes sociales son algunos ejemplos de fuentes de información que sirven para responder a preguntas de interés público, en ámbitos como la salud, el medio ambiente, la planificación espacial o la producción alimentaria, entre otros.

El Open Data Policy Lab de la Universidad de Nueva York lleva años documentando este fenómeno como parte de lo que denomina la “Tercera ola de los datos abiertos”, un movimiento hacia un dato abierto orientado a propósitos concretos, que amplía su alcance al sector privado y que pone el foco en un uso responsable de la información. En su blog, el laboratorio recopila periódicamente ejemplos recientes de cómo investigadores, administraciones y organizaciones internacionales están aprovechando estos datos no tradicionales en diversos campos.

¿Qué son los datos no tradicionales?

Un artículo publicado en el Centre for Digital Development de la Universidad de Manchester define los datos no tradicionales (o non-traditional data, NTD) como aquellos capturados, mediados u observados mediante tecnologías digitales y que, en muchos casos, son generados por empresas privadas o plataformas tecnológicas. Este tipo de datos suelen surgir como subproductos de otra actividad cotidiana o proceden del funcionamiento de infraestructuras digitales: una llamada de teléfono, una compra en el supermercado, una publicación en una red social o el paso de un satélite sobre el territorio. Entre sus características destacan que ofrecen información de forma continua y con un elevado nivel de detalle geográfico.

Este término se suele usar en contraposición al de datos tradicionales, que son datos recopilados de forma deliberada mediante metodologías estandarizadas y procesos de medición consolidados, como los censos oficiales, las encuestas estadísticas o los registros administrativos. Estos datos suelen tener una periodicidad más baja, una estructura muy definida y una finalidad explícita: describir fenómenos sociales, económicos o demográficos con altos niveles de control y validación.

Ambos tipos de datos son de gran valor, pero su combinación hace que su potencial se multiplique. Gracias a su análisis conjunto se pueden capturar mejor cambios rápidos o patrones finos del comportamiento social.

A continuación, profundizamos en tres ejemplos recientes recogidos por el Open Data Policy Lab, que muestran cómo se están aplicando los datos no tradicionales en ámbitos muy distintos, con consecuencias tangibles para la sociedad.

Salud pública: tarjetas de fidelidad para detectar señales tempranas de cáncer

Uno de los ejemplos más singulares de uso de datos no tradicionales en el ámbito sanitario es la reutilización de los datos de tarjetas de fidelización comercial para investigar si los hábitos de compra pueden anticipar un diagnóstico de cáncer.

Un equipo de investigación del Imperial College London está utilizando datos de tarjetas de fidelización de dos cadenas británicas de supermercados, con el consentimiento de unos 3.000 participantes, para analizar si los patrones de compra, especialmente de medicamentos sin receta, cambian antes de que se produzca un diagnóstico de cáncer. Los investigadores compararon los hábitos de compra de personas con cáncer frente a personas sanas, lo que les permitió identificar cambios sutiles de comportamiento previos al diagnóstico.

Estudios anteriores ya habían mostrado que los patrones de compra podían anticipar un diagnóstico de cáncer de ovario hasta ocho meses antes de que se confirmara clínicamente. Extender este enfoque a otros tipos de cáncer podría facilitar una detección más temprana, animando a las personas a buscar atención médica antes. Se trata de un claro ejemplo de cómo datos generados con fines puramente comerciales pueden aportar señales de salud que los sistemas tradicionales no captan por sí solos.

Movilidad: respuesta a alertas de evacuación por SMS

Un estudio publicado en diciembre de 2025 utilizó datos anonimizados de redes de telefonía móvil para analizar cómo responde la población ante alertas de evacuación por incendios forestales enviadas por SMS. Los investigadores monitorizaron la actividad de unos 580.000 dispositivos a intervalos de 15 minutos durante los incendios forestales de febrero de 2024 en Valparaíso, Chile. Para ello, utilizaron los cambios de conexión a las antenas de telefonía como indicador del movimiento de la población, y compararon estos patrones antes y después del envío de las alertas. Esta información se combinó con los registros de las propias alertas y con datos socioeconómicos para entender si la respuesta variaba según el tipo de comunidad.

El análisis mostró que las primeras alertas provocaban un movimiento de población claro, mientras que las alertas repetidas generaban una respuesta cada vez más débil. También se observó que las zonas de mayor renta respondían con más rapidez y que se producían desplazamientos incluso en áreas que no habían recibido la alerta de forma directa. Este tipo de evidencia puede ayudar a diseñar protocolos de aviso más eficientes y a anticipar cómo se comportará realmente la población durante una emergencia.

Medio ambiente: evaluación de la resiliencia al calor de los edificios con drones e imágenes de calle

El calentamiento global es una de las mayores preocupaciones a nivel mundial. Un estudio realizado en la ciudad de Dar es Salaam, en el delta del río Msimbazi, en Tanzania, utilizó imágenes captadas por drones y fotografías a nivel de calle para analizar qué características de los edificios influyen en la exposición al calor en entornos urbanos. Los investigadores combinaron estas fuentes visuales con datos de temperatura de superficie obtenidos por satélite y mapas de edificaciones. Entrenaron un modelo de inteligencia artificial capaz de extraer automáticamente atributos como el material de los tejados y las fachadas, la presencia de vegetación, la densidad edificatoria o la reflectividad de las superficies, y relacionarlos con los patrones térmicos observados.

El análisis permite identificar qué características del entorno construido contribuyen a reducir la exposición al calor, ofreciendo pautas útiles para el diseño urbano y la rehabilitación de edificios. Esta información resulta especialmente relevante en ciudades expuestas a un riesgo creciente de olas de calor, ya que facilita intervenciones más específicas y orientadas a proteger a la población vulnerable, en lugar de medidas generales aplicadas a escala urbana.

El potencial de combinar datos

Estos tres casos ilustran cómo los datos no tradicionales son especialmente útiles donde la medición convencional suele resultar lenta o demasiado agregada, ya sea para detectar señales tempranas de enfermedad, entender cómo responde realmente la población ante una emergencia o identificar qué edificios están más expuestos al calor.

En estos ejemplos, así como en otros que ha venido recogiendo el Open Data Policy Lab en los últimos años, el mayor potencial aparece cuando estos datos se combinan con fuentes de referencia ya existentes, como datos socioeconómicos, registros de temperaturas o mapas, que permiten validar e interpretar correctamente las señales detectadas.

A medida que este tipo de fuentes se consolida, también aumenta su incorporación a procesos de toma de decisiones públicas y privadas. En este contexto, cobran cada vez más importancia las cuestiones de gobernanza, como quién tiene acceso a los datos o cómo garantizar un uso responsable que proteja la privacidad de las personas. Resolver estos desafíos será clave para que el potencial de estas fuentes pueda generar valor de forma segura y confiable.

Estos ejemplos muestran que es posible extraer información realmente útil de los datos no tradicionales. Ahora el reto es construir los marcos de protección necesarios para hacerlo sin erosionar la confianza de quienes generan esos datos cada día.

Iruzkinak