Datos abiertos en tiempo real

Fecha de la noticia: 21-05-2019

datos aeropuerto tiempo real

Nuestro mundo es dinámico. Las cosas ocurren cuando ocurren. Nuestra vida es en tiempo real y las trazas digitales que dejamos en forma de datos también lo son.

Introducción

Hablamos comúnmente de datos en tiempo real cómo aquellos datos que se actualizan o cambian con una frecuencia relativamente alta. El término datos en tiempo real es más controvertido de lo que parece. No existe una definición exacta y unívoca de lo que significa en tiempo real. Cuantificar este término depende totalmente del caso de uso de explotación de datos que estemos hablando. Por ejemplo, la empresa VISA tiene una capacidad de procesamiento de más de 24.000 transacciones por segundo y registra una media de 150.000 transacciones al día. Por lo tanto, un sistema de procesamiento de datos en tiempo real para VISA es un sistema capaz de reaccionar a cambios de 24 transacciones en un milisegundo. Sin embargo, un sistema de tiempo real para una aplicación de predicción meteorológica (no crítica, en contraposición a otras aplicaciones que sí dependen críticamente de la predicción meteorológica como el tráfico aéreo o competiciones deportivas como la F1), tiene frecuencias de actualización de los datos del orden de entre 15 y 60 minutos. En resumen, la definición de tiempo real depende del caso de uso o aplicación que consuma y utilice los datos.

A continuación vemos dos ejemplos prácticos de consulta y consumo de datos en tiempo real publicados en repositorios de datos abiertos.

Ejemplo de consumo de datos en tiempo real. Sistema de bike-sharing de la ciudad de Santander.

En el repositorio de datos abiertos datos.gob.es encontramos multitud de conjuntos de datos abiertos y reutilizables. Algunos de éstos tienen una frecuencia de actualización alta y pueden considerarse datos en tiempo real para el propósito de este ejemplo.

En este caso, vamos a consultar los datos del estado de alquiler de bicicletas públicas en la ciudad de Santander. Un usuario podría querer consultar estos datos a través de una aplicación móvil o web para encontrar una bicicleta libre cerca de su posición. La frecuencia de actualización de este conjunto es de 2 minutos. A través del buscador en el catálogo de datos de datos.gob.es obtenemos 2 conjuntos de datos necesarios para desarrollar la aplicación que muestre el estado de las bicicletas libres en tiempo real.  

  • Un conjunto de datos disponible en esta URI (Unique Resource Identtifier) http://datos.santander.es/api/rest/datasets/tusbic_puestos_libres.json nos proporciona el estado de bicicletas libres en cada estación de bicicletas. Las estaciones de bicicletas, físicamente repartidas por la ciudad, aparecen en este conjunto de datos con un identificador numérico.

  • El segundo conjunto de datos, nos describe las estaciones de bicicletas, relacionando cada identificador numérico del primer conjunto con unos metadatos descriptivos, como su localización geográfica, su descripción, el número total de bicicletas que se pueden aparcar, etc. La URI del segundo conjunto de datos es http://datos.santander.es/api/rest/datasets/tusbic_estaciones.json

Una vez que estamos listos para acceder a estos dos conjuntos de datos, podemos utilizar nuestro lenguaje de programación favorito (en mi caso R) para leer los datos, procesarlos y combinar ambos conjuntos en uno que proporcione las bicicletas libres en cada estación identificada por su ubicación geográfica dentro de la ciudad. Superponiendo estos datos sobre un mapa obtenido de alguno de los servicios gratuitos y abiertos disponibles en Internet obtenemos nuestro mapa.

La escala de colores indica el rango de bicicletas libres en cada estación. Rojo, significa que quedan 5 bicicletas o menos libres en esa estación. El color naranja indica que quedan entre 6 y 10 bicis libres. El color verde indica que quedan más de 10 bicis libres en esa estación.

Cada vez que se ejecuta este programa simple se obtiene la información más reciente publicada por el Ayto. de Santander.

Ejemplo de consumo de datos en tiempo real internacional. Calidad del Aire en Europa.

La Agencia Medioambiental Europea (EEA) pone a disposición de los usuarios toda su base de datos de carácter medioambiental. Además de poner a disposición los datos (crudos) en diferentes formatos, la Agencia también suministra herramientas gráficas para la visualización y el análisis. El siguiente ejemplo muestra una aplicación en la que, sobre un mapa geográfico, se muestran las estaciones de medida y control de la calidad del aire. La escala de colores muestra la concentración de un contaminante en aire. En este caso, se muestra la concentración (en ug/m3) de PM10 (partículas contaminantes de diámetro inferior a 10 micrómetros). Los datos se actualizan con una frecuencia de 1h aunque su publicación puede acumular retrasos de hasta varias horas.

https://www.eea.europa.eu/data-and-maps/explore-interactive-maps/up-to-date-air-quality-data#tab-based-on-data

Las aplicaciones que usan datos en tiempo real son innumerables y no dejan de crecer a medida que la sociedad, los organismos públicos y las empresas digitalizan sus procesos. Las habilidades digitales para consultar, extraer y analizar datos en tiempo real son algunas de las más importantes. Desde científicos a periodistas, pasando por artistas y tecnólogos, ninguna de estas profesiones puede prescindir de contar entre sus equipos con personas especialistas en estas materias.

 


Contenido elaborado por Alejandro Alija,experto en Transformación Digital e Innovación.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.