Para poder extraer todo el valor de los datos, es necesario clasificarlos, filtrarlos y cruzarlos mediante procesos de analítica que nos ayuden a sacar conclusiones, convirtiendo los datos en información y conocimiento. Tradicionalmente la analítica de datos se divide en 3 categorías:
-
Analítica descriptiva, que nos ayuda a entender la situación actual, qué ha pasado para llegar hasta ella y por qué se ha producido.
-
Analítica predictiva, cuyo objetivo es anticipar hechos relevantes. Es decir, nos cuenta qué va a pasar para que un ser humano pueda tomar una decisión.
-
Analítica prescriptiva, donde se proporciona información sobre las decisiones más acertadas en base a una serie de escenarios futuros. Es decir, nos indica qué hacer.
El tercer informe de la serie “Awareness, Inspire, Action” se centra en el segundo estadio, el de la Analítica predictiva. Para ello sigue la misma metodología que los dos informes anteriores, dedicados a la Inteligencia Artificial y el Procesamiento del Lenguaje Natural.
La analítica predictiva nos permite responder preguntas de negocio como ¿sufriremos una rotura de stock? ¿Bajará la cotización de una determinada acción? O ¿Nos visitarán más turistas el próximo puente? En base a esta información las empresas pueden definir su estrategia de negocio, y los organismos públicos elaborar políticas que respondan a las necesidades de los ciudadanos.
Tras una breve introducción que contextualiza la materia a tratar y explica la metodología, el informe, elaborado por Alejandro Alija, se desarrolla de la siguiente manera:
-
Awareness. En la sección Awareness se explican los conceptos clave, destacando los tres atributos de la analítica predictiva: el énfasis en la predicción, la relevancia para el negocio de los conocimientos resultantes y su tendencia a la democratización para extender su uso más allá de los usuarios especialistas y científicos de datos. En este apartado también se mencionan los modelos matemáticos de los que hace uso y se detallan algunos de sus hitos más importantes a lo largo de la historia, como el protocolo de Kyoto o su utilidad para detectar la fuga de clientes.
-
Inspire. La sección Inspire analiza algunos de los casos de uso de la analítica predictiva con más relevancia en la actualidad en tres sectores muy diferentes. Empieza con el sector industrial, donde se explica cómo funciona el mantenimiento predictivo y la detección de anomalías. Continua con ejemplos relativos a la predicción de precios y demanda, en la cadena de distribución de un supermercado y en el sector energía. Y finaliza con el sector salud y el diagnóstico aumentado de imagen médica.
-
Action: En la sección Action se desarrolla de forma práctica un caso de uso concreto, utilizando para ello datos y herramientas tecnológicas reales. En este caso el conjunto de datos seleccionado es accidentes de tráfico en la ciudad de Madrid, publicado por el Ayuntamiento de Madrid. A través de la metodología recogida en la siguiente figura, se explica de manera sencilla cómo utilizar técnicas de análisis de series temporales para modelar y predecir el número de accidentes en los meses futuros.

El informe finaliza con la sección Última parada, donde se recopilan cursos, libros y artículos de interés para aquellos usuarios que quieran seguir avanzando en la materia.
En este vídeo, su autor te cuanta más sobre el informe y la analítica predictiva.
A continuación, puedes descargarte el informe completo en pdf y word (versión reutilizable), así como acceder al código utilizado en el ejemplo de Action en este enlace.
La pandemia originada el pasado año ha supuesto un cambio significativo en la forma que teníamos de ver el mundo y relacionarnos con este. En lo que al sector educativo se refiere, alumnos y docentes de todos los niveles se han visto obligados a tener que cambiar la metodología de enseñanza y aprendizaje presencial por un sistema telemático.
En este contexto, desde el marco de la Iniciativa Aporta se ha desarrollado el estudio “Tecnología educativa basada en datos para mejorar el aprendizaje en el aula y en el hogar”, realizado por José Luis Marín. Este informe ofrece diversas claves para reflexionar acerca de los nuevos retos y desafíos que plantea esta situación y que se pueden convertir en oportunidades si conseguimos introducir cambios que fomenten la mejora del proceso de enseñanza-aprendizaje más allá de solamente sustituir las clases presenciales por formación en línea.
La importancia de los datos para mejorar el sector educativo
A través de una tecnología educativa innovadora basada en datos e inteligencia artificial se pueden abordar algunos de los desafíos a los que se enfrenta el sistema educativo. Para este informe se han seleccionado 4 de estos retos:
- Supervisión no presencial de pruebas de evaluación: monitorización y vigilancia de pruebas evaluativas a través de recursos telemáticos.
- Identificación de problemas de comportamiento o atención: alerta a los docentes sobre actividades y conductas que indiquen problemas de atención, motivación o comportamiento.
- Programas formativos personalizados y más atractivos: adaptación de las rutas y el ritmo de aprendizaje de los alumnos.
- Mejora del rendimiento en exámenes estandarizados: uso de plataformas de aprendizaje en línea para mejorar resultados en pruebas estandarizadas, para reforzar el dominio de un tema en particular y para conseguir una evaluación más justa e igualitaria.
Para abordar cada uno de estos cuatro retos, se propone una sencilla estructura dividida en tres apartados:
- Descripción del problema, que nos permite poner el desafío en contexto.
- Análisis de algunos de los enfoques basados en el uso de datos e inteligencia artificial que se utilizan para ofrecer una solución tecnológica al reto en cuestión.
- Ejemplos de soluciones o experiencias relevantes o altamente innovadoras.
El informe también destaca la enorme complejidad que entraña este tipo de cuestiones, por lo que deben abordarse con cautela para evitar consecuencias negativas sobre los individuos, como pueden ser problemas de ciberseguridad, invasión de la privacidad o riesgo de exclusión de algunos colectivos, entre otros. Para ello, el documento finaliza con una serie de conclusiones que convergen en la idea de que el mejor camino para generar mejores resultados para todos los estudiantes, aliviando desigualdades, es combinar excelentes docentes y excelente tecnología que aumente sus capacidades. En este proceso los datos abiertos pueden jugar un papel aún más relevante para mejorar el estado del arte en tecnología educativa y asegurar un acceso más generalizado a determinadas innovaciones que en gran medida están basadas en tecnologías de aprendizaje automático o inteligencia artificial.
En este vídeo, su autor nos cuenta más sobre el informe:
El año 2020 se ha cerrado con el anuncio de los proyectos ganadores de dos concursos que buscaban impulsar la reutilización de datos abiertos en dos Comunidades Autónomas: Castilla y León y Euskadi.
Proyectos ganadores del IV Concurso de datos abiertos de la Junta de Castilla y León
Al igual que otros años, la última edición del concurso de datos abiertos de la Junta de Castilla y León tuvo como objetivo el apoyo y reconocimiento a proyectos que suministrasen cualquier tipo de idea, estudio, servicio, sitio web o aplicaciones para dispositivos móviles, sirviéndose para ello de los conjuntos de datos del Portal de Datos Abiertos de la Junta de Castilla y León.
En total, han sido ocho los proyectos vencedores divididos en diferentes categorías que quedan de la siguiente manera:
Categoría ideas
Esta categoría esta dirigida a aquellos participantes que cuentan con una gran idea a pesar de no tener la capacidad técnica, el tiempo y los recursos necesarios para ejecutarla.
- El primer premio fue otorgado a Cristina Pérez Fernández y César González Palomo. Su proyecto Castilla y León en remoto presenta un buscador de “la población ideal” para aquellos profesionales que trabajan en remoto y desean trasladarse a un lugar que les ayude a satisfacer sus deseos de cambio de estilo de vida. Basándose en las preferencias personales de cada usuario, el buscador ofrece las posibilidades que mejor se adaptan a sus necesidades y deseos. Para ello, explota datos como la de disponibilidad de cobertura 4G y/o fibra óptica, número de habitantes de la “población ideal”, distancia a lugares de interés, actividad cultural, entorno natural o precio medio del alquiler/compra por metro cuadrado.
- El segundo premio recayó en manos de Juan Carlos Solís Méndez por su proyecto CyL Movilidad. Han llevado a la práctica su idea a través de una primera versión de una web que reúne toda la información recopilada sobre los establecimientos de la comunidad autónoma que se encuentran adaptados a personas de movilidad reducida. Se trata, sin duda, de una idea con un claro valor social ya que favorece la mejora de la calidad de vida de un colectivo vulnerable.
Categoría productos y servicios
En esta categoría se buscaban proyectos que proporcionasen estudios, servicios, sitios web o aplicaciones para dispositivos móviles, que utilizasen conjuntos de datos del Portal de Datos Abiertos de la Junta de Castilla y León y que estuvieran accesibles para toda la ciudadanía vía web mediante una URL.
- El primer premio fue para el proyecto Escovid19data, una recopilación colaborativa de visualizaciones y datos reutilizables de COVID-19 por provincias en España. Este proyecto ayuda a mejorar los datos e informaciones publicadas por la Administración y fomenta que la ciudadanía tome mayor conciencia del grave problema al que nos enfrentamos.
- El segundo premio fue a parar al proyecto Castilla y León Gurú, un asistente basado en un bot conversacional en Telegram que ofrece a los usuarios información turística, cultural y de ocio de la comunidad.
- El premio estudiantes recayó en TurisCyL, una app para móviles Android que sirve como guía de viaje de la comunidad autónoma al ofrecer toda la información posible sobre lugares turísticos (restauración, alojamientos, etc.), así como de museos o eventos culturales.
Categoría Recurso Didáctico
Dentro de esta sección, se fomenta la creación de recursos didácticos abiertos innovadores (con licencias Creative Commons), que sirvan de apoyo a la enseñanza.
- El premio de esta categoría recayó en el proyecto Casual Learn, una aplicación para dispositivos móviles Android que permite aprender historia del arte a partir de los edificios y espacios públicos de Castilla y León. La app sugiere tareas de aprendizaje teniendo en cuenta los intereses y la localización del usuario. Por ejemplo, si el usuario pasa cerca de una iglesia gótica, Casual Learn puede sugerirle tomar una foto a su frontispicio y compararlo con el de una iglesia románica cercana.
Categoría Periodismo de Datos
Esta categoría premia piezas periodísticas relevantes publicadas o actualizadas en cualquier soporte, ya sea escrito o audiovisual.
- El primer premio de esta sección se lo llevó Cobertura sobre las pruebas diagnósticas del coronavirus en España, una recopilación de datos y reportajes sobre la falta de recursos y la transparencia en la realización de pruebas diagnósticas de la COVID-19.
- El segundo premio recayó en Así ha afectado el coronavirus en las residencias de Castilla y León, un extenso artículo periodístico sobre la situación vivida en las residencias de Castilla y León al inicio de la pandemia.
Ganadores de los Concursos de Ideas y Aplicaciones Open Data Euskadi 2020
Otros de los desafíos que se resolvieron al cierre del año, fueron los concursos de Ideas y de Aplicaciones de Datos Abiertos de Euskadi, con el objetivo de dar a conocer y fomentar la reutilización de datos abiertos en la región, organizados por el Gobierno Vasco junto con las Diputaciones Forales de Álava, Bizkaia y Gipuzkoa y los ayuntamientos de Bilbao, Donostia-San Sebastián y Vitoria-Gasteiz.
Proyectos ganadores del Concurso de Ideas Open Data Euskadi 2020
El Concurso de Ideas está dirigido tanto a particulares como a empresas que deseen presentar “ideas para crear productos o servicios derivados de datos abiertos de los principales catálogos de datos públicos de Euskadi”. La tercera edición admitió 30 candidaturas, de las que fueron premiadas dos:
- El primer premio de esta categoría recayó en el proyecto Servicio de Pronóstico de Polen Estacional de Euskadi, de Ortzi Torices Roldán y Hodei Goncalves Barkaiztegi. Se trata de una propuesta de creación de una red neuronal para pronosticar niveles de polen en Euskadi y ofrecer un servicio público para las personas que padecen alergias y afecciones respiratorias.
- Por su parte, el segundo premio fue para el proyecto Ongi etorri Euskal Herrira, de Iker Díez Arancibia y Alberto Nieto de Pablos. En él, se propone una aplicación basada en la generación de planes que aglomeren las tipologías de actividades deseadas por cada turista en un espacio geográfico acotado. Ofrece al turista una representación gráfica de los diferentes planes que solicita y permite la reserva conjunta de las actividades que componen el plan.
Proyectos ganadores del Concurso de Aplicaciones Open Data Euskadi 2020
Por su parte, el Concurso de Aplicaciones está dirigido tanto a particulares como a empresas que hayan creado o deseen crear “productos o servicios derivados de datos abiertos de los principales catálogos de datos públicos de Euskadi”. De las 28 candidaturas admitidas, han sido premiadas las siguientes:
- El primer premio ha sido para Smart Public Tender, de Manuel José García Rodríguez, una plataforma web que incluye las últimas innovaciones en el campo de la contratación pública y que ayuda tanto a las administraciones públicas como a las empresas licitadoras en su toma de decisiones utilizando la metodología de Machine Learning.
- El segundo premio se otorgó a AvatarParking, de Unai Antero Urruticoechea y Beatriz Arenal Redondo. Es una aplicación que está pensada como asistente para aparcamientos en San Sebastián. Accediendo a la ubicación del usuario en tiempo real, indica el parking más cercano, número de plazas libres de las que dispone, posibles incidencias en el trayecto, así como una estimación del coste de dejar el coche ahí aparcado. La aplicación está pensada para llevar de forma activa en el móvil, y recibir información y comandos mediante voz, por lo que evita distracciones con el móvil durante la conducción.
¡Enhorabuena a todos los premiados!
Los datos abiertos son un recurso cada vez más utilizado para la formación de estudiantes de diferentes etapas del sistema educativo y para la formación continua de profesionales de todos los sectores. Y es que ya existen pocas dudas acerca de la creciente importancia que están adquiriendo todas las habilidades relacionadas con el análisis de datos y su tratamiento en relación con casi cualquier disciplina del conocimiento. Del mismo modo las habilidades relacionadas con la visualización y la construcción de relatos sobre la base de las conclusiones extraídas de cualquier análisis o modelado de datos son cada vez más necesarias para complementar y extender las siempre necesarias habilidades para comunicar y presentar resultados de cualquier tipo de trabajo.
En todo el proceso de formación de profesionales relacionados con la ciencia de datos y la inteligencia artificial, los datos abiertos constituyen un valioso recurso para adquirir experiencia práctica con las técnicas y herramientas habituales en la profesión. Sin embargo, también comienzan a apreciarse los efectos que tiene el uso de datos, habitualmente abiertos, sobre el aprendizaje de otras materias, en la adquisición de otro tipo de habilidades e incluso en la motivación de los estudiantes hacia el aprendizaje.
Ya en 2013 en una investigación que realizó una comparación cuantitativa detallada de diferentes enfoques educativos adoptados por 39 escuelas en Nueva York se demostró que el uso de datos para guiar el programa educativo era una de las cinco políticas principales que tenía efecto sobre la mejora del desempeño académico.
Aunque el uso de datos abiertos en el aula no se ha estudiado de forma amplia, por el momento las pocas investigaciones realizadas sugieren de entrada que existe una falta de conocimiento de los datos abiertos entre los educadores. Si bien no tenemos un conocimiento consolidado sobre el efecto del uso de los datos abiertos en contextos educativos ya que no son actualmente un recurso educativo generalizado, si parece existir un conjunto de educadores ‘early adopters‘ que hacen un uso sustancial de datos abiertos en sus programas de enseñanza.
La investigación “The use of open data as a material for learning” del Institute of Educational Technology se basa en el análisis cualitativo de la experiencia de un conjunto de estos educadores pioneros para extraer una serie de conclusiones sobre el valor que aporta el uso de datos abiertos en la enseñanza.
Uno de los puntos de partida es que los datos abiertos no parecen ofrecer metodologías educativas o pedagógicas completamente nuevas, sino que su uso complementa conceptos de enseñanza y aprendizaje existentes como el aprendizaje basado en investigación o en proyectos o la personalización del aprendizaje. Destacan dos conclusiones al respecto:
-
Los conjuntos de datos abiertos que se utilizan como parte de los proyectos de aprendizaje en cualquier materia normalmente son relevantes para el alumno, bien porque describen cuestiones de su entorno geográfico o social, o bien porque tienen relaciones con cuestiones relativas a la actualidad o a sus propias aficiones. La investigación pone de manifiesto que el mero uso de estos conjuntos de datos que despiertan la curiosidad del estudiante durante el aprendizaje de cualquier concepto tiene efectos positivos sobre la motivación de los estudiantes para profundizar en la materia y apreciar su utilidad.
-
El uso de conjuntos de datos abiertos ofrece la posibilidad de proponer actividades más avanzadas sin aumentar la dificultad del programa formativo. En la investigación se citan ejemplos que van desde el uso de datos abiertos para apoyar la formación en estadística de alumnos de bachillerato hasta el uso de bases de datos científicas abiertas en el área de la genómica para apoyar la enseñanza de conceptos de bioinformática. De este modo los alumnos pueden adquirir conocimientos y habilidades más avanzados que de otro modo probablemente sólo se habrían producido en el ámbito de la actividad profesional o que habrían sido descartadas por no disponer de tiempo suficiente en el programa. Este efecto, sobre todo en los niveles educativos superiores, además contribuiría a cerrar la brecha entre el sistema educativo y la práctica profesional.
Aunque aún no se ha estudiado su efecto, los concursos de datos abiertos son otro vehículo para canalizar la formación práctica de los estudiantes y para crear nuevos recursos educativos. Cada vez es más frecuente que desde universidades o escuelas de enseñanza secundaria se incentive como actividad dentro de algunas asignaturas la formación de equipos que participen en concursos de datos abiertos regionales o nacionales. Algunos concursos, como el concurso de datos abiertos de Castilla y León, incluso tienen una categoría especial con su correspondiente premio que está reservado para la participación de estudiantes.
En la misma línea, el Ayuntamiento de Barcelona lleva cuatro años organizando el Reto Barcelona Dades Obertes, que tiene como finalidad acercar los beneficios de los datos abiertos y promover su uso en los centros educativos de la ciudad. El reto mezcla la competición entre escuelas, que tienen que desarrollar un proyecto basado en datos, con un Plan de Formación específico sobre datos abiertos para el profesorado, para que puedan orientar a sus alumnos.
El hecho que no haya un uso más generalizado de conjuntos de datos abiertos en los programas educativos se puede atribuir a factores como la falta de formación del profesorado o a la dificultad para adaptar los datos existentes. La mayoría de los conjuntos de datos abiertos proceden de entornos profesionales como la investigación científica o la administración de los servicios públicos y es posible que los alumnos y los educadores no tengan la alfabetización o los recursos necesarios para aprovecharlos a pesar de que están surgiendo herramientas que simplifican algunas de las complejidades de trabajar con datos abiertos. En este sentido, una mayor relación y trabajo conjunto entre los educadores y los alumnos y los productores de conjuntos de datos también podría fomentar el despliegue de un mayor número de programas de aprendizaje.
Por ello son interesantes iniciativas como UDIT (Use Open Research Data In Teaching) iniciada en 2017 con el objetivo de fomentar y ayudar a los profesores de educación superior a incorporar datos de investigación abiertos y otros conceptos de la ciencia abierta a su docencia para mejorar el proceso de aprendizaje.
En la Carta Internacional de Datos Abiertos ya se reconoce la importancia de involucrase “con escuelas e instituciones de educación superior para respaldar una mayor investigación de datos abiertos y para incorporar la alfabetización de los datos en los programas educativos”. Y es que el valor de los datos abiertos en el proceso de aprendizaje no está aún lo suficientemente estudiado. Sirva como ejemplo que en el discurso habitual de la comunidad de datos abiertos se destaca siempre el potencial valor económico y social de la reutilización, pero no tanto el potencial de su uso en educación.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El ecosistema de datos abiertos regresó después del verano a pleno rendimiento. Durante estos meses de otoño han sido numerosas las iniciativas que han surgido para promover el uso, la reutilización y la difusión de los datos abiertos. Han sido semanas muy productivas, por lo que nos ha sido imposible recogerlas todas en un mismo post. Sin embargo, te presentamos una pequeña selección que seguro será de tu interés.
Herramientas y aplicaciones para acceder a un mayor número de datos abiertos
Comenzamos el repaso a las novedades que han surgido este otoño en el ecosistema de datos abiertos con las iniciativas que se han animado a poner a disposición de los usuarios datos públicos a través de distintas herramientas. Te presentamos algunas de ellas:
- La Diputación de Castellón ha presentado su observatorio de datos abiertos, una gran plataforma de información actualizada que incluye indicadores con las acciones llevadas a cabo por la Diputación para hacer frente a la COVID, un área de buenas prácticas, un apartado con información sobre el Consejo de Reutilizadores y el Portal de Datos Abiertos de la Diputación.
- El Ayuntamiento de Valencia ha renovado su Geoportal con la app Smart City, que muestra miles de datos abiertos de la ciudad en campos como movilidad, puntos wifi, jardinería, mercados, deportes o elementos culturales.
- La Universidad de Extremadura ha hecho público su nuevo portal de investigación. El portal recopila de forma automática la producción científica y de transferencia de los investigadores sin requerir esfuerzo del usuario.
- El Ayuntamiento de Ponferrada, junto con la empresa Rendytel, ha presentado un proyecto para medir la calidad del aire en espacios y edificios públicos mediante tecnología basada en dispositivos IoT, que aportan datos abiertos a todos los ciudadanos. A través de su móvil los usuarios pueden conocer el estado de aire y el nivel de ventilación en tiempo real y, por tanto, valorar el posible riesgo de contagio de la Covid- 19.
Aunque no se trata de una iniciativa nueva, queremos aprovechar la ocasión para resaltar que la Junta de Castilla y León ha recibido el Premio NovaGob Excelencia por su trabajo de transparencia a la hora de mostrar datos en su portal.
Ejemplos de reutilizaciones
¿Sabías que los organismos públicos, además de continuar abriendo su información, también siguen creando servicios y productos basados en su reutilización? Aquí tienes tres ejemplos de este otoño:
- La Universidad de Valladolid ha desarrollado la aplicación ‘Casual Learn’, que se basa en datos abiertos para ayudar a sus usuarios a aprender historia del arte. La aplicación sugiere tareas de aprendizaje teniendo en cuenta los intereses y la localización del usuario.
- Casual Learn ha sido uno de los proyectos ganadores de del IV Concurso de Datos Abiertos de Castilla y León, en este caso en la categoría de Recurso Didáctico. En la categoría Productos y Servicios el ganador ha sido “Escovid19data”, una recopilación colaborativa de datos de COVID-19 por provincias en España, mientras que “Castilla y León en remoto” se ha alzado con la primera posición en la categoría de ideas y “Cobertura sobre las pruebas diagnósticas del coronavirus en España” en la de periodismo de datos.
- El Ayuntamiento de Onda ha presentado una app que ofrece información sobre plazas libres de parking, estado del tráfico, parámetros ambientales o farmacias de guardia. Esta aplicación se encuadra dentro del proyecto Onda Smart City, un proyecto que resultó ser el ganador de la XII Convocatoria de los Premios Aslan, como ya informamos hace unos meses.
Además de los organismos públicos, también queremos destacar el trabajo realizado por los cuatro jóvenes vascos que han creado Dataseeds, una plataforma al servicio de las pymes agrícolas europeas para ofrecer una gran cantidad de datos abiertos y facilitar su evolución hacia una transición verde. Con su solución han quedado terceros en el reto “A European Green Deal” en el EU Datathon 2020.
Eventos, cursos y publicaciones que persiguen la difusión de los datos abiertos
Pero si por algo ha destacado el otoño ha sido por la gran cantidad de eventos, concursos, webinars y demás actividades encaminadas a la promoción del open data.
- Este otoño Asedie ha estrenado nuevo blog. Entre los contenidos que aborda destaca la transformación digital, la inteligencia artificial o los datos abiertos, siempre con el foco puesto en las empresas infomediarias.
- La Iniciativa Aporta acompañó a Databeers Málaga en su primera edición online, que este año estuvo dedicada a los datos abiertos de Copernicus. Si quieres conocer más sobre nuestra participación en esta jornada, puedes hacerlo aquí.
- La Cátedra Govern Obert impulsada por la Universidad Politécnica de Valencia, ha trasladado a los participantes en el Campamento de Otoño de Transparencia y Gestión de Datos, los fundamentos para la comprensión de conceptos vinculados a la gestión de datos abiertos. Además, la Comunidad Valenciana ha anunciado durante este periodo que formará en tecnologías de smart city a empresas y profesionales a través del proyecto ‘Ciudades conectadas y habitables’.
- Los datos abiertos no solo sirven para dar vida a aplicaciones, sino que también sirven para enriquecer trabajos periodísticos y literarios. La Generalitat de Catalunya ha publicado el libro “Los datos abiertos y la inteligencia artificial, herramientas para la igualdad de género”. Este escrito nos permite reflexionar acerca de cómo los datos abiertos también son un elemento clave en la lucha contra la discriminación de género.
- Los concursos de datos abiertos han sido una constante durante todo el otoño: el Desafío Aporta, el concurso de Datos abiertos de Euskadi, BiscayApp…
Algunas propuestas internacionales
A nivel internacional también han surgido algunas iniciativas muy interesantes durante este otoño.
- El Banco Mundial ha puesto en marcha un portal de datos abiertos sobre agua para ayudar a los países a tomar decisiones informadas que nos lleven a un mundo con seguridad hídrica.
- Durante estos meses, el Portal Europeo de Datos ha organizado diferentes webinars para abordar el futuro de los portales de datos abiertos, donde se han mostrado experiencias, buenas prácticas y oportunidades de acción para garantizar que los portales de datos abiertos sigan siendo útiles para la comunidad. La emisión de estos webinars se prolongará hasta enero.
- Terminamos con una noticia internacional, pero con un componente local. Bruselas adjudica a un consorcio español Yoda, su nuevo proyecto europeo basado en datos abiertos. Se trata del desarrollo de una plataforma para que cualquier ciudadano europeo cree su propio tablero personalizado donde ordenar diferentes fuentes de información conforme a sus intereses.
Estos son solo algunos de los ejemplos más destacados que han surgido en el mundo de los datos abiertos durante los meses de otoño de 2020. Sin embargo, si conoces alguna otra novedad que pueda ser de interés, no dudes en mencionarla en los comentarios o enviarnos un correo a dinamizacion@datos.gob.es.
El dicho “una imagen vale más que mil palabras” es un claro ejemplo de sabiduría popular basada en la ciencia. El 90% de la información que procesamos es visual, gracias a un millón de fibras nerviosas que unen el ojo con el cerebro y a más de 20.000 millones de neuronas que realizan el procesamiento de los impulsos recibidos a gran velocidad. Por ello somos capaces de recordar el 80% de las imágenes que vemos, mientras que en el caso del texto y el sonido los porcentajes se reducen al 20% y al 10%, respectivamente.
Estos datos explican la importancia de la visualización de datos en cualquier sector de actividad. No es lo mismo contar cómo evoluciona un indicador, que verlo a través de elementos visuales, como gráficos o mapas. La visualización de datos nos ayuda a comprender conceptos complejos y supone una manera accesible para detectar y comprender tendencias y patrones en los datos.
Visualización de datos y Smart cities
En el caso de las Smart cities, donde se genera y captura tanta información, la visualización de datos es fundamental. A lo largo y ancho de una ciudad inteligente, hay un gran número de sensores y dispositivos inteligentes, con diferentes capacidades de detección, que generan una gran cantidad de datos en bruto. Por poner un ejemplo, solo la ciudad de Barcelona, dispone de más de 18.000 sensores repartidos por toda la ciudad que captan millones de datos. Esto datos permiten desde la vigilancia en tiempo real del entorno hasta la toma de decisiones informada o la rendición de cuentas. Visualizar estos datos a través de cuadros de mando visuales agiliza todos estos procesos.
Para ayudar a las Smart cities en esta tarea, desde el proyecto Ciudades abiertas, liderado por Red.es y cuatro ayuntamientos (A Coruña, Madrid, Santiago de Compostela y Zaragoza), se han seleccionado una serie de herramientas de visualización y se ha desarrollado una extensión para CKAN similar a la funcionalidad “Open With Apps”, inicialmente ideada para el portal Data.gov, que facilita la integración con este tipo de herramientas.
El método de integración inspirado en “Open with Apps”
La idea tras “Open With Apps” es permitir la integración con algunos servicios de terceros, para algunos formatos publicados en los portales de datos abiertos, como por ejemplo CSV o XLS, sin necesidad de descargar y cargar datos manualmente, a través de las APIs o URIs del servicio externo.
Pero no todos los sistemas de visualización permiten esta funcionalidad. Por ello, desde el proyecto ciudades abiertas han analizado varias plataformas y herramientas online de creación de visualizaciones y análisis de datos, y han seleccionado 3 que cumplen con las características necesarias para el funcionamiento descrito:
-
La integración se realiza a través de enlaces a sitios web sin necesidad de descargar ningún software.
-
En la invocación sólo es necesario pasar como parámetro la URL de descarga del fichero de los datos.
El resultado de dicho análisis ha dado lugar al informe “Análisis y definición de especificaciones de integración con sistemas externos de visualización”, donde se destacan 3 herramientas que cumplen estas funcionalidades.
3 herramientas de visualización y análisis de datos sencillas
De acuerdo con el citado informe, las 3 plataformas que cumplen las características necesarias para lograr dicho funcionamiento son:
-
Plotly: facilita la creación de visualizaciones interactivas de datos y paneles de control para compartir en línea con la audiencia. Los usuarios más avanzados pueden procesar datos con cualquier función personalizada, así como crear simulaciones con scripts de Python. Los formatos que acepta son CSV, TSV, XLS y XLSX.
-
Carto: antes conocida como CartoDB, genera mapas interactivos a partir de datos geoespaciales. Los mapas se crean automáticamente y el usuario puede filtrar y refinar los datos para obtener más información. Acepta ficheros en formatos CSV, XLS, XLSX, KML (Google Earth), KMZ, GeoJSON y SHP.
-
Geojson.io: permite visualizar y editar datos geográficos en formato GeoJSON, así como exportar a un gran número de formatos.

Para cada una de estas herramientas el informe incluye una descripción de sus requisitos y limitaciones, su modo de uso, una llamada genérica y ejemplos concretos de llamadas junto con el resultado obtenido.
La extensión “Abrir con”
Como se mencionó anteriormente, dentro del proyecto también se ha desarrollado una extensión para CKAN denominada “Abrir con”. Esta extensión permite visualizar los ficheros de datos utilizando los sistemas externos de visualización antes descritos. Se puede acceder a ella a través de la cuenta de GitHub del proyecto.
El informe explica cómo llevar a cabo su instalación de manera sencilla, aunque si surge alguna duda acerca de su funcionamiento, los usuarios pueden ponerse en contacto con Ciudades abiertas a través del correo electrónico contacto@ciudadesabiertas.es.
Aquellos interesados en otras extensiones de CKAN relacionadas con la visualización de datos tienen a su disposición el informe Análisis de las Extensiones de Visualización para CKAN, realizado en el marco de la misma iniciativa. En la cuenta de Gighub, se espera que vayan publicando ejemplos de visualizaciones realizadas.
En definitiva, la visualización de datos es una pata fundamental de las Smart cities, y gracias al trabajo del equipo de Ciudades Abiertas ahora le resultará más fácil a cualquier iniciativa integrar soluciones sencillas de visualización de datos en sus plataformas de gestión de la información.
El cambio climático, la contaminación del aire y la contaminación del mar. Estos son los 3 principales problemas medioambientales para los ciudadanos españoles de acuerdo con el último Eurobarómetro “Attitudes of European citizens towards the Environment”, publicado en marzo de 2020. La encuesta también resalta que el 90% de la población española considera importante proteger el entorno natural. Los ciudadanos quieren que se tomen más medidas y creen que la responsabilidad debería compartirse entre las empresas, los gobiernos nacionales, la UE y los propios ciudadanos.
Al igual que sucede con otros sectores, como la educación o la sanidad, los datos abiertos también pueden ayudarnos a superar los retos relacionados con el medio ambiente. Por un lado, nos proporcionan información detallada para comprender la situación y poder buscar soluciones. Por otro, sirven para poner en marcha soluciones que nos ayuden a concienciarnos y disminuir nuestra huella ambiental.
En su informe “The Economic Impact of Open Data Opportunities for value creation in Europe”, el European Data Portal resalta que los datos pueden “contribuir a reducir el consumo total de energía en Europa, aumentar el uso de fuentes de energía sostenibles, proteger la biodiversidad y aumentar la conciencia sobre las emisiones de CO2”, así como generar un impacto económico de alrededor de 1.000 millones de euros. Veamos algunos ejemplos:
- Reducir del consumo energético. Las aplicaciones basadas en datos abiertos pueden servir de instrumento para ayudar a hogares e instituciones a conocer y reducir su consumo de energía. En este sentido, la Junta de Castilla y León ha puesto en marcha un Datahub energético que ofrece información detallada y visual sobre el consumo de energía en los más de 1.500 centros gestionados por la Junta: centros educativos, centros de salud, oficinas administrativas, hospitales, etc. El cuadro de mando facilita el análisis desagregado por tipo de energía (electricidad, gas, gasoil) y por localización geográfica, permitiendo tomar decisiones informadas. Según la propia Junta, gracias al cuadro energético han ahorrado más de 12 millones de euros en electricidad desde 2015.
- Aumentar el uso de energía sostenible. La directiva de la UE de 2018 sobre la promoción del uso de energía procedente de fuentes renovables establece el objetivo de que la proporción de energías renovables en el consumo final bruto sea del 32% para 2030. Para ayudar a alcanzar este objetivo, los datos públicos disponibles sobre urbanismo, uso de los servicios públicos o condiciones meteorológicas se puede cruzar para crear soluciones que ayuden a hacer las viviendas más sostenibles. Un ejemplo es Solarmap, que permite calcular la rentabilidad de una instalación de paneles solares en un lugar concreto.
- Mejorar la biodiversidad: Los cambios en los ecosistemas pueden generar extinciones masivas de especies y la limitación de los recursos naturales disponibles, que pueden afectar no sólo a nuestra economía si no a nuestra propia forma de vida. En este sentido, los datos abiertos sirven de base para soluciones que, por ejemplo, nos ayudan a monitorizar diversos parámetros de las aguas de los puertos (como Environmental Control Panel), mejorar la gestión de residuos (Punto limpio) o dar a conocer la contaminación acústica (MAdb).
- Crear conciencia sobre la contaminación del aire y la reducción de las emisiones de CO2. Aunque como hemos visto al principio de este artículo los españoles somos muy conscientes del cambio climático, sin embargo, si miramos los hábitos individuales de los ciudadanos, vemos que todavía queda mucho por hacer. Solo un 38% intenta reducir su consumo energético, un 28% elige formas de transporte menos contaminantes, y un 36% compra productos locales. Por ello es necesario seguir concienciando, por ejemplo a través de indicadores de la calidad del aire en la ciudades como GV Aire. Así mismo son necesarias aplicaciones que promuevan el uso de medios de transporte más eficiente, como las bicicletas o el transporte público (Barcelona metro bus rodalies bici).
Puedes encontrar más ejemplos en la sección de aplicaciones de datos.gob.es y en nuestra sección de medio ambiente.

En un portal de datos abiertos conviven una gran cantidad de fuentes de datos de distinta naturaleza, con diversos contenidos y formatos. Por ello es necesario proporcionar a cada archivo, recurso o contenido de la red, un contexto o definición que permita a las personas, y también a las máquinas, interpretar su significado. Es aquí donde entra el concepto de Linked data.
Linked Data o datos enlazados permite usar la web como una única gran base de datos global. Siguiendo este paradigma de publicación los datos quedan disponibles contextualizados e interconectados para su reutilización. Linked Data surgió a partir del proyecto de la Web Semántica inspirado por Tim Berners-Lee, padre de la Web, de la necesidad de introducir información de contexto en forma de metadatos en la Web.
El documento “LinkedData como modelo de datos abiertos” explica de forma breve los conceptos básicos para entender cómo funciona la web semántica y los datos enlazados, como es el caso de las URIs o identificadores únicos de recursos, las ontologías o los vocabularios que permiten describir relaciones entre ellos, para centrarse en cómo Aragón ha implementado estas tecnologías para desarrollar distintos servicios, como por ejemplo:
- La Estructura de Información Interoperable (EI2A), una ontología que homogeniza estructuras, vocabularios y características para dar respuesta a la diversidad y heterogeneidad de datos existentes dentro de la Administración, en el marco de Aragón Open Data. El documento explica algunas de las ontologías y vocabularios usados para el desarrollo.
- El Identificador Europeo de Legislación (ELI), que permite acceder online a la legislación en un formato formalizado que facilita su reutilización.
- La infraestructura semántica en Aragón Open Data, donde destaca el uso dela herramienta Virtuoso para el almacenamiento de los datos enlazados. El documento explica cuáles son las características de este servidor universal, cuya arquitectura permite la persistencia de datos en formatos RDF-XML, entre otros. Además, se explica cómo funciona el banco que almacena tripletas de forma nativa para la relación entre recursos y se muestran ejemplos de servicios de Aragón Open data que explotan dichas tripletas de datos como Aragopedia y Aragón Open Data Pool.
A continuación, puedes descargar el documento completo.
Este documento forma parte de la serie de materiales didácticos y artículos tecnológicos que está realizando Aragón open Data con el fin de explicar cómo han desplegado distintas soluciones para dar respuesta a las necesidades de localización, acceso y reutilización de los distintos conjuntos de datos. Puedes completar su lectura con otro volumen de la serie: “Cómo implementar CKAN: caso real del portal Aragón Open Data”.
Aragón Open Data es una de las iniciativas de datos abiertos más activas del panorama español. Además de la puesta en marcha, gestión y mantenimiento de un catálogo de datos interoperable, desde su inicio han llevado a cabo acciones para acercar la cultura de los datos abiertos a ciudadanos, empresas y todo tipo de organizaciones. Estas iniciativas abarcan el desarrollo de servicios para ofrecer los datos y facilitar su reutilización de forma sencilla como Aragopedia, Open Social Data o la reciente Aragón Open Data Focus (más información disponible en esta entrevista). Aragón Open Data es la iniciativa de datos abiertos del Gobierno de Aragón, Departamento de Ciencia, Universidad y Sociedad del Conocimiento, Dirección General de Administración Electrónica y Sociedad de la Información cofinanciado por el Fondo Europeo de Desarrollo Regional (FEDER) “Construyendo Europa desde Aragón”.
Dado el conocimiento que atesoran, no es de extrañar que hayan comenzado a desarrollar materiales didácticos y artículos tecnológicos con el fin de explicar cómo han desplegado distintas soluciones para dar respuesta a las necesidades de localización, acceso y reutilización de los distintos conjuntos de datos.
A continuación, se recoge uno de estos materiales, centrado en explicar cómo han implementado la solución de software CKAN para mejorar la disponibilidad de datos en el portal.
CKAN como solución software de gestión de datos abiertos en un caso real para el portal Aragón Open Data
CKAN es una plataforma de código abierto, gratuito y libre, desarrollada por la Open Knowledge Foundation, que sirve para publicar y catalogar colecciones de datos. Debido a sus carácter libre y gratuito, así como a su rápida implementación, se ha convertido en un referente a nivel mundial para la apertura de datos.
Desde su nacimiento en 2012, Aragón Open Data ha apostado por tecnología CKAN para la gestión de su sistema de datos abiertos. El documento “CKAN, piedra angular para la gestión de un sistema de datos abiertos” nos muestra cómo funciona su arquitectura y sirve de ejemplo a otras iniciativas que quieran poner en marcha una plataforma de este tipo.
En el documento se relatan los retos que se encontraron a la hora de migrar la plataforma original a una versión superior y cómo lo solucionaron con la construcción de una aplicación cliente. Este proceso generó como resultado la arquitectura actual del portal que se recoge en la siguiente figura:

El backend de CKAN está desarrollado íntegramente en Python, con un frontal propio en Javascript, y permite desplegar una capa de servicios gestionable desde una API, y utilizar plugins base o extensiones que aportan funcionalidades adicionales a la plataforma. CKAN se apoya en una base de datos PostgreSQL, donde se almacenan los conjuntos de datos que alberga, sus recursos y demás metadatos necesarios para el funcionamiento de la plataforma, y hace uso de Solr, un motor de búsqueda que ayuda a agilizar la localización y disponibilidad de los conjuntos de datos.
Además de explicar esta arquitectura, el documento aborda las funcionalidades y extensiones utilizados en la instancia de CKAN personalizada, y cómo el conjunto de componentes integrados en la plataforma: Angular, NodeJS, PostgreSQL y Solr conviven para disponer conjuntos de datos que son la base para el desarrollo de servicios y soluciones de datos abiertos como Presupuestos de Aragón o el ya mencionado Aragón Open Data Focus.
CKAN incorpora una extensión que permite soportar serializaciones de datos en RFD que, además de permitir la exposición de datos enlazados en formatos como RDF-XML o Turtle, se utiliza para federar conjuntos de datos que siguen la especificación DCAT de metadatos, lo que hace de CKAN una plataforma más versátil y apropiada para la publicación de Linked Data, algo que también ha hecho Aragón Open Data como podemos ver en este otro documento.
Puedes descargar el documento “CKAN como solución software de gestión de datos abiertos en un caso real para el portal Aragón Open Data” a continuación. Además, puedes complementar su lectura con estos dos artículos adicionales:
- Recolección automática de datos abiertos: Explica cómo Aragón Open Data federa datos abiertos utilizando un plugin de CKAN.
- Arquitectura ELK como herramienta de datos abiertos: Explica cómo Aragón Open Data utiliza una arquitectura basada en el stack tecnológico ELK (Elasticsearch, Logstash y Kibana).
¿Es posible hallar en los datos la ayuda necesaria para solucionar los problemas reales a los que se enfrenta nuestra sociedad? Si bien es verdad que los datos por sí solos no se pueden transformar en alimento para los más desfavorecidos ni tampoco hacer que desaparezcan las armas en zonas de conflicto ni las desigualdades en el mundo, sí que resultan de gran utilidad a la hora de ofrecer información sobre las causas que provocan ciertos hechos o situaciones. Gracias a ellos, podemos valorar mejor las razones y consecuencias de dichas situaciones, y actuar para que no se repitan.
Una vez que, gracias a los datos abiertos, identificamos las causas que provocan este tipo de hechos, debemos dar un paso más: utilizar esta información para desarrollar soluciones y servicios que nos ayuden a solucionar problemas como, por ejemplo, la falta de inclusión social de grupos marginados o las desigualdades provocadas por cuestiones de género, económicas o sociales.
Cuando hablamos de inclusión, nos referimos al proceso por el que tanto individuos como comunidades de personas, como por ejemplo migrantes, refugiados, grupos o individuos socialmente desfavorecidos puedan interactuar e integrarse en sus comunidades de manera satisfactoria y con las mismas oportunidades.
A continuación, veremos algunos ejemplos acerca de la importancia que tienen los datos abiertos a la hora de crear instrumentos y servicios que ayudan a la integración de este tipo de grupos, centrándonos especialmente en los retos que tiene por delante nuestro país.
Problemas relacionados con la desigualdad en España y soluciones digitales basadas en datos abiertos para solucionarlos
Inserción laboral
En un contexto en donde la crisis sanitaria está dañando nuestra economía es fundamental acercar las oportunidades laborales a los ciudadanos. La publicación en abierto de las ofertas de empleo y cursos como hace el Servicio Vasco de Empleo a través de su plataforma Lanbide, está permitiendo que muchos portales web de empleo y centros de formación puedan añadir dichas ofertas a su catálogo fácilmente, fomentando su difusión y, por tanto, la inserción laboral de las personas que buscan empleo.
Despoblación de zonas rurales
Actualmente en España es necesario visibilizar y sensibilizar a los usuarios sobre el gran problema de despoblación que sufren algunas zonas de nuestro país, en las que sus habitantes cuentan cada vez con menos recursos sociales, lo que en ocasiones lleva a aumentar su aislamiento.
Herramienta como “La España vacía”, que consiste en una serie de mapas interactivos que muestran la evolución demográfica española, nos ayudan a visibilizar y comprender el problema, mientras que plataformas como Plan Repuebla pueden servir para atraer negocios y nuevos habitantes a las zonas con menor densidad de población.
Desigualdad de género
Existen plataformas que funcionan como un gran canal de sensibilización y apoyo a mujeres víctimas de la violencia machista, ofreciendo testimonios y análisis de la situación en la actualidad. Es el caso de Desprotegides , un portal creado en Cataluña que busca visibilizar el grave problema de violencia machista que sufren hoy en día miles de mujeres en el mundo, en este caso contando con datos actualizados sobre el número de víctimas en la comunidad catalana.
Un paso más allá va el proyecto Data COVID Gender creado por Iniciativa Barcelona Open Data junto con el grupo Género y TIC (GENTIC) del Internet Interdisciplicary Institute (IN3). El proyecto consiste en analizar el impacto que tienen el género y la segregación ocupacional en la prevalencia del coronavirus. Ha sido una de las 15 propuestas escogidas por la Agencia de Calidad y evaluación Sanitarias de Cataluña (Aquas) del Departamento de Salud para hacer investigación en analítica de datos sobre la incidencia del SARS-CoV-2 y Covid-19 en Cataluña.
Integración de personas con discapacidad
En los últimos años aplicaciones sencillas que, utilizando datos abiertos, proporcionan información útil sobre el entorno. En este artículo puedes encontrar distintas aplicaciones creadas por empresas y ciudadanos, pero también los servicios públicos están trabajando en este sentido. Como ejemplo el ayuntamiento de Murcia ha lanzado una aplicación gratuita que permite a las personas con discapacidad auditiva recibir información sobre los servicios municipales y realizar las gestiones que soliciten a modo de videoconferencia a través de un smartphone.
Información relevante sobre el coronavirus para grupos de riesgo
Curvaenaragon.com es una página web desarrollada por el Gobierno de Aragón cuyo objetivo principal es mostrar información actualizada sobre la situación del Covid-19 en la comunidad autónoma, desglosando los datos por las diferentes provincias (Huesca, Zaragoza y Teruel).
Esta web permite a todos los ciudadanos que residen o tienen que viajar a Aragón consultar la evolución de la pandemia en la zona, especialmente para los grupos de riesgo que son más vulnerables ante esta patología.

En definitiva, cada vez existen más aplicaciones y tecnologías que, gracias a los datos abiertos, nos permiten obtener información útil sobre el entorno para poder ofrecer soluciones a problemas como la desigualdad, la discapacidad, la pobreza o la violencia, entre otras.
Estas son solo algunos ejemplos de aplicaciones que utilizan datos abiertos para favorecer la erradicación de la desigualdad, pero si conoces alguna otra que cumpla una función similar, no dudes en registrarla en nuestro portal o enviarnos un mail a contacto@datos.gob.es.
Contenido elaborado por el equipo de datos.gob.es.