Documentación

Para poder extraer todo el valor de los datos, es necesario clasificarlos, filtrarlos y cruzarlos mediante procesos de analítica que nos ayuden a sacar conclusiones, convirtiendo los datos en información y conocimiento. Tradicionalmente la analítica de datos se divide en 3 categorías:

  • Analítica descriptiva, que nos ayuda a entender la situación actual, qué ha pasado para llegar hasta ella y por qué se ha producido.

  • Analítica predictiva, cuyo objetivo es anticipar hechos relevantes. Es decir, nos cuenta qué va a pasar para que un ser humano pueda tomar una decisión.

  • Analítica prescriptiva, donde se proporciona información sobre las decisiones más acertadas en base a una serie de escenarios futuros.  Es decir, nos indica qué hacer.

El tercer informe de la serie Awareness, Inspire, Action se centra en el segundo estadio, el de la Analítica predictiva. Para ello sigue la misma metodología que los dos informes anteriores, dedicados a la Inteligencia Artificial y el Procesamiento del Lenguaje Natural.

La analítica predictiva nos permite responder preguntas de negocio como ¿sufriremos una rotura de stock? ¿Bajará la cotización de una determinada acción? O ¿Nos visitarán más turistas el próximo puente? En base a esta información las empresas pueden definir su estrategia de negocio, y los organismos públicos elaborar políticas que respondan a las necesidades de los ciudadanos.

Tras una breve introducción que contextualiza la materia a tratar y explica la metodología, el informe, elaborado por Alejandro Alija, se desarrolla de la siguiente manera:

  • Awareness. En la sección Awareness se explican los conceptos clave, destacando los tres atributos de la analítica predictiva: el énfasis en la predicción, la relevancia para el negocio de los conocimientos resultantes y su tendencia a la democratización para extender su uso más allá de los usuarios especialistas y científicos de datos. En este apartado también se mencionan los modelos matemáticos de los que hace uso y se detallan algunos de sus hitos más importantes a lo largo de la historia, como el protocolo de Kyoto o su utilidad para detectar la fuga de clientes. 

  • Inspire. La sección Inspire analiza algunos de los casos de uso de la analítica predictiva con más relevancia en la actualidad en tres sectores muy diferentes. Empieza con el sector industrial, donde se explica cómo funciona el mantenimiento predictivo y la detección de anomalías. Continua con ejemplos relativos a la predicción de precios y demanda, en la cadena de distribución de un supermercado y en el sector energía. Y finaliza con el sector salud y el diagnóstico aumentado de imagen médica.

  • Action: En la sección Action se desarrolla de forma práctica un caso de uso concreto, utilizando para ello datos y herramientas tecnológicas reales. En este caso el conjunto de datos seleccionado es accidentes de tráfico en la ciudad de Madrid, publicado por el Ayuntamiento de Madrid. A través de la metodología recogida en la siguiente figura, se explica de manera sencilla cómo utilizar técnicas de análisis de series temporales para modelar y predecir el número de accidentes en los meses futuros.

El informe finaliza con la sección Última parada, donde se recopilan cursos, libros y artículos de interés para aquellos usuarios que quieran seguir avanzando en la materia.

En este vídeo, su autor te cuanta más sobre el informe y la analítica predictiva.

A continuación, puedes descargarte el informe completo en pdf y word (versión reutilizable), así como acceder al código utilizado en el ejemplo de Action en este enlace.

calendar icon
Documentación

La pandemia originada el pasado año ha supuesto un cambio significativo en la forma que teníamos de ver el mundo y relacionarnos con este. En lo que al sector educativo se refiere, alumnos y docentes de todos los niveles se han visto obligados a tener que cambiar la metodología de enseñanza y aprendizaje presencial por un sistema telemático.

En este contexto, desde el marco de la Iniciativa Aporta se ha desarrollado el estudio “Tecnología educativa basada en datos para mejorar el aprendizaje en el aula y en el hogar”, realizado por José Luis Marín. Este informe ofrece diversas claves para reflexionar acerca de los nuevos retos y desafíos que plantea esta situación y que se pueden convertir en oportunidades si conseguimos introducir cambios que fomenten la mejora del proceso de enseñanza-aprendizaje más allá de solamente sustituir las clases presenciales por formación en línea.

La importancia de los datos para mejorar el sector educativo

A través de una tecnología educativa innovadora basada en datos e inteligencia artificial se pueden abordar algunos de los desafíos a los que se enfrenta el sistema educativo. Para este informe se han seleccionado 4 de estos retos:

  • Supervisión no presencial de pruebas de evaluación: monitorización y vigilancia de pruebas evaluativas a través de recursos telemáticos.
  • Identificación de problemas de comportamiento o atención: alerta a los docentes sobre actividades y conductas que indiquen problemas de atención, motivación o comportamiento.
  • Programas formativos personalizados y más atractivos: adaptación de las rutas y el ritmo de aprendizaje de los alumnos.
  • Mejora del rendimiento en exámenes estandarizados: uso de plataformas de aprendizaje en línea para mejorar resultados en pruebas estandarizadas, para reforzar el dominio de un tema en particular y para conseguir una evaluación más justa e igualitaria.

Para abordar cada uno de estos cuatro retos, se propone una sencilla estructura dividida en tres apartados:

  1. Descripción del problema, que nos permite poner el desafío en contexto.
  2. Análisis de algunos de los enfoques basados en el uso de datos e inteligencia artificial que se utilizan para ofrecer una solución tecnológica al reto en cuestión.
  3. Ejemplos de soluciones o experiencias relevantes o altamente innovadoras.

El informe también destaca la enorme complejidad que entraña este tipo de cuestiones, por lo que deben abordarse con cautela para evitar consecuencias negativas sobre los individuos, como pueden ser problemas de ciberseguridad, invasión de la privacidad o riesgo de exclusión de algunos colectivos, entre otros. Para ello, el documento finaliza con una serie de conclusiones que convergen en la idea de que el mejor camino para generar mejores resultados para todos los estudiantes, aliviando desigualdades, es combinar excelentes docentes y excelente tecnología que aumente sus capacidades. En este proceso los datos abiertos pueden jugar un papel aún más relevante para mejorar el estado del arte en tecnología educativa y asegurar un acceso más generalizado a determinadas innovaciones que en gran medida están basadas en tecnologías de aprendizaje automático o inteligencia artificial.

En este vídeo, su autor nos cuenta más sobre el informe:

 

calendar icon
Blog

El cambio climático, la contaminación del aire y la contaminación del mar. Estos son los 3 principales problemas medioambientales para los ciudadanos españoles de acuerdo con el último Eurobarómetro “Attitudes of European citizens towards the Environment”, publicado en marzo de 2020. La encuesta también resalta que el 90% de la población española considera importante proteger el entorno natural. Los ciudadanos quieren que se tomen más medidas y creen que la responsabilidad debería compartirse entre las empresas, los gobiernos nacionales, la UE y los propios ciudadanos.

Al igual que sucede con otros sectores, como la educación o la sanidad, los datos abiertos también pueden ayudarnos a superar los retos relacionados con el medio ambiente. Por un lado, nos proporcionan información detallada para comprender la situación y poder buscar soluciones. Por otro, sirven para poner en marcha soluciones que nos ayuden a concienciarnos y disminuir nuestra huella ambiental.

En su informe “The Economic Impact of Open Data Opportunities for value creation in Europe”, el European Data Portal resalta que los datos pueden “contribuir a reducir el consumo total de energía en Europa, aumentar el uso de fuentes de energía sostenibles, proteger la biodiversidad y aumentar la conciencia sobre las emisiones de CO2”, así como generar un impacto económico de alrededor de 1.000 millones de euros. Veamos algunos ejemplos:

  • Reducir del consumo energético. Las aplicaciones basadas en datos abiertos pueden servir de instrumento para ayudar a hogares e instituciones a conocer y reducir su consumo de energía. En este sentido, la Junta de Castilla y León ha puesto en marcha un Datahub energético que ofrece información detallada y visual sobre el consumo de energía en los más de 1.500 centros gestionados por la Junta: centros educativos, centros de salud, oficinas administrativas, hospitales, etc. El cuadro de mando facilita el análisis desagregado por tipo de energía (electricidad, gas, gasoil) y por localización geográfica, permitiendo tomar decisiones informadas. Según la propia Junta, gracias al cuadro energético han ahorrado más de 12 millones de euros en electricidad desde 2015.
  • Aumentar el uso de energía sostenible. La directiva de la UE de 2018 sobre la promoción del uso de energía procedente de fuentes renovables establece el objetivo de que la proporción de energías renovables en el consumo final bruto sea del 32% para 2030. Para ayudar a alcanzar este objetivo, los datos públicos disponibles sobre urbanismo, uso de los servicios públicos o condiciones meteorológicas se puede cruzar para crear soluciones que ayuden a hacer las viviendas más sostenibles.  Un ejemplo es Solarmap, que permite calcular la rentabilidad de una instalación de paneles solares en un lugar concreto.
  • Mejorar la biodiversidad: Los cambios en los ecosistemas pueden generar extinciones masivas de especies y la limitación de los recursos naturales disponibles, que pueden afectar no sólo a nuestra economía si no a nuestra propia forma de vida. En este sentido, los datos abiertos sirven de base para soluciones que, por ejemplo, nos ayudan a monitorizar diversos parámetros de las aguas de los puertos (como Environmental Control Panel), mejorar la gestión de residuos (Punto limpio) o dar a conocer la contaminación acústica (MAdb).
  • Crear conciencia sobre la contaminación del aire y la reducción de las emisiones de CO2. Aunque como hemos visto al principio de este artículo los españoles somos muy conscientes del cambio climático, sin embargo, si miramos los hábitos individuales de los ciudadanos, vemos que todavía queda mucho por hacer. Solo un 38% intenta reducir su consumo energético, un 28% elige formas de transporte menos contaminantes, y un 36% compra productos locales. Por ello es necesario seguir concienciando, por ejemplo a través de indicadores de la calidad del aire en la ciudades como GV Aire. Así mismo son necesarias aplicaciones que promuevan el uso de medios de transporte más eficiente, como las bicicletas o el transporte público (Barcelona metro bus rodalies bici).

Puedes encontrar más ejemplos en la sección de aplicaciones de datos.gob.es y en nuestra sección de medio ambiente.

calendar icon
Documentación

Las administraciones públicas tienen un papel fundamental en el sector infomediario, es decir, en el negocio de la reutilización de datos. Por un lado, en la parte de la oferta, gracias a su papel publicador de datos abiertos, una fuente original de información libre y gratuita que puede ser utilizada para crear productos y servicios de valor; y por otro en la demanda, ya que las administraciones también pueden reutilizar dicha información e incluso ser clientes de las empresas infomediarias.  

Este es el punto de partida del nuevo informe del Observatorio Nacional de las Telecomunicación y de la Sociedad de la Información (ONTSI), titulado “Las Administraciones Públicas ante la reutilización de la información pública”. Este informe analiza el peso y el modo en que la administración interactúa con el sector infomediario, convirtiéndose en uno de sus principales clientes.  

En concreto, el informe determina que casi el 50% de las empresas infomediarias tienen a las administraciones públicas como clientes. Los servicios que más demandan los organismos públicos son la consultoría y realización de estudios específicos, el tratamiento de datos y la generación de herramientas de visualización. 

Para realizar el informe, se ha entrevistado en profundidad a representantes de diversos organismos de todos los niveles de la administración: todos los Ministerios, 6 Comunidades Autónomas y 10 Ayuntamientos. Todos los entrevistados han coincidido en la necesidad de impulsar la colaboración entre el ámbito público y privado para mejorar la publicación de información y la creación de servicios de valor. Desde el punto de vista de la reutilización estas colaboraciones impulsan la actividad económica e impactan en 3 ámbitos

  • Impacto en los usuarios: Disponen de un mayor conocimiento de la actividad pública, mejora su percepción de las administraciones y se pueden beneficiar de unos servicios más personalizados y de mayor calidad. Además, pueden aprovechar la información pública para crear nuevos negocios. 
  • Impacto interno en las propias administraciones: Los beneficios son múltiples, desde la mejora de la gestión y los procesos administrativos, hasta el ahorro de costes o el impulso a la capacitación de los trabajadores públicos.   
  • Impacto político: El mayor conocimiento del entorno permite tomar unas decisiones más informadas, acorde con la realidad y necesidades de los ciudadanos. 

En este sentido, el informe contiene una serie de ejemplos de buenas prácticas, que muestran de manera clara dicho impacto, y que se recogen en la infografía a continuación. 

El informe también incluye un análisis de los retos a superar por parte de las administraciones y una serie de recomendaciones para obtener un mayor valor e impulsar dichas colaboraciones público-privadas.  

Puedes descargar el informe completo al final del artículo. Acompañando a este informe, el ONTSI también ha publicado el estudio “Del Sector Infomediario a la Economía del Dato. Caracterización del Sector Infomediario. Edición 2020”, centrado en la evolución del mercado y los modelos de negocio basados en los datos y la información.  

calendar icon
Documentación

En España existen un gran número de iniciativa de datos, tanto locales, como regionales y estatales. Para armonizar este ecosistema, datos.gob.es se alza como un punto de acceso único, facilitando que los reutilizadores puedan encontrar en un único espacio la información que demandan. Además, datos.gob.es federa con el European Data Portal (EDP), por lo que las iniciativas españolas dadas de alta en el catálogo ganan visibilidad a nivel internacional.  

Para que los datos de una iniciativa de datos abiertos de nuestro país aparezcan en el catálogo de datos.gob.es es necesario seguir una serie de pasos sencillos. El primero de ellos es solicitar una cuenta de usuario, a través de este formulario. Las cuentas de usuario están reservadas solo a los organismos o entidades publicadoras de datos abiertos; no son necesarias para poder acceder o descargar conjuntos de datos del catálogo. El siguiente vídeo te explica que debes hacer para obtener tu cuenta de usuario:

 

Una vez registrado, el usuario publicador podrá dar de alta sus conjuntos de datos de dos maneras distintas

  1. Manual: Implica dar de alta cada datasets de manera individual, completando para cada conjunto de datos un formulario donde se detallan sus metadatos de forma manual. 
  2. Automática (federada): El alta y actualización se hace de forma periódica a partir de un fichero RDF donde se incluyen los metadatos disponibles a través de una url en el sitio web del publicador. Ya no es necesario trabajar individualmente con cada dataset, sino que se el proceso puede abarcar automáticamente a varios conjuntos de datos. 

datos.gob.es también realiza un análisis exhaustivo para garantizar que los metadatos cumplen los estándares de calidad. Entre otras acciones, se comprueba si los metadatos son válidos, se analizan los enlaces rotos y se chequean las distribuciones. 

La siguiente infografía recoge el proceso de manera sencilla. Pulsa en las flechas laterales para cambiar de diapositiva. Puedes descargar la infografía completa al final del artículo.

Si tienes cualquier duda o comentario, puedes ponerte en contacto con el equipo de soporte de datos.gob.es.

 

 
calendar icon
Blog

¿Sabías que el patrimonio digital abierto es fundamental a la hora de comprender el mundo que nos rodea, impulsar una economía más creativa y cumplir con los objetivos educativos acordados? Se calcula que alrededor del 90% del patrimonio cultural mundial todavía no ha sido digitalizado. Del 10% restante que sí ha sido digitalizado, tan solo el 34% está disponible de forma online mientras que apenas el 3% de ese trabajo se encuentra abierto. 

La mayoría de instituciones culturales cuentan con una gran cantidad de información de alto valor. Esta información se suele encontrar principalmente en forma de colecciones, pero también en las fichas de autores, fechas, técnica utilizada, etc. Tanto las obras como su información son susceptible de convertirse en datos abiertos. 

Algunos ejemplos de museos que sí han digitalizado y abierto su colección son The Rijksmuseum (Países Bajos), el Statens Museum for Kunst (Dinamarca) o el Metropolitan Museum (Estados Unidos).

¿Qué nuevos productos se pueden crear reutilizando datos culturales? 

Las nuevas tecnologías nos ofrecen un sinfín de posibilidades a la hora de crear nuevos productos a través de la reutilización de los datos culturales. Es el caso de las nuevas plataformas educativas como BNEscolar, que permiten el aprendizaje del arte desde un punto de vista diferente. Los datos abiertos culturales sirven incluso para generar juegos de scaperoom o nuevas piezas de arte. También se pueden utilizar como herramientas de diseño o para complementar películas y documentales

En definitiva, se puede establecer que los datos culturales están dotados de un gran valor que, a través de una mayor apertura, podrían suponer grandes beneficios para la creación de nuevas iniciativas que aporten beneficios para toda la sociedad.

calendar icon
Entrevista

Alberto Cairo enseña infografía y visualización de datos en la Universidad de Miami.

Es autor de The Functional Art: An Introduction to Information Graphics and Visualization (2012).

 

¿Qué es, en su opinión, el Periodismo de datos y en qué se diferencia de otros modelos de información?

Lo que se conoce hoy como Periodismo "de datos" es un agregado de varias tradiciones clásicas del periodismo: el data-driven journalism, el database journalism, el periodismo de precisión y la visualización de información. En resumen, el Periodismo de datos consiste en el uso sistemático de métodos de investigación (principalmente cuantitativa, pero no sólo) para generar datos, analizarlos, filtrarlos, organizarlos, extraer sentido de ellos y presentarlos por medio de historias periodísticas, gráficos, mapas, etc. Con ese fin, toma prestadas herramientas y técnicas de las ciencias sociales, el periodismo y el diseño gráfico y de interacción.

... generar datos, analizarlos, filrarlos, organizarlos, extraer sentido de ellos y presentarlos por medio de historias periodísticas..."

 

¿Qué papel entiende que guardan los profesionales de este ámbito respecto de la información del sector público?

El periodista es un mediador entre fuentes y público, un facilitador de la comunicación entre individuos y entidades. El sector público puede (y debe), ciertamente, poner datos a disposición del público, y es seguro que muchos ciudadanos accederán a dichos datos en su forma bruta. Pero el papel del profesional especializado en leer esos datos y darles una forma digerible por los ciudadanos sin tiempo (o sin conocimientos) para hacerlo por su cuenta es imprescindible.

... leer esos datos y darles una forma digerible para los ciudadanos sin tiempo (o conocimientos)... es imprescindible."

 

¿Cómo surgió su interés por esta actividad?

Soy periodista de formación e infografista por vocación. Siempre me ha inquietado la desconfianza que muchos colegas muestran por las matemáticas, la estadística y el método científico. Esa desconfianza conduce a una profunda ignorancia y a un mal servicio a los ciudadanos. En un mundo en el que la cantidad de información se duplica cada poco tiempo, el periodista debe aprender a manejar las mejores herramientas para domarla.

 

¿Qué conocimientos, habilidades o herramientas precisa el tratamiento periodístico de los datos del sector público?

Conceptuales (estadística, métodos de investigación) y tecnológicos (herramientas de software: OpenOffice, Excel, R, Tableau...). De todas formas, no hay que mitificar la tecnología. Se pueden conseguir buenos resultados utilizando herramientas rudimentarias, siempre que se dominen los fundamentos.

 

¿Qué perfiles profesionales serían, a su juicio, los mejor situados para trabajar en el Periodismo de datos?

Profesionales de las ciencias de la computación con interés en comunicación, periodistas con conocimientos de métodos de investigación cuantitativa y diseñadores e infografistas de perfil técnico, no tan artístico como es tradicional en la profesión.

... interés en comunicacion... investigación cuantitativa... diseñadores e infografistas de perfil técnico..."

 

En su opinión, ¿cuál sería un buen ejemplo de lo que es este modelo de periodismo?

The Guardian (con ciertas reservas), NPR, ProPublica y The New York Times, pero hay muchos otros. En América Latina, por ejemplo, tenemos a La Nación (Costa Rica), que tiene un equipo de periodismo de investigación muy fuerte, La Nación (Argentina), que está explorando el periodismo de datos, Estado de São Paulo, que acaba de abrir un pequeño grupo formado por periodistas, programadores y diseñadores, etc.

 

¿Qué haría falta para que el conjunto de la sociedad, incluidos los gobiernos, valorasen todavía más el papel de los datos públicos?

La existencia de más historias y herramientas que ayudasen a los ciudadanos a descubrir realidades que a veces permanecen ocultas. Un buen ejemplo es España en llamas, que no ha recibido toda la publicidad que se merece: http://www.espanaenllamas.es/ o el Manifestómetro, una iniciativa ignorada por todos los medios de comunicación porque va en contra de sus intereses ideológicos: http://manifestometro.blogspot.com/

... Un buen ejemplo es España en llamas, que no ha recibido toda la publicidad que se merece."

 

Si fuera una administración local, regional o nacional, ¿qué información consideraría más interesante para su apertura?

En general, cualquiera relacionada con el control social de los representantes políticos: gastos, actividades, agenda, etc.

 

¿Por qué habría un lector de interesarse por este tipo de noticias basadas en los datos que gestionan las administraciones?

Porque le ayuda a controlar mejor a quien le representa y le ayuda a confirmar (o desmentir) intuiciones. Le doy un ejemplo: hace más de un año, cuando todavía trabajaba en Brasil, para la revista semanal Época, hicimos un gráfico que mostraba cuánto cada diputado gasta en llamadas telefónicas por mes. Esos datos están disponibles en la Web del Congreso, pero no en un formato que sea legible por los ciudadanos, lo que es un problema común en muchos países. Nosotros tomamos ese banco de datos, lo analizamos y creamos el siguiente interactivo:

http://revistaepoca.globo.com/diagrama/noticia/2011/10/diagrama-298-anos-de-falacao.html

El éxito fue enorme.

... ayuda a controlar mejor a quien le representa y le ayuda a confirmar (o desmentir) intuiciiones..."

calendar icon