Documentación

Los Objetivos de Desarrollo Sostenible (ODS) son un conjunto de metas adoptadas por la comunidad internacional que buscan abordar los desafíos más urgentes de nuestro tiempo. Estos objetivos nacieron simultaneamente junto con la Alianza Mundial para los Datos del Desarrollo Sostenible y la Carta Internacional de Datos Abiertos, que proporcionaron una coalición de expertos dispuestos a poner los beneficios de los datos abiertos a disposición de la nueva agenda de desarrollo. 

En este sentido, los datos abiertos juegan un papel muy relevante dentro de la agenda de desarrollo como indicadores de evolución en los ODS, porque permiten medir y evaluar su progreso, así como mejorar la rendición de cuentas a través de la compartición de esos datos con el resto de la comunidad, aportando un gran valor de múltiples formas:  

  • Facilitando la toma de decisiones a la hora de diseñar políticas y estrategias que ayuden a cumplir con los objetivos;
  • Identificando desigualdades y desafíos específicos entre distintas regiones o grupos de población;
  • Mejorando la eficiencia en la implementación de políticas y programas; o
  • Como motor de innovación a través de la investigación y desarrollo.

Hoy en día, existen grandes bases de datos globales, tanto generalistas como temáticas, que podemos utilizar para estos fines, además de todas las fuentes de datos nacionales disponibles en nuestro propio país. No obstante, todavía queda camino por recorrer en este aspecto: la proporción de indicadores de los ODS que son conceptualmente claros y tienen una buena cobertura nacional aún es del 66%, según el último informe de progreso de los ODS publicado en 2023. Esto da lugar a que sigamos teniendo que hacer frente a lagunas de datos en áreas tan vitales como la pobreza, el hambre, la educación, la igualdad, la sostenibilidad, el clima, los mares y la justicia, entre otros. Además, existe también una carencia bastante general y significativa de datos desglosados por edad y/o por sexo, lo que hace muy difícil poder supervisar adecuadamente el posible avance de los objetivos en cuanto a los grupos de población más vulnerables.  

En este informe, se realiza un recorrido a través del doble papel que los datos abiertos juegan a la hora de dar soporte al avance nacional y global en la consecución de los ODS. La primera parte del informe se centra en el papel más conocido de los datos abiertos como meros indicadores a la hora de medir el avance de los objetivos, mientras que en la segunda parte se aborda su papel como herramienta clave y materia prima fundamental para el desarrollo de la sociedad en general y para la consecución de los propios objetivos en particular. Para ello, se explora cuáles son los conjuntos de datos que podrían contar con mayor potencial en cada caso, mostrando algunos ejemplos prácticos, nacionales y a nivel europeo, en varios objetivos de desarrollo concretos.

Si quieres saber más sobre el contenido de este informe, puedes ver la entrevista a su autor.

A continuación, puedes descargar el informe completo, su versión accesible, el resumen ejecutivo y una presentación-resumen.

calendar icon
Documentación

Este informe que publica el Portal de Datos Europeo explora los llamados Citizen Generated Data (CGD). Esta categoría de datos hace referencia a aquellos generados por los ciudadanos. Existe una carencia de este tipo de datos dentro de los portales de datos abiertos europeos, principalmente debido a la falta de publicación y gestión de CGDs por parte de las administraciones públicas.

En el documento se realiza un análisis de diversos portales de datos abiertos, cuyo principal objetivo es proporcionar una visión de los CGDs que pueden formar parte de dichos portales y cómo incluirlos por parte de las administraciones públicas. Cabe destacar que durante el análisis, se establece un marco para la descripción, referencia y caracterización de los CGDs.

Por último, basándose en las conclusiones del análisis previo, el documento ofrece una serie de recomendaciones y pautas para los publicadores de datos. El objetivo es aumentar y mejorar la presencia de CGDs en la publicación de datos abiertos, involucrando a los ciudadanos en el diseño de la política, los procesos y la gobernanza.

Este informe se encuentra disponible en el siguiente enlace: "Data.europa.eu y los datos generados por ciudadanos"

 

calendar icon
Documentación

Los datos son fundamentales para resolver los retos sociales y económicos a los que nos enfrentamos en la actualidad. Gracias a ellos podemos conocer las causas detrás de una determinada situación y los factores que influyen en ella, hacer estimaciones de su evolución y tomar decisiones informadas encaminadas al cambio.

El problema está en que para resolver este tipo de retos suele ser necesario combinar datos procedentes de diversas fuentes:

  • Datos ofrecidos por el sector público
  • Datos de múltiples compañías del sector privado
  • Datos generados por la ciudadanía

Pero, ¿cómo se puede lograr esa colaboración? Esta es la pregunta que se plantea el informe “Cómo facilitar la colaboración en torno a los datos para resolver problemas de la sociedad”, elaborado por Jose Luis Marín en el marco de la Iniciativa Aporta.

El informe comienza con una breve introducción donde se esboza la situación actual de la apertura de datos en los sectores público y privado, así como en la ciudanía. A continuación, se abordan cuáles son las principales barreras que dificultan la cesión de datos por parte de empresas y ciudadanos, los beneficios tanto individuales como colectivos que pueden motivar estas prácticas en aras del interés público, y las políticas que se pueden poner en marcha desde las administraciones públicas para compensar e incentivar la colaboración.

Una vez que tenemos claro el contexto, es el momento de analizar algunos de los mecanismos existentes de colaboración para la recopilación, intercambio o procesamiento de datos con el fin de abordar un desafío social. Aunque no existen análisis sistematizados de las formas ideales de gobernanza, para este informe se han determinados 4 fórmulas:

¿A quién aplican los distintos proyectos de colaboración en torno a los datos?  1.	Gestionando datos personales aportados por ciudadanos: ciudadanos y sector privado. 2.	Creando nuevos conjuntos de datos con fuerza de trabajo voluntario: ciudadanos, sector privado y sector público. 3.	Colaborando entre actores de diferentes sectores: sector privado y sector público. 4.	Intercambiando datos de empresa a gobierno o institución internacional (B2G data-sharing): sector privado y sector público.

Con el fin de ilustrar y conocer mejor cada fórmula, el informe incluye múltiples ejemplos de casos de éxito internacionales, como Accelerating Medicines Partnership (AMP), enfocada en transformar el modelo actual de desarrollo de nuevos diagnósticos y tratamientos, u Open Apparel Registry (OAR) cuyo objetivo es contribuir a la mejora de los derechos humanos y las condiciones medioambientales en torno a las fábricas.

El informe finaliza con una serie de recursos para ayudar a las organizaciones a colaborar de forma exitosa y a reducir las barreras, donde se incluyen redes de colaboración, marcos de colaboración, cursos y formaciones.

A continuación, puedes descargar el informe, así como acceder a los materiales complementarios (resumen ejecutivo, video-entrevista y presentación resumen).

calendar icon
Entrevista

El periodismo de datos es una de las disciplinas que más ha crecido en los medios de comunicación en los últimos años, tanto dentro como fuera de nuestras fronteras. Esta modalidad del periodismo consiste en recabar datos veraces, analizarlos y ponerlos a disposición de la ciudanía a través de artículos y/o recursos gráficos e interactivos, facilitando la comprensión de asuntos complejos.  

En datos.gob.es hemos entrevistado a Adolfo Antón, diseñador, periodista, formador y apasionado del Software Libre y el conocimiento abierto. Adolfo ha sido presidente de Open Knowledge Foundation España, coordinador de School of Data España, responsable del Datalab de Medialab Prado, coordinador del grupo de trabajo de Periodismo de Datos, de las Jornadas de Periodismo de Datos y comisario de los talleres de Periodismo de Datos (2014-2019) y Visualizar (2015-2018). Actualmente es coordinador del Máster Universitario de Periodismo y Visualización de Datos de la Universidad de Alcalá y Profesor del Máster de Periodismo Digital y de Datos en Universidad Nebrija. 

Entrevista completa:

1. ¿A qué se dedica un periodista de datos? 

Gracias, en primer lugar, por interesaros en el periodismo y la visualización de datos y por lo que puedo aportar a estos ámbitos. Agradezco y celebro la existencia de datos.gob.es, un proyecto imprescindible que cumple diez años dentro de poco y que, paradójicamente, creo que no es lo suficientemente conocido, utilizado y reconocido en estos campos.  

Para responder a vuestra primera pregunta me voy a centrar en lo que habéis definido como periodismo de datos y que comienza por la recolección de datos veraces. Actualmente hay muchos proyectos que se encuentran en el campo de la verificación de noticias y esto, a mi modo de ver, lo entiendo como reacción a una proliferación exagerada de noticias falsas, manipuladas, bulos, mentiras y otras faunas y floras de las malas prácticas no solo periodísticas, sino también comunicativas. Es necesario verificar, certificar, acreditar y/o curar los datos con los que trabajamos, aportando un contexto, fuente y metodología. Si no, desarrollaremos análisis erróneos e historias falseadas.  

Hay un dicho periodístico que dice "que un mal dato no te estropee un buen titular", y en esta tentación es muy importante que la ética periodística sea fuerte en periodistas, editorxs y en el propio medio.  

Es necesario verificar, certificar, acreditar y/o curar los datos con los que trabajamos, aportando un contexto, fuente y metodología. Si no, desarrollaremos análisis erróneos e historias falseadas. 

El periodismo de datos es, fundamentalmente, el uso de aplicaciones informáticas para trabajar con datos, ya sean pocos, muchos o muchísimos. En el periodismo de datos también son importantes la estadística, la infografía o la visualización de datos.  

Con esas herramientas informáticas, se realiza lo que Paul Bradshaw denominó la pirámide invertida del periodismo de datos 

  • Compilar (recopilar, recoger, recabar) 
  • Limpiar (fregar, escarbar, investigar, interrogar) 
  • Contextualizar (contexto de los datos y de la historia, metodología) y 
  • Combinar (datos, visualizaciones, infografías, mapas, textos, interactivos…) 

Para ello es necesario, por tanto, utilizar herramientas informáticas y lenguajes informáticos que cubran una, varias o todas las tareas del proceso de trabajo. No es mandatorio, pero sí que es conveniente no enclaustrarnos en software que sea privativo y/o propietario pues determinará el uso que hagamos del mismo. Asimismo, los servicios de terceros pueden ser de gran ayuda, pero se prefieren servicios propios que podamos controlar al cien por cien. 

2. ¿Por qué es importante el periodismo de datos? ¿Podría indicarnos algún caso de éxito o investigación donde haya sido clave? 

El periodismo de datos es el periodismo que investiga con datos y, por tanto, es tan importante, necesario y primordial como el periodismo, si por ello entendemos un periodismo crítico e independiente, un cuarto poder de la sociedad actual. No saber trabajar con datos utilizando herramientas informáticas nos limita hacer buen periodismo, sea este económico, político o deportivo. Cada vez más el periodismo de datos deja de ser el caso de éxito excepcional de un periodismo generalista para ser la metodología del periodismo en general 

Los primeros casos de éxito en España pueden circunscribirse en torno a Civio, una organización que realiza periodismo de datos en proyectos como España en llamas, entre otros. Luego, son relevantes los proyectos que surgieron en torno a la conjunción de tres elementos que hicieron crecer el periodismo de datos en España:  

  • El grupo de Periodismo de Datos de Medialab-Prado, que despierta el interés público por esta disciplina y permiten la creación de una comunidad incipiente;  
  • El Máster de Periodismo de Investigación, Datos y Visualización de Unidad Editorial/URJC, que forma a una primera generación de periodistas de datos;  
  • Los medios que apuestan por ello en mayor o menor medida, como El Español, El Mundo, El Confidencial, RTVE, El Diario de Navarra, eldiario.es o Ara.cat.  

Un punto álgido del periodismo de datos internacional y también de España fue, sin duda, la investigación sobre los Papeles de Panamá (Panama Papers) del Consorcio Internacional de Periodistas de Investigación (ICIJ, International Consortium of Investigative Journalists) de 2016 en la que participaron 109 medios de 76 países. En España fueron LaSexta y El Confidencial los medios participantes y lograron una amplia repercusión y la dimisión de entonces ministro de Industria, Energía y Turismo. 

Lamentablemente, ni el Laboratorio de Datos de Medialab-Prado (continuador del grupo de periodismo de datos entre 2016 y 2019) existe ya, ni todos esos medios han mantenido o fortalecido los equipos. Pero, en general, sí que la disciplina se ha extendido en cuanto a comunidad, universidades y prácticas. Este proceso se ha acelerado tanto con la crisis del COVID19 que ya se considera al periodo actual como la segunda edad de oro de la visualización de datos

3. ¿A qué retos se enfrenta hoy en día el periodismo de datos? 

Es una pregunta difícil de contestar pues creo que a los retos tradicionales del periodismo se suman los que producen, como decía al principio, la abundancia de noticias falsas, manipuladas, sesgadas y difundidas por redes sociales donde cuestiones como la ética, la intimidad, la privacidad, la autoría, el anonimato o la producción automática y replicada en masa de contenidos genera un ruido ensordecedor. Además, se apuesta por una polarización intensiva que sirve para coleccionar datos de personas para crear perfiles de consumidores. Esto bombardea el proceso racional, reflexivo, discursivo y con escala de grises que un buen periodismo puede favorecer.  

Si me centro en el periodismo de datos como metodología, el principal reto que observo es el de formar a periodistas en el uso de aplicaciones informáticas para trabajar con datos y con ello, poco a poco, mejorar la producción periodística para que el público en general valore los buenos productos periodísticos de datos.

El principal reto que observo es el de formar a periodistas en el uso de aplicaciones informáticas para trabajar con datos y con ello, poco a poco, mejorar la producción periodística para que el público en general valore los buenos productos periodísticos de datos.

4. ¿Hay una apuesta decidida de los medios tradicionales por el periodismo de datos? 

Los Papeles de Panamá supusieron un momento esperanzador para el periodismo de datos y también por el hecho de que una televisión generalista apostara por esta disciplina. No ha ocurrido en términos generales, pero sí que la crisis del coronavirus ha producido un aumento de trabajos donde se produce cierto análisis y visualización de datos que son apreciables en las portadas de las webs de los medios, por ejemplo. Sin un análisis en profundidad diría que la mayoría son más escaparates con productos fáciles que completos trabajos de periodismo de datos en el sentido de que no se realizan todas las etapas del proyecto periodístico, sino fragmentos que cubren la demanda.  

Cabe destacar el trabajo en análisis y visualización de datos que están haciendo en El País, RTVE.es y eldiario.es. A su vez, los medios especializados en verificación de noticias como Newtral y Maldita realizan una constante producción de noticias con formatos innovadores que también cuentan con análisis y visualización de datos.  

Por otro lado, hay personas que no trabajan en medios pero que se han agrupado para trabajar desde el inicio de la pandemia sobre los datos del COVID19 en un esfuerzo encomiable que aúna recolección, análisis y visualización de datos y que deja el trabajo prácticamente preparado para que los medios lo tomen y rematen, pero todavía no se ha producido esa conexión mágica.  

Por la experiencia de los talleres de periodismo de datos de Medialab-Prado diría que trabajar con datos lleva tiempo, requiere profesionales, equipo, ideas, etc., pero no son inversiones que puedan estar alejadas de cualquier redacción periodística, sea cual sea el tamaño del medio. El hecho de que esa apuesta decidida no se haya producido también deja el campo abierto a que otras propuestas se posicionen mejor, como ha ocurrido con las de verificación de noticias. 

5. Los datos abiertos son fundamentales para que los periodistas de datos cuenten con información veraz de fuentes oficiales. ¿Qué tipos de datos son los más demandados por estos profesionales para sus investigaciones?

Mi impresión es que normalmente no se aprovechan los datos abiertos que hay, ya sea porque son muy complejos, porque se requiere amplios conocimientos en el tratamiento de datos, porque hay que trabajar mucho con ellos, porque se desconocen o, finalmente, porque no son "atractivos", no están de moda.  

Es decir, tener un portal de datos abiertos y una política de publicación de datos abierta no asegura que se haga un uso de los datos, lo cual no quita para que esto, la publicación de datos abiertos de calidad, deba ser la política por defecto de toda administración pública y fuente de información que se precie.  

Hay muchos casos distintos y citarlos todos llevaría un ejercicio más preciso de recolección de los mismos. Pongamos dos ejemplos. Los datos del INE, además de su complejidad, de los microdatos, vienen en formatos diversos, hay buscadores con los que crear tu propio conjunto cuyas interfaces son muy antiguas y poco usables. Otro caso es el del portal de datos del ayuntamiento de Zaragoza. Uno de los mejores, pero requiere registro para trabajar con la API y los datos se puede extraer JSON… Pongo puntos suspensivos porque si bien es uno de los formatos de datos más utilizados y manejable, no todo el mundo, al igual que con los microdatos, sabe usarlo. En definitiva, no todos los problemas en el periodismo de datos vienen por la ausencia de datos sino también por los formatos y las habilidades para manejarlos 

Normalmente no se aprovechan los datos abiertos que hay, ya sea porque son muy complejos, porque se requiere amplios conocimientos en el tratamiento de datos, porque hay que trabajar mucho con ellos, porque se desconocen o, finalmente, porque no son "atractivos", no están de moda.

En este sentido, el del manejo de las habilidades, recuerdo que últimamente he visto más de un medio que incrusta visualizaciones hechas por terceros. Podría ser un ejemplo más de esos nichos que el periodismo de datos está produciendo para que haya agencias de noticias especializadas en datos. No tendría que ser algo negativo, pero me parece que se usan herramientas a su vez de terceros con formatos limitados. En el extremo contrario estaría el caso de la BBC, que realiza una guía de estilo de cómo hacer gráficos con R y crean una librería para que el estilo de sus gráficos sea distinto. Eso es apostar por los datos también.  

En los talleres de periodismo de datos o visualizar siempre nos encontrábamos con la falta del conjunto de datos mágico con el que trabajar, había que crearlo. Pero también nos encontrábamos con sorpresas y creo que, sin lugar a dudas, no utilizamos la mayoría de los datos disponibles por desconocimiento de que existan. Así que, además de demandar datos, apostaría en paralelo por aprender a utilizar los existentes o crearlos 

6. ¿Qué importancia tienen las visualizaciones en los reportajes de datos? ¿Qué tecnologías y herramientas utilizan? 

Si me atengo a lo que normalmente se cuenta, las visualizaciones se utilizan en dos fases fundamentalmente:

  • Por un lado, en la etapa del análisis de datos. Se visualizan los datos más fácilmente con todo tipo de herramientas gráficas o gráficos que nos ayuden a encontrar valores extraños, patrones, medias, etc.  
  • Por otro lado, en la parte final del proyecto, del producto periodístico. La o las visualizaciones pueden ser una parte más o la pieza principal de la historia periodística.  

Últimamente intento explicar qué es la visualización de datos en términos informáticos. En formato papel la visualización se realiza con herramientas manuales, impresión manual o digital. Pero en la pantalla, en la Web se pueden hacer ¡las visualizaciones que queramos! Con caracteres, texto, imágenes, vídeo, audio, interacción, etc. Si entendemos el lenguaje y los lenguajes de este medio, seremos capaces de producir de una manera más integrada trabajos de periodismo de datos donde cualquier elemento tenga cabida 

Para ello no necesitamos hardware distinto al que ya manejamos, ordenadores de sobremesa o portátiles, pero sí un compendio de herramientas de software libre o de código abierto 

Huelga decir que hay un espectro amplísimo de posibilidades en el terreno del software privativo y/o propietario, pero el uso de software libre o de código abierto es fundamental para dar un salto en el uso de tecnologías en el periodismo y la visualización de datos.

Si entendemos el lenguaje y los lenguajes de este medio, seremos capaces de producir de una manera más integrada trabajos de periodismo de datos donde cualquier elemento tenga cabida. 

7. Actualmente está implicado en 2 masters sobre periodismo de datos. ¿Por qué los periodistas deberían tener conocimientos de análisis y visualización de datos? 

Además de la experiencia de Medialab-Prado, he recibido o dado cursos en medios y universidades. He formado parte del Máster de Periodismo de Datos del Centro Universitario Villanueva en sus tres ediciones; realicé la guía docente de dos módulos del Máster de Periodismo de Datos de UNIR y comencé la docencia, aunque en aquel momento no me convenció la formación en línea, posiblemente por el uso y abuso de software propietario; he dado un módulo de datos en el Máster del Periodismo de Agencia de la Agencia EFE-UC3M. Ahora estoy como docente en el módulo de Periodismo de Datos y Visualización del Máster de Periodismo Digital y de Datos de la Universidad Nebrija donde intento transmitir estos conocimientos básicos sobre periodismo y visualización de datos.  

No dejo de aprender y de practicar cada día. He creado este Máster de Periodismo y Visualización de Datos de la Universidad de Alcalá porque entiendo que no hay ninguna apuesta formativa que aborde estas temáticas de forma integral, desde el software libre o de código abierto, y porque desde que comencé a relacionarme con este mundo he visto que el análisis y la visualización de datos son esenciales para el periodismo de datos, pero no se han abordado así en las distintas apuestas universitarias.  

Es cierto que, desde el inicio, también he oído o leído que el periodismo de datos es colaboración y que hay muchos perfiles en la redacción y una persona no puede albergarlos todos, y la virtud es la cooperación. Eso es cierto, pero para cooperar hay que saber cooperar por un lado y saber de lo que se quiere cooperar por otro. En el periodismo clásico la cooperación es habitual –esperemos que no se pierda–, por lo que solo faltarían las habilidades. La formación que se hace, casi siempre, suele atender a diversos perfiles, así ha de ser para tener también una visión de conjunto, saber qué hacen otros, qué cosas me podrían interesar, qué puntos fuertes debo desarrollar o compensar. Y luego, teniendo una buena base y con la práctica, utilizar unas u otras habilidades en unos u otros roles.

calendar icon
Empresa reutilizadora

Organización sin ánimo de lucro que promueve la transparencia de las instituciones y el fácil acceso a la información pública mediante la tecnología y el periodismo. Para ello cuentan con tres líneas de actuación: periodismo, incidencia pública y servicios de transparencia para las AA.PP.

calendar icon
Evento

Este viernes, 21 de abril, tiene lugar en el espacio madrileño Media-Lab Prado un taller dedicado a la ciencia de datos en el sector social y sanitario. Un encuentro diseñado para profesionales e investigadores especializados en el análisis de datos con fines sociales y pertenecientes a las ciencias de la salud.

El evento arrancará con una sesión específica sobre el análisis de la movilidad urbana a través del big data, seguida de dos charlas relativas al área de la atención sanitaria bajo los títulos “Big4Cast: predicción de crisis en trastornos de bipolaridad” y “Aprendizaje automático sobre el análisis predictivo EGG”.

Para terminar la jornada, los asistentes podrán conocer los trabajo de otros expertos en la materia a través de la exhibición de pósteres que tendrá lugar en el recinto. Aquellos profesionales que hayan enviado sus piezas con anterioridad a vlopezlo@ucm.es verán expuestos sus pósteres y obtendrán el certificado correspondiente. Posteriormente, tendrá lugar una mesa redonda que reunirá a cinco representantes de entidades públicas y privadas para debatir sobre las siguientes temáticas:

  • Desarrollo social a través de los mapas (ESRI España).

  • Investigación sanitaria (Fujitsu).

  • Madrid Salud (WAP).

  • Innovación en la nube (AWS).

  • Datos abiertos (Ayto. de Madrid).

Para participar en el taller, es necesario registrarse previamente a través de la página web de Eventbrite.

 
calendar icon