Entrevista a Adolfo Antón, periodista de datos
Data: 26-05-2021
Izena: Adolfo Antón
Sektorea: Gizartea eta ongizatea
El periodismo de datos es una de las disciplinas que más ha crecido en los medios de comunicación en los últimos años, tanto dentro como fuera de nuestras fronteras. Esta modalidad del periodismo consiste en recabar datos veraces, analizarlos y ponerlos a disposición de la ciudanía a través de artículos y/o recursos gráficos e interactivos, facilitando la comprensión de asuntos complejos.
En datos.gob.es hemos entrevistado a Adolfo Antón, diseñador, periodista, formador y apasionado del Software Libre y el conocimiento abierto. Adolfo ha sido presidente de Open Knowledge Foundation España, coordinador de School of Data España, responsable del Datalab de Medialab Prado, coordinador del grupo de trabajo de Periodismo de Datos, de las Jornadas de Periodismo de Datos y comisario de los talleres de Periodismo de Datos (2014-2019) y Visualizar (2015-2018). Actualmente es coordinador del Máster Universitario de Periodismo y Visualización de Datos de la Universidad de Alcalá y Profesor del Máster de Periodismo Digital y de Datos en Universidad Nebrija.
Entrevista completa:
1. ¿A qué se dedica un periodista de datos?
Gracias, en primer lugar, por interesaros en el periodismo y la visualización de datos y por lo que puedo aportar a estos ámbitos. Agradezco y celebro la existencia de datos.gob.es, un proyecto imprescindible que cumple diez años dentro de poco y que, paradójicamente, creo que no es lo suficientemente conocido, utilizado y reconocido en estos campos.
Para responder a vuestra primera pregunta me voy a centrar en lo que habéis definido como periodismo de datos y que comienza por la recolección de datos veraces. Actualmente hay muchos proyectos que se encuentran en el campo de la verificación de noticias y esto, a mi modo de ver, lo entiendo como reacción a una proliferación exagerada de noticias falsas, manipuladas, bulos, mentiras y otras faunas y floras de las malas prácticas no solo periodísticas, sino también comunicativas. Es necesario verificar, certificar, acreditar y/o curar los datos con los que trabajamos, aportando un contexto, fuente y metodología. Si no, desarrollaremos análisis erróneos e historias falseadas.
Hay un dicho periodístico que dice "que un mal dato no te estropee un buen titular", y en esta tentación es muy importante que la ética periodística sea fuerte en periodistas, editorxs y en el propio medio.
Es necesario verificar, certificar, acreditar y/o curar los datos con los que trabajamos, aportando un contexto, fuente y metodología. Si no, desarrollaremos análisis erróneos e historias falseadas.
El periodismo de datos es, fundamentalmente, el uso de aplicaciones informáticas para trabajar con datos, ya sean pocos, muchos o muchísimos. En el periodismo de datos también son importantes la estadística, la infografía o la visualización de datos.
Con esas herramientas informáticas, se realiza lo que Paul Bradshaw denominó la pirámide invertida del periodismo de datos:
- Compilar (recopilar, recoger, recabar)
- Limpiar (fregar, escarbar, investigar, interrogar)
- Contextualizar (contexto de los datos y de la historia, metodología) y
- Combinar (datos, visualizaciones, infografías, mapas, textos, interactivos…)
Para ello es necesario, por tanto, utilizar herramientas informáticas y lenguajes informáticos que cubran una, varias o todas las tareas del proceso de trabajo. No es mandatorio, pero sí que es conveniente no enclaustrarnos en software que sea privativo y/o propietario pues determinará el uso que hagamos del mismo. Asimismo, los servicios de terceros pueden ser de gran ayuda, pero se prefieren servicios propios que podamos controlar al cien por cien.
2. ¿Por qué es importante el periodismo de datos? ¿Podría indicarnos algún caso de éxito o investigación donde haya sido clave?
El periodismo de datos es el periodismo que investiga con datos y, por tanto, es tan importante, necesario y primordial como el periodismo, si por ello entendemos un periodismo crítico e independiente, un cuarto poder de la sociedad actual. No saber trabajar con datos utilizando herramientas informáticas nos limita hacer buen periodismo, sea este económico, político o deportivo. Cada vez más el periodismo de datos deja de ser el caso de éxito excepcional de un periodismo generalista para ser la metodología del periodismo en general.
Los primeros casos de éxito en España pueden circunscribirse en torno a Civio, una organización que realiza periodismo de datos en proyectos como España en llamas, entre otros. Luego, son relevantes los proyectos que surgieron en torno a la conjunción de tres elementos que hicieron crecer el periodismo de datos en España:
- El grupo de Periodismo de Datos de Medialab-Prado, que despierta el interés público por esta disciplina y permiten la creación de una comunidad incipiente;
- El Máster de Periodismo de Investigación, Datos y Visualización de Unidad Editorial/URJC, que forma a una primera generación de periodistas de datos;
- Los medios que apuestan por ello en mayor o menor medida, como El Español, El Mundo, El Confidencial, RTVE, El Diario de Navarra, eldiario.es o Ara.cat.
Un punto álgido del periodismo de datos internacional y también de España fue, sin duda, la investigación sobre los Papeles de Panamá (Panama Papers) del Consorcio Internacional de Periodistas de Investigación (ICIJ, International Consortium of Investigative Journalists) de 2016 en la que participaron 109 medios de 76 países. En España fueron LaSexta y El Confidencial los medios participantes y lograron una amplia repercusión y la dimisión de entonces ministro de Industria, Energía y Turismo.
Lamentablemente, ni el Laboratorio de Datos de Medialab-Prado (continuador del grupo de periodismo de datos entre 2016 y 2019) existe ya, ni todos esos medios han mantenido o fortalecido los equipos. Pero, en general, sí que la disciplina se ha extendido en cuanto a comunidad, universidades y prácticas. Este proceso se ha acelerado tanto con la crisis del COVID19 que ya se considera al periodo actual como la segunda edad de oro de la visualización de datos.
3. ¿A qué retos se enfrenta hoy en día el periodismo de datos?
Es una pregunta difícil de contestar pues creo que a los retos tradicionales del periodismo se suman los que producen, como decía al principio, la abundancia de noticias falsas, manipuladas, sesgadas y difundidas por redes sociales donde cuestiones como la ética, la intimidad, la privacidad, la autoría, el anonimato o la producción automática y replicada en masa de contenidos genera un ruido ensordecedor. Además, se apuesta por una polarización intensiva que sirve para coleccionar datos de personas para crear perfiles de consumidores. Esto bombardea el proceso racional, reflexivo, discursivo y con escala de grises que un buen periodismo puede favorecer.
Si me centro en el periodismo de datos como metodología, el principal reto que observo es el de formar a periodistas en el uso de aplicaciones informáticas para trabajar con datos y con ello, poco a poco, mejorar la producción periodística para que el público en general valore los buenos productos periodísticos de datos.
El principal reto que observo es el de formar a periodistas en el uso de aplicaciones informáticas para trabajar con datos y con ello, poco a poco, mejorar la producción periodística para que el público en general valore los buenos productos periodísticos de datos.
4. ¿Hay una apuesta decidida de los medios tradicionales por el periodismo de datos?
Los Papeles de Panamá supusieron un momento esperanzador para el periodismo de datos y también por el hecho de que una televisión generalista apostara por esta disciplina. No ha ocurrido en términos generales, pero sí que la crisis del coronavirus ha producido un aumento de trabajos donde se produce cierto análisis y visualización de datos que son apreciables en las portadas de las webs de los medios, por ejemplo. Sin un análisis en profundidad diría que la mayoría son más escaparates con productos fáciles que completos trabajos de periodismo de datos en el sentido de que no se realizan todas las etapas del proyecto periodístico, sino fragmentos que cubren la demanda.
Cabe destacar el trabajo en análisis y visualización de datos que están haciendo en El País, RTVE.es y eldiario.es. A su vez, los medios especializados en verificación de noticias como Newtral y Maldita realizan una constante producción de noticias con formatos innovadores que también cuentan con análisis y visualización de datos.
Por otro lado, hay personas que no trabajan en medios pero que se han agrupado para trabajar desde el inicio de la pandemia sobre los datos del COVID19 en un esfuerzo encomiable que aúna recolección, análisis y visualización de datos y que deja el trabajo prácticamente preparado para que los medios lo tomen y rematen, pero todavía no se ha producido esa conexión mágica.
Por la experiencia de los talleres de periodismo de datos de Medialab-Prado diría que trabajar con datos lleva tiempo, requiere profesionales, equipo, ideas, etc., pero no son inversiones que puedan estar alejadas de cualquier redacción periodística, sea cual sea el tamaño del medio. El hecho de que esa apuesta decidida no se haya producido también deja el campo abierto a que otras propuestas se posicionen mejor, como ha ocurrido con las de verificación de noticias.
5. Los datos abiertos son fundamentales para que los periodistas de datos cuenten con información veraz de fuentes oficiales. ¿Qué tipos de datos son los más demandados por estos profesionales para sus investigaciones?
Mi impresión es que normalmente no se aprovechan los datos abiertos que hay, ya sea porque son muy complejos, porque se requiere amplios conocimientos en el tratamiento de datos, porque hay que trabajar mucho con ellos, porque se desconocen o, finalmente, porque no son "atractivos", no están de moda.
Es decir, tener un portal de datos abiertos y una política de publicación de datos abierta no asegura que se haga un uso de los datos, lo cual no quita para que esto, la publicación de datos abiertos de calidad, deba ser la política por defecto de toda administración pública y fuente de información que se precie.
Hay muchos casos distintos y citarlos todos llevaría un ejercicio más preciso de recolección de los mismos. Pongamos dos ejemplos. Los datos del INE, además de su complejidad, de los microdatos, vienen en formatos diversos, hay buscadores con los que crear tu propio conjunto cuyas interfaces son muy antiguas y poco usables. Otro caso es el del portal de datos del ayuntamiento de Zaragoza. Uno de los mejores, pero requiere registro para trabajar con la API y los datos se puede extraer JSON… Pongo puntos suspensivos porque si bien es uno de los formatos de datos más utilizados y manejable, no todo el mundo, al igual que con los microdatos, sabe usarlo. En definitiva, no todos los problemas en el periodismo de datos vienen por la ausencia de datos sino también por los formatos y las habilidades para manejarlos.
Normalmente no se aprovechan los datos abiertos que hay, ya sea porque son muy complejos, porque se requiere amplios conocimientos en el tratamiento de datos, porque hay que trabajar mucho con ellos, porque se desconocen o, finalmente, porque no son "atractivos", no están de moda.
En este sentido, el del manejo de las habilidades, recuerdo que últimamente he visto más de un medio que incrusta visualizaciones hechas por terceros. Podría ser un ejemplo más de esos nichos que el periodismo de datos está produciendo para que haya agencias de noticias especializadas en datos. No tendría que ser algo negativo, pero me parece que se usan herramientas a su vez de terceros con formatos limitados. En el extremo contrario estaría el caso de la BBC, que realiza una guía de estilo de cómo hacer gráficos con R y crean una librería para que el estilo de sus gráficos sea distinto. Eso es apostar por los datos también.
En los talleres de periodismo de datos o visualizar siempre nos encontrábamos con la falta del conjunto de datos mágico con el que trabajar, había que crearlo. Pero también nos encontrábamos con sorpresas y creo que, sin lugar a dudas, no utilizamos la mayoría de los datos disponibles por desconocimiento de que existan. Así que, además de demandar datos, apostaría en paralelo por aprender a utilizar los existentes o crearlos.
6. ¿Qué importancia tienen las visualizaciones en los reportajes de datos? ¿Qué tecnologías y herramientas utilizan?
Si me atengo a lo que normalmente se cuenta, las visualizaciones se utilizan en dos fases fundamentalmente:
- Por un lado, en la etapa del análisis de datos. Se visualizan los datos más fácilmente con todo tipo de herramientas gráficas o gráficos que nos ayuden a encontrar valores extraños, patrones, medias, etc.
- Por otro lado, en la parte final del proyecto, del producto periodístico. La o las visualizaciones pueden ser una parte más o la pieza principal de la historia periodística.
Últimamente intento explicar qué es la visualización de datos en términos informáticos. En formato papel la visualización se realiza con herramientas manuales, impresión manual o digital. Pero en la pantalla, en la Web se pueden hacer ¡las visualizaciones que queramos! Con caracteres, texto, imágenes, vídeo, audio, interacción, etc. Si entendemos el lenguaje y los lenguajes de este medio, seremos capaces de producir de una manera más integrada trabajos de periodismo de datos donde cualquier elemento tenga cabida.
Para ello no necesitamos hardware distinto al que ya manejamos, ordenadores de sobremesa o portátiles, pero sí un compendio de herramientas de software libre o de código abierto.
Huelga decir que hay un espectro amplísimo de posibilidades en el terreno del software privativo y/o propietario, pero el uso de software libre o de código abierto es fundamental para dar un salto en el uso de tecnologías en el periodismo y la visualización de datos.
Si entendemos el lenguaje y los lenguajes de este medio, seremos capaces de producir de una manera más integrada trabajos de periodismo de datos donde cualquier elemento tenga cabida.
7. Actualmente está implicado en 2 masters sobre periodismo de datos. ¿Por qué los periodistas deberían tener conocimientos de análisis y visualización de datos?
Además de la experiencia de Medialab-Prado, he recibido o dado cursos en medios y universidades. He formado parte del Máster de Periodismo de Datos del Centro Universitario Villanueva en sus tres ediciones; realicé la guía docente de dos módulos del Máster de Periodismo de Datos de UNIR y comencé la docencia, aunque en aquel momento no me convenció la formación en línea, posiblemente por el uso y abuso de software propietario; he dado un módulo de datos en el Máster del Periodismo de Agencia de la Agencia EFE-UC3M. Ahora estoy como docente en el módulo de Periodismo de Datos y Visualización del Máster de Periodismo Digital y de Datos de la Universidad Nebrija donde intento transmitir estos conocimientos básicos sobre periodismo y visualización de datos.
No dejo de aprender y de practicar cada día. He creado este Máster de Periodismo y Visualización de Datos de la Universidad de Alcalá porque entiendo que no hay ninguna apuesta formativa que aborde estas temáticas de forma integral, desde el software libre o de código abierto, y porque desde que comencé a relacionarme con este mundo he visto que el análisis y la visualización de datos son esenciales para el periodismo de datos, pero no se han abordado así en las distintas apuestas universitarias.
Es cierto que, desde el inicio, también he oído o leído que el periodismo de datos es colaboración y que hay muchos perfiles en la redacción y una persona no puede albergarlos todos, y la virtud es la cooperación. Eso es cierto, pero para cooperar hay que saber cooperar por un lado y saber de lo que se quiere cooperar por otro. En el periodismo clásico la cooperación es habitual –esperemos que no se pierda–, por lo que solo faltarían las habilidades. La formación que se hace, casi siempre, suele atender a diversos perfiles, así ha de ser para tener también una visión de conjunto, saber qué hacen otros, qué cosas me podrían interesar, qué puntos fuertes debo desarrollar o compensar. Y luego, teniendo una buena base y con la práctica, utilizar unas u otras habilidades en unos u otros roles.