Blog

Cada vez son más los medios de comunicación que cuentan entre sus páginas con artículos ligados al llamado periodismo de datosEsta modalidad de periodismo utiliza las tecnologías y herramientas ligadas a los datos para ofrecer a los lectores una información más documentada, fácil de comprender y con mayor atractivo. 

En este artículo te explicamos en qué consiste el periodismo de datos y te mostramos algunos ejemplos de medios de comunicación que ya incorporan esta modalidad dentro de sus procesos informativos. 

¿Qué es el periodismo de datos? 

El periodismo de datos o data journalism, es una disciplina periodística que incorpora diferentes campos como la informática, la programación, la ingeniería, la estadística, el diseño y el periodismo para combinar en un mismo espacio el análisis de datos junto a la narrativa propia de la prensa. Según el Data Journalism Handbook, los datos pueden ser la herramienta utilizada para contar una historia, la fuente en la que se basa una historia, o ambas cosas. 

El periodismo de datos tiene su origen en el Periodismo de precisión -evolución del periodismo de investigación-, donde se incorporan disciplinas como la sociología y la estadística al periodismo tradicional, y el Periodismo Asistido por Computadora (Computer Assisted Reporting o CAR), que surgió en 1969 cuando los periodistas empezaron a utilizar sistemas informáticos para apoyarse a la hora tratar la información que recolectaban. 

El Periodismo de datos va un paso más allá y es fruto de la transformación digital presente hoy en día en el trabajo diario de muchas redacciones a lo largo del mundo. Mediante recursos y herramientas relacionadas con la analítica de datos se extrae información de grandes bases de datos. De esta forma se oferta una información de mayor valor y más completa, adaptada al dinamismo que requiere la lectura digital.

¿Qué productos ofrece el periodismo de datos? 

De acuerdo con la revista digital Cuadernos de periodistas, existen al menos cuatro producciones que pueden derivar de esta disciplina, y que generalmente son complementarias entre sí:  

  • Artículos basados en datos: se trata de artículos breves que son elaborados a partir de grandes bases de datos. Este tipo de artículos son propios del periodismo de investigación, ya que su denominador común es tener como base encuestas o estadísticas. 
  • Visualizaciones interactivas: como infografías, gráficos o aplicaciones que permiten visualizar con mayor claridad la información obtenida de las bases de datos, facilitando la compresión de temas complejos por parte de los lectores. Las visualizaciones pueden complementar artículos o ser un producto por sí mismas cuando se acompañan de textos explicativos breves.  
  • Conjuntos de datos abiertos (datasets): Algunos medios ofrecen datos en abierto, fruto de sus investigaciones, con el fin de democratizar la información a través de la accesibilidad de datos y su disponibilidad en Internet en formatos reutilizables y gratuitos. Como ejemplo, el New York Times ofrece datos sobre el coronavirus de manera abierta
  • Aplicaciones de noticias: cada vez son más comunes los servicios que agrupan la información y mandan notificaciones a los usuarios sobre noticias de su interés pertenecientes a distintos medios. Por ejemplo, los principales proveedores. Por ejemplo, Google Discover o Samsung Daily

El periodismo de datos en los medios de comunicación 

Cada vez son más los medios que cuentan con una producción de noticias a partir de datos. A continuación, mostramos algunos ejemplos: 

A nivel nacional 

Entre otros,  El PaísEl Mundo o El Diario cuentan con una sección específica dentro de sus diarios digitales dedicadas al periodismo de datos. Dentro de ambas, los diarios abordan los temas de actualidad desde la perspectiva que ofrecen los datos y a través de los cuales generan visualizaciones como la siguiente. En ella, se puede ver un mapa que muestra las desigualdades en la mortalidad según la zona en la que se reside.

Por su parte, EpData es la plataforma creada  por Europa Press para facilitar el uso de datos públicos por parte de los periodistas, con el objetivo tanto de enriquecer las noticias con gráficos y análisis de contexto como de contrastar las cifras ofrecidas por las diversas fuentes. EpData ofrece además herramientas para crear y editar gráficos. Un ejemplo de la actividad que realizan es este artículo, donde puedes consultar cómo se encuentra la situación de las listas de espera de la dependencia en España. 

Gráfico, Gráfico de líneas, Esta es la situación de la lista de espera a la dependencia

Otro ejemplo de periodismo de datos es Newtral. Se trata de una startup de contenido audiovisual fundada en 2018 en la que los datos son la base de todo su trabajo, sobre todo en la lucha contra las fake news. Por ejemplo, en este artículo se pueden ver diferentes visualizaciones de datos relacionadas con la oscilación del precio de la luz durante diferentes meses. 

Gráfico, Gráfico de líneas, índice de precios de consumo (IPC) de vivienda, agua electricidad, gas y otros combustibles

A nivel internacional 

El periodismo de datos forma parte de algunos de los diarios de mayor relevancia a nivel internacional. Es el caso de The Guardian, que también cuenta con una sección específica dedicada a la producción de material periodístico a través de artículos, gráficos y visualizaciones basadas en datos. Por ejemplo, en este mapa interactivo puedes consultar qué zonas de Australia sufrieron mayores catástrofes naturales durante 2020.

Mapa de Australia donde se msrcsn en un color rojizo las zonas que sufrieron incendios

Otro medio de comunicación internacional que también cuenta con un apartado específico para el periodismo basado en datos es el diario argentino La Nación, que a través de su sección La Nación Data ofrece numerosas producciones informativas en las que combina datos y actualidad. Por ejemplo, en este artículo puedes ver un indicador de movilidad de los ciudadanos argentinos.  

Mapa que muestra la movilidad de los ciudadanos argentinos

Másters y estudios relacionados con el periodismo de datos 

La transformación digital ha provocado que el periodismo de datos haya llegado para quedarse. Por ello, cada vez son más las universidades y centros de educación que ofertan estudios relacionados con el periodismo de datos. Por ejemplo, el Máster Propio en Periodismo de Datos y Visualización de la Universidad de Alcalá; el Máster en Periodismo Digital y de Datos que imparten Atresmedia y la Universidad de Nebrija o el Curso de Periodismo de Datos de la Escuela de Periodismo UAM-El País.  

En definitiva, estamos ante una modalidad con futuro, que necesita de medios que sigan apostando por esta disciplina y de profesionales capaces de manejar herramientas de análisis y tratamiento de datos, pero también de contar historias, capaces de transmitir qué está sucede en nuestro entorno con el apoyo de los datos de una manera veraz y cercana.  

Por ello, no es de extrañar que esta modalidad de periodismo siga creciendo en los próximos años y que además de los ejemplos incluidos en este artículo aumenten los medios de comunicación y estudios relacionados con el periodismo de datos. Si conoces alguno más y quieres compartirlo, no dudes en escribirnos a contacto@datos.gob.es o dejarnos un mensaje en los comentarios. 


Contenido elaborado por el equipo de datos.gob.es.

calendar icon
Blog

El Centro de soporte para el intercambio de datos (Support Centre for Data Sharing o SCDS en inglés) nació en 2019 como parte de la estrategia europea para impulsar un ecosistema de datos común. Se trata de un espacio para investigar e informar sobre las prácticas del llamado data sharing (intercambio de datos), que ellos mismos definen como “transacciones de cualquier tipo de información en forma digital, entre diferentes tipos de organizaciones”.  

El SCDS proporciona soporte práctico a organismos públicos o privados que busquen compartir sus datos -independientemente del modelo elegido para ello-. Entre otras cuestiones, difunde buenas prácticas y casos de éxito con el objetivo de inspirar a otros en el intercambio de datos. Los ejemplos, que no se limitan al ámbito geográfico de Europa, abarcan diferentes sectores, desde la agricultura hasta la sanidad o la movilidad. 

En el informe Data Sharing Practice Examples encontramos algunos de ellos. Este documento se centra principalmente en plataformas e iniciativas de terceros que pueden servir de apoyo a la gobernanza y el cumplimiento normativo en las prácticas de intercambio de datos.  

Ejemplos prácticos e iniciativas de intercambio de datos 

Uno de los principales retos que se encuentran las organizan que empiezan a desarrollar acciones de intercambio de datos es la falta de confianza que puede generar en la industria y la ciudadanía la compartición de su información. El uso de estándares y soluciones tecnológicas de terceros ayudan a paliar este reto, aumentando también la eficiencia al no tener que dedicar tiempo y recursos al desarrollo propio. 

El informe divide los ejemplos que muestra en 3 categorías, en base a su función principal: 

  • Catalizadores de espacios de datos: su objetivo es crear espacios para la puesta en común de datos, abordando un sector o territorio específico.  

  • Facilitadores políticos/legales: se centran en los retos legales del intercambio de datos, bien desde una posición de soporte u ofreciendo su visión desde la experiencia. 

  • Facilitadores tecnológicos: se dedican a desarrollar tecnología - o asesorar sobre ella - para el intercambio de datos de manera general, sin centrarse en un sector específico. 

El informe incluye ejemplos relativos a cada una de estas categorías como veremos a continuación.  

Catalizadores de espacios de datos: MaaS Madrid y Mobility 360 

Empezamos con un ejemplo relativo a nuestro país y al sector de la movilidad. En Madrid conviven operadores públicos y privados de transporte que ofrecen servicios de autobuses, trenes, tranvías, coches, bicicletas y motos. 

MaaS Madrid nació como un agregador de datos que permite a los usuarios acceder a la información en tiempo real de los citados operadores en una única plataforma integrada, incorporando la información disponible del transporte público y de los servicios de movilidad compartida adheridos - como coches compartidos, patinetes o bicicletas-. MaaS Madrid fue una primera aproximación, que ha dado paso a Mobility 360, presentada recientemente en una fecha posterior al informe y por ello no incluida en el mismo. 

Mobility 360 ofrece “una experiencia de movilidad inteligente, es decir, digital e innovadora que proporciona al usuario alternativas eficientes para realizar sus desplazamientos de forma fácil y fluida”. Esto supone una gran ventaja para los usuarios, que disponen de toda la información centralizada para elegir la ruta y el servicio que mejor responda a sus necesidades, a la vez que se fomenta el uso del transporte público o compartido (con el consiguiente beneficio para el medio ambiente).  

Este modelo también tiene ventajas para los operadores, que amplían su visibilidad y se hacen más conocidos entre su público. Además, permite recopilar datos anónimos agregados en tiempo real, muy útiles para la toma de decisiones y la planificación de políticas de movilidad por parte de los entes públicos. 

Madrid mobility 360. Principales características

Fuente: www.mobility360.app

Facilitadores políticos/legales: Technology Industries Finland 

Technology Industries of Finland (TIF) es la organización en defensa de las empresas de electrónica, electrotécnica, mecánica y metalúrgica, consultoría de ingeniería y tecnología de la información en el país nórdico, con más de 1.600 miembros.  Tras analizar el uso de los datos en estos campos y observar la falta de prácticas establecidas relativas a los derechos de uso de los datos, TIF ha elaborado un modelo de condiciones para el intercambio de información, que están promoviendo dentro y fuera del país. 

Este modelo incluye una serie de cláusulas estándar compatibles con la legislación sobre competencia y protección de datos personales de la Unión Europea. TIF recomienda incluir estas cláusulas como apéndices a los acuerdos preexistente entre las partes implicadas en el intercambio de datos.  

Los términos del modelo están disponibles en la tienda web de Teknova.  

Technology Industries Finland

Fuente: eudatasharing.eu/examples/technology-industries-finland 

Facilitadores tecnológicos: DataVaccinators 

DataVaccinators se centra en el intercambio de datos personales de forma segura. Ofrece una solución de software de código abierto para el almacenamiento y la protección de datos personales mediante el uso de técnicas de seudonimización aplicadas en el momento de generación de los datos, que son separados en distintas bases de datos y cifrados.  

DataVaccinators se puede integrar en cualquier aplicación. Los desarrolladores pueden integrar otros componentes en la base de datos. El código fuente puede verse y descargarse en GitHub (con licencia AGPL), al igual que la implementación en JavaScipt (con licencia MIT).  

Esta solución está dirigida a cualquier tipo de organización, aunque es especialmente útil para hospitales, universidades, bancos, aseguradoras o fabricantes, que pueden aprovechar los datos anonimizados de los clientes para extraer tendencias y tomar decisiones.  

DataVaccinators 

Fuente: eudatasharing.eu/examples/datavaccinator-personal-data-protection-design-industrialised-pseudonymisation

Accede a más ejemplos 

Estos son solo 3 ejemplos, pero el informe incluye muchos más. Además, en la web del SCDS puedes encontrar más casos de éxito. Como bien indican desde el propio SCDS, todavía no ha surgido ningún modelo que se haya impuesto a los demás, por ello es importante documentar y tener constancia de las iniciativas que van surgiendo en este ámbito, para poder elegir la que más se adapte a nuestras necesidades, aunque esta situación tiene el riego de crear silos, en base a la solución elegida por cada operador. 

El intercambio de datos entre organizaciones privadas y con organismos públicos en todas sus modalidades puede generar múltiples beneficios, principalmente al proporcionar una mayor información para tomar mejores decisiones que afecten tanto al ámbito económico como social. Pero para aprovecharse de todas sus ventajas es necesario llevar a cabo este intercambio de manera segura, legal y respetuosa con los derechos de privacidad de los ciudadanos. La Unión Europea es consciente de ello y ya está dando pasos en este sentido. Uno de ellos es el Reglamento sobre gobernanza de los datos en el ámbito europeo, dirigido a “ampliar la disponibilidad de datos con miras a su utilización”, a través de mecanismos como los proveedores de servicios de intercambio de datos o el punto único de información. 


Contenido elaborado por el equipo de datos.gob.es.

calendar icon
Blog

El mundo de la tecnología y los datos está en evolución constante. Estar a la última de las novedades y tendencias puede ser una tarea complicada. Por ello, son importantes los espacios de diálogo donde compartir conocimientos, dudas y recomendaciones. 

¿Qué son las comunidades? 

Las comunidades son canales abiertos a través de los cuales diferentes personas interesadas en una misma temática o tecnología se reúnen de forma física o virtual para aportar, preguntar, discutir y resolver temas relacionados con dicha tecnología. Comúnmente se crean a través de una plataforma en línea, aunque existen comunidades que organizan reuniones y eventos de manera periódica donde comparten experiencias, establecen objetivos y afianzan los lazos creados a través de la pantalla. 

¿Cómo funcionan? 

Muchas comunidades de desarrolladores utilizan plataformas de código abierto conocidas como GitHub o Stack Overflow, a través de las que almacenan y administran su código, además de compartir y debatir sobre temas relacionados.  

Respecto a cómo se organizan, no todas las comunidades disponen de un organigrama como tal, algunas sí, pero no existe un parámetro que rija la organización de las comunidades de manera general. Sin embargo, sí pueden existir roles definidos en función de las habilidades y conocimientos de cada uno de sus miembros. 

Las comunidades de desarrolladores como reutilizadores de datos 

Existe un gran significativo número de comunidades que acercan los conocimientos sobre datos y sus tecnologías asociadas a diferentes grupos de usuarios. Algunas de ellas, están integradas por desarrolladores, que se reúnen para ampliar sus capacidades a través de webinars, concursos o proyectos. En ocasiones, estás actividades ayudan a impulsar la innovación y la transformación en el mundo de la tecnología y los datos, y pueden servir de escaparate para promover el uso de los datos abiertos. 

A continuación, recogemos tres ejemplos de comunidades de desarrolladores relacionadas con los datos que pueden ser de tu interés si quieres ampliar tu conocimiento en este campo:  

Hackathon Lovers 

Desde su creación en 2013, esta comunidad de desarrolladores, diseñadores y emprendedores amantes de los hackathones, organizan encuentros para probar nuevas plataformas, APIs, productos, hardware, etc. Entre sus principales objetivos se encuentra el crear nuevos proyectos y aprender, a la vez que los usuarios se divierten y afianzan lazos con otros profesionales. 

Las temáticas que abordan en sus eventos son variadas. En el hackathon #SerchathonSalud, se centraron en impulsar la formación e investigación en el campo de la salud a partir de las búsquedas bibliográficas en 3 bases de datos (PubMedEmbaseCochrane). En otros eventos, se han focalizado en el uso de APIs concretas. Es el caso de #OpenApiHackathon, un evento de desarrollo sobre Open Banking y #hackaTrips, un hackathon para buscar ideas sobre turismo sostenible. 

¿A través de qué canales puedes seguir sus novedades? 

Hackathon Lovers está presente en las principales redes sociales como son Twitter y Facebook, además de YouTubeGithubFlickr y cuenta con un blog propio.  

Comunidad R Hispano 

Se creó en noviembre de 2011, en el seno de las III Jornadas de Usuarios de R celebradas en la Escuela de Organización Industrial en Madrid. Organizada a través de grupos locales de usuarios, su principal objetivo es el de fomentar el avance del conocimiento y el uso del lenguaje de programación en R, además del desarrollo de la profesión en todas sus vertientes, especialmente la investigadora, docente y empresarial.  

Uno de sus principales campos es el de la formación de R y tecnologías asociadas a sus usuarios, en las que los datos abiertos tienen cabida. Respecto a las actividades que realizan, se encuentran eventos como:  

  • Congresos anuales: hasta ahora se han realizado once ediciones basadas en charlas y talleres con los asistentes con el software R como protagonista.
  • Iniciativas locales: aunque la asociación es el principal promotor de los congresos anuales, el sentimiento de comunidad se forja gracias a grupos locales como los de Madrid, patrocinado por RConsortiumCanarias, que comunica aspectos como datos públicos y geográficos o Sevilla, que durante sus últimos hackatones han desarrollado varios paquetes vinculados a datos abiertos
  • Colaboración con grupos e iniciativas centradas en datos: como la UNED, Grupo de Periodismo de DatosGrupo Machine Learning Spain o empresas como Kabel o Kernel Analytics. 
  • Colaboración con instituciones académicas españolas: como EOI, Universidad Francisco de Vitoria, ESIC, o K-School, entre otras. 
  • Relación con instituciones internacionales: como RConsortium o RStudio
  • Creación de paquetes centrado en datos en España: participación en ROpenSpain, una iniciativa para entusiastas de R y datos abiertos encaminada a crear paquetes de R de máxima calidad para la reutilización de datos españoles de interés general. 

¿A través de qué canales puedes seguir sus novedades? 

 Esta comunidad está formada por más de 500 socios. El principal canal de comunicación para entrar en contacto con sus usuarios es Twitter, aunque sus grupos locales poseen cuentas propias, como es el caso de MálagaCanarias o Valencia, entre otros.  

R- Ladies Madrid 

R-Ladies Madrid es una rama local de R-Ladies Global -un proyecto financiado por el R Consortium-Linux Foundation- que nace en 2016. Se trata de una comunidad open source desarrollada por mujeres que se apoyan y ayudan a crecer dentro del sector R.  

La actividad principal de esta comunidad reside en la celebración de encuentros mensuales o meet ups donde ponentes mujeres comparten  conocimientos y proyectos en los que trabajan, o enseñan funcionalidades relacionadas con R. Entre sus miembros encontramos desde profesionales que tienen R como herramienta principal de trabajo hasta aficionadas que buscan aprender y mejorar sus capacidades. 

R-Ladies Madrid es muy activa dentro de la comunidad software y apoya diferentes iniciativas tecnológicas, desde la creación de grupos de trabajo open source hasta su participación en diferentes eventos tecnológicos. En algunos de sus grupos de trabajo utilizan datos abiertos, procedentes de fuentes como el BOE o Open Data NASA. Además, también han ayudado a montar un grupo de trabajo con datos sobre Covid-19. En años anteriores han organizado hackatones de género donde todos los equipos participantes estaban constituidos por un 50% mujeres y se proponía trabajar con datos de organizaciones sin ánimo de lucro. 

¿A través de qué canales puedes seguir sus novedades? 

R – Ladies Madrid está presente en Twitter, además de tener un grupo de Meetup.  

 

Esta ha sido una primera aproximación, pero existen más comunidades de desarrolladores relacionadas con el mundo de los datos en nuestro país. Estas son fundamentales no solo para acercar los conocimientos teóricos y técnicos a los usuarios, sino también para impulsar la reutilización de los datos públicos a través de diversos proyectos como los que hemos visto. ¿Conoces alguna otra organización con fines similares? No dudes en escribirnos a dinamizacion@datos.gob.es o dejarnos toda la información en los comentarios. 

calendar icon
Blog

Personas, gobiernos, economía, infraestructuras, medio ambiente… todos estos elementos confluyen en nuestras ciudades y hacen que para poder ser más eficientes éstas tengan que sacar el máximo potencial del flujo de datos constante que fluye a través de sus calles. Análisis de eficiencia de los servicios, seguimiento de la inversión, mejora del transporte público, participación y colaboración con los ciudadanos, reducción de los residuos o prevención de desastres naturales son sólo algunos de los múltiples ejemplos de innovación en las ciudades dirigidas por datos que nos muestran cómo los gobiernos locales están consiguiendo mejorar los servicios y la calidad de vida de sus ciudadanos gracias a la apertura y mejor explotación de sus datos.

Desde encontrar una plaza de aparcamiento a descubrir nuevos lugares de ocio o simplemente movernos por la ciudad. Las aplicaciones que nos facilitan el día a día ya forman parte del paisaje habitual de las ciudades. Al mismo tiempo, los datos están también transformando las ciudades poco a poco delante de nuestros propios ojos y nos ofrecen una visión alternativa de las mismas a través de la definición de nuevos barrios virtuales en función de la huella que vamos dejando con nuestras acciones y nuestros datos.

  

Ciudades hiperconectadas, dirigidas por los datos, gestionadas por inteligencia artificial y habitadas por un mayor número de robots que de humanos ya no serán una exclusiva de las películas y series de ciencia ficción, sino proyectos reales en mitad del desierto y con planes ya definidos que han sido puestos en marcha en busca de la diversificación y con el objetivo de transformar y renovar economías demasiado dependientes del viejo petróleo irónicamente gracias al supuesto nuevo petróleo de los datos. Volviendo por un momento al presente, encontramos también ya ejemplos de cómo esa transformación a través de los datos es real y está sucediendo en casos tan tangibles como la prevención de crímenes y disminución de la violencia en las favelas de Rio de Janeiro.

Pero no todas las expectativas son tan optimistas, ya que la visión transformadora que tienen algunas empresas tecnológicas para nuestros barrios genera también serias dudas fundadas, no sólo sobre cómo se gestionarán nuestros datos más personales y quiénes serán realmente los que tendrán acceso y control sobre ellos, sino también sobre el supuesto poder transformador de los propios datos.

Por el momento lo único que parece estar totalmente claro es que el papel de los datos en la transformación de las ciudades y ciudadanos del futuro inmediato será clave y deberemos encontrar nuestro propio camino a medias entre las visiones más optimistas y las más pesimistas para definir entre todos qué entendemos como el nuevo paradigma de las Smart Cities, pero siempre con el foco puesto en el elemento humano y no únicamente en los aspectos puramente tecnológicos y con la participación y la co-creación como elementos clave.

calendar icon
Blog

Con toda la probabilidad la mayoría de nosotros conoceremos, o habremos al menos oído hablar de la tecnología blockchain, por su relación con la criptomoneda más popular del momento – Bitcoin. Sin embargo, blockchain no es una tecnología nacida únicamente para sostener esta nueva economía digital, sino que como otras muchas tecnologías de cadenas de bloques su principal finalidad es almacenar y gestionar cadenas de datos de forma descentralizada y distribuida.

Blockchain cuenta con una serie de características que serán en definitiva las que nos proporcionen las ventajas la convertirán en una tecnología de utilidad en varios campos de aplicación: privacidad, (cuasi) anonimato, integridad, distribución de la confianza, transparencia, seguridad, sostenibilidad y código abierto. Si bien está claro que su aplicación más extendida hasta el momento está en el campo de las finanzas, y más concretamente las criptomonedas, también puede resultar de gran utilidad para muchos otros campos fuera y dentro de los gobiernos, particularmente todo aquello relacionado con la identificación personal o la protección de los datos personales mediante la descentralización de la privacidad.

Con respecto a la mejora de los gobiernos blockchain puede contribuir en muy diversas áreas tales como la prestación de servicios públicos, la autenticidad de los registros públicos, la gestión de los datos del sector público, la lucha contra la corrupción o las garantías en los procesos electorales entre otros. Son también ya decenas los ejemplos de emprendedores aplicando la tecnología para innovar en campos tan importantes como la sanidad o la agricultura.

En definitiva, blockchain es una tecnología con el potencial de transformar nuestros sistemas políticos y al mismo tiempo habilitar cambios sociales relevantes. Pero, como pasa también con cualquier otra tecnología disruptiva y todavía en fase de maduración, no todo son ventajas y nos encontraremos también algunos inconvenientes y limitaciones que también habrá que superar, como por ejemplo los problemas de escalabilidad, el alto coste computacional y de interconexión que soportan las operaciones, el impacto medioambiental asociado a ese coste, la excesiva centralización de cada cadena o la alta complejidad de los procesos criptográficos.

Por otro lado, aun cuando blockchain se ha convertido rápidamente en la tecnología de moda y a pesar de la aparente simplicidad del concepto subyacente, sigue siendo al mismo tiempo una de las tecnologías más crípticas e incomprendidas por parte de sus potenciales beneficiarios en la actualidad. Por tanto, para que estas tecnologías de gestión de datos descentralizadas se puedan popularizar en un futuro próximo será también necesario afrontar otro tipo de barreras de entrada de tipo más estructural relacionadas con la necesidad de más formación, una mejora en la usabilidad, mayor capacidad de adaptación institucional o el desarrollo de los cambios regulatorios necesarios para darle soporte.

Si quieres saber más de blockchain, puedes leer nuestro informe Descubriendo las claves de blockchain.

calendar icon
Blog

"The simple graph has brought more information to the data analyst’s mind than any other device.” — John Tukey

La visualización gráfica de datos constituye una disciplina propia dentro del universo de la ciencia de datos. Esta práctica ha marcado hitos importantes a lo largo de la história en la analítica de datos. En este post te ayudamos a descubrir y entender su importancia y repercusión de una forma amena y práctica.

Pero, empecemos la historia por el principio. En 1975, un joven de 33 años comienza a impartir un curso de estadística en la universidad de Princeton, sentando las bases de lo que sería la disciplina del visual analytics varias décadas después. Ese joven, llamado Edward Tufte, es considerado el Leonardo da Vinci de los datos. Tufte es, actualmente, profesor emérito de ciencias políticas, estadística y ciencias de la computación en la universidad de Yale. Entre 2001 y 2006, el profesor Tufte escribió una serie de 4 libros - considerados ya clásicos- sobre la visualización gráfica de datos. Algunas ideas centrales de las tesis de Tufte hacen referencia a la eliminación de los elementos inútiles y no informativos en los gráficos. Tufte, aboga por la eliminación de elementos no cuantitativos y decorativos de las visualizaciones, argumentando que éstos distraen la atención de los elementos realmente explicativos y de valor.

Desde el gráfico más sencillo hasta el más complejo (figura 1) y refinado, todos ofrecen alto valor tanto al analista, durante su proceso de ciencia de datos, como al usuario final, al cual estamos comunicando una historia basada en datos.

Figura1. La imagen muestra la diferencia entre dos visualizaciones gráficas de datos. A la izquierda, un ejemplo de la visualización de datos más sencilla que se puede realizar. Representación de puntos en coordenadas cartesianas x|y. A la derecha, un ejemplo de visualización de datos compleja en el que se representa en coordenadas polares la distribución de un contaminante (SO2). Los ejes representan las direcciones del viento N|S E|W (en grados) mientras que el radio de la distribución representa la velocidad del viento según la dirección en m/s. La escala de colores representa la concentración promedio de SO2 (en ppb) para esas direcciones y velocidades del viento. Con este tipo de visualización se pueden representar gráficamente tres variables (dirección del viento, velocidad del viento y concentración de contaminantes) en un gráfico "plano" en dos dimensiones (2D). La visualización en 2D es muy conveniente pues resulta más fácil de interpretar para el cerebro humano.

¿Por qué es tan importante la visualización gráfica de los datos?

En la ciencia de datos existen muchos tipos diferentes de datos para analizar. Una forma de clasificación de los datos atiende al nivel de estructuración lógica que éstos tienen. Por ejemplo, se entiende que los datos en formatos similares a hojas de cálculo  -aquellos datos que se estructuran en forma de filas y columnas- son datos con una estructura bien definida - o datos estructurados- Sin embargo, aquellos datos como los 140 caracteres de un feed de twitter se consideran datos sin estructura - o desestructurados-. En medio de estos dos extremos se encuentra toda una gama de grises, que va desde los ficheros delimitados por caracteres especiales (comas, puntos y comas, espacios, etc.) hasta las imágenes o los videos de Youtube. Es evidente que las imágenes y los videos solamente cobran sentido humano una vez representadas visualmente. De nada serviría (para un humano) que presentaremos una imagen como una matriz de números que representan una combinación de colores RGB (Red, Green, Blue). En el caso de los datos estructurados, su representación gráfica es necesaria en todas las etapas del proceso de análisis, desde la etapa exploratoria, hasta la presentación final de resultados. Veamos un ejemplo:

En 1963, la compañía de aerolíneas norteamericana Pam Am utilizó la representación gráfica (la serie temporal entre 1949 y 1960) del número mensual de pasajeros internacionales para pronosticar la demanda futura de aviones y realizar un pedido de compra. En el ejemplo, vemos la diferencia entre la representación matricial de los datos y su representación gráfica. La ventaja de representar gráficamente los datos salta a la vista con el ejemplo de la figura 2.

Figura 2. Diferencia entre la representación tabular de los datos y la representación gráfica o visualización.

La visualización gráfica de los datos tiene un papel fundamental en todos los estadios del análisis de datos. Existen múltiples aproximaciones sobre cómo realizar un proceso de análisis de datos de forma correcta y completa. De acuerdo con Garrett Grolemund y Hadley Wickham en su reciente libro R for Data Science, un proceso estándar en análitica de datos sería de la siguiente forma (figura 3):

Figura 3. Representación de un proceso estándar en analítica avanzada de datos.

La visualización de datos está en el núcleo del proceso. Es una herramienta básica para el analista o científico de datos que -mediante un proceso iterativo- va transformando y componiendo un modelo lógico de los datos. Apoyándose en la visualización, el analista va descubriendo los secretos enterrados en los datos. La visualización permite de forma rápida:

  • Descartar aquellos datos poco representativos o erróneos.

  • Identificar aquellas variables que dependen unas de otras y por lo tanto contienen información redundante

  • Realizar cortes a los datos para poder observarlos desde diferentes perspectivas.

  • Finalmente, comprobar que aquellos modelos, tendencias, predicciones y agrupaciones que hemos aplicado sobre los datos, nos devuelven el resultado esperado.

Herramientas para el análisis visual de datos

Tan importante es la visualización gráfica de los datos en todos los ámbitos de la ciencia, ingeniería, negocios, banca, medio ambiente, etc. que existen multitud de herramientas para diseñar, desarrollar y comunicar la visualización gráfica de los datos.

Estas herramientas cubren un amplio espectro del público objetivo, desde desarrolladores de software, hasta científicos de datos pasando por periodistas y profesionales de la comunicación.

  • Para desarrolladores de software, existen cientos de librerías y paquetes de software que contienen miles de tipos de visualizaciones. Los desarrolladores tan solo tienen que cargar estas librerías en sus respectivos frameworks de programación y parametrizar el tipo de gráfico que deseen generar. El desarrollador tan solo ha de indicar los datos de origen que desea representar, el tipo de gráfico (líneas, barras, etc.) y la parametrización de dicho gráfico (escalas, colores, etiquetas, etc.). En los últimos años, la visualización web se impone con fuerza, y las librerías más populares se basan en frameworks JavaScript (la mayoría open source). Quizás una de las más populares por su potencia sea D3.JS, aunque existen muchas más.

  • El científico de datos acostumbra a trabajar con un framework de análisis concreto que, normalmente, incluye todos los componentes, entre ellos su motor de análisis visual de los datos. Los entornos más populares, hoy en día, para la ciencia de datos son R y Python, y ambos incluyen librerías nativas para la analítica visual. Quizás la librería más popular y potente en R sea ggplot2, mientras que en Python, matplotlib y Plotly son de las más populares.

  • Para comunicadores profesionales o personal no técnico de las distintas áreas de negocio (Marketing, Recursos Humanos, Producción, etc.) que necesita tomar decisiones basadas en datos, existen herramientas - que no son únicamente herramientas de visual analytics - con funcionalidades para generar representaciones gráficas de los datos. Herramientas modernas de Business Intelligence de autoservicio como MS Excel, MS Power BI, Qlik, Tableau, etc. son estupendas herramientas para comunicar los datos sin necesidad de disponer de competencias en programación o codificación.

En definitiva, las herramientas de visualización permiten a todos estos profesionales acceder a los datos de una manera más ágil y sencilla. En un universo donde la cantidad de datos útiles a analizar no deja de crecer, cada vez son más necesarias este tipo de herramientas, que facilitan la obtención de valor procedente de los datos y, con ello, la toma decisiones relativas al presente y al futuro de nuestro negocio o actividad.

Si quieren conocer más sobre herramientas de visualización de datos, te recomendamos el informe Visualización de datos: definición, tecnología y herramientas, así como el material formativo Uso de herramientas básicas de tratamiento de datos.

 


Contenido elaborado por Alejandro Alija,experto en Transformación Digital e Innovación.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Evento

El próximo día 23 de octubre, jornada previa al Encuentro Aporta 2017, tendrá lugar la presentación del informe “La reutilización de datos para la generación de negocios”, que analiza los datos publicados y los portales donde se publican, junto a los responsables de su gestión y los servicios generados a partir de ellos.

Durante la sesión, que se desarrollará - de 16:30 a 18:00 h. - en la sede de la Fundación para la Innovación COTEC, se presentarán los datos del informe y se abrirá un debate sobre los aspectos clave relacionados con la publicación de datos para la generación de nuevos servicios, así como sobre la oportunidad de una asociación europea de publicadores de datos.

La organización de esta jornada, que será difundida en redes sociales con el hasthag #DatosAbiertosCotec, cuenta con la colaboración de Iniciativa Barcelona Open Data y la Universidad Rey Juan Carlos, y será liderada por el experto en datos abiertos Alberto Abella.

Las conclusiones del evento serán presentadas el 24 de octubre en la jornada de tarde del Encuentro Aporta 2017.

calendar icon
Evento

Esta primavera, Madrid se ha convertido en la capital nacional de los datos al albergar desde el mes de marzo hasta junio un conjunto de actividades, relacionadas todas ellas con la importancia y el impacto del big data en la sociedad actual. Desde el pasado 17 de marzo al 6 de junio, tiene lugar Ojo al Data, proyecto promovido por Medialab-Prado del Ayuntamiento de Madrid y el cual explora las prácticas creativas, sociales y políticas que surgen alrededor de la cultura de los datos.

Con el apoyo del Centro de innovación BBVA, Fundación Telefónica, la Open Knowledge Foundation España o el Instituto Nacional de Estadística, entre un gran número de entidades colaboradoras, Ojo al Data brinda un intenso programa –conferencias, workshops, exposiciones o debates- para que el público general descubra cómo los datos masivos encierran la respuesta a gran parte de los retos actuales; fortaleciendo, a su vez, la colaboración entre organismos públicos, entidades privadas y sociedad civil. Además, este proyecto también incluye actividades dedicadas a los niños, jóvenes y familias con diferentes recorridos por Madrid para conocer más de cerca a algunas de las entidades colaboradoras que explotan y trabajan con datos.

Programa de actividades de Ojo al Data durante el mes de mayo

Con el fin de promover el conocimiento sobre el big data y concienciar a la ciudadanía sobre la explosión de los datos y su alto valor económico, científico y social, Ojo al Data abarca un amplio abanico de temáticas que incluye desde métodos de visualización, data mining, periodismo de datos, políticas de apertura y reutilización de la información a, incluso, aspectos relativos a la seguridad TI como la privacidad  de los datos personales en la Red.

calendar icon
Evento

Del 14 marzo al 24 mayo 2015, tendrá lugar en la cuarta planta del Espacio Fundación Telefónica el evento Big Bang Data, una exposición coproducida por Fundación Telefónica y el CCCB (Centro de Cultura Contemporanea de Barcelona) que explora el fenómeno de los datos como materia prima para múltiples sectores e industrias así como el motor del cambio de la sociedad actual.

La muestra está estructura en diez bloques temáticos que estudian diferentes aspectos del big data donde profesionales de diversa índole -investigadores, analistas, economistas, educadores y programadores, entre otros- muestran diferentes acercamientos y enfoques del fenómeno del big data.

Junto a la exposición Big Bang Data, a lo largo de la primavera se organizarán otras iniciativas paralelas que convertirán a Madrid en la capital española de los datos. El ciclo Vivir en un Mar de Datos o el proyecto Ojo al Data, del 13 de marzo al 17 de abril en el espacio MediaLab Prado, brindarán un programa de actividades que explora las prácticas creativas, sociales y políticas relacionadas con los datos.

calendar icon
Aplicación

Iniciativa del Gobierno de Aragón que dota a los diferentes municipios de la comunidad autónoma de un portal web propio. Gracias a este servicio, se ha cubierto el 100% del territorio aragonés y los ciudadanos disponen, en un punto único, acceso a los datos de su zona geográfica que incluye: datos territoriales, demográficos, electorales y medioambientales.

Aragopedia extrae toda la información del catálogo de datos abiertos de Aragón Open Data y organiza el open data en un mapa virtual que agiliza y facilita el tratamiento de la información. 

calendar icon