Tabulae es una plataforma de visualización y análisis de datos. Esta herramienta permite convertir la información en conocimiento, al poder crear de forma fácil y autónoma informes, presentaciones, mapas o cuadros de mando como aplicaciones web accesibles desde cualquier dispositivo.
1. ¿Cómo surgió la idea de crear esta plataforma y cómo han sido sus inicios?
Las personas que formamos parte de este proyecto empresarial venimos de diferentes ámbitos tecnológicos relacionados con la explotación y análisis de datos: inteligencia de negocio, data mining, gestión de conocimiento y open data. Nos dimos cuenta que una necesidad común que teníamos en nuestros proyectos era la falta de herramientas orientadas al usuario que facilitasen la interpretación de los datos y le proporcionasen mecanismos de navegación dinámicos y, sobre todo, fáciles de usar.
A partir de aquí, arrancamos nuestro proyecto empresarial con el objetivo de construir una plataforma de visualización orientada al mundo web y que tuviese como principal referente al usuario experto en datos dentro de las organizaciones. Quisimos dotarle de herramientas para el tratamiento de la información y la construcción personalizada de cuadros de mando e informes interactivos, sin necesidad de conocimientos programáticos. Todo se realiza mediante interfaces visuales intuitivas.
Una vez arrancado el proyecto, Tabulae ha ido creciendo y ganando en funcionalidad y potencia, entrando en competencia con plataformas, principalmente de B.I., más tradicionales, lo que nos ha permitido entrar en nichos de mercado que inicialmente no teníamos previsto. Nuestra propuesta y nuestra diferenciación sigue siendo la misma: acercar los datos al usuario y agilidad y dinamismo a la hora de construir cuadros de mando e informes.
Desde luego, los inicios nunca son fáciles y combinar el desarrollo tecnológico de un producto muy especializado y complejo con su comercialización es complicado. Nuestras primeras barreras fueron, a mi juicio, las naturales: producto poco maduro, falta de referencia de clientes importantes, escepticismo sobre la aproximación tecnológica y cómo encontrar el “matching” entre necesidades de los potenciales clientes y tus capacidades. A esto hay que añadir la falta de confianza en una empresa con menos de un año de vida. En esta parte da igual tu experiencia y tu pasado profesional. Afortunadamente, las cosas nos están funcionando bien a nivel de desarrollo de negocio, siendo este 2015 un año realmente positivo y esperamos que en el 2016 las cosas vayan incluso mejor.
2015 está siendo realmente positivo"
2. ¿Qué servicios concretos de tratamiento y visualización de datos abiertos ofrece?
Tabulae es una plataforma de análisis y visualización de datos. Como tal, se puede conectar con diferentes fuentes de datos: BD relacionales, carga ficheros CSV o Excel, integración con Google Analytics, Drive, etc. A partir de aquí, el usuario experto en datos dispone de mecanismos amigables para realizar diferentes operaciones: refinamiento de campos, correcciones, fórmulas, operaciones de agregación, definición de jerarquías para análisis drill-down, filtrados dinámico de datos, etc. Una de las funcionalidades más interesantes en el tratamiento de datos es la georreferenciación que permite al usuario la generación automática de mapas interactivos.
Tabulae es una plataforma de análisis y visualización de datos"
Una vez el experto en datos ha realizado los procesos de refinamiento pertinentes, Tabulae le permite construir cuadros de mando e informes de manera asistida mediante interfaces dedicados WYSIWYG (“what you see is what you get”). Todo se construye a partir de componentes de gráfica, mapas, filtros y diferentes tipos de tablas, que se pueden personalizar al detalle y son altamente interactivos. Esto enriquece las posibilidades de mostrar información y de jugar con la disposición de los elementos para comunicar mejor el mensaje.
Gráficos, mapas, filtros y diferentes tipos de tablas, que se pueden personalizar al detalle y son altamente interactivos"
3. ¿Con qué tipo de entidades y organizaciones suele trabajar conjuntamente Tabulae? ¿Qué beneficios les brinda?
El análisis y visualización datos es transversal a cualquier sector de actividad económica. Nuestra tecnología, por tanto, no está pensada para una aplicación específica, sino que Tabulae está diseñada con una perspectiva amplia y genérica para poder adaptarse a diferentes proyectos visualización.
Tabulae está diseñada con una perspectiva amplia y genérica"
Nuestros principales partners suelen ser empresas tecnológicas a las que nosotros complementamos tanto en la parte de producto de B.I. y visualización (Tabulae) como la de consultoría de datos, especialmente en todo lo que tiene que ver modelos de análisis estadístico y construcción de cuadros de mando.
Ahora mismo estamos principalmente en tres sectores. En primer lugar, el sector asegurador, especialmente en el canal de la mediación. En segundo lugar, el sector ligado a la transparencia y open data. Esto no es exclusivo de las administraciones, ya que muchas empresas por su tamaño y volumen tienen necesidades parecidas. Y, en tercer lugar, empresas y consultoras de estudios de mercado y marketing.
4. Con respecto al Sector público ¿En qué proyectos de open data y reutilización habéis colaborado?
Nuestra primera inmersión en el mundo open data viene de la mano de la AIMJB (Asociación Ibero-Macaronésica de Jardines Botánicos) en un proyecto para la construcción de un portal de acceso y gestión de especies botánicas silvestres conservados en bancos de germoplasma: OpenRedBag. Primero se publica la información en GBIF, la plataforma internacional open data de información de biodiversidad. Una vez la información está en GBIF y es pública para su consumo, Tabulae accede a esta información utilizando los servicios web disponibles, enriqueciéndola con datasets de terceros proveedores también accesibles en GBIF y con otras fuentes de datos nacionales (por ejemplo, con la legislación autonómica aplicable). Finalmente, Tabulae construye visualizaciones geográficas (básicamente, mapas interactivos) facilitando la realización de estudios. Este proyecto no sólo publica y facilita el acceso a la información, sino que proporciona herramientas de gestión y análisis.
No es sólo publicar, sino construir cosas útiles con los datos"
Actualmente estamos trabajando con el Gobierno del Principado de Asturias para construir el Portal de Transparencia, en el que aplicamos los principios del open data e introducimos elementos innovadores basados en la visualización y la accesibilidad de la información. El objetivo no es sólo cumplir la normativa vigente respecto a transparencia y apertura de datos, sino realmente facilitar el acceso y la interpretación de la información a los ciudadanos. Se tratar de que la gente pueda “usar” libremente los datos y la propia administración utilizar este servicio para consultas internas, en los medios de comunicación y, por supuesto, en las empresas infomediarias.
Además una de nuestras iniciativas actuales es impulsar, junto con nuestro partner ebroker, empresa tecnológica de referencia en el sector asegurador, una acción conjunta con la Administración en el ámbito de la Documentación Estadístico Contable (DEC): información que las entidades aseguradoras y las de mediación deben remitir a la Administración. La mejora de estos procesos de comunicación, de la publicación posterior de los datos y los informes resultantes puede tener un efecto muy positivo en el sector asegurador. El objetivo también es demostrar cómo la apertura de datos específica en un sector de negocio tiene un impacto real.
El objetivo también es demostrar cómo la apertura de datos específica en un sector de negocio tiene un impacto real"
5. ¿Os habéis encontrado algún obstáculo a la hora de reutilizar la información del sector público? ¿Cúales?
El primer proyecto en el que estuve involucrado estaba relacionado con la construcción de un buscador para un boletín oficial autonómico en el 2005. En aquella época, muchos de los boletines oficiales del estado no estaban accesibles digitalmente o eran básicamente PDFs generados a partir de imágenes. Desde luego, la situación ha cambiado sustancialmente para bien en los últimos años. Se publica información desde todos los niveles de la Administración: cada vez más, de mejor calidad y en formatos reusables.
Sin embargo, sigue habiendo ciertos problemas que dificultan su reutilización a gran escala y de una manera normalizada:
a. No hay una aproximación tecnológica y de vocabularios consensuada. Esto deriva en una fragmentación de soluciones a la hora de abordar la publicación. Desde luego, hay excepciones, como en el caso de la información geográfica.
b. Misma información en multitud de formatos. Personalmente considero esto una moda, que además no tiene un beneficio claro por parte de los reutilizadores y en parte introduce dificultades artificiales. Por ejemplo, formatos W3C estándar como RDF no son realmente conocidos en la industria y son costosos de procesar.
c. Muchos organismos siguen publicando la información en PDFs. Esto realmente es una barrera, aunque la información es pública. Lo mismo ocurre cuando se utilizan hojas de cálculo, ya que la mayor parte de las veces se introduce formato, lo que impide su tratamiento automático.
d. Formatos estándar como CSV, que son suficientes para gran parte de los procesos de publicación de datos estructurados, no son utilizados correctamente por parte de los publicadores, simulando formato cuando son ficheros planos.
e.En muchos casos, no hay una política de actualización y mantenimiento de los datos. La información se sube, se cumple el requisito y ya está. Otro problema derivado es que las URLs además pueden cambiar con este proceso de actualización.
f. Falta de endpoints donde acceder a los datos de una manera sistemática y programática. Quizás el objetivo no sea tener un servicio único de acceso a los datos, sino más bien un catálogo de servicios de la misma manera que existen los catálogos de datos. También creo que sería importante el uso de tecnologías estándar ampliamente conocidas y utilizadas por la mayor parte de las empresas. Uno de los riesgos del uso de ciertas aproximaciones es que el uso de esos servicios tienda a cero. En este sentido, me parece muy acertada la aproximación de GBIF para datos de biodiversidad.
Esto lo vemos en un proyecto que estamos llevando acabo actualmente para la reutilización de datos públicos en un medio de comunicación, donde el objetivo es construir visualizaciones a partir de fuentes públicas como complemento y soporte a las noticias (data-driven journalism). Desde el punto de vista del periodista, surgieron las siguientes preguntas: ¿Dónde están los datos?, ¿Qué tipo de fichero puedo manejar?, ¿Este fichero lo puedo tratar de manera mecánica con un programa software?, en caso contrario, ¿Cuándo tiempo me lleva tratar el fichero original para que pueda ser procesado? Las respuestas, desafortunadamente, no están siendo fáciles de encontrar.
6. ¿Cómo puede ayudar Tabulae al sector reutilizador de datos abiertos?
Creemos que nuestra tecnología puede ayudar fundamentalmente en dos direcciones:
- A las Administraciones: en la fase de publicación de datos para construir servicios de valor añadido basados en la visualización. De esta manera, se ofrece un servicio de interpretación y análisis de la información que permite una comunicación transparente entre la Administración y la ciudadanía. Esta aproximación no sólo se queda como un ejercicio hacia el exterior, sino que en los mismos proyectos se pueden abordar necesidades internas de la Administración que pueden ser sustentadas por nuestra tecnología y experiencia en el análisis de datos.
Se ofrece un servicio de interpretación y análisis de la información"
- A las empresas infomediaria: nuestra tecnología permite la automatización de los procesos de carga, la combinación de fuentes y la construcción de conocimiento a partir de los datos. Podemos ayudar a enriquecer sus sistemas de información y en la oferta de un servicio enriquecido basado en el valor que proporciona nuestra tecnología. Si una imagen vale más que mil palabras, se puede decir que una visualización (una gráfica, un mapa…) bien construida vale más que mil datos.
Nuestra tecnología permite la automatización de los procesos de carga, la combinación de fuentes y la construcción de conocimiento a partir de los datos"
En noviembre de 2013 nacía OpenDataMonitor, una iniciativa panaeuropea que permitirá identificar y caracterizar los conjuntos de datos públicos puestos a disposición en 25 países europeos a través de una serie de herramientas que están siendo desarrolladas en el marco del proyecto. Gracias a diferentes métodos de visualización y analítica, el usuario final tendrá la oportunidad de conocer en mayor profundidad los repositorios de datos abiertos a escala local, regional, nacional y europea.
Los equipos integrantes de OpenDataMonitor finalizarán sus trabajos en el plazo de un año. Hasta la fecha se han ido presentando los avances alcanzados a través de diferentes publicaciones disponibles en la página web del proyecto, entre las que cabe resaltar las siguientes:
- Armonización de topologías, catálogos y metadatos
Este estudio muestra una fotografía actualizada del movimiento de datos abiertos, principalmente en Europa, identifica buena parte de los retos a los que se enfrenta la comunidad open data y propone posible soluciones, especialmente en aspectos clave como son la necesaria armonización de vocabularios y de esquemas de representación de la información.
- Buenas prácticas de visualización, cuadros de mando y métricas
El documento presenta un conjunto de métricas que se entienden necesarias para la comprensión de las tendencias open data, detalla técnicas de visualización que se consideran relevantes para este fin, así como posibles combinaciones de las visualizaciones que se presentarán en el futuro cuadro de mandos a desarrollar.
- Informe de stakeholders en el campo de datos abiertos (1º parte, septiembre 2014).
Este informe ofrece una fotografía general de los agentes involucrados en el movimiento de datos abiertos: qué papel juegan, qué les interesa y qué requisitos debe cumplir el ecosistema open data para que los reutilizadores de los datos puedan obtener el máximo provecho de ellos.
En la iniciativa participan siete entidades europeas expertas en materia open data, visualización de la información e ingeniería de software. Entre los colaboradores se encuentra el Proyecto Aporta, encargado de la investigación de las topologías de datos abiertos; del control de las funcionalidades y usabilidad de la infraestructura, así como de la divulgación y formación de los usuarios finales de la herramienta de OpenDataMonitor.
Mari Luz Congosto es licenciada en Informática por la Universidad Politécnica de Madrid y Máster en Telemática por la Universidad Carlos III.
Ha trabajado en entornos de investigación en Telefónica I+D, ELIOP y Fujitsu y participado en la creación plataformas sociales dedicadas a la divulgación científica.
Actualmente es investigadora del Departamento de Telemática de la Universidad Carlos III. Está especializada en minería y visualización de datos.
¿Qué es, en su opinión, el periodismo de datos y la visualización de datos y en qué se diferencia de otros modelos de información?
El periodismo de datos se diferencia fundamentalmente en las fuentes. En el periodismo tradicional las fuentes suelen ser personas; en el de investigación, documentos que no se pueden procesar automáticamente. En el periodismo de datos las fuentes son datos que pueden ser procesados automáticamente hasta obtener información. La automatización permite escalar el volumen de datos hasta niveles inimaginables.
La visualización es hija del periodismo infográfico del que hereda el lenguaje visual y la capacidad de síntesis para transmitir información. A diferencia de la infografía, la visualización se desarrolla en un medio digital, lo que le permite ser dinámica, interactiva y multimedia.
El periodismo de datos y la visualización pertenecen al mundo digital, se complementan y se realimentan. La visualización permite sintetizar los datos de forma visual y facilita descubrir nuevos patrones que mejoren el proceso de los datos.
El periodismo de datos y la visualización pertenecen al mundo digital, se complementan y se realimentan…"
¿Qué papel entiende que guardan los profesionales de este ámbito respecto de la información del sector público?
El sector público es depositario de una gran cantidad y variedad de datos de interés común. La explotación de estos datos por el sector público está enfocada al área administrativa pero puede tener muchísimas más aplicaciones y en ese punto el periodismo de datos puede generar información de valor.
¿Cómo surgió su interés por esta actividad?
Para mi Tesis empecé a trabajar con datos de la Red, primero en blogs y después en Twitter y utilicé la visualización como una herramienta de análisis que me ayudaba a mejorar el proceso de datos y a comprender mejor la información que estaba manejando.
¿Qué conocimientos, habilidades o herramientas precisa el tratamiento periodístico de los datos del sector público?
Hay tres conocimientos básicos: periodismo para saber comunicar información; programación para poder procesar datos automáticamente; y diseño para ser capaces de sintetizarlos de una forma visual.
Es muy difícil que una sola persona posea estos tres conocimientos aunque puede ser fuerte en uno de ellos y tener nociones de los otros dos. Lo más práctico es que haya equipos multidisciplinares que hablen un lenguaje común, como ocurre en The New York Times, que son líderes en periodismo de datos.
Lo más práctico es que haya equipos multidisciplinares que hablen un lenguaje común..."
¿Qué perfiles profesionales serían, a su juicio, los mejor situados para trabajar en el Periodismo o en la visualización de datos?
Hay tres perfiles profesionales: los periodistas, los informáticos y los diseñadores. Ellos son fuertes en uno de los conocimientos básicos; sólo tienen que complementar los dos restantes.
En su opinión, ¿cuál sería un buen ejemplo de lo que es este modelo de periodismo y de trabajo en el área del Open Data?
En España, el periódico La Información tiene un buen equipo de periodismo de datos y ha hecho trabajos muy interesantes, como los Presupuestos Generales del Estado, a través de los años; la evolución del paro; el patrimonio de los diputados; comparativas de IRPF por comunidades, etc. También existen iniciativas particulares como la Fundación CIVIO con Dónde van mis impuestos y España en llamas -con 10 años de incendios forestales-.
Todos estos ejemplos aportan información de valor basada en datos públicos y son de interés general.
En España, el periódico La Información tiene un buen equipo de periodismo de datos…"
¿Qué haría falta para que el conjunto de la sociedad, incluidos los gobiernos, valorasen todavía más el papel de los datos públicos?
Los ciudadanos deben tomar conciencia de que los datos públicos han sido generados con el dinero de los impuestos y, por tanto, son un bien común. Los gobiernos necesitan transmitir confianza a los ciudadanos y una manera de hacerlo es mediante una gestión transparente que incluya los datos abiertos.
Por otro lado, los datos públicos pueden ser una fuente de riqueza generadora de nuevos servicios para los ciudadanos.
Los gobiernos necesitan transmitir confianza a los ciudadanos…"
Si fuera una administración local, regional o nacional, ¿qué información consideraría más interesante para su apertura?
Debería ser obligatorio que todas las administraciones proporcionasen de una manera accesible las partidas presupuestarias desglosadas al máximo detalle y la ejecución del presupuesto indicando qué cantidades se han adjudicado en las distintas formas de licitación.
Además de los datos económicos, deberían irse incorporando datos como los de tráfico, transporte público, medio ambiente, sanidad, seguridad oferta cultural, etc., que pueden generar nuevas servicios de información que ayuden a la toma de decisiones.
datos como los de tráfico, transporte público, medio ambiente, sanidad, seguridad... pueden generar nuevos servicios de información que ayuden a la toma de decisiones…"
¿Por qué habría un lector de interesarse por este tipo de noticias basadas en los datos que custodian las administraciones?
Porque los lectores pueden acceder de una manera más relacionada, comprensible y sintetizada a una enorme cantidad de datos que ahora está oculta, dispersa o publicada en medios tan poco atractivos como los boletines oficiales.
¿Cómo ves ahora mismo el estado del Open Data en el ámbito estatal y en el conjunto de España?
En el ámbito estatal me parece una buena iniciativa datos.gob.es por su labor de catalogación de datos y de difusión de información relacionada con el Open Data. La mayoría de las administraciones autonómicas ha abierto su portal de Open Data siguiendo el camino de autonomías pioneras. La Administración Local está aún por desplegar.
De todas estas iniciativas echo en falta un criterio común en la forma de llevar a cabo la apertura de datos tanto en la prioridad de los temas como en los formatos de datos y en los métodos de acceso.
Un handicap para los portales de Open Data es la velocidad con que se desarrolla la tecnología y la rapidez con que unos formatos de datos pasan a ser obsoletos mientras que otros adquieren mucho auge. Por otro lado, la forma de acceder vía fichero puede ser insuficiente para cierto tipo de tratamientos de datos que requieran de información muy específica en tiempo real y en este punto los portales de Open Data deberían ir incorporando una alternativa de acceso a los datos vía APIs (application programming interface), como ya han empezado a realizar algunos portales.
No dudo de que la apertura de datos irá a más y a mejor, porque es algo beneficioso para todos.
Los portales de Open Data deberían ir incorporando una alternativa de acceso a los datos vía API's…"
Alberto Cairo enseña infografía y visualización de datos en la Universidad de Miami.
Es autor de The Functional Art: An Introduction to Information Graphics and Visualization (2012).
¿Qué es, en su opinión, el Periodismo de datos y en qué se diferencia de otros modelos de información?
Lo que se conoce hoy como Periodismo "de datos" es un agregado de varias tradiciones clásicas del periodismo: el data-driven journalism, el database journalism, el periodismo de precisión y la visualización de información. En resumen, el Periodismo de datos consiste en el uso sistemático de métodos de investigación (principalmente cuantitativa, pero no sólo) para generar datos, analizarlos, filtrarlos, organizarlos, extraer sentido de ellos y presentarlos por medio de historias periodísticas, gráficos, mapas, etc. Con ese fin, toma prestadas herramientas y técnicas de las ciencias sociales, el periodismo y el diseño gráfico y de interacción.
... generar datos, analizarlos, filrarlos, organizarlos, extraer sentido de ellos y presentarlos por medio de historias periodísticas..."
¿Qué papel entiende que guardan los profesionales de este ámbito respecto de la información del sector público?
El periodista es un mediador entre fuentes y público, un facilitador de la comunicación entre individuos y entidades. El sector público puede (y debe), ciertamente, poner datos a disposición del público, y es seguro que muchos ciudadanos accederán a dichos datos en su forma bruta. Pero el papel del profesional especializado en leer esos datos y darles una forma digerible por los ciudadanos sin tiempo (o sin conocimientos) para hacerlo por su cuenta es imprescindible.
... leer esos datos y darles una forma digerible para los ciudadanos sin tiempo (o conocimientos)... es imprescindible."
¿Cómo surgió su interés por esta actividad?
Soy periodista de formación e infografista por vocación. Siempre me ha inquietado la desconfianza que muchos colegas muestran por las matemáticas, la estadística y el método científico. Esa desconfianza conduce a una profunda ignorancia y a un mal servicio a los ciudadanos. En un mundo en el que la cantidad de información se duplica cada poco tiempo, el periodista debe aprender a manejar las mejores herramientas para domarla.
¿Qué conocimientos, habilidades o herramientas precisa el tratamiento periodístico de los datos del sector público?
Conceptuales (estadística, métodos de investigación) y tecnológicos (herramientas de software: OpenOffice, Excel, R, Tableau...). De todas formas, no hay que mitificar la tecnología. Se pueden conseguir buenos resultados utilizando herramientas rudimentarias, siempre que se dominen los fundamentos.
¿Qué perfiles profesionales serían, a su juicio, los mejor situados para trabajar en el Periodismo de datos?
Profesionales de las ciencias de la computación con interés en comunicación, periodistas con conocimientos de métodos de investigación cuantitativa y diseñadores e infografistas de perfil técnico, no tan artístico como es tradicional en la profesión.
... interés en comunicacion... investigación cuantitativa... diseñadores e infografistas de perfil técnico..."
En su opinión, ¿cuál sería un buen ejemplo de lo que es este modelo de periodismo?
The Guardian (con ciertas reservas), NPR, ProPublica y The New York Times, pero hay muchos otros. En América Latina, por ejemplo, tenemos a La Nación (Costa Rica), que tiene un equipo de periodismo de investigación muy fuerte, La Nación (Argentina), que está explorando el periodismo de datos, Estado de São Paulo, que acaba de abrir un pequeño grupo formado por periodistas, programadores y diseñadores, etc.
¿Qué haría falta para que el conjunto de la sociedad, incluidos los gobiernos, valorasen todavía más el papel de los datos públicos?
La existencia de más historias y herramientas que ayudasen a los ciudadanos a descubrir realidades que a veces permanecen ocultas. Un buen ejemplo es España en llamas, que no ha recibido toda la publicidad que se merece: http://www.espanaenllamas.es/ o el Manifestómetro, una iniciativa ignorada por todos los medios de comunicación porque va en contra de sus intereses ideológicos: http://manifestometro.blogspot.com/
... Un buen ejemplo es España en llamas, que no ha recibido toda la publicidad que se merece."
Si fuera una administración local, regional o nacional, ¿qué información consideraría más interesante para su apertura?
En general, cualquiera relacionada con el control social de los representantes políticos: gastos, actividades, agenda, etc.
¿Por qué habría un lector de interesarse por este tipo de noticias basadas en los datos que gestionan las administraciones?
Porque le ayuda a controlar mejor a quien le representa y le ayuda a confirmar (o desmentir) intuiciones. Le doy un ejemplo: hace más de un año, cuando todavía trabajaba en Brasil, para la revista semanal Época, hicimos un gráfico que mostraba cuánto cada diputado gasta en llamadas telefónicas por mes. Esos datos están disponibles en la Web del Congreso, pero no en un formato que sea legible por los ciudadanos, lo que es un problema común en muchos países. Nosotros tomamos ese banco de datos, lo analizamos y creamos el siguiente interactivo:
http://revistaepoca.globo.com/diagrama/noticia/2011/10/diagrama-298-anos-de-falacao.html
El éxito fue enorme.
... ayuda a controlar mejor a quien le representa y le ayuda a confirmar (o desmentir) intuiciiones..."
Medialab-Prado, espacio cultural y de investigación orientado a la producción de contenidos digitales, organiza en Madrid del 14 de junio al 1 de julio de 2011 el taller y seminario internacional "Visualizar'11: comprender las infraestructuras".
Esta iniciativa, dirigida por José Luis de Vicente en colaboración con EOI Escuela de Organización Industrial, gira en torno a la visualización -a partir de los datos- de infraestructuras físicas (líneas eléctricas, oleoductos, pantanos); de información (emisiones de radio, cables submarinos); de transporte (rutas marítimas y aéreas); y de tipo legal y financiero (que rigen el comercio y los mercados mundiales).
Como en anteriores ediciones, esta cuarta convocatoria de Visualizar contine un taller de desarrollo colaborativo de proyectos, unseminario teórico y la posterior muestra de los proyectos realizados.
Open Knowledge Foundation, una de las plataformas más activas y comprometidas dentro del movimiento Open Data, ha publicado a mediados del pasado mes de febrero un artículo especial de Hjálmar Gíslason sobre DataMarket.com, portal del que es fundador.
El post, que insiste en la necesidad de involucrar a ciudadanos de todo el mundo en el uso y reutilización de los datos públicos –con independencia de sus competencias culturales y/o profesionales-, repasa las principales virtudes de dicho sitio web.
Así, según Gislason (miembro, también, del grupo de trabajo europeo sobre Datos Abiertos), la herramienta DataMarket.com ofrece a los usuarios la posibilidad de comparar, visualizar y descargar estadísticas de organizaciones como Naciones Unidas, el Banco Mundial o Eurostat, entre otras, y hacerlo además en un mismo entorno.
Con ello pretende que los usuarios comprendan:
- cómo funcionan los datos abiertos;
- cómo pueden utilizarse en un entorno cotidiano;
- de qué forma pueden ayudar a identificar nuevas oportunidades de negocio, tomar decisiones estratégicas y mejorar la competitividad empresarial.
Este portal, en opinión del artículo, añade valor a las fuentes de información originales, precisamente, generando análisis comparativossobre los cerca de 13.000 conjuntos de datos y casi 100 millones de series temporales incluidos, ya sea sobre la producción de naranjas en Chipre o sobre el consumo en Estados Unidos de energía geotérmica.
Como venimos destacando en nuestra bitácora, los grandes beneficios de la la reutilización de información del sector público son, por un lado, el desarrollo de aplicaciones comerciales y su integración en servicios de valor añadido y, por otro lado, el acceso de los ciudadanos a los datos públicos.
Sin embargo, tal y como apuntábamos en el artículo sobre el Periodismo basado en Datos, uno de los obstáculos para alcanzar estos beneficios es la dificultad de los ciudadanos y potenciales profesionales del sector para comprender las informaciones publicadas por sus administraciones. Tablas, cuadros, listados… Miles de datos liberados incluso en las condiciones más idóneas corren el riesgo de quedar infrautilizados en tanto en cuanto no se produzca la intermediación de expertos (infomediarios, reutilizadores, diseñadores gráficos, periodistas…) que hagan que dichos recursos sean:
- Comprensibles.
- Atractivos.
- Manejables.
- Útiles.
La visualización de datos, en este sentido, constituye desde hace años la apuesta de un reducido grupo de expertos y empresas de todo el mundo para propiciar la apertura de datos públicos y hacer más satisfactoria y eficiente su acceso y utilización. Esta disciplina, basada en el uso de las imágenes y los gráficos para explicar de manera inteligible las informaciones liberadas por las administraciones –entre otras fuentes-, cuenta cada vez con más seguidores gracias a la popularización de mashups que integran datos y gráficas. Pueden citarse, entre otras herramientas, Google –de la que ya habláramos en 2009- o la española Impure, desarrollada por la empresa barcelonesa Bestiario y premiada en nuestro país por su contribución social y tecnológica. Un ejemplo del potencial de la visualización de datos, citado ya en otras ocasiones, es el portal Where does my Money go?, cuyas infografías representan de manera dinámica y amena la evolución y distribución de los presupuestos públicos del Reino Unido dentro de una serie histórica. Esta herramienta, desarrollada por la Open Knowledge Foundation y trasladada al ámbito español por David Cabo con ¿Dónde van mis impuestos?, llega al punto de ofrecer desagregado el gasto estatal estimado por persona, partida económica y nivel de renta. Otro ejemplo, en esa misma línea, es el promovido directamente por el Gobierno de Estados Unidos mediante UsaSpending.gov.
La visualización no solo favorece la contextualización de varias fuentes de datos sino que, además, propicia que el usuario entienda las interconexiones y las relaciones de causa-efecto que hay detrás de cada actividad o conjunto de políticas públicas. Un buen modelo, en este sentido, es el contenido en Tu Atlas del Sector de la Alimentación, que integra de forma ágil e intuitiva los datos públicos y privados de cerca de 200 parámetros distintos relacionados con la dieta, el acceso a los mercados, la salud y los niveles de obesidad de Estados Unidos. Simultáneamente, lo que se pretende es que los usuarios conozcan mejor los servicios públicos que tienen a su disposición, accediendo de un solo vistazo a gran cantidad de información. Así lo han entendido en nuestro país, entre otros, el Ayuntamiento de Badalona (Barcelona), que hace escasas fechas lanzaba un mapa interactivo municipal con las actuaciones que en materia de salud, convivencia vecinal y protección del medio ambiente urbano realiza la policía de esta localidad. Dentro de este apartado, merecen también atención los trabajos realizados por la empresa española Vizzuality sobre la calidad del aire de la ciudad de Madrid. Asimismo, y por su popularidad en países como Estados Unidos, destacan los Mapas de Criminalidad que a partir de informaciones del sector público han comenzado a elaborar algunas ciudades.
El de San Francisco es sólo un ejemplo. Con un enfoque más periodístico, dentro del llamado Data-Driven Journalism, resultan de gran atractivo las representaciones gráficas realizadas por empresas de comunicación como The New York Times –a partir de los censos públicos de población y registros oficiales sobre movimientos migratorios- o The Guardian –con indicadores de pobreza y exclusión social de carácter local-. En este último campo, una buena referencia sobre el potencial visual de las informaciones del sector público es la iniciativa Gapminder, que utiliza series de datos históricos de instituciones como la Organización Internacional del Trabajo o el Banco Mundial para promover, entre otros objetivos, un crecimiento global sostenible y la consecución de los llamados Objetivos de Desarrollo del Milenio de Naciones Unidas. De la misma forma, son de especial valor los vídeos publicados por la organización TED (Tecnología, Entretenimiento y Diseño) sobre la evolución de la riqueza mundial (2007) o sobre la propia visualización de datos (2010); o el elaborado por el espacio MediaLab Prado junto con José Luis de Vicente acerca de los nuevos modelos de comunicación e innovación (2011). Los interesados en la visualización de datos –incluidas las informaciones del sector público- tienen una oportunidad de conocer más a fondo esta disciplina en el taller que el propio equipo de MediaLab Prado organiza entre el 14 de junio y el 1 de julio del presente año.
Las plataformas cívicas Pro Bono Publico y Acces Info Europe organizaron el pasado 15 de febrero en Madrid una jornada dedicada al Periodismo de Datos.
Esta disciplina, por la que están empezando a apostar medios de comunicación fuertemente comprometidos con el Open Data, como The Guardian, constituye uno de los enfoques más recientes y atractivos de la apertura y reutilización de la información del sector público.En concreto, y bajo los principios de la transparencia y la rendición de cuentas, el Data-Driven Journalism (en su descripción inglesa original) se configura como un canal adicional de difusión de la información pública.El objetivo perseguido es que los periodistas y otros profesionales de la comunicación aprendan a utilizar los datos brutos que ofrecen los repositorios oficiales para convertirlos en historias de interés social y al alcance de todas las audiencias.Esta labor profesional facilita el acceso del ciudadano con menos conocimiento técnico a la información pública. Así, el Periodismo de Datos ofrece nuevas herramientas para propiciar una mayor apertura y reutilización de las informaciones que gestionan los organismos y departamentos oficiales. En concreto, contribuye a potenciar los siguientes puntos:
1. Conocimiento y acceso a los recursos públicos.
2. Interpretación de los contenidos oficiales.
3. Comprensión de la utilidad y potencial aplicación de los datos.
4. Difusión de los beneficios socioeconómicos de la reutilización.
5. Visibilidad de la actividad diaria de las instituciones.
6. Cercanía de las administraciones y los gobiernos.
7. Implicación de empresas, colectivos y ciudadanos.
8. Obtención de feed-back en beneficio de una gestión pública eficiente y eficaz.
Por su parte, la actividad periodística obtiene de los datos públicos nuevas fuentes de estudio con las que narrar la actualidad, describir la evolución social o introducir puntos de debate originales. Esta tendencia ya está siendo explotada por periodistas como Lisa Evans (Guardian Data Blog y Open Knowledge Foundation) o Gavin Sheridan (cofundador de The Story), ambos participantes invitados en el encuentro del pasado mes de febrero.
Este Periodismo de Datos, en cualquier caso, se nutre también de otra disciplina emergente y directamente vinculada a la información del sector público como es la de visualización de datos. Se trata, en líneas generales, del procesamiento gráfico de los datos abiertos por las administraciones para generar una representación verdaderamente comprensible de los mismos. Buen ejemplo de ello son las presentaciones realizadas en el encuentro del 15 de febrero por David Cabo (¿Dónde van mis impuestos?, página de la que hablamos en un post anterior) o por Sergio Álvarez (Vizzuality). Estos trabajos se encuentran publicados en la web de Media-Lab Prado, institución colaboradora del encuentro, donde también se encuentran las ponencias en video de otros expertos participantes y profesionales comprometidos con el Open Data o el acceso a la información pública. Son, entre otros, José Luis Marín (Euroalert), Helen Darbishire y Victoria Anderica (Access Info Europe), Marcos García (Media-Lab Prado) y Javier de la Torre (Vizzuality). Todos ellos coincidieron en apuntar lo que ya asegurara en su momento Tim Berners-Lee, fundador de la World Wide Web, y destacaran los propios promotores de la cita en su convocatoria: “la prensa tiene la responsabilidad de analizar los conjuntos de datos”.
La plataforma Sunlight Labs, orientada a diseñadores y programadores, ha lanzado un concurso ciudadano denominado Diseño para América. Su objetivo: facilitar el acceso, la comprensión y la utilización de los datos públicos que gestionan las distintas agencias oficiales de Estados Unidos.
Éste certamen, que incluye premios a la mejor iniciativa para cada una de las siete categorías convocadas, pretende reunir en torno a las políticas de Gobierno Abierto a los mejores talentos artísticos y creativos de dicho país.
De esa manera, los organizadores entienden que las informaciones del sector público pueden ser más interesantes y atractivas para los expertos en reutilización y creación de aplicaciones tecnológicas y, al mismo tiempo, más útiles para los usuarios noveles.
El plazo para la presentación de proyectos finaliza el próximo 17 de mayo.
El anuncio de los ganadores está previsto para el día 27 de ese mismo mes, con motivo de la clausura de las jornadas Gov 2.0 Expo que se celebrarán en Washington DC (Estados Unidos).