Entrevista a Tabulae

Fecha: 23-06-2015

Nombre: Tabulae

Sector: Ciencia y tecnología

Equipo Tabulae

Tabulae es una plataforma de visualización y análisis de datos. Esta herramienta permite convertir la información en conocimiento, al poder crear de forma fácil y autónoma informes, presentaciones, mapas o cuadros de mando como aplicaciones web accesibles desde cualquier dispositivo. 

 

1. ¿Cómo surgió la idea de crear esta plataforma y cómo han sido sus inicios?

Las personas que formamos parte de este proyecto empresarial venimos de diferentes ámbitos tecnológicos relacionados con la explotación y análisis de datos: inteligencia de negocio, data mining, gestión de conocimiento y open data. Nos dimos cuenta que una necesidad común que teníamos en nuestros proyectos era la falta de herramientas orientadas al usuario que facilitasen la interpretación de los datos y le proporcionasen mecanismos de navegación dinámicos y, sobre todo, fáciles de usar.

 

A partir de aquí, arrancamos nuestro proyecto empresarial con el objetivo de construir una plataforma de visualización orientada al mundo web y que tuviese como principal referente al usuario experto en datos dentro de las organizaciones. Quisimos dotarle de herramientas para el tratamiento de la información y la construcción personalizada de cuadros de mando e informes interactivos, sin necesidad de conocimientos programáticos. Todo se realiza mediante interfaces visuales intuitivas. 

 

Una vez arrancado el proyecto, Tabulae ha ido creciendo y ganando en funcionalidad y potencia, entrando en competencia con plataformas, principalmente de B.I., más tradicionales, lo que nos ha permitido entrar en nichos de mercado que inicialmente no teníamos previsto. Nuestra propuesta y nuestra diferenciación sigue siendo la misma: acercar los datos al usuario y agilidad y dinamismo a la hora de construir cuadros de mando e informes.

 

Desde luego, los inicios nunca son fáciles y combinar el desarrollo tecnológico de un producto muy especializado y complejo con su comercialización es complicado. Nuestras primeras barreras fueron, a mi juicio, las naturales: producto poco maduro, falta de referencia de clientes importantes,  escepticismo sobre la aproximación tecnológica y cómo encontrar el “matching” entre necesidades de los potenciales clientes y tus capacidades. A esto hay que añadir la falta de confianza en una empresa con menos de un año de vida. En esta parte da igual tu experiencia y tu pasado profesional. Afortunadamente, las cosas nos están funcionando bien a nivel de desarrollo de negocio, siendo este 2015 un año realmente positivo y esperamos que en el 2016 las cosas vayan incluso mejor.

2015 está siendo realmente positivo"

2. ¿Qué servicios concretos de tratamiento y visualización de datos abiertos ofrece?

Tabulae es una plataforma de análisis y visualización de datos. Como tal, se puede conectar con diferentes fuentes de datos: BD relacionales, carga ficheros CSV o Excel, integración con Google Analytics, Drive, etc. A partir de aquí, el usuario experto en datos dispone de mecanismos amigables para realizar diferentes operaciones: refinamiento de campos, correcciones, fórmulas, operaciones de agregación, definición de jerarquías para análisis drill-down, filtrados dinámico de datos, etc. Una de las funcionalidades más interesantes en el tratamiento de datos es la georreferenciación que permite al usuario la generación automática de mapas interactivos.

Tabulae es una plataforma de análisis y visualización de datos"

 

Una vez el experto en datos ha realizado los procesos de refinamiento pertinentes, Tabulae le permite construir cuadros de mando e informes de manera asistida mediante interfaces dedicados WYSIWYG (“what you see is what you get”). Todo se construye a partir de componentes de gráfica, mapas, filtros y diferentes tipos de tablas, que se pueden personalizar al detalle y son altamente interactivos. Esto enriquece las posibilidades de mostrar información y de jugar con la disposición de los elementos para comunicar mejor el mensaje.

Gráficos, mapas, filtros y diferentes tipos de tablas, que se pueden personalizar al detalle y son altamente interactivos"

3. ¿Con qué tipo de entidades y organizaciones suele trabajar conjuntamente Tabulae? ¿Qué beneficios les brinda?

El análisis y visualización datos es transversal a cualquier sector de actividad económica. Nuestra tecnología, por tanto, no está pensada para una aplicación específica, sino que Tabulae está diseñada con una perspectiva amplia y genérica para poder adaptarse a diferentes proyectos visualización.

Tabulae está diseñada con una perspectiva amplia y genérica"

 

Nuestros principales partners suelen ser empresas tecnológicas a las que nosotros complementamos tanto en la parte de producto de B.I. y visualización (Tabulae) como la de consultoría de datos, especialmente en todo lo que tiene que ver modelos de análisis estadístico y construcción de cuadros de mando.

 

Ahora mismo estamos principalmente en tres sectores. En primer lugar, el sector asegurador, especialmente en el canal de la mediación. En segundo lugar, el sector ligado a la transparencia y open data. Esto no es exclusivo de las administraciones, ya que muchas empresas por su tamaño y volumen tienen necesidades parecidas. Y, en tercer lugar, empresas y consultoras de estudios de mercado y marketing.

 

4. Con respecto al Sector público ¿En qué proyectos de open data y reutilización habéis colaborado?

Nuestra primera inmersión en el mundo open data viene de la mano de la AIMJB (Asociación Ibero-Macaronésica de Jardines Botánicos) en un proyecto para la construcción de un portal de acceso y gestión de especies botánicas silvestres conservados en bancos de germoplasma: OpenRedBag. Primero se publica la información en GBIF, la plataforma internacional open data de información de biodiversidad. Una vez la información está en GBIF y es pública para su consumo, Tabulae accede a esta información utilizando los servicios web disponibles, enriqueciéndola con datasets de terceros proveedores también accesibles en GBIF y con otras fuentes de datos nacionales (por ejemplo, con la legislación autonómica aplicable). Finalmente, Tabulae construye visualizaciones geográficas (básicamente, mapas interactivos) facilitando la realización de estudios. Este proyecto no sólo publica y facilita el acceso a la información, sino que proporciona herramientas de gestión y análisis. 

No es sólo publicar, sino construir cosas útiles con los datos"

 

Actualmente estamos trabajando con el Gobierno del Principado de Asturias para construir el Portal de Transparencia, en el que aplicamos los principios del open data e introducimos elementos innovadores basados en la visualización y la accesibilidad de la información. El objetivo no es sólo cumplir la normativa vigente respecto a transparencia y apertura de datos, sino realmente facilitar el acceso y la interpretación de la información a los ciudadanos. Se tratar de que la gente pueda “usar” libremente los datos y la propia administración utilizar este servicio para consultas internas, en los medios de comunicación y, por supuesto, en las empresas infomediarias.

 

Además una de nuestras iniciativas actuales es impulsar, junto con nuestro partner ebroker, empresa tecnológica de referencia en el sector asegurador, una acción conjunta con la Administración en el ámbito de la Documentación Estadístico Contable (DEC): información que las entidades aseguradoras y las de mediación deben remitir a la Administración. La mejora de estos procesos de comunicación, de la publicación posterior de los datos y los informes resultantes puede tener un efecto muy positivo en el sector asegurador. El objetivo también es demostrar cómo la apertura de datos específica en un sector de negocio tiene un impacto real.

El objetivo también es demostrar cómo la apertura de datos específica en un sector de negocio tiene un impacto real"

5. ¿Os habéis encontrado algún obstáculo a la hora de reutilizar la información del sector público? ¿Cúales?

El primer proyecto en el que estuve involucrado estaba relacionado con la construcción de un buscador para un boletín oficial autonómico en el 2005. En aquella época, muchos de los boletines oficiales del estado no estaban accesibles digitalmente o eran básicamente PDFs generados a partir de imágenes. Desde luego, la situación ha cambiado sustancialmente para bien en los últimos años. Se publica información desde todos los niveles de la Administración: cada vez más, de mejor calidad y en formatos reusables.

 

Sin embargo, sigue habiendo ciertos problemas que dificultan su reutilización a gran escala y de una manera normalizada:

a. No hay una aproximación tecnológica y de vocabularios consensuada. Esto deriva en una fragmentación de soluciones a la hora de abordar la publicación. Desde luego, hay excepciones, como en el caso de la información geográfica.

 

b. Misma información en multitud de formatos. Personalmente considero esto una moda, que además no tiene un beneficio claro por parte de los reutilizadores y en parte introduce dificultades artificiales. Por ejemplo, formatos W3C estándar como RDF no son realmente conocidos en la industria y son costosos de procesar.

 

c. Muchos organismos siguen publicando la información en PDFs. Esto realmente es una barrera, aunque la información es pública. Lo mismo ocurre cuando se utilizan hojas de cálculo, ya que la mayor parte de las veces se introduce formato, lo que impide su tratamiento automático.

 

d. Formatos estándar como CSV, que son suficientes para gran parte de los procesos de publicación de datos estructurados, no son utilizados correctamente por parte de los publicadores, simulando formato cuando son ficheros planos.

 

e.En muchos casos, no hay una política de actualización y mantenimiento de los datos. La información se sube, se cumple el requisito y ya está. Otro problema derivado es que las URLs además pueden cambiar con este proceso de actualización.

 

f. Falta de endpoints donde acceder a los datos de una manera sistemática y programática. Quizás el objetivo no sea tener un servicio único de acceso a los datos, sino más bien un catálogo de servicios de la misma manera que existen los catálogos de datos. También creo que sería importante el uso de tecnologías estándar ampliamente conocidas y utilizadas por la mayor parte de las empresas. Uno de los riesgos del uso de ciertas aproximaciones es que el uso de esos servicios tienda a cero. En este sentido, me parece muy acertada la aproximación de GBIF para datos de biodiversidad.

 

Esto lo vemos en un proyecto que estamos llevando acabo actualmente para la reutilización de datos públicos en un medio de comunicación, donde el objetivo es construir visualizaciones a partir de fuentes públicas como complemento y soporte a las noticias (data-driven journalism). Desde el punto de vista del periodista, surgieron las siguientes preguntas: ¿Dónde están los datos?, ¿Qué tipo de fichero puedo manejar?, ¿Este fichero lo puedo tratar de manera mecánica con un programa software?, en caso contrario, ¿Cuándo tiempo me lleva tratar el fichero original para que pueda ser procesado? Las respuestas, desafortunadamente, no están siendo fáciles de encontrar.

 

6. ¿Cómo puede ayudar Tabulae al sector reutilizador de datos abiertos?

Creemos que nuestra tecnología puede ayudar fundamentalmente en dos direcciones:

 

- A las Administraciones: en la fase de publicación de datos para construir servicios de valor añadido basados en la visualización. De esta manera, se ofrece un servicio de interpretación y análisis de la información que permite una comunicación transparente entre la Administración y la ciudadanía. Esta aproximación no sólo se queda como un ejercicio hacia el exterior, sino que en los mismos proyectos se pueden abordar necesidades internas de la Administración que pueden ser sustentadas por nuestra tecnología y experiencia en el análisis de datos.

Se ofrece un servicio de interpretación y análisis de la información"

 

- A las empresas infomediaria: nuestra tecnología permite la automatización de los procesos de carga, la combinación de fuentes y la construcción de conocimiento a partir de los datos. Podemos ayudar a enriquecer sus sistemas de información y  en la oferta de un servicio enriquecido basado en el valor que proporciona nuestra tecnología. Si una imagen vale más que mil palabras, se puede decir que una visualización (una gráfica, un mapa…) bien construida vale más que mil datos.

Nuestra tecnología permite la automatización de los procesos de carga, la combinación de fuentes y la construcción de conocimiento a partir de los datos"