Pubby y LODI, abriendo los datos enlazados a los humanos

Fecha de la noticia: 31-01-2018

Pubby y LODI

Una parte importante de los datos que están publicados bajo las premisas de la Web Semántica, donde los recursos están identificados por URIs, se almacenan dentro de bases de datos de tripletas (triplestore), y estos datos solo pueden ser accedidos mediante consultas SPARQL a través de un SPARQL endpoint.

Además, las URIs utilizadas, normalmente diseñadas bajo un patrón, en la mayoría de los conjuntos de datos (datasets) que se almacenan en esas bases de datos no son dereferenciables, esto es, que al realizar una petición a ese identificador no se recibe ninguna respuesta (error 404).

Ante esta situación, en el cual esos datos solo están accesibles para las máquinas, y aunado  con el empuje del movimiento de los datos enlazados (Linked Data), son varios los proyectos que han surgido con el principal objetivo de generar vistas para humanos de esos datos mediante interfaces web (donde las vistas de los recursos estén enlazadas unas con otras), así como ofrecer un servicio donde las URIs sean dereferenciables.

Pubby es, posiblemente, el proyecto más conocido que se ha creado con este objetivo. Es una aplicación web desarrollada en java, cuyo código está compartido bajo la licencia de código abierto Apache License, Version 2.0., y que está diseñada para ser desplegada en sistema que posea acceso SPARQL a la base de datos de tripletas sobre la que se quiera aplicar.

Mediante un fichero de configuración, se realiza un mapeo entre las URI no-dereferenciables y las URIs dereferenciables que son gestionadas por el servidor Pubby. Con ello, la aplicación tramita las peticiones a las URIs mapeadas, preguntando por la información de la URI original a la base datos asociada (mediante una consulta SPARQL DESCRIBE) y devuelve los resultados al cliente (en el formato de representación solicitado).

Además, Pubby proporciona una vista simple en HTML de los datos almacenados y gestiona la negociación de contenidos entre las diferentes representaciones. Mediante el interfaz web, el usuario puede navegar entre las vistas HTML de los recursos enlazados (Linked Data). En estas vistas se muestra toda la información de los recursos, incluyendo los atributos y relaciones con otros recursos.

Del proyecto Pubby han surgido múltiples proyectos paralelos (forks) y proyectos inspirados. Uno de los últimos ha sido el proyecto Linked Open Data Inspector (LODI), desarrollado desde el grupo de ingeniería software Quercus de la Universidad de Extremadura bajo licencia Creative Commons Atribución 3.0. Este proyecto está desarrollado en Node.js y posee algunas diferencias positivas respecto a Pubby:

  • Proporciona una vista simple en HTML para todos los públicos, y otra más detallada para programadores.

  • Proporciona información del recurso en el formato N3 (aunque no RDF/XML o Turtle).

  • En el caso de recursos con información geoespaciales, se muestra un mapa detallando la ubicación.

  • De igual manera, en el caso de detectar imágenes (.jpg, .jpeg o .png), estas son mostradas de forma automática.

Actualmente existen dos portales de datos abiertos que están utilizando LODI: Open Data Cáceres y Open Data UEx.

Pubby, LODI y otros proyectos similares (como LODDY), usando en el tesauro AGROVOC han conseguido exponer información que estaba retenida dentro de bases de datos RDF y que no era accesible para los humanos. Proyectos como estos hacen que la web de los datos enlazados siga creciendo en cantidad y en calidad, poniendo la interacción con las personas como el eje y centro de estos avances.