Linked data como modelo de datos

Fecha de la noticia: 27-01-2017

Linked_data

Ya han pasado 15 años del afamado artículo de Tim Berners Lee en el que se habla por primera vez de una web de datos. Este artículo fue el germen de la iniciativa de la web semántica, un esfuerzo para evolucionar la forma en la que se representaba la información con el objetivo de pasar de texto (contenido no estructurado) a datos (contenido estructurado) facilitando, por tanto, operaciones y procesos de computación más complejos.

Como resultado de esta iniciativa nació el paradigma linked data (o, como se conoce en español, “los datos enlazados”), que en su propuesta conceptual más básica se refiere a construir una web de datos, donde la información tenga un nivel de representación suficiente que permita la construcción de relaciones y enlaces, los cuales facilitan la navegación entre conjuntos de datos provenientes de diferentes fuentes, inclusive de diferentes proveedores.

Así, el linked data, en sí mismo, no es más que un conjunto de buenas prácticas para publicar y conectar datos estructurados en la web. Una propuesta que se articula a través de un conjunto de tecnologías estándar del W3C:

●   Las URIs, un mecanismo genérico para identificar entidades y conceptos, que funcionan de forma análoga a los nombres propios en el lenguaje natural. La principal ventaja con otros identificadores es que son globales (en la web) y únicos (i.e., se refieren e identifican de forma unívoca y sin ambigüedad al mismo recurso).

●   El protocolo HTTP, un mecanismo simple y universal que permite recuperar al recurso que identifica una URI. De esta forma, cuando “resolvemos” una URI es como si estuviéramos llamando al recurso a través de su nombre propio, pudiendo acceder también a su descripción (su “significado”) construido a través de otros recurso, es decir, otras URIs.

●  Modelo de datos RDF. Esta tecnología, piedra angular del stack tecnológico de la web semántica, es un framework para la descripción de recursos (entidades y objetos en la web) que se apoya en los mecanismos de nombrado y acceso que mencionados anteriormente (URIs y HTTP respectivamente).

Así, el RDF no es más que una sintaxis para la expresión de tripletas: “sujeto - verbo/relación/enlace - objeto”, que nos permiten describir los recursos de forma sencilla y natural además de un modelado abierto de los recursos, sin necesidad de esquemas o vocabularios, que facilitan la integración de conjuntos de datos heterogéneos.

El propósito original para el que fue diseñado RDF es el intercambio de datos. RDF no nació con el objetivo de sustituir ninguna tecnología, sino de complementar y proporcionar valor añadido a las ya existentes permitiendo elevar el nivel de representación de los datos publicados en la web y facilitando la comunicación entre sistemas y agentes; todo ello, independientemente de cómo estén construidos y de la tecnología subyacente.