Wikidata, una base de datos de conocimiento libre y abierto
Fecha de la noticia: 23-02-2021

Había un tiempo, no muy lejano, en el que una discrepancia en una información podía dar lugar a una larga conversación entre amigos y familiares. Ahora, esas discusiones se acaban con una rápida búsqueda en internet: cuántos años tiene un famoso, qué equipo de fútbol ganó una determinada competición o quién gobernaba en un momento histórico concreto. Todo está en la red.
Al buscar la respuesta a cualquiera de estas preguntas en internet, el primer resultado que suele aparecer es Wikipedia, la famosa enciclopedia online gratuita. Wikipedia es un proyecto de la Fundación Wikimedia, una organización sin ánimo de lucro cuyo objetivo es llevar el conocimiento a todos los habitantes del planeta. Wikipedia es el proyecto más conocido, pero Wikimedia ofrece otros muchos servicios como Wikiversity, que apoya a las comunidades de aprendizaje proporcionando materiales y actividades didácticas, o Wiktionary, un diccionario gratuito.
Volviendo a Wikipedia, esta enciclopedia nos ofrece piezas de información creadas y editadas por voluntarios de todo el mundo en base a tres principios: punto de vista neutral, verificabilidad y no es una fuente primaria. Si entras a un artículo de una organización o persona al azar, verás que aparece una tabla a la derecha con una serie de datos. Al principio, estos datos había que cargarlos manualmente en cada entrada, y traducirlos a cada idioma. Teniendo en cuenta que contiene más de 50 millones de artículos en más de 300 idiomas, la tarea manual se hacía cuanto menos complicada. Esto cambio con la llegada de Wikidata.
Ejemplo de entrada de Wikipedia y Wikidata
¿Qué es wikidata?
Wikidata es una base de conocimiento colaborativa, libre y abierta que almacena información estructurada. Su principal ventaja es que ofrece datos enlazados, descritos mediante RDF, lo cual permite relacionarlos con otros conjuntos de datos de otros repositorios digitales.
Wikidata puede ser leída y editada tanto por seres humanos como por máquinas, integrando fuentes de datos publicadas con licencias compatibles con Creative Commons de dominio público (CC-0). Por tanto, todo el contenido puede ser reutilizado por cualquier persona u empresa que así lo desee.
Wikidata aprovecha las ventajas de la Web semántica para crear una base de datos enlazados de conocimiento universal. A la hora de editar Wikipedia o cualquier otra wiki de Wikimedia, el usuario puede cargar los datos dinámicamente desde Wikidata. De esta forma se pueden gestionar de manera centralizada estadísticas, fechas u ubicaciones. Al cambiar el dato en wikidata, se actualizará de manera automática en todos artículos en los que aparece y en todos los idiomas.
No hay que confundir Wikidata con DBpedia. DBPedia es básicamente un repositorio de datos extraído de Wikipedia y relaciones entre ellos en forma de tripletas en RDF que reside en la nube de datos Linked Open Data. Por tanto, mientras que DBPedia extrae datos de infoboxes de Wikipedia, Wikidata ofrece referencias de datos estructurados que cualquiera puede editar. Es decir, da la vuelta al proceso de extracción de DBpedia: en lugar de extraer datos estructurados de infoboxes, permitirá crear infoboxes a partir de datos estructurados. En este sentido, ambos proyectos se pueden considerar complementarios.
¿Cómo funciona Wikidata?
El repositorio de Wikidata se compone principalmente de ítems o artículos, cada uno de los cuales tiene una etiqueta y una descripción. Los ítems se identifican de forma única con una Q seguida de un número, por ejemplo Biblioteca Nacional de España (Q750403). Cada item se describe mediante una serie de propiedades (identificadas mediante una P seguida de un número). Una declaración es el triple de un ID de artículo (Q), un ID de propiedad (P) y un valor. Por ejemplo, Miguel de Cervantes (Q5682) es autor (P2093) de "El Ingenioso Hidalgo...", el valor, en este caso, podría ser otro item (Q)".
Los usuarios tienen a su disposición tutoriales para crear nuevos ítems y declaraciones. Hay muchas consideraciones a la hora de aportar datos, archivos u otros recursos a los proyectos Wikidata, algunas de las cuales se pueden ver en este cuadro.
¿Cómo se puede acceder y utlizar los datos?
Se puede acceder a los datos a través de URIs referenciables siguiendo los estándares de datos enlazados, o a través de la API de MediaWiki.
Wikidata proporciona además un endpoint SPARQL disponible además mediante una interfaz Web-GUI. Con ello el usuario puede extraer cualquier tipo de datos, con una consulta a los datos semánticos. Aquellos usuarios que lo necesiten tienen a su disposición un tutorial y un “query helper”.
El Sparql Endpoint de Wikidata se puede utilizar, además de para recuperar datos, para representar mapas, diagramas, líneas de tiempo, listados y otras visualizaciones convenientes.
Un caso práctico de explotación de los datos de Wikidata lo encontramos en la aplicación Monumental, creada para navegar y consultar información de patrimonio histórico y de inmuebles. Otro ejemplo a destacar es la iniciativa Wikicite para crear una base de datos de bibliografía científica en base a la información de Wikidata, con aplicaciones como Scholia.
Un proyecto con éxito sostenible en el tiempo
Wikidata ha demostrado un gran potencial desde sus inicios. Fue una de las causas detrás del cierre de Freebase, la plataforma libre del gigante Google que almacenaba bases de datos relacionados con más de 46 millones de temas. Antes de su cierre, los usuarios tuvieron la oportunidad de exportar sus datos a Wikidata, que se posicionó como la gran vencedora del duelo.
Wikidata ofrece numerosas ventajas, no solo para editar y actualizar Wikipedia de manera automática, sino también para todos los profesionales del mundo del dato que tienen a su disposición una amplia base de conocimiento.
En febrero de este año hemos asistido al 20 aniversario de Wikipedia. Wikidata tiene ya nueve, pero seguro que alcanzará mucho más, cada vez con mayor entidad propia.
Contenido elaborado por el equipo de datos.gob.es en base a la información compartida por Ismael Olea