Herramientas para la gestión de vocabularios controlados con soporte SKOS

Fecha del post: 19-10-2017

vocabularios controlados, SKOS,

Para organizar (clasificar, describir, indexar) el conocimiento, existen varias herramientas documentales de organización, siendo un extracto de ellas, ordenadas de las más simple (el menos formalizado y con menos reglas) a la más compleja (más formalizado y con más reglas) el siguiente: los vocabularios controlados, las taxonomías, los tesauros y las ontologías.

Para las tres primeras opciones más simples (vocabulario controlado, taxonomía y tesauro), el consorcio W3C ha desarrollado un modelo para la representación de la estructura básica y el contenido de las mismas: SKOS, Simple Knowledge Organization System (Sistema Simple de Organización del Conocimiento). Al tratarse de un modelo basado en RDF (Resource Description Framework), SKOS permite la creación y publicación de conceptos en la Web, así como enlazarlos con otros esquemas de conceptos o con otros datos o su reutilización por parte de terceros, lo que está propiciando su rápida adopción por parte de la comunidad Linked Open Data. En este contexto se definió posteriormente SKOS-XL, una extensión de SKOS para dar soporte a la descripción de entidades léxicas vinculadas a conceptos, es decir, con la extensión SKOS-XL “se pueden decir más cosas sobre una etiqueta léxica”. Por ejemplo, el concepto bicicleta (ex:Bicicleta) puede tener un literal como etiqueta léxica (ex:Bicicleta skos:prefLabel “bicicleta”@es). Pero con SKOS-XL la etiqueta puede ser una URI (ex:Bicicleta skosxl:prefLabel ex:Bicicleta_etiqueta_ES), lo que permite describir la etiqueta de manera más prolija, indicando por ejemplo:

  • Fecha de edición (ex:Bicicleta_Etiqueta_ES dct:issued 2013-12-15)
  • Creador de la etiqueta (ex:Bicicleta_Etiqueta_ES dc:creator ex:Asociacion_ConBici)

En este contexto, vamos a realizar una enumeración de algunas de las herramientas para la gestión de vocabularios controlados, taxonomías y tesauros, que tengan soporte para SKOS (en esta revisión hemos dejado fuera las herramientas para la visualización y para el control de calidad).

iQvoc es un gestor de vocabularios SKOS(-XL), disponible como código abierto (licencia Apache Versión 2.0). Su principal característica es la simplicidad de uso y la posibilidad de aumentar su funcionalidad mediante extensiones (como por ejemplo para dar soporte a SKOS-XL)

SKOSEd es un plugin de código abierto para la gestión de tesauros dentro del conocido editor de ontologías Protégé (disponible como software de escritorio). Al estar dentro del marco de Protégé, se puede combinar con razonadores externos que determinen si el modelo SKOS es consistente.

ThManager es una herramienta de escritorio multiplataforma (Unix, Windows) para crear y visualizar tesauros SKOS, de código abierto (bajo licencia GNU Lesser General Public License (LGPL)) y desarrollada por la Universidad de Zaragoza. Su desarrollo parece que ha sido descontinuado, a la vista de las fechas de los últimos cambios.

PoolParty es un gestor web propietario para tesauros, con soporte para SKOS. Esta herramienta incluye funcionalidades de análisis de texto y de enlazado de datos. Mediante add-ons se aumenta la funcionalidad de la herramienta, como por ejemplo ofreciendo soporte para SKOS-XL, soporte para flujos de gestión y aprobación de los conceptos en base a los roles de usuario en el gestor. Además, ofrece la publicación del tesauro como LOD, con URIs dereferenciables o un SPARQL endpoint para realizar consultas.

TemaTres es una herramienta web, de código abierto y distribuida bajo licencia GNU Public License (GPL), para la gestión y explotación de vocabularios controlados, tesauros, taxonomías y otros modelos de representación formal del conocimiento. Internamente utiliza un modelo basado en términos, que difiere del basado en conceptos, lo que produce cierta confusión (acrecentada cuando el modelo se exporta en SKOS). También hay cierta confusión con el soporte multilingüe de los tesauros. Por otro lado, dispone de funcionalidades especialmente orientadas a ofrecer datos de trazabilidad y control de calidad de los modelos creados. Es una herramienta fácil de utilizar y un posible punto de partida.

TopBraid Enterprise Vocabulary Net (TopBraid EVN) es una plataforma web propietaria para la creación y gestión de estructuras semánticas (donde se incluyen vocabularios, taxonomías, tesauros y ontologías). Destaca su sistema de control de versiones y trazabilidad, así como el soporte nativo a SKOS.

VocBench es una plataforma web de código abierto (bajo licencia Mozilla Public License MPL) que permite la edición de tesauros multilingües SKOS(XL) de manera colaborativa. Esta herramienta es desarrollada principalmente por la Universidad de Roma Tor Vergata, y está estrechamente relacionada con el tesauro AGROVOC [enlace al post sobre AGROVOC], ya que la gestión del mismo fue la razón de la creación de VocBench. Posiblemente sea una de las herramientas más completas que existen, con soporte nativo a SKOS(XL), gestión de roles y flujos de trabajo o multilingüismo. En las próximas semanas se espera una completa nueva versión VocBench 3, del que ya hemos podido ver algunas pinceladas en un webinar realizado por el portal Agricultural Information Management Standards (AIMS) de la FAO.

En la siguiente tabla, recopilamos algunas respuestas para cada una de las herramientas revisadas.

Tabla con características de las principales herramientas de gestión de vocabularios

A la hora de decantarse por uno u otro sistema, habría que hacerse una serie de preguntas sobre las necesidades y la sostenibilidad:

  • ¿Que presupuesto tienes?
  • ¿Tienes personal de sistemas que pueda desplegar una plataforma o tienes que optar por un servicio en la nube?
  • ¿Tiene soporte técnico y no técnico? ¿Es una herramienta con mantenimiento fiable?
  • ¿Quieres utilizar herramientas de código abierto y que tu trabajo esté basado en los movimientos Open?
  • ¿Necesitas una plataforma para la gestión interna de la herramienta documental de organización o también para visualizarla externamente?
  • ¿Cuánto tiempo necesitas gestionar la herramienta documental de organización? ¿Se podría generar completamente en marco temporal definido y que después solo sea necesario exponerlo (es decir, que se haya creado una herramienta documental de organización sin cambios)?
  • ¿Necesitas control de versiones y/o flujo de trabajo sobre los cambios en la herramienta documental de organización?
  • ¿Necesitas almacenar información “extra” (SKOS-XL) de las etiquetas léxicas asociadas a los conceptos?

Para concluir, a la hora de elegir una herramienta para gestionar un vocabulario controlado no hay herramienta mejor o peor “per sé”, sino que cada caso es único y diferente. Siguiendo el principio KISS (Keep it Simple, Stupid!), se debe de seleccionar la herramienta más sencilla que cubra las necesidades solicitadas, y así evitar cualquier complejidad innecesaria.