Datos abiertos y de calidad

Fecha de la noticia: 09-11-2017

datos abiertos, calidad, open data

Para que los datos gubernamentales sean fáciles de usar y valiosos, deben ser también detallados, precisos y de gran calidad. Sin embargo, tanto la Web Foundation como Open Knowledge, dos de las organizaciones que promueven más activamente la adopción de los datos abiertos en el ámbito internacional, nos advierten de que de acuerdo con sus últimos estudios los datos gubernamentales por lo general están incompletos, desactualizados, fragmentados y son de baja calidad.

Todo parece indicar que en verdad los gobiernos han estado dando respuesta al llamamiento masivo por una mayor disponibilidad de los datos, pero en ocasiones lo han hecho creando nuevas barreras para su uso, dificultando su acceso o utilizando formatos y codificaciones que resultan, finalmente, ininteligibles.

Todo lo anterior da lugar a la paradoja de que, actualmente, hay más datos disponibles que nunca antes en la historia. Sin embargo, muchas veces se publican de una forma tan diversa y compleja que con frecuencia es muy difícil establecer conexiones entre ellos, dando lugar a una nueva Torre de Babel de los Datos. Los principios de los datos abiertos son también importantes para la accesibilidad y la usabilidad de los datos. En ellos, se establecen ya una sería de cualidades que los datos de calidad deberían siempre cumplir, tales como:

  • Completitud y exhaustividad.
  • Puntualidad y oportunidad.
  • Comparabilidad e interoperabilidad.

Sin embargo, hay muchos otros aspectos que también definen la (buena o mala) calidad de los datos y, aunque no estén directamente contemplados en los principios de los datos abiertos, deberían también tenerse en cuenta a la hora de producir cualquier tipo de datos. Como, por ejemplo, los atributos de calidad inherente definidos por la ISO/IEC 25012, que podrían adaptarse fácilmente ya que como vemos se solapan en cierta medida:

Listado de losatributos de calidad de los datos abiertos

  • Exactitud: dentro del rango de valores válidos definidos para el dominio de aplicación
  • Completitud: aportando los valores correspondientes a todos los atributos disponibles
  • Consistencia: sin contradicciones y coherentes con los otros datos en su contexto
  • Credibilidad: tanto para los datos en sí como para la fuente de información
  • Actualidad: proporcionados en el momento preciso para mantener su valor
  • Accesibilidad: facilidad de acceso en su contexto
  • Conformidad: con respecto a los estándares y normativas vigentes
  • Confidencialidad: respetando la privacidad y seguridad de los datos
  • Eficiencia: para que puedan ser procesados con unos recursos razonables
  • Precisión: respecto al contexto al que pertenecen
  • Trazabilidad: respecto a la fuente u origen de los datos
  • Comprensibilidad: con una codificación adecuado para su posterior interpretación

En áreas como la estadística, donde la gestión de la calidad de los datos es una cultura ya largamente establecida, existen múltiples referencias al respecto, como los manuales elaborados y publicados por EuroStat o las Naciones Unidas, por ejemplo. Sin embargo, los datos son ahora un activo global que ya no se encuentran únicamente centralizados en las agencias de estadística, sino que se gestionan a lo largo de todos los niveles y áreas de la administración. Por ello, lo que es realmente necesario es que todas y cada una de las agencias definan sus propios requisitos de calidad de los datos, o adopten otros ya existentes como los propuestos por el proyecto de datos abiertos de la Comisión Europea, y que además empiecen también a aplicarlos cuando publiquen los datos en abierto.