Los cinco problemas técnicos más frecuentes a la hora de publicar tus datos abiertos

Fecha de la noticia: 21-04-2017

5 problemas técnicos open data

Los resultados de la tercera edición del Barómetro de los Datos Abiertos muestran cómo los gobiernos, como parte de su actividad habitual, están ya en la actualidad recopilando y gestionando una gran cantidad de datos en ámbitos tan diversos como cartografía, catastro, estadística, presupuestos y gasto público, registros empresariales, legislación, transporte, comercio, sanidad, educación, criminalidad, medio ambiente, resultados electorales o contratación pública.

Además, más de tres cuartas partes de esos datos oficiales están también disponibles online de algún modo a través de los múltiples sitios web gestionados por los distintos organismos gubernamentales. Sin embargo, tan sólo un pequeño porcentaje de todos esos conjuntos de datos ya digitalizados (alrededor del 10%) pueden considerarse realmente datos abiertos y, además, la gran mayoría de ellos se concentran en los 10 países que lideran el ranking.

¿A qué se deben entonces estas diferencias tan significativas? ¿Cuáles son los problemas que hacen que la gran mayoría de los datos publicados por los gobiernos no puedan considerarse todavía como datos abiertos? A continuación hacemos un rápido repaso por los cinco problemas más habituales, ordenados según su frecuencia,  que han sido detectados en el estudio realizado por el Barómetro tras el análisis de  1.380 conjuntos de datos:

  1. Licencias no abiertas: Tan sólo un 18% de los datos que se publican están claramente asociados a una licencia abierta que permita usar los datos sin ningún tipo de restricción más allá de la atribución a la fuente original. Eso quiere decir que en una gran mayoría de los datos disponibles las licencias son restrictivas o simplemente desconocidas, impidiendo de este modo su reutilización.

  2. Conjuntos de datos incompletos: Únicamente un 32% de los conjuntos de datos digitalizados que se han analizado se publican de forma completa para facilitar su descarga y uso. La mayoría de los datos en la actualidad se encuentran fraccionados y diseminados entre múltiples secciones del sitio en el que se publican o incluso entre diferentes sitios web dificultando considerablemente su localización.

  3. Formatos no legibles por máquinas o difícilmente reutilizables: Poco más de la mitad de los datos (concretamente un 55%) se publican en formatos que, además de ser legibles por las máquinas, pueden también reutilizarse fácilmente. El uso de formatos estandarizados es muy limitado, lo que hace más difícil la interoperabilidad. Asimismo, los formatos propietarios siguen siendo mayoría, limitando también el acceso a aquellos usuarios que no cuenten con el software necesario.

  4. Datos desactualizados: Hasta un 26% de los datos disponibles no se actualizan con la frecuencia que sería adecuada según su naturaleza. Igualmente, en la mayoría de los casos tampoco se indica cuál será la frecuencia de actualización a seguir. Los datos desactualizados pierden gran parte de su interés para los potenciales reutilizadores.

  5. Tasas de acceso: Todavía es necesario pagar una tasa para poder tener acceso completo a un 10% de los datos publicados. Esto no sólo limita considerablemente el público beneficiado por el uso de esos datos, sino que también contribuye a aumentar la brecha digital.

Todos estos problemas afectan directamente a características que son distintivas de los datos abiertos y son la clave de su potencial. Mientras no se cumpla con todas estas características no será posible obtener todos los beneficios sociales y económicos ofrecidos por los datos abiertos.