Datos abiertos, big data y gobierno abierto: diferentes tipos de datos

Fecha de la noticia: 21-02-2017

Fuente: http://www.opendatanow.com/2013/11/new-big-data-vs-open-data-mapping-it-out/#.WKwewPnhDIU

Data

¿Qué tienen en común los datos abiertos y el big data? ¿En qué punto convergen lo movimientos open data y gobierno abierto? Para poder dar respuesta a estas cuestiones teóricas, en primer lugar, sería necesario comprender cada uno de los tres conceptos de forma independiente. Así, podemos definir big data (o en castellano, macrodatos) como grandes conjunto de datos que no pueden tratarse de manera convencional, ya que superan la capacidades de las herramientas tecnológicas habituales para la captura, gestión y procesamiento.

En cuanto a los datos abiertos, de acuerdo con la Carta Internacional de Datos Abiertos, el open data son aquellos datos digitales disponibles con las características técnicas y jurídicas necesarias para que puedan ser reutilizados y redistribuidos libremente. Por último, para alcanzar la comprensión de este trinomio, a estas dos definiciones hay que sumarle la filosofía colaborativa que aboga por la inclusión y participación ciudadana en los procesos gubernamentales, denominada gobierno abierto

La interrelación de los datos abiertos, big data y gobierno abierto ha dado lugar a seis subtipos diferentes de datos con rasgos comunes procedentes de cada una de las categorías madre, tal y como se muestra en el gráfico anterior, pero que dependiendo de la intersección de éstas, presentan una características diferentes:

  1. Grandes datos, pero no abiertos. Datos de compra, información clínica, registros de transacciones económicas… Gran cantidad de macrodatos se engloba dentro de  esta categoría, la mayoría con un importante valor comercial. Su tratamiento y reutilización es de gran utilidad tanto para el sector público como privado ya que, gracias a ellos, se puede predecir patrones comerciales, tendencias demográficas o brotes epidemiológicos.
  2. Gobierno abierto, sin apertura de datos. El movimiento open government aboga por la participación ciudadana en las decisiones de los gobiernos locales, regionales o nacionales. Sin embargo, esta corriente no siempre incluye políticas de datos abiertos y, en ocasiones, no conlleva la apertura de la información del sector público.
  3. Big data, abiertos pero no gubernamentales.  Actualmente, existe una gran cantidad de datos que no proceden de organismos públicos, sino de fuentes académicas, empresariales o privadas, con un enfoque abierto y reutilizable. La publicación de los resultados de investigaciones científicas como en el caso del buscador Zooniverse o la reutilización del social data, como Weanalyze, son solo algunos ejemplos de datos masivos y abiertos, pero no públicos.
  4. Datos gubernamentales pero no big data. Los datos del gobierno no tienen por qué ser masivos para ser valiosos. La publicación de una cantidad modesta de información pública, como por ejemplo los horarios de transporte público, puede tener un impacto positivo en la sociedad gracias al desarrollo de nuevos productos o servicios de valor añadido.
  5. Datos abiertos y privados.. Esta categoría incluye aquellos datos del sector privado que las empresas deciden abrir para sus propios fines, por ejemplo, para satisfacer a posibles inversores o mejorar su reputación corporativa. Los hackathones que organizan las entidades financieras a partir de su propia información es una buena muestra de esta categoría de datos abiertos.
  6. Datos abiertos, big data y gobierno abierto. El trinomio perfecto. La apertura de estos conjuntos de datos puede tener un gran impacto socieconómico en su entorno. De hecho, según estadísticas del Portal Europeos de Datos, la reutilización de los datos abiertos podría salvar 7.000 vidas al año o ahorrar hasta 629 mil millones de horas en las carreteras.

Este diagrama tan solo es una de las posibles representaciones del ecosistema de datos, un escenario dinámico que está en constante evolución según avanzan las tecnologías de la información y los gobiernos inviertan más recursos en el almacenamiento y apertura de los datos; un sector que, solo en la Unión Europea, se traduce en un mercado valorado en 75,7 mil millones de euros y el ahorro de 1,7 miles de millones en gasto público para el año 2020.