Blog

16.500 millones de euros. Esos son los ingresos que se estima generarán la inteligencia artificial (IA) y los datos en la industria española para 2025, según se avanzó el pasado febrero en el foro de IndesIA, la asociación para la aplicación de la inteligencia artificial en la industria. La IA ya forma parte de nuestro día a día: ya sea haciendo más sencillo nuestro trabajo al realizar tareas rutinarias y repetitivas, o bien complementando las capacidades humanas en diversos ámbitos a través de modelos de aprendizaje automático que facilitan, por ejemplo, el reconocimiento de imágenes, la traducción automática o la predicción de diagnósticos médicos. Todas ellas, actividades que nos ayudan a mejorar la eficiencia de negocios y servicios, impulsando una toma de decisiones más certera.

Pero para que los modelos de aprendizaje automático (también conocidos por el término en inglés machine learning) funcionen correctamente, se necesitan datos de calidad y bien documentados. Todo modelo de aprendizaje automático se entrena y evalúa con datos. Las características de estos conjuntos de datos condicionan el comportamiento del modelo. Por ejemplo, si los datos de entrenamiento reflejan sesgos sociales no deseados es probable que estos también se incorporen en el modelo, lo cual puede tener graves consecuencias cuando se utiliza en ámbitos de gran importancia, como la justicia penal, la contratación de personas o el préstamo de créditos. Además, si no conocemos el contexto de los datos, puede que nuestro modelo no funcione correctamente, ya que en su proceso de construcción no se han tenido en cuenta las características intrínsecas de los datos sobre los cuales se sustenta.

Por estas y otras razones, el Foro Económico Mundial sugiere que todas las entidades deben documentar la procedencia, la creación y el uso de los conjuntos de datos de aprendizaje automático con el fin de evitar resultados erróneos o discriminatorios.

¿Qué son Datasheets for datasets?

Un mecanismo para documentar esta información son las conocidas como Datasheets for datasets. Este marco de trabajo propone que todo conjunto de datos debe ser acompañado de una “ficha de datos”, llamada datasheet, que consiste de un cuestionario que guía en la documentación de los datos y la reflexión a lo largo del ciclo de vida de los datos. Algunas de las ventajas que supone son:

  • Mejora la colaboración, la transparencia y la responsabilidad dentro de la comunidad de aprendizaje automático.
  • Mitiga los sesgos sociales no deseados en los modelos.
  • Ayuda a los investigadores y desarrolladores a seleccionar los conjuntos de datos más apropiados para alcanzar sus objetivos específicos.
  • Facilita una mayor reproducibilidad de los resultados.

Los datasheets variarán dependiendo de factores tales como el área de conocimiento, la infraestructura organizacional existente o los flujos de trabajo.

Para ayudar en la creación de las datasheet, se ha diseñado un cuestionario con una serie de preguntas, acordes a las etapas del ciclo de vida de los datos:

  • Motivación. Recoge las razones que han llevado a la creación de los conjuntos de datos. También se pregunta sobre quién creó o financió dichos datasets.
  • Composición. Ofrece a los usuarios la información necesaria sobre la adecuación del conjunto de datos a sus objetivos. Incluye, entre otras preguntas, qué unidades de observación representan el conjunto de datos (documentos, fotos, personas, países), qué tipo de información ofrece cada unidad o si hay errores, fuentes de ruido o redundancias en él. Reflexiona acerca de los datos que se refieren a personas para evitar posibles sesgos sociales o violaciones a la privacidad.
  • Proceso de recolección. Su objetivo es ayudar a los investigadores y usuarios a pensar en cómo crear conjuntos de datos alternativos con similares características. Aquí se detalla, por ejemplo, cómo se adquirieron los datos, quién participó en el proceso de recopilación o cómo fue el proceso de revisión ética. Trata especialmente los aspectos éticos del procesamiento de datos protegidos por la RGPD.
  • Preprocesamiento, limpieza o etiquetado. Gracias a estas preguntas, los usuarios de datos podrán determinar si estos han sido procesados de formas compatibles con los usos que les pretenden dar. Indaga sobre si se realizó algún preprocesamiento, limpieza o etiquetado de los datos, o si está disponible el software que se utilizó para preprocesarlos, limpiarlos y etiquetarlos.
  • Usos. Esta sección proporciona información sobre aquellas tareas para las cuales los datos pueden o no pueden ser usados. Para ello, se debe responder a preguntas como: ¿El conjunto de datos ya ha sido usado para alguna tarea? ¿Para qué otras tareas pueden ser utilizados? ¿La composición del conjunto de datos o la forma en que se recopiló, preprocesó, limpió y etiquetó puede afectar a otros usos futuros?
  • Distribución. Recoge cómo se difundirá el conjunto de datos. Las preguntas se centran en si los datos se distribuirán a terceros y, en caso afirmativo, cómo, cuándo, cuáles son las restricciones de uso y bajo qué licencias.
  • Mantenimiento. El cuestionario finaliza con preguntas dirigidas a planificar el mantenimiento de los datos y comunicar el plan a los usuarios de los datos. Por ejemplo, se responde a si se actualizará el conjunto de datos o quién dará soporte.

Se recomienda que todas las preguntas sean tenidas en cuenta antes de la recolección de los datos, para que sus creadores puedan ser conscientes de los posibles problemas. Para ilustrar cómo se podría responder a cada una de ellas en la práctica, los creadores del modelo han elaborado un apéndice con un ejemplo para un conjunto de datos determinado.

Los datasheets for datasets son fichas que ayudan en la documentación de los datos.  Cada ficha, incluye una serie de preguntas relacionadas con los siguientes aspectos:      Motivación     Composición del dataset     Proceso de recolección     Preprocesamiento, limpieza o etiquetado.     Usos     Distribución     Mantenimiento  Ventajas:      Mejoran la transparencia y responsabilidad.     Mitigan los sesgos sociales no deseados en los modelos.     Ayudan a seleccionar los conjuntos de datos más apropiados para cada objetivo.     Facilitan una mayor reproducibilidad de los resultados.

¿Es efectivo Datasheets for datasets?

El marco para documentar los datos Datasheets for datasets ha recibido inicialmente buenas críticas, pero su implementación continúa acarreando diversos retos, sobre todo cuando se trabaja con datos dinámicos.

Para conocer si el marco resuelve de forma efectiva las necesidades de documentación de los creadores y los usuarios de los datos, en junio del 2022, Microsoft USA y la Universidad de Michigan llevaron a cabo un estudio sobre su implementación. Para ello realizaron una serie de entrevistas y un seguimiento de la aplicación del cuestionario por parte de varios profesionales del aprendizaje automático.

En resumen, los participantes expresaron la necesidad de que los marcos de documentación sean adaptables a los diferentes contextos, se integren en las herramientas existentes y en los flujos de trabajo, y que sean tan automatizados como sea posible, debido en parte a la extensión de las preguntas. No obstante, también resaltaron sus ventajas, como, por ejemplo, que reduce el riesgo de pérdida de información, promueve la colaboración entre todos los que participan en el ciclo de vida de los datos, facilita el descubrimiento de los datos o impulsa el pensamiento crítico, entre otras.

En definitiva, nos encontramos ante un buen punto de partida, pero que deberá evolucionar, sobre todo para adaptarse a las necesidades de los datos dinámicos y a los flujos de documentación aplicados en diferentes contextos.


Contenido elaborado por el equipo de datos.gob.es.

calendar icon
Documentación

A la hora de publicar datos abiertos, es fundamental garantizar su calidad. Si los datos están bien documentados y cuentan con la calidad necesaria, será más fácil su reutilización, ya que serán menores los trabajos adicionales de depuración y procesamiento. Además, la baja calidad de los datos puede suponer un coste para los publicadores, que pueden llegar a gastar más dinero en solucionar los errores que en evitar con antelación los potenciales problemas.

Para ayudar en esta tarea, en el marco de la Iniciativa Aporta se ha elaborado la “Guía práctica para la mejora de la calidad de datos abiertos, que proporciona un compendio de directrices para actuar sobre cada una de las características que definen la calidad, impulsando su mejora. El documento toma como referente la guía para la calidad de datos de data.europe.eu, publicada en 2021 por la Oficina de Publicaciones de la Unión Europea.

¿A quién está dirigida la guía?

La guía está dirigida a publicadores de datos abiertos, a quienes proporciona una serie de pautas claras para mejorar la calidad de sus datos.

No obstante, esta recopilación también puede orientar a los reutilizadores de datos sobre cómo afrontar las debilidades de calidad que pueden presentar los conjuntos de datos con los que trabajan.

¿Qué incluye la guía?

El documento comienza definiendo las características, según la norma ISO/IEC 25012, que deben cumplir los datos para considerarse de calidad, las cuales se recogen en la siguiente imagen.

Atributos de la calidad de los datos: exactitud, completitud, consistencia, credibilidad, actualidad, accesibilidad, conformidad, confidencialidad, eficiencia, precisión, trazabilidad, comprensibilidad.

A continuación, el grueso de la guía está enfocado en la descripción de recomendaciones y buenas prácticas para evitar los problemas más habituales que suelen surgir a la hora de publicar datos abiertos, estructuradas de la siguiente manera:

  • Una primera parte donde se detallan una serie pautas generales para garantizar la calidad de los datos abiertos, como, por ejemplo, utilizar una codificación de caracteres estandarizada, evitar la duplicidad de registros o incorporar variables con información geográfica. Para cada pauta se proporciona una descripción detallada del problema, las características de calidad afectadas y las recomendaciones para su resolución, junto a ejemplos prácticos que facilitan su comprensión.
  • Una segunda parte con pautas concretas para asegurar la calidad de los datos abiertos según el formato de datos utilizado. Se han incluido pautas específicas para los formatos CSV, XML, JSON, RDF y APIs.
  • Por último, la guía también incluye recomendaciones para la estandarización y enriquecimiento de datos, así como para su documentación, y un listado de herramientas útiles para trabajar la calidad de los datos.

Puedes descargar la guía aquí o al final de la página.

Materiales adicionales

La guía va acompañada de una serie de infografías que recopilan las pautas antes indicadas:

caratula Infografía “Pautas generales para garantizar la calidad de los datos abiertos”

Version accesible

Captura de la infografía " Pautas para asegurar la calidad usando formatos específicos de datos"

Versión accesible

calendar icon
Blog

Hoy en día podemos encontrar gran cantidad de información legislativa en la red. Países, regiones y municipios hacen públicos sus textos normativos y jurídicos a través de diversos espacios y boletines oficiales. El uso de esa información puede ser de gran utilidad para impulsar mejoras en el sector: desde facilitar la localización de información jurídica hasta el desarrollo de chatbots capaces de resolver dudas legales de los ciudadanos.

Sin embargo, localizar, acceder y reutilizar estos documentos suele resultar complejo, debido a las diferencias en los ordenamientos jurídicos, los diversos idiomas o los distintos sistemas técnicos utilizados para almacenar y gestionar los datos.

Para resolver este reto, la Unión Europea cuenta con un estándar de identificación y descripción de las normas denominado Identificador Europeo de Legislación, conocido como ELI por sus siglas en inglés (European Legislation Identifier).

¿Qué es el Identificador Europeo de Legislación?

El ELI surgió en 2012 a través de unas Conclusiones del Consejo (2012/C 325/02) en las que la Unión Europea invitaba a los Estados miembros a adoptar un estándar de identificación y descripción de las normas jurídicas. Esta iniciativa ha ido evolucionando y enriqueciéndose gracias a nuevas conclusiones publicadas en 2017 (2017/C 441/05) y 2019 (2019/C 360/01).

El ELI, que se basa en un acuerdo voluntario entre los países de la UE, busca facilitar el acceso, intercambio e interconexión de la información jurídica publicada en los sistemas nacionales, europeos y mundiales. De esta forma se facilita su disponibilidad como conjuntos de datos abiertos, impulsando su reutilización.

En concreto, el ELI permite:

  • Identificar documentos legislativos, como normas o recursos legales, de forma univoca mediante un identificador único (URI), comprensible tanto por personas como por máquinas.
  • Definir las características de cada documento a través de metadatos procesables automáticamente. Para ello utiliza vocabularios definidos mediante ontologías consensuadas y recomendadas para cada ámbito.

Gracias a ello, se consiguen una serie de ventajas:

  • Aporta mayor calidad y fiabilidad.
  • Aumenta la eficacia en los flujos de información, reduciendo tiempos y ahorrando costes.
  • Optimiza y agiliza el acceso a la legislación de distintos sistemas jurídicos al proporcionar la información de manera uniforme.
  • Mejora de la interoperabilidad de los sistemas jurídicos, facilitando la cooperación entre países.
  • Facilita la reutilización de datos jurídicos como base de nuevos servicios y productos de valor añadido que mejoran la eficiencia del sector.
  • Impulsa la transparencia y la rendición de cuentas de los Estados Miembros.

Aplicación del ELI en España

El ELI es un sistema flexible que debe ser adaptado a las peculiaridades de cada territorio. En el caso del ordenamiento español, existen diversos aspectos jurídicos y técnicos que condicionan su implementación.

Uno de los principales condicionantes es la pluralidad de emisores, con normas a nivel nacional, autonómico y local, cada una de las cuales cuenta con su propio medio de publicación oficial. Además, cada organismo publica los documentos en los formatos que considera adecuados (pdf, html, xml, etc.) y con distintos metadatos. A ello hay que sumar la pluralidad lingüística, por la cual cada boletín se publica en las lenguas oficiales correspondientes.

Por ello, se acordó que la implementación del ELI se realizaría de forma coordinada por todas las administraciones, en el marco de la Comisión Sectorial de Administración Electrónica (CSAE), a través de dos fases:

  • Debido a la complejidad de la normativa local, en la primera fase, se decidió abordar únicamente la especificación técnica aplicable al Estado y las Comunidades Autónomas, mediante acuerdo de la CSAE de 13 de marzo de 2018.
  • En febrero de 2022, se ha elaborado una nueva versión para incluir en su aplicación a la normativa local.

Con esta nueva especificación, quedan establecidas las directrices comunes para la implementación del ELI en el contexto español, pero respetando las particularidades de cada organismo. Es decir, recoge únicamente los elementos mínimos necesarios para garantizar la interoperabilidad de la información legal publicada en todos los niveles de administración, pero se sigue permitiendo que cada organismo mantenga sus propios diarios oficiales, bases de datos, procesos internos, etc.

Con respecto al ámbito temporal, los organismos tienen que aplicar estas especificaciones de la siguiente manera:

  • Normativa estatal: aplica a aquella publicada a partir del 29/12/1978, así como la publicada antes si cuenta con versión consolidada.
  • Normativa autonómica: aplica a aquella publicada a partir del 29/12/1978.
  • Normativa local: cada entidad podrá aplicar su propio criterio.

¿Cómo implementar el ELI?

En la página web https://www.elidata.es/ se ofrecen recursos técnicos para la aplicación del identificador. En ella se explica el modelo contextual y se ofrecen distintas plantillas para facilitar su aplicación:

También ofrece la relación de metadatos mínimos comunes, entre otros recursos.

Además, para facilitar la coordinación nacional y la compartición de experiencias, en la web también se puede encontrar información sobre la implementación efectuada por las distintas administraciones.

El ELI ya se aplica, por ejemplo, en el Boletín Oficial del Estado (BOE). Desde su página web se puede acceder a todas las normas del BOE identificadas con ELI, distinguiendo entre las normas estatales y autonómicas. Si tomamos como referencia una norma como el Real Decreto-ley 24/2021, donde se procedía a la transposición de varias directivas europeas (incluida la de datos abiertos y reutilización de la información del sector público), vemos que se incluye un incluye un permalink ELI.

En definitiva, nos encontramos ante un mecanismo común de gran utilidad para facilitar la interoperabilidad de la información jurídica, lo cual puede impulsar su reutilización no solo a nivel nacional, sino también europeo, favoreciendo la creación del espacio de libertad, seguridad y justicia de la Unión Europea.


Contenido elaborado por el equipo de datos.gob.es.

calendar icon
Documentación

Un espacio de datos es un ecosistema donde, de forma voluntaria, se ponen en común los datos de sus participantes (sector público, grandes y pequeñas empresas tecnológicas o de negocio, individuos, organismos de investigación, etc). Así y bajo un contexto de soberanía, confianza y seguridad, se pueden compartir, consumir y diseñar productos o servicios a partir de estos espacios de datos.  

Esto es especialmente importante porque si el usuario siente que tiene el control sobre sus propios datos, gracias a una comunicación clara y concisa sobre los términos y condiciones que marcarán su uso, la compartición de los mismos se hará efectiva impulsando, así, el desarrollo económico y social del entorno.

En línea con esta idea y con el objetivo de mejorar el diseño de los espacios de datos, desde la Oficina del Dato establecen una serie de características cuyo objetivo es dejar constancia de la normativa que deben seguir para diseñar, desde el punto de vista arquitectónico, espacios de datos eficaces y funcionales.

Resumimos en el siguiente visual algunas de las características más importantes para la creación de espacios de datos. Para consultar el documento original y la todas las normas propuestas por la Oficina del Dato es necesario descargar el documento adjunto que se encuentra al final de esta noticia. 

(Puedes descargar la versión accesible en word aquí)

calendar icon
Documentación

Este informe que publica el European Data Portal (EDP) tiene como objetivo avanzar en el debate sobre la sostenibilidad a medio y largo plazo de las infraestructuras de los portales de datos abiertos.

Ofrece recomendaciones a los publicadores de datos abiertos y a los intemediarios de datos sobre cómo hacer que los datos abiertos estén disponibles y como promover su reutilización. Está basado en el trabajo realizado anteriomente por el equipo de data.europa.eu, en la investigación sobre la gestión de datos abiertos, y en la interacción entre los humanos y los datos.

Teniendo en cuenta las conclusiones, se proponen 10 recomendaciones para el aumento en la reutilización de los datos.

El informe se encuentra disponible en este enlace: " Principles and recommendations to make data.europa.eu data more reusable: A strategy mapping report "

calendar icon
Blog

Una de las acciones clave que destacamos recientemente como necesarias para construir el futuro de los datos abiertos en nuestro país es la implantación de procesos para mejorar la gestión y gobernanza de los datos. No en vano, el llevar a cabo una gestión adecuada de los datos en nuestras organizaciones se está convirtiendo en una tarea cada vez más compleja y demandada. Buena muestra de ello es, por ejemplo, que los especialistas en data governance están cada vez más demandados – con más de 45.000 ofertas de empleo activas en Estados Unidos para un rol que hace no mucho era prácticamente inexistente – y docenas de plataformas de gestión de datos ahora se anuncian como data governance platforms.

¿Pero qué es lo que hay realmente detrás de esas palabras clave? ¿Qué es lo que debemos entender realmente por gobernanza de los datos? En realidad, de lo que estamos hablando es de una serie de procesos de transformación bastante complejos que afectan al conjunto de la organización.

Esa complejidad queda perfectamente reflejada en el framework que nos proponen desde el Open Data Policy Lab, donde podemos observar claramente las diferentes capas superpuestas del modelo y cuáles son sus principales características – dando lugar a un recorrido a través de la elaboración de los datos, la colaboración con los datos como herramienta principal, la generación de conocimiento, el establecimiento de las condiciones habilitadoras necesarias y la creación de valor añadido.

 

Diferentes capas superpuestas del modelo Open Data Framework: El ciclo de vida de los datos  (Recolección, Procesamiento,  Compartición, Análisis,  Uso ); La colaboración a través de los datos  (Interfaces públicos, Intermediarios confiables, Colecciones de datos,  Acuerdos para la investigación y el análisis, Concursos y retos,  Generación de inteligencia); La generación de conocimiento (Análisis de la situación, Causa y efecto, Predicción, Evaluación del impacto);    Condiciones facilitadoras (Publicar con un propósito, Establecer alianzas, Potenciar el fortalecimiento de fuentes de datos alternativas,  Establecer un marco de responsabilidad);     Generación de valor,  Mejorar la gobernanza, Potenciar a las personas,  Crear nuevas oportunidades,  Solucionar problemas).

Fuente: Open Data Policy Lab (traducción creada por el equipo de datos.gob.es)

 

Pasemos entonces a continuación a pelar esa cebolla y observemos más en detalle qué es lo que encontraremos en cada una de esas capas:

El ciclo de vida de los datos

Nunca deberíamos considerar los datos como elementos aislados, sino como parte de un ecosistema mayor, que se encuentra inmerso en un ciclo continuo con las siguientes fases:

  • Recolección o recopilación de los datos procedentes de distintas fuentes.
  • Procesamiento y transformación de los datos para conseguir que sean utilizables.
  • Compartición e intercambio de datos entre los distintos miembros de la organización.
  • Análisis para extraer el conocimiento que se está buscando.
  • Uso de los datos de acuerdo al conocimiento obtenido.

La colaboración a través de los datos

No es extraño que el ciclo de vida de los datos transcurra únicamente dentro de la organización donde se originan. Sin embargo, podremos aumentar el valor de esos datos exponencialmente, simplemente exponiéndolos a la colaboración con otras organizaciones a través de diversos mecanismos, añadiendo así una nueva capa de gestión:

  • Interfaces públicos que ofrecen un acceso selectivo a los datos, habilitando nuevos usos y funciones.
  • Intermediarios confiables que funcionan como agentes independientes de datos. Estos agentes coordinan el uso de los datos por parte de terceros, garantizando su seguridad e integridad en todo momento.
  • Colecciones de datos que ofrecen una visión común, conjunta, completa y coherente de los datos a través de la agregación de porciones procedentes de distintas fuentes.
  • Acuerdos para la investigación y el análisis, por los que se garantiza el acceso a ciertos datos con el objetivo de generar un conocimiento específico.
  • Concursos y retos que dan acceso a datos específicos durante un periodo limitado de tiempo para promover nuevos usos innovadores de los mismos.
  • Generación de inteligencia, mediante la cual se comparten también los conocimientos adquiridos por la organización a través de los datos y no solo la materia prima.

La generación de conocimiento

Gracias a las colaboraciones establecidas en la capa anterior será posible realizar nuevos estudios de los datos que nos permitirán tanto analizar el pasado como tratar de extrapolar el futuro mediante diversas técnicas como:

  • Análisis de la situación, conociendo lo que está pasando en el entorno de los datos.
  • Causa y efecto, buscando una explicación al origen de lo que está pasando.
  • Predicción, intentando inferir que será lo siguiente que va a pasar.
  • Evaluación del impacto, estableciendo lo que esperamos que debería suceder.

Condiciones facilitadoras

Existen una serie de procedimientos que cuando se aplican por encima de un ecosistema de datos colaborativo ya existente pueden dar lugar a un uso todavía más efectivo de los datos mediante técnicas como:

  • Publicar con un propósito, con el objetivo de coordinar la oferta y la demanda de datos de la forma más eficiente posible.
  • Establecer alianzas, incluyendo en nuestros análisis a aquellos grupos de personas y organizaciones que nos puedan ayudar a entender mejor las necesidades reales.
  • Potenciar el fortalecimiento de fuentes de datos alternativas proporcionando los recursos necesarios para crear nuevas fuentes de datos en las áreas aún por explotar.
  • Establecer un marco de responsabilidad en torno a los datos que tenga en cuenta los principios de equidad, compromiso y transparencia.

Generación de valor

La ampliación del ecosistema y el establecimiento de las condiciones adecuadas para que ese ecosistema florezca pueden dar lugar a economías de datos de escala de las que podremos obtener nuevos beneficios como:

  • Mejorar la gobernanza y la operativa de la propia organización gracias a las mejoras generales en transparencia y eficiencia que acompañan a los procesos de apertura.
  • Potenciar a las personas proporcionándoles las herramientas que necesitan para realizar sus tareas de la forma más adecuada y tomar las decisiones correctas.
  • Crear nuevas oportunidades para la innovación, la creación de nuevos modelos de negocio y la elaboración de políticas públicas dirigidas por la evidencia.
  • Solucionar problemas optimizando los procesos y servicios y las intervenciones dentro del sistema en el que operamos.

 

Como podemos observar, el concepto de gobernanza de los datos es en realidad mucho más amplio y complejo de lo que en principio uno podría esperar y abarca una serie de actuaciones clave y tareas que en la mayoría de organizaciones será prácticamente imposible tratar de centralizar en un único rol o a través de una única herramienta. Por tanto, a la hora de establecer un sistema de gobernanza de datos en una organización deberíamos afrontar el reto como un proceso de transformación integral o un cambio de paradigma en el que prácticamente todos los miembros de la misma deberán estar implicados en mayor o menor medida. Una buena forma de afrontar este reto con mayor facilidad y mejores garantías sería a través de la adopción e implementación de algunos de los marcos y estándares de referencia que se han ido creando al respecto y que se corresponderías con distintas partes de este modelo.


Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

 

calendar icon
Entrevista

El portal de datos abiertos de Aragón surgió en 2012 y desde entonces no ha dejado de crecer. Actualmente cuenta con más de 2.100 conjuntos de datos y un gran número de aplicaciones. En estos años ha ido incorporando novedades para adaptarse a las necesidades reales de los  ciudadanos, como su estructura de información que mejora la interoperabilidad y homogeniza los datos disponibles, o la incorporación de aplicaciones como Open Analytics Data, que ofrece las estadísticas de uso de los portales más importantes del Gobierno de Aragón.

En los últimos meses, han estado trabajando en la Iniciativa Aragón Open Data Focus, destinada a conocer mejor a los publicadores y usuarios de datos abiertos. Para que nos cuente más sobre este interesante proyecto y el resto de actividades que desarrollan, hemos hablado con Julián Moyano, Asesor Técnico de la Dirección General de Administración Electrónica y Sociedad de la Información, Departamento de Ciencia, Universidad y Sociedad del Conocimiento del Gobierno de Aragón.

Entrevista completa

1. ¿Qué es Aragón Open Data Focus? ¿Cuáles son sus puntos estratégicos?

Aragón Open Data Focus es una manera de acercar los datos del portal de datos abiertos del Gobierno de Aragón, Aragón Open Data, a la sociedad, y a aquellas personas que no están tan familiarizadas con los datos para favorecer su uso e interpretación.

Acercar los datos disponibles en Aragón Open Data ha requerido conocer mejor las necesidades reales de los usuarios y los colectivos implicados. Siendo los cuatro puntos estratégicos de este trabajo:

  • Primero, hemos partido de un análisis inicial de los datos y servicios disponibles en Aragón Open Data.
  • Segundo, mediante ese análisis se han definido potenciales grupos de usuarios y agentes de interés.
  • Tercero, a partir de ahí se han organizado diferentes encuentros con estos grupos para buscar sinergias y establecer líneas de trabajo.
  • Cuarto, todo ello ha dado como fruto el servicio denominado Aragón Open Data Focus con historias y narrativas digitales basadas en datos abiertos disponibles y en las inquietudes de los usuarios.

2. Para conocer mejor las necesidades de los usuarios han realizado diversos encuentros virtuales. ¿Con qué colectivos se han reunido? ¿Cuáles son las conclusiones que han obtenido de esas conversaciones?

Los encuentros han sido una parte muy destacada de Aragón Open Data Focus. A principios de 2020 se habían planificado de manera presencial 8 encuentros, para favorecer la participación y el contacto directo con estos agentes implicados. Por culpa de la pandemia del coronavirus el primero de ellos tuvo que ser suspendido, reprogramando la agenda de participantes y calendario, para celebrarlos por videoconferencia. Ha habido una grandísima actividad online y han tenido una muy buena acogida por los diferentes grupos de participantes. Los colectivos con los que hemos trabajado han sido:

  • Organismos del sector público: enfocado a empresas y otras entidades del sector público.
  • Narradores de historias: periodistas.
  • Empresas reutilizadoras de datos.
  • Estudiantes.
  • Dirección, gestores y altos cargos de organizaciones privadas y públicas.
  • Desarrolladores y programadores del sector tecnológico.
  • Fiscalizadores de la acción pública, colectivos ciudadanos y movimientos sociales.
  • Ciudadanía, en general, novel sobre datos abiertos.

Las conclusiones de todos estos encuentros han sido muy valiosas. La primera de ellas es que resulta necesario hablar y debatir de “tú a tú” con los agentes implicados, con los receptores de los servicios, con los posibles y potenciales usuarios de los datos, para conocer mucho mejor sus necesidades y compartirlas en Aragón Open Data. 

Algunas de las conclusiones que me gustaría destacar que se obtuvieron con los grupos de usuarios fueron:   

  • Los responsables de organismos del sector público demandan más cooperación dentro de las administraciones para articular correctamente el esfuerzo en materia de transparencia y datos abiertos.
  • Los usuarios con un perfil más técnico y familiarizados con los datos exigen más datos en formatos abiertos, de mejor calidad, mejorar sus descripciones, nivel de desagregación y actualizados en tiempo real.
  • Los interesados y usuarios con perfiles más generales quieren posibilidades de relacionar datos de diferentes fuentes, visualizaciones, geoposicionamiento de los datos abiertos disponibles, visualizaciones en mapas e información geográfica descargable en formatos abiertos y con la posibilidad de integrarlos en otras webs.
  • Además, los portales de datos abiertos necesitan mejorar su dinamización, difusión y acercamiento constante a los proveedores de datos y a sus usuarios. También se solicita una atención permanente y rápida a nuevas demandas de datos abiertos o resolución de dudas de los usuarios, vinculando cualquier acción a la cultura de la apertura y transparencia por parte de las Administraciones Públicas.

También indicar que el contenido, dinámica y conclusiones de cada uno de los eventos se encuentra disponible en la web del Gobierno de Aragón: https://www.aragon.es/-/los-datos-abiertos-mas-cerca-de-la-sociedad-aragon-open-data-focus.

3. ¿Qué acciones están desarrollando para dar respuesta a las peticiones de los usuarios?

Han sido unas jornadas intensas, cargadas de ideas, propuestas y debates. Ahora toca asentar las conclusiones de estos encuentros para trabajar en las líneas y demandas sugeridas.

Hay que remarcar que estos encuentros y sus conclusiones están alineadas con la Estrategia de Aragón Open Data en la que se analiza la evolución del portal web de Aragón Open Data y el mapa de agentes (periodistas, investigadores, ciudadanos) que trabajan con datos abiertos para ofrecer una visión integral del servicio y es por eso, que Aragón Open Data Focus tiene cabida en dicha Estrategia.

Con ello se sigue perfilando, trabajando y cumpliendo sus líneas de acción, que permiten potenciar la implicación de los usuarios y desarrollar un modelo de gobernanza de datos que cubra sus demandas: trabajando en la apertura de nuevos recursos, mejorando los existentes y favoreciendo su utilización.

4. ¿Con qué obstáculos se han encontrado a la hora de poner en marcha Aragón Open Data Focus?

El principal obstáculo, y ya lo he señalado anteriormente, ha sido la pandemia del coronavirus. Aragón Open Data Focus tenía un marcado carácter presencial, para hablar y debatir con los implicados de manera directa con dinámicas participativas, incluso teníamos previstos eventos en pequeños pueblos y el entorno rural de Aragón, para divulgar y compartir ideas sobre datos abiertos y conocer de primera mano sus demandas y necesidades. La pandemia nos hizo cambiar su dinámica y hacerlo online, que no ha sido tampoco inconveniente para celebrar estos “encuentros” y obtener conclusiones.

Más allá de eso, sí que hemos notado que los usuarios tienen grandes expectativas sobre los datos abiertos, y a veces darles respuesta en este tipo de jornadas no resulta sencillo por diferentes motivos: la inexistencia de datos en la administración (es competencia de otro organismo), problemas técnicos, o por las características de los propios datos abiertos disponibles, circunstancias que, aunque pueden justificar, no excusar, detalladamente la situación, son difícil de entender por parte del usuario o demandante de datos, cuando estamos en el siglo XXI, en la era de los datos y la economía digital.

5. ¿Qué beneficios aporta a las administraciones públicas este tipo de iniciativas?

Sobre todo profundizar en las necesidades reales de los usuarios y los colectivos con los que hemos trabajado para enfocar mejor nuestras acciones y líneas de trabajo futuras.

6. Hace unos años, nos comentabais que los conjuntos de datos más demandados por los usuarios de Aragón Open Data eran aquellos relacionados con los presupuesto. ¿Está situación ha cambiado? ¿Qué tipo de información demandan ahora los reutilizadores?

Los datos de los presupuestos siguen siendo de los más utilizados en Aragón Open Data, tanto como conjuntos de datos abiertos como en el servicio que lo refleja: https://presupuesto.aragon.es/

Hoy en día, si acudimos al número de accesos, y en plena actualidad, lo más demandado (duplica al segundo recurso con más accesos) están siendo los datos relacionados con el coronavirus en Aragón, seguido de datos cartográficos, datos sobre la PAC (Política Agraria Común) y datos estadísticos.

7.¿Cómo ve el panorama de datos abiertos en España? ¿Qué puntos fuertes cree que existe? ¿Y débiles? ¿Cómo se podrían solucionar?

El panorama en España es prometedor, se ha recorrido ya mucho camino a la hora de aportar datos en formatos abiertos por diferentes administraciones públicas de todos los niveles territoriales. Ahora los portales, una vez que han crecido su oferta en número de conjuntos de datos, se están adaptando más a las demandas de la sociedad que no solo quiere cantidad, quiere datos muy concretos para sacarles partido y valor, por ejemplo: datos de movilidad, transporte de viajeros, infraestructuras de telecomunicaciones, servicios digitales y salud, en tiempo real. Esto está en línea con lo que la Unión Europea ha legislado con su nueva directiva relativa a los datos abiertos y la reutilización de la información del sector público, como punto fuerte. Es decir, existe una importante apuesta normativa y respaldo institucional a las iniciativas de datos abiertos en Europa, para poder hacer del continente un auténtico mercado digital basado en datos que mejore la vida de los ciudadanos.

Como puntos débiles en la apertura de datos abiertos, que tiene un buen respaldo normativo y jurídico, pueden ser los tiempos de respuesta para incluir un conjunto de datos demandado a un determinado portal, por lo que convendría agilizar más los procesos de apertura de datos. Y en caso que no exista un proveedor que actúa de gestor de datos, aprovechar las posibilidades de las tecnologías actuales, por ejemplo, reconocimiento de datos o detección automática de esquemas con validadores de calidad y seguridad, para permitir abrir y disponer de datos abiertos con la mínima intervención humana.

Si los datos son un activo de las administraciones públicas que sirven a los ciudadanos, empresas y terceros en esta nueva economía digital, también tienen que perder esa aura de cerrados y de propiedad, que a veces desprenden.

calendar icon
Blog

El Desafío Aporta, en línea con otras muchas iniciativas promovidas por las administraciones públicas, no podía ser ajeno a los grandes retos a los que nos estamos enfrentando en este año 2020. Por ello su tercera edición, a la vez que cumple con su habitual objetivo de fomentar el uso de datos y las tecnologías relacionadas, pretende contribuir en la resolución de problemas relacionados con la educación digital. Sin duda uno de los ámbitos en los que más se ha puesto de manifiesto la necesidad de proponer nuevas innovaciones para garantizar que la pandemia no cause un grave daño en el potencial de las generaciones más jóvenes.

Con el lema “El valor del dato en la educación digital”, desde datos.gob.es se propone un Desafío Aporta que en 2020 premie ideas y prototipos que identifiquen nuevas oportunidades de captar, analizar y utilizar la inteligencia de los datos en el desarrollo de soluciones para el ámbito educativo en cualquiera de sus etapas.

Identificar un problema

Si afrontásemos la participación en el desafío como un proyecto de ciencia de datos, lo primero que haríamos es determinar la pregunta que nos gustaría resolver, en definitiva, elegir un problema en el que valga la pena trabajar.  En este artículo proponemos algunas líneas de trabajo, pero no son restricciones, tan sólo pretenden servir de inspiración para que nos sea más fácil elegir un reto en el ámbito de la educación con el que podamos tener un gran impacto. Siempre hay que aspirar a mejorar el mundo.

Por otra parte, podemos fijarnos en las  grandes brechas educativas que define el programa Educa en Digital, cuyo objetivo es complementar el Plan de Digitalización y Competencias Digitales y fomentar la transformación digital de la educación en España, haciendo un uso intensivo de las TIC tanto en el aula, como en los formatos no presenciales, y abordando problemas específicos gracias a desarrollos ligados a los datos y la inteligencia artificial. Para cada uno de los objetivos específicos podemos pensar en un buen número de cuestiones en las que podemos trabajar:

  1. La dotación de dispositivos y de recursos educativos digitales. Por ejemplo, ¿cómo podríamos ayudar a que el acceso a la tecnología no sea una barrera para acceder a la educación, especialmente para los colectivos más vulnerables?, ¿cómo podemos reducir los requisitos necesarios para acceder a los programas educativos de forma remota?, ¿cómo podemos apoyarnos en los dispositivos más económicos y de más amplia disponibilidad entre los estudiantes?, etc.
  2. La dotación de recursos educativos digitales, sobre todo en relación con el punto anterior. En muchas ocasiones el problema en el que podemos trabajar no tiene por qué ser completamente nuevo, sino que podemos encontrar un enfoque más eficiente para una cuestión aparentemente resuelta.  Por ejemplo, ¿cómo podemos ayudar a que un docente pueda realizar un mejor seguimiento a un número elevado de alumnos?, ¿cómo podemos mejorar la seguridad de las aplicaciones que utilizan los alumnos a través de redes públicas? ¿cómo podemos garantizar la privacidad de los alumnos?, etc.
  3. La adecuación de las competencias digitales de los docentes. En esta línea existen también un importante número de cuestiones que resolver: ¿cómo podemos mejorar la usabilidad de las herramientas para docentes y alumnos?, ¿cómo podemos fomentar competencias relacionadas con la colaboración o la comunicación cuando las personas no están en un mismo espacio físico?, ¿cómo podemos ayudar a que las competencias STEM se perciban como transversales?, etc.
  4. La aplicación de la inteligencia artificial a la educación personalizada, que es casi un santo grial de la Educación. ¿cómo podemos crear itinerarios de aprendizaje personalizados para cada grupo de alumnos?, o mejor aún ¿optimizando el ritmo de aprendizaje de cada alumno atendiendo a sus características individuales?, ¿cómo podemos predecir el impacto de los cambios en los programas en la evolución del aprendizaje de los grupos o los alumnos?, ¿cómo podemos detectar y evitar sesgos de género en los modelos que trabajen sobre cualquiera de los problemas anteriores?

En definitiva, con las sugerencias que se publican en las bases y un poco de investigación es fácil localizar un buen número de cuestiones en las que podemos aportar nuestro grano de arena para mejorar la educación digital. Sin olvidarnos de nuestra propia experiencia. Todos hemos sido al menos estudiantes, y quizá también docentes, en algún momento.

Examinar el ‘arte previo’

Antes de comenzar a trabajar tenemos que plantearnos que es muy probable que, con o sin éxito, otros hayan identificado y propuesto soluciones al problema que hemos elegido. De su éxito o fracaso también podemos extraer lecciones así que revisar bien el estado del arte, es clave para enfocar bien nuestro proyecto. En relación con la tecnología educativa es interesante revisar recursos como:

Como veréis muchos de los proyectos están centrados en resolver problemas mayoritariamente presentes en países menos desarrollados que el nuestro. Sin embargo, la pandemia ha cambiado las reglas del juego de lo que habríamos podido prever y nos vuelve a desafiar con problemas que en circunstancias normales daríamos por superados.

Localizar conjuntos de datos

Los datos abiertos están presentes en casi cualquier problema que se resuelve con tecnologías relacionadas con datos y lo habitual es que sean un ingrediente más, no el único. Las bases del Desafío Aporta reflejan esta realidad e imponen muy pocas restricciones a los creadores, ni siquiera es obligatorio utilizar fuentes de datos listadas en datos.gob.es, a pesar de ser el impulsor del desafío. Debe utilizarse, eso sí, al menos un conjunto de datos generados por las AAPP para su reutilización, pero puede provenir de cualquier fuente y puede tener cualquier papel dentro del proyecto.

Para localizar datos relacionados con nuestro proyecto podemos comenzar por los más de 1.700 conjuntos de datos del catálogo de datos de datos.gob.es, el cuál federa una buena parte de los datos disponibles en portales españoles. En el portal europeo de datos podemos encontrar más de 8000 conjuntos de datos relacionados con la educación de todos los países de la UE y otros 3000 conjuntos de datos más del catálogo del portal de datos abiertos de la Unión Europea.

Las instituciones internacionales que trabajan por el desarrollo de la educación como UNICEF o el Banco Mundial también disponen de catálogos de datos abiertos en los que podemos localizar recursos que nos ayuden en alguna parte de nuestro proyecto.

El buscador de conjuntos de datos de Google, el registro de datos abiertos de  AWS o los conjuntos de datos de Microsoft Azure son recursos en los que también podemos encontrar conjuntos de datos con los que enriquecer cualquier proyecto basado en datos.

El catálogo de datos de instituciones como el Institute of Education Sciences del Gobierno de los Estados Unidos, que aunque está centrado en este país, sin duda contiene datos de gran valor  para medir y entender el impacto de las iniciativas que se desarrollan para mejorar la educación y que pueden enriquecer muchos proyectos.

Otra opción que debemos tener en cuenta es que es posible que para resolver el problema que hemos elegido no sea suficiente con limpiar, reconciliar y transformar conjuntos de datos de cualquiera de las fuentes que están disponibles de forma pública y abierta. En ocasiones es necesario que trabajemos en generar o construir nuestro propio conjunto de datos. Y en ese caso una muy buena opción es hacerlo disponible de forma pública y abierta para que pueda ser reutilizado y mejorado por otros.

Definir el producto

Por último, tenemos que pensar en la mejor forma de entregar el resultado de nuestro trabajo para que pueda ser utilizado por sus destinatarios y tenga el impacto que deseamos. Las opciones son múltiples y de nuevo las bases no imponen restricciones. Algunas posibilidades podrían ser:

  • Apps móviles: La enorme penetración de las plataformas iOS y Android hace que cualquier producto que construyamos para estas plataformas y publiquemos en sus respectivos stores tenga garantizada una enorme difusión potencial. Además, existen opciones para realizar desarrollos multiplataforma e incluso para realizar los desarrollos con pocos (low-code) o nulos (no-code) conocimientos de desarrollo de software.
  • Sitios web: Las aplicaciones web siguen siendo probablemente el mecanismo más habitual para hacer disponible un proyecto de cualquier tipo a la sociedad en general. Los avances en servicios gestionados de los grandes proveedores de cloud y las facilidades que ofrecen para disponer de infraestructura de forma gratuita hacen que nunca haya sido más fácil comenzar un proyecto. También es posible utilizar plataformas no-code como appypie o low-code como Appian para reducir la barrera inicial si no tenemos un desarrollador de software en el equipo.
  • Algoritmos de Inteligencia Artificial: Cada vez es más frecuente que un proyecto basado en datos se entregue en forma de un modelo de aprendizaje automático o de inteligencia artificial. Por ejemplo Amazon AWS ofrece la posibilidad e listar algoritmos al igual que Microsoft Azure en su Machine Learning Marketplace para que puedan ser consumidos por otras aplicaciones.
  • Historias y Visualizaciones: En ocasiones la mejor forma de entregar resultados es a través de una visualización o de una DataStory que permita comunicar el resultado del trabajo realizado. Para ello existen múltiples opciones que van desde las utilidades que incorporan la mayor parte de las herramientas genéricas de Business Intelligence como Tableau hasta otras especializadas en localización espacial como la española Carto.

Os deseamos mucha suerte a todos los participantes y os animamos a trabajar en un reto que tiene un gran impacto para la sociedad.


Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Documentación

En el Plan de Acción de la Conferencia Internacional de Datos Abiertos, el desarrollo de capacidades se ha convertido en un aspecto prioritario dentro del movimiento open data internacional. Al fin y al cabo la necesidad de herramientas formativas es imprescindible para los líderes responsables de las políticas RISP, los productores y reutilizadores de datos, el sector público y privado, e incluso, los ciudadanos. Por ello, facilitar herramientas formativas que permitan a los diferentes agentes avanzar en la apertura y reutilización constituye una tarea prioritaria.

Con este objetivo, desde la línea de difusión, sensibilización y formación de Iniciativa Aporta, se han elaborado ocho unidades didácticas, dirigidas a todo tipo de público: desde ciudadanos que se acercan por primera vez a los datos abiertos hasta reutilizadores y empleados públicos, responsables de iniciativas de apertura de la información, que deseen ampliar sus conocimientos.

Las unidades formativas están diseñada para entender los conceptos básicos del movimiento open data, para conocer buenas prácticas en la implementación de políticas de datos abiertos y su reutilización, pautas metodológicas para la apertura, normativas técnicas como DCAT-AP y NTI-RISP o además del uso de herramientas de tratamiento de datos, entre otros aspectos.

En la elaboración de los recursos, se han tenido en cuenta dos tipos de aprendizaje. El aprendizaje por descubrimiento, orientado a ampliar los conocimientos para resolver las dudas y reflexiones planteadas y el aprendizaje significativo basado en el conocimiento previo, a través del uso de ejemplos prácticos para contextualizar y aplicar los conceptos tratados.

Además, los módulos formativos contienen materiales complementarios a través de enlaces a páginas externas y documentos para su descarga sin necesidad de conexión. De esta forma, se le brinda la oportunidad al alumno de ampliar sus conocimientos y familiarizarse con fuentes relevantes donde obtener información fiable y actualizada sobre el sector open data.

Todas las unidades se distribuyen bajo la licencia Creative Commons Share-Alike Attribution Licence (CC-BY-SA) que permite copiar, distribuir el material en cualquier medio o formato y adaptarlo para crear nuevos recursos a partir de él.

¿Qué contenidos están disponibles?¿Qué contenidos están disponibles?

El material formativo elaborado por Iniciativa Aporta consta de ocho unidades didácticas que abordan los siguientes contenidos del sector de la apertura y reutilización de la información del sector público:

  1. Conceptos básicos, beneficios del Open Data y Barreras
  2. Marco Normativo
  3. Tendencias y buenas prácticas en la implementación de políticas de datos abiertos
  4. La reutilización de datos públicos en su papel transformador
  5. Pautas metodológicas para la apertura de datos
  6. DCAT-AP y la Norma Técnica de Interoperabilidad de Reutilización de Recursos de Información (NTI-RISP)
  7. Uso de herramientas básicas de tratamiento de datos
  8. Buenas prácticas en el diseño de APIs y Linked Data

¿En qué consisten las unidades didácticas?¿En qué consisten las unidades didácticas?

Cada unidad está diseñada para que el alumno adquiera o amplíe sus conocimientos sobre el sector de la apertura y reutilización del sector público. Con el fin de facilitar su comprensión, todas ellas cuentan con una estructura similar que incluye objetivos, contenidos, actividades de evaluación, ejemplos prácticos, información complementaria y conclusiones.

Todas las unidades didácticas puede realizarse de forma online, directamente desde el portal de datos.gob.es o, en su defecto, también es posible su descarga en el equipo del usuario e, incluso, su carga en una plataforma LMS.

¿Es necesario realizar todas las unidades didácticas?¿Es necesario realizar todas las unidades didácticas?

Cada unidad independiente en sí misma; permitiendo al alumno adquirir los conocimientos necesarios en una materia específica acorde a sus necesidades formativas. No obstante, aquellos alumnos que deseen poseer una visión más completa del sector RISP, tienen la oportunidad de realizar la serie completa de ocho unidades didácticas para conocer en profundidad los aspectos más relevantes de las iniciativas de datos abiertos.

¿Dónde están publicadas las unidades didácticas?¿Dónde están publicadas las unidades didácticas?

Las unidades didácticas están disponibles dentro de la sección web “Documentación” bajo la categoría “Materiales formativos” para su realización a través del portal online o para su descarga en el equipo del alumno.

Materiales formativos de la Iniciativa Aporta

 
calendar icon
Noticia

El ecosistema de datos abiertos no descansa en verano. Durante los meses estivales hemos asistidos tanto a la apertura de nuevos contenidos, como a la creación de interesantes proyectos de reutilización. A nivel estatal, nos encontramos con iniciativas pioneras relacionadas con áreas como la sostenibilidad y las smart cities, las humanidades y la cultura o los datos geográficos.

A continuación, recogemos algunos ejemplos de las propuestas que se han lanzado durante este verano relacionadas con los datos abiertos.

Lanzamiento de nuevos portales, repositorios y herramientas para promover el acceso a los datos abiertos

Los reutilizadores cada vez tienen más contenido a su alcance. Cada día son más las iniciativas que se animan a poner sus datos a disposición de los usuarios, así como los organismos que van un paso más allá y lanzan repositorios temáticos:

  • El Ayuntamiento de Terrassa estrenó en julio un nuevo portal de datos abiertos. El portal incluye un catálogo de datos con 133 datasets sobre demografía, transporte, urbanismo e infraestructuras, etc. Además incluye una sección de aplicaciones, con ejemplos de reutilización.
  • También la Generalitat Valenciana ha puesto en marcha un nuevo portal de datos abiertos, que permite consultar y descargar datos de diversa índole: educación, salud, infraestructuras… y cuenta con un espacio con información para reutilizadores.
  • El Ayuntamiento de San Sebastián ha abierto el portal GeoDonostia, en el que libera todos los datos geográficos y 300 gráficos -que se irán ampliando- para que ciudadanos y profesionales los puedan consultar.
  • En el ámbito económico, el Instituto de Estudios Económicos de la Provincia de Alicante, INECA, ha lanzado, gracias a los datos abiertos, la mayor base de datos económicos de la provincia.
  • En lo que respecta a las iniciativas referentes al sector de la alimentación, los grupos AGR127 y RNM322 de la Universidad de Córdoba que forman parte del Grupo Operativo ‘Cereal Agua’ investigan nuevas técnicas y tecnologías para conseguir un cultivo de cereal más sostenible. Todos los datos generados se compartirán próximamente a través de su plataforma.
  • En lo que respecta al arte y humanidades, el Museo Guggenheim de Bilbao, abrió sus puertas de manera online mediante muestras y recorridos digitales que permitían acceder a sus obras.

Donde más avances se están experimentando es en el campo de la sostenibilidad y la búsqueda de ciudades smart y eficientes. Un buen ejemplo es la ciudad de Onda, cuyo proyecto resultó ser el ganador de la XII Convocatoria de los Premios Aslan. El proyecto promueve la obtención de datos en tiempo real referentes a transporte público e incorpora un asistente virtual que resuelve las dudas vecinales.

La reutilización de datos en las administraciones públicas

Pero los organismos públicos no solo están abriendo su información, también están creando servicios para impulsar su reutilización:

  • El Ayuntamiento de Murcia ha presentado MUDATAlab, un laboratorio que promueve la producción y divulgación humanística y patrimonial relacionadas con el patrimonio de Murcia, basándose en el empleo de datos abiertos.
  • El verano ha sido la época escogida por varias iniciativas de datos para poner en marcha concursos encaminados a promover la creación de soluciones basadas en la reutilización de datos. La Junta de Castilla y León ha abierto el plazo para participar la cuarta edición de su concurso de datos, que este año incluye como novedad un premio destinado al periodismo de datos. El Gobierno de Euskadi ha aprobado una nueva convocatoria sus premios, cuya convocatoria se abrirá en septiembre, igual que la nueva edición del Reto Barcelona Dades Obertes.

Las administraciones públicas no solo publican datos, sino que también son reutilizadoras de servicios de información, como hemos visto en este reciente informe. Algunos ejemplos de estas reutilizaciones desarrollados durante los últimos meses son:

  • Andalucía ha sacado una aplicación a través de la cual se puede consultar información geolocalizada sobre los puntos de acceso libre a Internet.
  • Con el fin de mejorar la habitabilidad en la ciudad, el Ayuntamiento de Santiago de Compostela ha anunciado que introducirá un sistema de tráfico que señalará la disponibilidad de plazas en los parkings utilizando datos abiertos de su portal open data.
  • El Instituto Cartográfico y Geológico de Cataluña, ICGCat, ha publicado un visor de rutas en la provincia con datos extraídos del portal de datos abiertos de la Generalitat Catalana. En la misma comunidad, la Conselleria de Agricultura ha publicado un mapa de explotaciones agrícolas de Cataluña.

Propuestas internacionales que promueven el uso de datos abiertos

Pero las iniciativas que se basan en el uso de datos abiertos no solo se ciñen al ámbito estatal, sino que también hay propuestas interesantes en el ámbito internacional que pueden servir de inspiración:

Estas son algunas de los ejemplos más llamativos que se pueden encontrar en el mundo de los datos abiertos, pero hay muchos más. Si conoces alguna otra novedad interesante, puedes mencionarla en los comentarios o mandando un email al departamento de Dinamización: dinamizacion@datos.gob.es.

calendar icon