Blog

¿Cuántas veces has tenido entre tus manos un conjunto de datos que necesitabas analizar, pero te has encontrado con errores, inconsistencias o problemas de formato que te han hecho perder horas de trabajo? La realidad es que, aunque cada día tenemos más datos disponibles, no siempre contamos con las herramientas o conocimientos necesarios para trabajar con ellos de manera eficiente.

Para abordar este proceso existen varias opciones. Una de ellas es Open Data Editor, una herramienta gratuita y de código abierto que Open Knowledge Foundation (OKFN) ha diseñado pensando en democratizar el acceso y la explotación de los datos.

Características principales y funcionalidades

Tal y como indican desde OKFN, esta aplicación está diseñada para personas que trabajan con datos tabulares (Excel, Google Sheets, CSV) y que no saben programar o no tienen acceso a herramientas técnicas especializadas. Su enfoque sin código la convierte en una alternativa accesible que se centra específicamente en la limpieza y validación de datos tabulares.

La herramienta implementa un proceso conocido como "validación de datos", que consiste en encontrar errores en conjuntos de datos y corregirlos de manera eficiente. Además, verifica que las hojas de cálculo o conjuntos de datos contengan toda la información necesaria para que otras personas puedan utilizarlos. Por lo tanto, también tiene en cuenta la interoperabilidad, un valor muy relevante en lo que respecta a la reutilización de datasets.

Más allá de garantizar la reutilización, Open Data Editor también vela por la privacidad y seguridad gracias a su arquitectura local, es decir, los datos permanecen en el dispositivo del usuario.

Proyectos piloto: impacto global y resultados tangibles

A pesar de que se trata de una herramienta muy intuitiva, la organización pone a disposición del usuario un curso online y gratuito para aprender a sacarle el máximo partido. Actualmente el curso está en inglés, pero la traducción al español estará disponible próximamente.

Además del curso principal, la Open Knowledge Foundation ha implementado un programa de “formación de formadores” que capacita a personas para que puedan impartir el curso localmente en diferentes regiones del mundo. En el marco de este programa de formación se están ejecutando proyectos piloto aplicados a diferentes sectores y comunidades. Estos proyectos piloto se han enfocado especialmente en incentivar el acceso a formación básica en herramientas de análisis de datos de calidad, algo que, OKFN considera que no debe estar limitado por barreras económicas o tecnológicas.

Los casos de uso documentados muestran aplicaciones diversas que van desde organizaciones de derechos humanos hasta instituciones gubernamentales locales, todas aprovechando las capacidades de validación y limpieza de datos que ofrece la herramienta. El enfoque educativo de Open Data Editor va más allá del simple uso de la herramienta: se trata de formar en open data y promover el conocimiento abierto y accesible.

Próximos pasos: integración de inteligencia artificial

Los resultados de esta primera fase han sido tan prometedores que la Open Knowledge Foundation ha decidido avanzar hacia una segunda etapa, esta vez incorporando tecnologías de inteligencia artificial para ampliar aún más las capacidades de la herramienta. La nueva versión, que ofrece asistencia de IA enfocada en validación y características que generen confianza, acaba de ser anunciada y lanzada.

La filosofía detrás de esta integración de IA es mantener el carácter educativo de la herramienta. En lugar de crear una "caja negra" que simplemente proporcione resultados, la nueva funcionalidad explicará cada paso que realiza la inteligencia artificial, permitiendo que los usuarios comprendan no solo qué se está haciendo con sus datos, sino también por qué se están tomando ciertas decisiones.

Esta aproximación transparente a la IA es especialmente importante en el contexto de datos abiertos y gubernamentales, tal y como explicamos en este episodio del pódcast de datos.gob.es. Los usuarios de Open Data Editor podrán ver cómo la IA identifica problemas potenciales, sugiere correcciones y valida la calidad de los datos, convirtiéndose en una herramienta de aprendizaje además de una utilidad práctica.

Impacto en el ecosistema open data

Esta nueva funcionalidad se sumará al propósito por ofrecer una herramienta sostenible y abierta. Es precisamente este compromiso con el código abierto lo que hace que Open Data Editor pueda ser adaptada y mejorada por la comunidad global de desarrolladores. Para ello, utilizan como base tecnológica el Framework Frictionless, que asegura que los estándares utilizados sean abiertos y ampliamente adoptados en el ecosistema de datos abiertos.

No hay duda de que la herramienta está especialmente alineada con los principios de datos abiertos gubernamentales, proporcionando a las Administraciones públicas una manera de mejorar la calidad de sus publicaciones de datos sin requerir inversiones significativas en infraestructura técnica o capacitación especializada. Para periodistas de datos y organizaciones de la sociedad civil, Open Data Editor ofrece la capacidad de trabajar con conjuntos de datos complejos de manera más eficiente, permitiendo que se concentren en el análisis y la interpretación en lugar de en la limpieza técnica de los datos.

En definitiva, más que una herramienta técnica, Open Data Editor simboliza un cambio paradigmático hacia la democratización del análisis de datos. Porque su impacto se extiende más allá de sus funcionalidades inmediatas, contribuyendo a un ecosistema más amplio de datos abiertos y accesibles.

calendar icon
Entrevista

Fundadora del proyecto Open Science Training Initiative, Sophie Kay se doctoró en Biología de Sistemas por la Universidad de Oxford. Como reconocimiento a su trabajo, ha recibido varios galardones entre los que se encuentra el OxTalent Award al mejor esquema educativo abierto o el Oxford Teaching Award 2013. Además, Sophie Kay ha sido finalista de los premios UK S-Lab 2014.

  1. OSTI ha recibido el galardón a la “Mejor Iniciativa de Open Science”, entregado por la entidad OKFN España. ¿En qué consiste Open Science Training Initiative?

 

Open Science Training Initiative (OSTI) es un sistema educativo diseñado específicamente para jóvenes investigadores. El objetivo de esta iniciativa es fomentar la apertura en el ámbito científico al proporcionar en abierto códigos fuente, datos y publicaciones a aquellos estudiantes que realizan un doctorado. OSTI se adapta a un amplio abanico de áreas académicas y puede aplicarse a diferentes disciplinas científicas.

A menudo los educadores se encuentran ante un problema: tienen que proporcionar material de estudio al mismo tiempo que inculcan habilidades de open science. OSTI brinda una solución al respecto: ofrece dichos materiales a través de un programa educativo que forma en técnicas digitales, gestión de datos y prácticas abiertas.

¿Qué ofrece OSTI?

- Conocimiento para que los jóvenes aprendan a publicar en abierto los resultados de sus investigaciones. A través de pequeñas lecciones, se enseñan los conceptos básicos y las técnicas necesarias; aunque la mayor parte de los cursos de OSTI se realizan de forma práctica.

- Formación para que los jóvenes comiencen su doctorado con el conocimiento y confianza necesaria para realizar una investigación colaborativa, abierta y de calidad.

- Ayuda para que los investigadores publiquen en abierto de forma correcta y coherente sus resultados: datos, informes, gráficos…

El esquema educativo está basado en un sistema de rotación. Los investigadores se dividen en diferentes grupos, no estando permitida la comunicación entre ellos. En la Fase 1 (etapa de iniciación), cada grupo selecciona un tema para su análisis. Al final de esta fase, se desarrolla un informe, un código y un plan de gestión de datos, bajo las correspondientes licencias, donde se exponen los resultados obtenidos. Un grupo de expertos acompaña y ayuda a los estudiantes en esta fase al mismo tiempo que se organizan tutorías para resolver las dudas de los investigadores.

En la segunda fase (etapa de sucesión), se pone a prueba los resultados de la primera fase. Se rotan los grupos para que trabajen en un problema nuevo, recibiendo los estudios de sus compañeros (código, informe y plan de datos). Los grupos no pueden comunicarse entre sí y deben comprobar el análisis del resto antes de examinar el suyo propio. De esta manera, los investigadores tienen la oportunidad de analizar el trabajo de sus compañeros y conocer de primera mano los desafíos y obstáculos de cualquier investigación.

Este sistema rotatorio permite a los estudiantes abordar sus investigaciones desde el punto de vista del productor y del usuario. En el programa piloto realizado en el año 2013, este esquema educativo aumentó la motivación de los investigadores y mejoró la calidad de sus trabajos en comparación con las investigaciones de años anteriores que siguieron un programa educativo tradicional.

Para más información:

 

OTSI ofrece dichos materiales a través de un programa educativo que forma en técnicas digitales, gestión de datos y prácticas abiertas

 

 

2. ¿Qué obstáculos –legales, tecnológicos o económicos- habéis encontrado a la hora de poner en marcha el proyecto?

 

La apertura en sí misma no es un concepto novedoso; existen muchos ejemplos de código abierto y, en los últimos años, hemos sido testigos de una mayor sensibilización y apoyo al open science. No obstante, cuando comencé este proyecto, el término todavía no estaba muy extendido en el ámbito académico. En algunos casos, tuve que explicar primero en qué consistía esta disciplina antes de convencer a los docentes de sus beneficios. Hoy en día, resulta una tarea más sencilla: los educadores ya se han posicionado a favor de la ciencia abierta y los jóvenes investigadores ya saben qué es y quieren aplicarla. Por fin, las cosas se mueven en la dirección correcta.

Al igual que con cualquier otro proyecto, el mayor escollo ha sido encontrar financiación. En mi caso, todo dio un giro en 2012 cuando comencé a colaborar con la Open Knowledge Foundation. Gracias a ello, pude acceder a los contactos y a la ayuda económica necesaria para desarrollar la iniciativa OSTI.

 

3. Los materiales de OSTI se publican bajo la licencia Commons Attribution Licence, que permite la reutilización de los datos. ¿Cómo contribuye OSTI al trabajo de investigación?  

 

Dada la complejidad de los problemas que acechan a la ciencia moderna, es de vital importancia poder cotejar los resultados de las investigaciones científicas. A este respecto, el open data puede ser de gran ayuda en materia de replicabilidad (cuando se aplica la misma técnica experimental o computacional para obtener ciertos resultados) o reproducibilidad (los resultados se obtienen a través de diferentes métodos). El open data, los códigos abiertos y las publicaciones permiten que cualquier usuario tenga acceso a los resultados de una investigación, pudiendo comprobar la veracidad de la información de forma fácil y rápida. De esta manera, se construiría una base sólida para futuras investigaciones. De hecho, esto ha sido una de las motivaciones para el desarrollo del sistema rotatorio del OTSI, el cual permite a los estudiantes abordar sus investigaciones desde el punto de vista del productor y del usuario.

Los datos procedentes de la literatura experimental juegan un papel muy importante dentro de la investigación interdisciplinar. Los investigadores matemáticos y computacionales que trabajan en áreas como la biología de sistemas requieren de buenos datos con los que calibrar sus modelos. Poder acceder a los resultados de los experimentos en formato abierto ayudaría a los investigadores a reutilizar en el futuro dicha información. En esos casos, un plan coherente (datos abiertos, código abierto y publicación en abierto) que incluya de forma detallada los protocolos usados para generar los datos es imprescindible para determinar el origen e idoneidad de la información antes de su reutilización.

 

El open data, los códigos abiertos y las publicaciones permiten que cualquier usuario tenga acceso a los resultados de una investigación, pudiendo comprobar la veracidad de la información de forma fácil y rápida.

calendar icon
Evento

En el primer cuatrimestre de 2015, la comunidad open data global tiene la oportunidad de disfrutar de dos eventos a escala internacional los cuales promueven el acceso abierto a la información pública para su transformación en soluciones prácticas para la ciudadanía.

El primero de ellos se celebrará el próximo 21 de febrero, con motivo del Día Mundial de los Datos Abiertos. Organizado por la OKFN España, el Hackatón Internacional de Datos Abiertos tendrá lugar en la misma fecha y espacio que  el acto de entrega del II Premio al Conocimiento Abierto, Open Data y Transparencia organizado también por la misma entidad.

El encuentro estará abierto a reutilizadores open data de toda índole –ciudadanos, desarrolladores, periodistas, diseñadores,…- para que desarrollen aplicaciones, herramientas y visualizaciones de datos abiertos; demostrando así el potencial que encierran este recurso para el avance socioeconómico global.

El acceso al evento será libre y gratuito, poniendo a disposición de la comunidad open data internacional diferentes canales para que puedan compartir sus ideas con el resto de participantes. Gracias al streaming de vídeo, hangouts, chats y wiki cualquier miembro en el mundo tendrá la oportunidad de seguir el evento y los diferentes proyectos que se presenten durante la cita.

Asimismo, el próximo 4 de marzo tendrá lugar en Quito (Ecuador) el IEEE Hack Ecuador Challenge 2015, hackathon organizado IEEE STC e-Government e IEEE Computer Society a través de IEEE Ecuador.

El objetivo de este encuentro será el desarrollo de una visualización o aplicación que, reutilizando datos abiertos, optimice los portales electrónicos del gobierno de Ecuador, mejorando y promoviendo los servicios digitales en el sector público del país.

El plazo de inscripción se abrirá el 20 de febrero para todos aquellos interesados que, en grupos compuestos por al menos dos personas, deseen participar en este concurso de datos abiertos.

Tras la celebración del hackathon el 4 de marzo, los participantes tendrán hasta el día 18 del mismo mes para enviar la demo funcional de las aplicaciones desarrolladas durante el encuentro. Un jurado de expertos seleccionará a los finalistas y se anunciarán los ganadores el 8 de abril para, una jornada más tarde, hacer la entrega de premios en la capital ecuatoriana. 

A través de sendos hackathons, la comunidad internacional de datos abiertos pretende fomentar la apertura de la información e involucrar a organizaciones cívicas y entidades privadas en la cultura open data para que contribuyan en la generación de soluciones innovadoras a partir de datos abiertos. 

calendar icon
Evento

 

La institución independiente OKFN Spain ha abierto la convocatoria para el II Premio al Conocimiento Abierto, Open Data y Transparencia que, por segundo año consecutivo.

 

 

El garlardón distingue a las iniciativas presentadas que más destaquen en las seis categorías que forman el  galardón:

  •    Mejor iniciativa de fomento del emprendimiento desde el conocimiento abierto.
  •    Mejor negocio basado en conocimiento abierto.
  •    Mejor iniciativa no pública de transparencia.
  •    Mejor iniciativa de open science.
  •    Mejor iniciativa pública de impulso de la transparencia a través del open data.
  •    Mejor iniciativa pública de open data con implicación de la ciudadanía.

El plazo para la presentación de las candidaturas está abierto hasta el próximo viernes 30 de enero; fecha tras la cual, el jurado, formado por los socios de la organización, seleccionará entre todos los participantes a tres candidatos para cada una de las categorías. El nombre del ganador final se hará público en el acto de entrega que tendrá lugar el 21 de febrero en el recinto Media Lab Prado de Madrid. Además, durante el evento se contará con la asistencia de un amplio grupo de expertos en datos y conocimiento abierto así como la presencia online de Rufus Pollock, presidente global de la Open Knowledge Foundation.

Todos los interesados en participar deben enviar su candidatura a través de la página web de OKFN Spain, cumpliendo con los requisitos que exige cada una de las categorías. Asimismo, ya es posible conocer la lista de candidatos presentados hasta la fecha, entre los que se encuentra el organismo Aragón Open Data perteneciente al sector público o la entidad independiente Open Kratio.

calendar icon