Entrevista

R Hispano es una comunidad de usuarios y desarrolladores que nació en 2011, en el seno de las III Jornadas de Usuarios de R, con el objetivo de fomentar el avance del conocimiento y el uso del lenguaje de programación en R. Desde datos.gob.es hemos hablado con Emilio López Cano, presidente de R Hispano, para que nos cuente más sobre las actividades que realizan y el papel de los datos abiertos en ellas. 

Entrevista completa

1. ¿Puede explicarnos de forma breve qué es la Comunidad R-Hispano? 

Se trata de una asociación creada en España cuyo objetivo es el de promover el uso de R entre un público hispano. Hay muchos usuarios de R a nivel mundial e intentamos servir como punto de encuentro entre todos aquellos cuyo idioma principal es el español. Al tener como referencia un grupo más pequeño dentro de una comunidad tan grande, es más fácil entablar relaciones y conocer a personas a las que acudir cuando se quiere aprender más o compartir lo aprendido. 

2. R nace como lenguaje ligado a la explotación estadística de los datos, sin embargo, se ha ido convirtiendo en una herramienta esencial de la Ciencia de Datos, ¿por qué tanta aceptación de este lenguaje por la comunidad? 

Es verdad que muchos profesionales de la ciencia e ingeniería de datos tienden a utilizar lenguajes más genéricos como Python. Sin embargo, hay varios motivos por los que R se hace imprescindible en el “Stack” de los equipos que trabajan con datos. En primer lugar, R tiene su origen en el lenguaje S, que se diseñó en los años 70 específicamente para el análisis de datos, en el seno de los laboratorios Bell. Esto permite que personas con diferente formación informática pueda participar en proyectos complejos, centrándose en los métodos de análisis. En segundo lugar, R ha envejecido muy bien, y una amplia comunidad de usuarios, desarrolladores y empresas contribuyen al proyecto con paquetes y herramientas que extienden la funcionalidad de forma rápida hacia los métodos más innovadores con (relativa) sencillez y todo el rigor.

3. R Hispano funciona a través de numerosas iniciativas locales, ¿qué ventajas conlleva esta forma de organización?  

En las actividades del día a día, sobre todo cuando teníamos encuentros presenciales, hace más de un año, es más cómodo coordinar a las personas de la manera más cercana posible. No tiene sentido que una persona en Madrid organice reuniones mensuales en Málaga, Sevilla o Canarias. Lo interesante de estos eventos es asistir regularmente, ir conociendo a los asistentes, entender lo que demanda el público y lo que se puede ofrecer. Eso, aparte de mimo y dedicación, requiere estar cerca porque, si no, no hay forma de establecer ese vínculo. Por eso nos ha parecido que es desde las propias ciudades como se tiene que mantener esa relación de día a día. Por otra parte, es la forma en la que la Comunidad de R se ha organizado en todo el mundo, con el éxito que todos conocemos. 

4. ¿Consideráis las iniciativas de datos abiertos una valiosa fuente de información para el desarrollo de vuestros proyectos? ¿Algún ejemplo de reutilización destacable? ¿Qué aspectos consideráis mejorables de las iniciativas actuales? 

Lo primero decir que R Hispano como tal no tiene proyectos. Sin embargo, muchos socios de R Hispano trabajan con datos abiertos en su ámbito profesional, ya sea académico o empresarial. Desde luego, es una fuente de información muy valiosa, con muchísimos ejemplos, como el análisis de los datos de la pandemia que todavía sufrimos, los datos de competiciones deportivas y rendimiento de deportistas, datos medioambientales, socioeconómicos, … No podemos destacar ninguno porque hay muchos muy interesantes que lo merecerían igualmente. En cuanto a las mejoras, todavía hay muchos repositorios de datos públicos que no los publican en formato “tratable” por los analistas. Un informe en PDF puede ser datos abiertos, pero desde luego no contribuyen a su difusión, análisis, y explotación por el bien de la sociedad. Todos los datos abiertos deberían estar tabulados en formatos que permitan la rápida importación a software, como por ejemplo R. 

5. ¿Puede contarnos algunas de las actividades que llevan a cabo esas Iniciativas locales? 

Varios grupos locales de R, tanto en España como Latam, colaboraron recientemente con la empresa de formación en tecnologías, UTad, en el evento Encuentros en la fase R. Celebrado en formato online con dos días de duración. Las jornadas de usuarios de R que celebramos cada año, normalmente las organiza alguno de los grupos locales de la sede. El grupo de Córdoba está organizando las próximas, aplazadas con motivo de la pandemia y de las que esperamos poder anunciar fechas pronto.  

El Grupo de Usuarios de R de Madrid comenzó a funcionar como grupo local vinculado a la Comunidad R hispano hace más de quince años. Desde su origen mantiene una periodicidad mensual de reuniones anunciadas en la red social Meetup (patrocinado por parte de RConsortium, entidad, fundada y subvencionada por grandes compañías para favorecer el uso de R). La actividad se ha visto interrumpida por las limitaciones del Covid-19, pero todo el historial de las presentaciones se ha ido recopilando en este portal. 

Desde el Grupo de R Canarias se han involucrado en la conferencia TabularConf, que tuvo lugar el 30 de enero, en formato online, con una agenda de una decena de ponencias sobre data science e inteligencia artificial. En el pasado el grupo canario realizó un encuentro de usuarios de R con comunicaciones sobre varios tópicos, incluidos modelización, tratamiento de datos geográficos, así como consultas a APIs de datos públicos, como datos.gob.es, con la librería opendataes. Otras librerías presentadas en un meetup que realizaron en 2020 son istacr o inebaseR, siempre apostando por el acceso a datos públicos. 

En el Grupo Local de Sevilla, durante los hackatones celebrados en los últimos años, ha comenzado a desarrollar varios paquetes totalmente vinculados a datos abiertos. 

  • Aire: Para obtener datos de calidad del aire en Andalucía (funciona, pero necesita algunos ajustes)  

  • Aemet: Paquete de R para interaccionar con la API de AEMET (datos climáticos). Dimos los primeros pasos en un hackaton, luego Manuel Pizarro hizo un paquete totalmente funcional.  

  • Andaclima: Paquete para obtener datos climáticos de estaciones agroclimáticas de la Junta de Andalucía 

  • Datos.gob.es.r: Embrión de paquete para interaccionar con http://datos.gob.es. Realmente solo una exploración de ideas, nada funcional por ahora.  

Sobre COVID-19 merece la pena destacar el desarrollo por parte de la UCLM, con la colaboración en un exmiembro de la Junta Directiva de la Comunidad R Hispano, de un panel de análisis de la COVID-19, con los casos que la Junta de Comunidades de Castilla-La Mancha presenta por municipio. Consiste en una herramienta interactiva para consultar la información sobre la incidencia y tasas por 100.000 habitantes. 

6. Además, también colaboran con otros grupos e iniciativas. 

Sí, colaboramos con otros grupos e iniciativas centradas en datos, como la UNED (Facultad de Ciencias), que durante un largo periodo de tiempo nos acogió como sede permanente. También destacaría nuestras actuaciones con: 

  • Grupo de Periodismo de Datos. Presentaciones conjuntas con el grupo de Periodismo de Datos, compartiendo las bondades de R para sus análisis. 

  • Una colaboración con el Grupo Machine Learning Spain que se tradujo en una presentación común en el Google Campus de Madrid. 

  • Con grupos de otros lenguajes de datos, como Python. 

  • Colaboraciones con empresas. En este punto destacamos el haber participado en dos eventos de Analítica Avanzada organizadas por Microsoft, así como el haber recibido pequeñas ayudas económicas de empresas como Kabel o Kernel Analytics (recientemente adquirida por Boston Consulting Group). 

Estos son algunos ejemplos de presentaciones en el grupo de Madrid basadas en datos abiertos 

Además, diferentes socios de R-Hispano, también colaboran con instituciones académicas, en las que imparten diferentes cursos relacionados al análisis de Datos, fomentando especialmente el uso y análisis de datos abiertos, como por ejemplo la Facultad de Economía de la UNED, la Facultades de Estadística y de Turismo y Comercio de la UCM, la Universidad de Castilla-La Mancha, la EOI (asignatura específica sobre datos abiertos), la Universidad Francisco de Vitoria, la Escuela Superior de Ingeniería de Telecomunicaciones, el ESIC y la escuela K-School. 

Por último, nos gustaría destacar el vínculo constante que se mantiene con diferentes entidades de relevancia del ecosistema R: con R-Consortium (https://www.r-consortium.org/) y RStudio (https://rstudio.com/). Es a través del R-Consortium donde hemos conseguido el reconocimiento del Grupo de Madrid como grupo estable y del que conseguimos el patrocinio para el pago de Meetup Dentro de RStudio mantenemos diferentes contactos que nos han permitido igualmente conseguir patrocinios que han ayudado en las Jornadas de R, así como ponentes de la talla de Javier Luraschi (autor del paquete y libro sobre “sparklyr”) o Max Kuhn ( autor de paquetes como “caret” y de su evolución “tidymodels”). 

7. A través de ROpenSpain algunos socios de RHispano han colaborado en la creación de paquetes en R que facilitan el uso de datos abiertos. 

ROpenSpain es una comunidad de entusiastas de R, de los datos abiertos y la reproducibilidad que se reúne y organiza para crear paquetes de R de la máxima calidad para la explotación de datos españoles de interés general. Nace, con la inspiración de ROpenSci, en febrero de 2018 como organización de GitHub y dispone de un canal de colaboración en Slack. A enero de 2021, ROpenSpain agrupa los siguientes paquetes de R: 

  • opendataes: Interactúa fácilmente con la API de datos.gob.es, que proporciona datos de las administraciones públicas de toda España. 

  • MicroDatosEs: Permite importar a R varios tipos de ficheros de microdatos del INE: EPA, Censo, etc. 

  • caRtociudad: Consulta la API de Cartociudad, que proporciona servicios de geolocalización, rutas, mapas, etc. 

  • Siane: Para representar información estadística sobre los mapas del Instituto Geográfico Nacional. 

  • airqualityES: Datos de calidad del aire en España de 2011 a 2018. 

  • mapSpain: Para cargar mapas de municipios, provincias y CCAA. Incluye un plugin para leaflet. 

  • MorbiditySpainR: Lee y manipula datos de la Encuesta de Morbilidad Hospitalaria 

  • Spanish: Para el procesamiento de cierto tipo de información española: números, geocodificación catastral, etc. 

  • BOE: Para el procesamiento del Boletín Oficial del Estado y del Boletín Oficial del Registro Mercantil. 

  • istacbaser: Para consultar la API del Instituto Canario de Estadística. 

  • CatastRo: Consulta la API del Catastro. 

Algunos de estos paquetes se han presentado en eventos organizados por la Comunidad R Hispano.

8. Para terminar, ¿cómo pueden las personas interesadas seguir a R-Hispano y colaborar con vosotros? 

Un elemento importante como nexo de unión en toda la comunidad de usuarios de R en español es la lista de ayuda R-Help-es: 

Es una de las pocas listas de ayuda sobre R, activas e independiente de la principal en inglés R-Help que ha generado más de 12.800 entradas en sus más de 12 años de historia. 

Además, se mantiene un gran nivel de actividad en las redes sociales que sirven como altavoz, palanca a través de las cuales se dan a conocer futuros eventos o diferentes noticias relacionadas con datos de interés para la comunidad.  Podemos destacar las siguientes iniciativas en cada una de las plataformas: 

  • Twitter: Presencia de la propia asociación R-Hispano; https://twitter.com/R_Hisp y participación en el hastag #rstatsES (R en Español) de diferentes colaboradores de R del ámbito nacional. 

  • LinkedIn: En esta red profesional, “R” tiene presencia a través de la página de empresa https://www.linkedin.com/company/comunidad-r-hispano/. Además, multitud de socios de R-Hispano tanto de España como de Latam forman parte de esta red compartiendo recursos en abierto. 

  • Canal de Telegram: Existe un canal de Telegram dónde se difunden con cierta periodicidad noticias de interés para la comunidad https://t.me/rhispano 

Por último, en la página web de la asociación, http://r-es.org, se puede encontrar información sobre la asociación, así como la forma de hacerse socio/a (la cuota es, como R, gratuita).

calendar icon
Noticia

El European Data Portal (EDP) ha presentado su informe Copernicus data for the open data community, elaborado por con.terra como parte del consorcio encargado del EDP. Como ya hemos contado en otras ocasiones, Copernicus es el programa de la Unión Europea de Observación de la Tierra que proporciona información precisa, oportuna y de fácil acceso para mejorar la gestión del medio ambiente, comprender y mitigar los efectos del cambio climático y garantizar la seguridad civil.

El informe pretende ayudar a los usuarios a aprovechar el potencial de los datos de Copernicus para crear aplicaciones de observación de la Tierra, dando respuesta a tres preguntas básicas:

  • ¿Qué puedo hacer con los datos de Copernicus?
  • ¿Cómo puedo acceder a los datos?
  • ¿Qué herramientas necesito para utilizar los datos?

Tras una introducción en las que se repasan las principales actividades y servicios disponibles del programa, el informe se divide en dos partes: una primera donde se examinan ejemplos de aplicaciones de datos de Copernicus y una segunda parte más práctica, donde se replica un caso de uso particular en profundidad.

Casos de uso de Copernicus

La primera parte abarca una serie de posibles casos de uso a nivel general para responder a la primera de las preguntas planteadas anteriormente: ¿qué se puede hacer con los datos de Copernicus?

Los casos de uso analizados se vinculan con las áreas temáticas que aborda el programa Copernicus (emergencias, seguridad, vigilancia marina, vigilancia terrestre, cambio climático y vigilancia atmosférica), así como con sus servicios y herramientas. Estos ejemplos abarcan la observación de la contaminación plástica de los océanos, el cambio de la tierra por las actividades mineras, el impacto de las actividades volcánicas, la pérdida de hielo, la creación de islas artificiales, la deforestación, los incendios forestales, las tormentas o las plagas.

Captura de la página web de Copernicus donde se muestran los servicios que aborda

El informe resalta la importancia de conocer qué datos son adecuados para cada caso de uso específico. Por ejemplo, los datos se SENTINEL 2 MSI son adecuados para los servicios de vigilancia terrestre, gestión de emergencias y seguridad, mientras que los de SENTINEL 3 Altimetry están ligados a las áreas de vigilancia marina y cambio climático. Para ayudar en esta tarea de identificación, la guía incluye referencias a distintas guías de usuario con especificaciones sobre las misiones, los instrumentos utilizados para recopilar los datos y los productos de datos generados.

Caso práctico de uso de los datos de Copernicus 

La segunda parte del informe se centra en un caso de uso particular que aborda en profundidad, incluyendo cómo descargar los datos apropiados, procesarlos y construir aplicaciones con ellos. En concreto, se aborda el mapeo del flujo de lava del volcán Etna utilizando datos del servicio de gestión de emergencias de Copernicus. El objetivo es realizar el seguimiento del impacto de las actividades volcánicas en la naturaleza y en las zonas urbanas.

En primer lugar, el informe muestra cómo buscar y descargar datos para esta área de interés.  En este caso, se usan los productos de Sentinel-2 desde el Copernicus Open Access Hub. El punto de entrada para acceder a los datos de Copernicus es su propia web,  que proporciona una visión general de los puntos de acceso a los datos. A través de distintas imágenes, el informe muestra las opciones de búsqueda y de filtro para localizar los datos adecuados.

Captura que muestra las posibilidades de búsqueda y descarga de escenas de sentinel-2 desde el Open Access Hub de Copernicus (url:scihub.copernicus.eu/dhus/)

Para visualizar y procesar los datos, se propone  utilizar software comerciales como ArcGIS Pro, herramientas SIG gratuitas como QGIS, herramientas de procesamiento de código abierto como SNAP o bibliotecas de programación como GDAL. En el caso del ejemplo, se utiliza SNAP (Sentinel Application Platform), la plataforma de la Agencia Espacial Europea (ESA, en sus siglas en inglés), para ver el flujo de lava.

Al final del capítulo se ofrecen algunas explicaciones sobre la automatización del flujo de trabajo con la API del Open Access Hub y la herramienta SNAPgraph.

Conclusiones finales

El informe finaliza con varias conclusiones, entre las que destacan:

  1. Los usuarios pueden extraer un gran valor de los datos de Copernicus pero para ello necesitan estar familiarizados con las plataformas implicadas y las herramientas necesarias.
  2. Para la mayoría de los casos de uso, es necesario combinar los datos de Copernicus con datos in situ. El propio programa Copernicus utiliza datos procedentes de sensores terrestres, por ejemplo, para la calibración y validación de sus productos.

El papel de España en Copernicus

El Ministerio de Transportes, Movilidad y Agenda Urbana, a través del Instituto Geográfico Nacional, y el Ministerio para la Transición Ecológica (MITECO) representan a España en el Foro de Usuarios de Copernicus, para el seguimiento y evolución del programa. En esta entrevista  Nuria Valcárcel, Subdirectora Adjunta (Observación del Territorio) de la Subdirección General de Geodesia y Cartografía, en la D.G. Instituto Geográfico Nacional (IGN) profundiza en los servicios de Copernicus y su utilidad en el ámbito económico y social.

En datos.gob.es también puedes encontrar esta otra entrevista a Stéphane Ourevitch, fundador de  SpaceTec, que participó como ponente en el Encuentro Aporta 2019, donde nos cuenta la utilidad de los datos para la observación del Espacio y cómo desde el programa Copernicus se impulsa en emprendimiento a través de acciones como hackathons.

Los datos de Copernicus son de gran utilidad en todo el mundo. En nuestro país, también encontramos múltiples servicios y aplicaciones desarrollados en base a los datos de Copernicus, algunos de los cuales están recogidos en este artículo.

calendar icon
Noticia

El Open Data Day fue la fecha elegida para el lanzamiento del EU Datathon 2021, un evento que ya va por su quinta edición. Organizado por la Oficina de Publicaciones de la Unión Europea en el marco de las primeras jornadas EU Open Data Days, busca poner de manifiesto el valor de los datos abiertos y mostrar las oportunidades de los modelos de negocio basados en ellos. Tienes más información sobre estas jornadas en esta nota de prensa.

Los equipos participantes deben crear una aplicación móvil o web que dé respuesta a retos relacionados con las prioridades de la Comisión Europea, utilizando conjuntos de datos abiertos.

3 retos a resolver

Los retos disponibles son: 

  • Reto 1: ‘A European Green Deal. El Pacto Verde Europeo (European Green Deal, en inglés) es el plan para impulsar una economía europea moderna, sostenible y competitiva. Aquellos que elijan este reto deberán desarrollar aplicaciones o servicios dirigidos a crear una Europa más verde, por ejemplo, impulsando el uso eficiente de los recursos o reduciendo la contaminación. 
  • Reto 2: ‘An economy that works for people’. En este caso se buscan aplicaciones o servicios dirigidos a empresas, administraciones públicas o ciudadanos en general con el fin de crear una unión económica y monetaria más justa, que permita el crecimiento de las economías de los países miembro junto con la reducción de la pobreza y la desigualdad. En esta categoría tendría cabida, por ejemplo, una solución para impulsar la creación de empleo juvenil. 
  • Reto 3: ‘A Europe fit for the digital age’. La UE aspira a una transformación digital que funcione para las personas y las empresas. Por ello, en este reto se impulsa la creación de aplicaciones o servicios que mejoren las competencias en materia de datos, aumenten la conectividad o hagan que los datos sean más comprensibles para todos, tomando como base la Estrategia Europea de Datos. 

Cada desafío se organiza como una competición independiente de igual importancia.

Las soluciones presentadas deben combinar al menos un conjunto de datos de data.europa.eu (EU Open Data Portal o European Data Portal) con cualquier otro conjunto de datos disponible públicamente.

¿Quién puede participar?

Está dirigido a ciudadanos de todo el mundo que estén interesado en crear prototipos de productos basados en datos abiertos públicos e incluso crear nuevos modelos de negocio con o sin ánimo de lucro a través de la exploración de dichos datos.

La participación está abierta a personas físicas o entidades jurídicas, integradas en equipos de entre uno y cuatro miembros.

No puede inscribirse el personal que trabaja en las instituciones, agencias, organismos, organizaciones asociadas o contratistas de la Oficina de Publicaciones de la UE.

¿Cómo se desarrolla la competición?

Los equipos participantes deben registrar su propuesta siguiendo este formulario antes del 21 de mayo de 2021 a las 23:59 CET (hora central europea). A partir de entonces la competición se desarrollará en 2 fase:

  1. Preselección

Todas las propuestas serán evaluadas por el jurado, compuesto por expertos de dentro y fuera de las instituciones y agencias de la UE en base a una serie de criterios como son la pertinencia del reto seleccionado o el potencial y creatividad de la solución propuesta.

Para cada desafío, se preseleccionará un máximo de tres equipos que hayan obtenido el mayor número de puntos. Todos los equipos participantes recibirán la notificación de los resultados antes del 11 de junio de 2021. 

  1. Fase final 

Se invitará a los equipos preseleccionados (tres por reto) a convertir sus propuestas en aplicaciones Además, cada equipo preseleccionado debe producir un video de 60 segundos, en el que presente su aplicación y el equipo que trabaja en ella, antes del 1 de agosto de 2021.

La final de la competición tendrá lugar el 25 de noviembre. Las aplicaciones presentadas en cada desafío serán evaluadas por un jurado compuesto por al menos cinco expertos. Además de la relevancia de la propuesta, se tendrán en cuenta los datos abiertos utilizados (potencial económico y social, interoperabilidad con otras fuentes de datos, etc.) y la adecuación al objetivo (madurez del producto, beneficios ofrecidos, etc.).

Calendario EU Datathon 2021

¿Cuál es el premio?

En total, se entregarán 99.000 euros (33.000 para cada reto), que se dividirán para cada reto de la siguiente manera:

  • Primer puesto: 18.000 euros
  • Segundo puesto: 10.000 euros 
  • Tercer puesto: 5.000 euros 

Desde datos.gob.es te invitamos a presentar tu propuesta. ¡Mucha suerte a todos los participantes!

calendar icon
Blog

Más de 2.500 millones de toneladas. Esa es la cantidad de residuos que según la Unión Europea se producen cada año en el territorio comunitario –aunque el dato en concreto es de 2016-, con el consiguiente peligro para el medio ambiente y nuestro propio futuro. Esta preocupante situación está llevando a las instituciones europeas a fomentar un cambio de modelo en la gestión de residuos.

Durante años, la gestión de residuos ha sido lineal, es decir, se extraen los recursos naturales, que se usan para producir un determinado bien, que se consume y posteriormente se desecha. Este sistema requiere de grandes cantidades de energía y materiales baratos y de fácil acceso. Parte de este modelo también son prácticas como la obsolescencia programada, muy habitual en el ámbito tecnológico, donde la empresa “programa" el fin de la vida útil del producto, de tal forma que pasado un determinado periodo de tiempo este deja de funcionar.

Este modelo lineal no es viable a largo plazo y por ello cada vez más voces piden cambiarlo por una gestión basada en la economía circular.

¿Qué es la economía circular?

Cuando hablamos de economía circular nos referimos a un sistema económico que reemplaza el concepto de 'fin de vida útil' por el de “Reducir, reutilizar, reciclar y recuperar materiales en los procesos de producción, distribución y consumo”. Es decir, en vez de desechar los productos estos vuelven a entrar en el ciclo de producción, lo cual contribuye a crear calidad ambiental, prosperidad económica y equidad social, en beneficio de las generaciones actuales y futuras.

Gracias a estas acciones, podemos alargar el ciclo de vida de los productos al máximo y reducir los residuos al mínimo. Cuando un producto deja de funcionar, sus materiales todavía se pueden aprovechar para crear otros productos nuevos y mantenerse dentro de la economía siempre que sea posible.

Esta práctica conlleva numerosas ventajas, desde la reducción de las emisiones de gases de efecto invernadero hasta el ahorro económico para las empresas y los consumidores, que pueden disponer de productos más duraderos.

¿Cómo contribuyen los datos abiertos a fomentar la economía circular?

Al igual que en otros campos, la información que se obtiene a través de los datos abiertos puede ayudar a impulsar una mejor toma de decisiones sobre el uso eficiente de los recursos. Los datos pueden contribuir al entrenamiento de algoritmos para predecir ciertas tendencias y ayudar a ciudadanos, administraciones y empresas a implementar las medidas necesarias para garantizar un futuro sostenible.

En su artículo ‘Open Data and the Circular Economy’, el European Data Portal detalla 3 áreas donde los datos abiertos tienen un gran impacto en la economía circular:

  • Un sistema de generación de alimentos más sostenible. Los datos abiertos pueden contribuir a resolver problemas logísticos, mejorar la eficiencia y garantizar la seguridad alimentaria. Los datos sobre la producción y la distribución, los cambios de temperatura que sufren los productos, el aumento del nivel del agua o el mapeo de la deforestación pueden mejorar la toma de decisiones estratégicas para regular la oferta y la demanda en toda Europa, evitando consumir recursos de más. En este sentido, destaca la investigación basada en datos abiertos de Smartchain, cuyo objetivo es desarrollar una cadena de suministro de alimentos más corta y sostenible. 
  • Gestión de recursos eficiente y optimización de residuos. El proceso de recogida selectiva y el uso de la capacidad total de las plantas de reciclaje se puede mejorar si contamos con la información apropiada. En este sentido, el Ayuntamiento de Santiago ha puesto en marcha un sistema inteligente de recogida de residuos sólidos urbanos utilizando tecnología IoT y algoritmos de aprendizaje automático enriquecidos con datos abiertos. En este ámbito la concienciación ciudadana también es fundamental a través de apps como EcoCity, que monitoriza la gestión de residuos en las ciudades y establece una serie de objetivos para mejorar los hábitos de reciclaje urbano y reducir la generación de residuos. Los usuarios pueden escoger el contenedor de reciclaje que desean monitorizar en su barrio. Si detectan alguna incidencia con los contenedores registrados, pueden enviar un aviso directamente al ayuntamiento de la localidad.
  • Reducción de la contaminación. Los datos abiertos sobre la contaminación del aire o de nuestros mares ayudan a concienciar sobre la polución y sus riesgos para la salud. Este tipo de información puede mejorar el proceso de toma de decisiones para proteger la salud de los ciudadanos de la UE y el medio ambiente a través de medidas preventivas, como la paralización de la expansión del Aeropuerto de Heathrow, en Londres. Aplicaciones y visualizaciones como el Índice Nacional del Aire, Aire.cat o el explorador de ecosistemas de agua dulce muestran indicadores que permiten tomar conciencia de la realidad de nuestro entorno.

Así avanza la economía circular en Europa

La Comisión Europea presentó el pasado mes de marzo de 2020, en el marco del Pacto Verde Europeo, un nuevo Plan de acción para la Economía Circular que incluye propuestas sobre el diseño de productos más sostenibles, la reducción de residuos y el empoderamiento de los ciudadanos (como el “derecho a reparar").

Además, con el fin de aplicar de manera eficaz y eficiente el nuevo marco de productos sostenibles, la Comisión persigue realizar diversas acciones en materia de datos como:

  • Establecer un espacio común europeo de datos relativos al Pacto Verde, para aplicaciones inteligentes con datos sobre las cadenas de valor e información de los productos.
  • Proporcionar datos armonizados sobre las concentraciones de microplásticos en el agua de mar.
  • Cooperar con la industria para desarrollar sistemas armonizados de seguimiento y gestión de la información sobre sustancias peligrosas, en sinergia con las medidas del marco de la política de productos sostenibles y la European Chemicals Agency (ECHA).
  • Impulsar la publicación de datos medioambientales por parte de las empresas a través de la revisión de la directiva sobre información no financiera.
  • Apoyar una iniciativa empresarial para desarrollar principios de contabilidad ambiental que complementen los datos financieros con datos de desempeño de la economía circular.
  • Además, Horizon Europe apoyará el desarrollo de indicadores y datos, materiales y productos innovadores que ayuden a impulsar la economía circular.

Acciones de datos incluidas en el Plan de Acción de la Economía Circular

En nuestro país, el impulso de la economía circular viene marcado por la Estrategia Española de Economía Circular 2030 (EEEC), entre cuyos objetivos para 2030 se encuentran reducir la generación de residuos en un 15% con respecto a 2010, mejorar un 10% la eficiencia en el uso del agua o reducir la emisión de gases de efecto invernadero por debajo de los 10 millones de toneladas de CO2 equivalente.

Vivimos en un contexto marcado por el aumento de la demanda de materias primas y escasez de recursos. Muchas de las materias primas son finitas y, al igual que la población mundial aumenta, también lo hace la demanda. Por ello, la economía circular se presenta como un elemento capital para el óptimo desarrollo del futuro de toda la población. Dentro de todas las iniciativas que ya se están llevando a cabo, los datos pueden jugar un papel fundamental a la hora de aumentar nuestro conocimiento e impulsar tecnologías que nos ayuden a todos los ciudadanos a avanzar hacia un futuro sostenible.


Contenido elaborado por el equipo de datos.gob.es.

calendar icon
Noticia

El ecosistema de datos abiertos ha estado muy activo durante los últimos meses. El año 2020 ha finalizado ofreciéndonos dos novedades importantes. La primera, el Open Data Maturity Report publicado por el European Data Portal, donde España ha aumentado su posición global en un 5% y se mantiene entre los líderes del sector europeo.  La segunda, la nueva Estrategia Nacional de la Inteligencia Artificial, que incluye una serie de medidas relacionadas con los datos abiertos.

Pero son muchas más las novedades que se han producido estos meses. Es este artículo te contamos algunos ejemplos, tanto a nivel nacional como local y regional.

Iniciativas estatales relacionadas con los datos abiertos

Además de la publicación de la Estrategia de Inteligencia Artificial, en las últimas semanas también se ha presentado el Plan de Digitalización de las Administraciones Públicas 2021-2025, que movilizará una inversión pública de, al menos, 2.600 millones de euros para los próximos tres años. Entre sus puntos, el plan destaca “la importancia de evolucionar el modelo de acceso a la información pública y privada para impulsar servicios de alto valor añadido”. Para ello tomará como base el trabajo desarrollado en materia de datos abiertos por la Iniciativa Aporta.

Además de estas acciones estratégicas, cabe destacar que algunos organismos estatales han aprovechado la época invernal para lanzar nuevos proyectos ligados a los datos abiertos:

  • El Ministerio de Transportes, Movilidad y Agenda Urbana ha publicado su estudio de movilidad con Big Data que caracteriza la movilidad a nivel nacional, de comunidad autónoma, provincial y local durante la pandemia de COVID-19. Los datos generados en el estudio han sido puestos a disposición de los ciudadanos en formato de datos abiertos y han servido para elaborar una serie de indicadores.

Iniciativas Locales de datos abiertos

Durante estos últimos meses, diversos ayuntamientos e instituciones han llevado a cabo iniciativas relacionadas con los datos abiertos, como por ejemplo:

  • El portal de datos abiertos del Gobierno de Aragón estrenó un nuevo servicio de chatbot que facilita a los ciudadanos el acceso a la información disponible en Aragón Open Data. Gracias a ello, los aragoneses pueden estar mejor informados y hacer uso de los datos de manera más accesible.
  • La Comunidad de Murcia crea 'Educación en Gobierno Abierto' un nuevo programa educativo para acercar a los estudiantes conceptos como la rendición de cuentas o participación ciudadana.
  • El Ayuntamiento de Santiago de Compostela ha desarrollado y construido nuevos recolectores inteligentes de superficie para la caracterización de los residuos sólidos orgánicos, a través del uso de tecnologías IoT y algoritmos entrenados con datos abiertos. Esta acción le permite avanzar en su camino hacia convertirse en una smart city.
  • El Gobierno de Canarias estrenó su nuevo portal de datos abiertos, que cuenta con más de 7.500 datos. Gracias a ello, este portal ha logrado convertirse en el punto de acceso único con más datos de información pública registrados en toda España.
  • La Comunidad de Madrid ha anunciado una nueva estrategia de datos abiertos para promover y reforzar la transparencia de la administración y favorecer un desarrollo económico basado en el conocimiento, la información y los datos.
  • El Ayuntamiento de Ronda lanza “Geoportal Ronda” una nueva herramienta de  datos abiertos espaciales a través de la cual ya se puede consultar toda la información geográfica y urbanística del término municipal.
  • El Ayuntamiento de Málaga ha recibido un reconocimiento en los Premios IDC gracias a un proyecto municipal que pone en valor los datos abiertos y sus usos para mejorar la calidad de vida de la ciudadanía. En concreto, el Consistorio ha quedado tercero en la categoría de 'Desarrollo económico y compromiso ciudadano'.
  • En dichos premios también ha sido galardonado el Ayuntamiento de Vigo en la categoría 'Planificación y administración' gracias la plataforma Smart City VCI+, que centraliza y estructura los datos de la ciudad para crear un cuadro de mando que permite una gestión local más eficaz. La plataforma incluye un portal de datos abiertos para que los ciudadanos puedan consultar datos de carácter municipal en diferentes formatos y utilizarlos así en ámbitos profesionales y particulares.

Novedades internacionales

Acabamos el repaso incluyendo algunos ejemplos de proyectos internacionales ligados con la materia:

  • La Unión Europea está impulsando el proyecto EO4AGRI, que busca utilizar datos de observación terrestre del programa Copernicus para digitalizar el sector agrícola y adaptar la PAC a los nuevos tiempos.
  • La Comisión Europea ha lanzado una consulta pública para recopilar opiniones sobre las iniciativas de interoperabilidad del sector público en la UE. La información recopilada se incorporará a la evaluación del Marco Europeo de Interoperabilidad (EIF). La fecha límite para participar es el 27 de abril.
  • Una expedición internacional ha creado un conjunto de datos que recopila información sobre las dinámicas físicas y biológicas del Ártico para ayudar a entender mejor el cambio climático. De momento estos datos se utilizarán de forma exclusiva hasta el 1 de enero de 2023, cuando se publicarán en abierto.
  • China  ha presentado una plataforma pública de datos que permite comprobar los niveles de emisiones en tiempo real ver que fábricas e instituciones contaminan más.
  • El Ministerio de Turismo y Deportes de Argentina ha lanzado un portal de datos abiertos utilizando Andino, una plataforma sobre CKAN.

Estos han sido tan solo algunos ejemplos que se pueden encontrar en el mundo de los datos abiertos, pero hay muchos más. Si conoces alguna otra novedad interesante que sea de interés, puedes hacer una mención en los comentarios o enviarnos un correo a la dirección dinamizacion@datos.gob.es.

calendar icon
Noticia

El pasado mes de octubre, desde la Iniciativa Aporta, junto con la Secretaría de Estado de Digitalización e Inteligencia Artificial y Red.es, se lanzó la tercera edición del Desafío Aporta. Bajo el lema “El valor del dato en la educación digital” se buscaba premiar ideas y prototipos que fueran capaces de identificar nuevas oportunidades de captar, analizar y utilizar la inteligencia de los datos en el desarrollo de soluciones en el ámbito educativo.

Dentro de las propuestas presentadas en la Fase I, se pueden encontrar candidaturas de diversa índole. Han participado desde particulares, hasta equipos del ámbito académico universitario, instituciones educativas y empresas privadas, que han ideado plataformas web, aplicaciones móviles y soluciones interactivas con la analítica de datos y las técnicas de machine learning como protagonistas.

Un jurado de reconocido prestigio ha sido el encargado de evaluar las propuestas presentadas en base a una serie de criterios públicos. Las 10 soluciones seleccionadas como finalistas son:

Finalistas desafío Aporta

 

EducaWood

  • Equipo: Jimena Andrade, Guillermo Vega, Miguel Bote, Juan Ignacio Asensio, Irene Ruano, Felipe Bravo y Cristóbal Ordóñez.

¿En qué consiste?

EducaWood es un portal web socio-semántico que permite explorar la información forestal de una zona del territorio español y enriquecerla con anotaciones de árboles. El profesorado puede proponer actividades de aprendizaje medioambiental contextualizadas a su entorno. Los estudiantes realizan dichas actividades en visitas al campo mediante anotaciones de árboles (localización e identificación de especies, medidas, microhábitats, fotos, etc.) a través de sus dispositivos móviles. Además, EducaWood permite realizar visitas virtuales al campo y realizar actividades remotas con la información forestal disponible y con las anotaciones generadas por la comunidad, posibilitando así su uso por colectivos vulnerables y en escenarios Covid.

EducaWood utiliza fuentes como el Mapa Forestal Español, el Inventario Forestal Nacional o GeoNames,  las cuales han sido integradas y republicadas como datos abiertos enlazados. Las anotaciones que se generan con las actividades de los estudiantes se publicarán también como datos abiertos enlazados, contribuyendo así al beneficio comunitario.

Educación en Datos. Innovación y Derechos Humanos.

  • Equipo: María Concepción Catalán, Asociación Innovación y Derechos Humanos (ihr.world).

¿En qué consiste?

Esta propuesta plantea un portal web de educación en datos para estudiantes y docentes centrado en los Objetivos de Desarrollo Sostenible (ODS). Su principal objetivo es proponer a sus usuarios diferentes retos a resolver mediante el uso de datos, como por ejemplo ‘¿A qué se dedicaban las mujeres en España en 1920?’ o ‘¿Cuánta energía se necesita para mantener una granja de 200 cerdos?’.

Esta iniciativa utiliza datos de diversas fuentes como la ONU, el Banco Mundial,  Our World in Data, la Unión Europea y cada uno de sus países. En el caso de España utiliza datos de datos.gob.es y el INE, entre otros.

UniversiDATA-Lab

  • Equipo: Universidad Rey Juan Carlos, Universidad Complutense de Madrid, Universidad Autónoma de Madrid, Universidad Carlos III de Madrid y DIMETRICAL The Analytics Lab S.L.

¿En qué consiste?

UniversiDATA-Lab es un portal público y abierto cuya función es alojar un catálogo de análisis avanzados y automáticos de los conjuntos de datos publicados en el portal UniversiDATA, y que es fruto del trabajo colaborativo de las universidades. Surge como evolución natural de la sección "laboratorio" actual de UniversiDATA, abriendo el alcance de los análisis potenciales a todos los datasets/universidades presentes y futuros, con el fin de mejorar los aspectos analizados y estimular que las universidades sean laboratorios de ciudadanía, aportando un valor diferencial a la sociedad.

Todos los conjuntos de datos que las universidades están publicando o van a publicar en UniversiDATA son potencialmente utilizables para llevar a cabo análisis en profundidad, siempre considerando el respeto a la protección de datos personales. Las fuentes concretas de los análisis se publicarán en GitHub para favorecer la colaboración de otros usuarios para aportar mejoras.

LocalizARTE

  • Equipo: Pablo García, Adolfo Ruiz, Miguel Luis Bote, Guillermo Vega, Sergio Serrano, Eduardo Gómez, Yannis Dimitriadis, Alejandra Martínez y Juan Ignacio Asensio.

¿En qué consiste?

Esta aplicación web persigue el aprendizaje de historia del arte a través de diferentes entornos educativos. Permite al alumnado visualizar y realizar tareas geoetiquetadas sobre un mapa. El profesorado puede proponer nuevas tareas, que son agregadas al repositorio público, además de seleccionar las tareas que puedan resultar más interesantes para su alumnado y visualizar las que realicen. Por otro lado, en el futuro se desarrollará una versión móvil de LocalizARTE en la que para realizar las tareas será necesario que el usuario se encuentre próximo al lugar donde estén geoetiquetadas.

Los datos abiertos que se utilizan en la primera versión de LocalizARTE provienen de la relación de monumentos históricos de Castilla y León, DBpedia, Wikidata, Casual Learn SPARQL y OpenStreetMap.

Estudio Datos PISA y datos.gob.es

  • Equipo: Antonio Benito, Iván Robles y Beatriz Martínez.

¿En qué consiste?

Este proyecto se basa en la creación de un cuadro de mando que permite ver la información del informe PISA, realizado por la OCDE, u otras evaluaciones educativas junto con datos proporcionados por datos.gob.es de ámbito socioeconómico, demográfico, educativo o científico. El objetivo es detectar qué aspectos favorecen el incremento del rendimiento académico utilizando un modelo de machine learning, de tal forma que se pueda llevar a cabo una toma de decisiones eficaz. La idea es que los propios centros de estudio puedan adaptar sus prácticas y currículos educativos hacia las necesidades de aprendizaje del alumnado para garantizar un mayor éxito.

Esta aplicación utiliza diversos datos abiertos del INE, del Ministerio de Educación y Formación Profesional o de PISA España.

Big Data en Educación Secundaria… y lo secundario en Educación

  • Equipo: Carmen Navarro, Colegio Nazaret Oporto.

¿En qué consiste?

Esta propuesta persigue dos objetivos: por un lado, mejorar la formación del alumnado de secundaria en competencias digitales, como el control de sus perfiles digitales en internet o el uso de datos abiertos para sus trabajos y proyectos. Por otro, la utilización de los datos generados por el alumnado en una plataforma e-learning del centro tipo Moodle para determinar patrones y métricas que permitan personalizar el aprendizaje. Todo ello alineado con los ODS y la Agenda 20-30.

Para su desarrollo se utilizan datos de la OMS y del datatón “Big Data en la lucha contra la obesidad”, donde diversos alumnos y alumnas propusieron medidas para mitigar la obesidad mundial en base al estudio de datos públicos.

DataLAB: el laboratorio de datos en la Educación

  • Equipo: iteNlearning, Ernesto Ferrández Bru.

¿En qué consiste?

Los datos obtenidos con técnicas de Inteligencia Artificial empiristas como big data o machine learning ofrecen correlaciones, no causas. iteNleanring basa su tecnología en modelos científicos con evidencia, además de en datos (procedentes de fuentes como el INE o el Instituto Vasco de Estadística - Eustat). Estos datos son curados con el fin de asistir a los docentes en la toma de decisiones, una vez que DataLAB identifica las necesidades específicas de cada estudiante.

DataLAB Matemáticas es un instrumento educativo profesional que, partiendo de modelos neuropsicológicos y cognitivos, mide el nivel de neurodesarrollo de los procesos cognitivos específicos desarrollados por cada estudiante. Con ello genera un cuadro de mando educativo que, a partir de datos, nos informa de las necesidades específicas de cada persona (alta capacidad, discalculia...) con el objetivo de que puedan ser potenciadas y/o reforzadas, permitiendo una educación basada en evidencias.

El valor del podcast en la educación digital

  • Equipo: Adrián Pradilla Pórtoles y Débora Núñez Morales.

¿En qué consiste?

2020 ha sido el año en que los podcasts han despegado como nuevo formato digital para el consumo de diferentes ámbitos de información. Esta idea busca aprovechar el auge de esta herramienta para utilizarla en el ámbito educativo y que el alumnado pueda aprender de una forma más amena y diferente.

La propuesta recoge los temarios oficiales de educación secundaria o universitaria, así como de oposiciones, que se pueden obtener de fuentes de datos abiertas y webs oficiales. A través de tecnologías de procesamiento del lenguaje natural, esos temarios se asocian con audios ya existentes del profesorado sobre historia, inglés, filosofía, etc. en plataformas como iVoox o Spotify, dando como resultado un listado de podcast por curso y materia.

Entre las fuentes de datos utilizadas para esta propuesta se incluyen la Oferta Pública de Empleo de Castilla La Mancha o las competencias educativas en diferentes etapas.

Proyecto MIPs

  • Equipo: Aday Melián Carrillo, Daydream Software.

¿En qué consiste?

Un MIP (Marked Information Picture) es un nuevo soporte interactivo de información, que consiste en una serie de capas interactivas sobre imágenes estáticas que facilitan la retención de información y la identificación de elementos.

Este proyecto consiste en un servicio para la creación de MIPs de forma rápida y sencilla, dibujando manualmente regiones de interés sobre cualquier imagen importada a través de la web. Los MIPs creados serán accesible desde cualquier dispositivo y tienen múltiples aplicaciones como recurso docente, personal y profesional.

Además de la creación manual, los autores han implementado en Python un conversor de datos GeoJSON a MIP de forma automática. Como primer paso, han desarrollado un MIP de provincias españolas a partir de esta base de datos pública.

FRISCHLUFT

  • Equipo: Harut Alepoglian y Benito Cuezva, Asociación Cultural Colegio Alemán, Zaragoza.

¿En qué consiste?

El proyecto Frischluft (Aire Fresco) es una solución hardware y software para la medición de parámetros ambientales en el colegio. Con ello se pretende mejorar el confort térmico de las aulas y aumentar la protección del alumnado a través de una ventilación inteligente, a la vez que se consolida un proyecto tractor que impulse la transformación digital del colegio.

Esta propuesta utiliza fuentes de datos del Ayuntamiento de Zaragoza sobre niveles de CO2 en el entorno urbano de la ciudad y repositorios de datos internacionales para la medición de emisiones globales, que se comparan a través de técnicas estadísticas y modelos de machine learning.

Próximos pasos

Todas estas ideas han sido capaces de plasmar cómo utilizar de manera óptima la inteligencia de los datos para desarrollar soluciones reales en el sector de la educación. Ahora, los finalistas cuentan con 3 meses para desarrollar un prototipo. Los tres prototipos que obtengan la mejor valoración del jurado, según los criterios de evaluación establecidos, serán premiados con 4.000, 3.000 y 2.000 euros respectivamente.

¡Mucha suerte a todos los participantes!

calendar icon
Documentación

Para poder extraer todo el valor de los datos, es necesario clasificarlos, filtrarlos y cruzarlos mediante procesos de analítica que nos ayuden a sacar conclusiones, convirtiendo los datos en información y conocimiento. Tradicionalmente la analítica de datos se divide en 3 categorías:

  • Analítica descriptiva, que nos ayuda a entender la situación actual, qué ha pasado para llegar hasta ella y por qué se ha producido.

  • Analítica predictiva, cuyo objetivo es anticipar hechos relevantes. Es decir, nos cuenta qué va a pasar para que un ser humano pueda tomar una decisión.

  • Analítica prescriptiva, donde se proporciona información sobre las decisiones más acertadas en base a una serie de escenarios futuros.  Es decir, nos indica qué hacer.

El tercer informe de la serie Awareness, Inspire, Action se centra en el segundo estadio, el de la Analítica predictiva. Para ello sigue la misma metodología que los dos informes anteriores, dedicados a la Inteligencia Artificial y el Procesamiento del Lenguaje Natural.

La analítica predictiva nos permite responder preguntas de negocio como ¿sufriremos una rotura de stock? ¿Bajará la cotización de una determinada acción? O ¿Nos visitarán más turistas el próximo puente? En base a esta información las empresas pueden definir su estrategia de negocio, y los organismos públicos elaborar políticas que respondan a las necesidades de los ciudadanos.

Tras una breve introducción que contextualiza la materia a tratar y explica la metodología, el informe, elaborado por Alejandro Alija, se desarrolla de la siguiente manera:

  • Awareness. En la sección Awareness se explican los conceptos clave, destacando los tres atributos de la analítica predictiva: el énfasis en la predicción, la relevancia para el negocio de los conocimientos resultantes y su tendencia a la democratización para extender su uso más allá de los usuarios especialistas y científicos de datos. En este apartado también se mencionan los modelos matemáticos de los que hace uso y se detallan algunos de sus hitos más importantes a lo largo de la historia, como el protocolo de Kyoto o su utilidad para detectar la fuga de clientes. 

  • Inspire. La sección Inspire analiza algunos de los casos de uso de la analítica predictiva con más relevancia en la actualidad en tres sectores muy diferentes. Empieza con el sector industrial, donde se explica cómo funciona el mantenimiento predictivo y la detección de anomalías. Continua con ejemplos relativos a la predicción de precios y demanda, en la cadena de distribución de un supermercado y en el sector energía. Y finaliza con el sector salud y el diagnóstico aumentado de imagen médica.

  • Action: En la sección Action se desarrolla de forma práctica un caso de uso concreto, utilizando para ello datos y herramientas tecnológicas reales. En este caso el conjunto de datos seleccionado es accidentes de tráfico en la ciudad de Madrid, publicado por el Ayuntamiento de Madrid. A través de la metodología recogida en la siguiente figura, se explica de manera sencilla cómo utilizar técnicas de análisis de series temporales para modelar y predecir el número de accidentes en los meses futuros.

El informe finaliza con la sección Última parada, donde se recopilan cursos, libros y artículos de interés para aquellos usuarios que quieran seguir avanzando en la materia.

En este vídeo, su autor te cuanta más sobre el informe y la analítica predictiva.

A continuación, puedes descargarte el informe completo en pdf y word (versión reutilizable), así como acceder al código utilizado en el ejemplo de Action en este enlace.

calendar icon
Documentación

La pandemia originada el pasado año ha supuesto un cambio significativo en la forma que teníamos de ver el mundo y relacionarnos con este. En lo que al sector educativo se refiere, alumnos y docentes de todos los niveles se han visto obligados a tener que cambiar la metodología de enseñanza y aprendizaje presencial por un sistema telemático.

En este contexto, desde el marco de la Iniciativa Aporta se ha desarrollado el estudio “Tecnología educativa basada en datos para mejorar el aprendizaje en el aula y en el hogar”, realizado por José Luis Marín. Este informe ofrece diversas claves para reflexionar acerca de los nuevos retos y desafíos que plantea esta situación y que se pueden convertir en oportunidades si conseguimos introducir cambios que fomenten la mejora del proceso de enseñanza-aprendizaje más allá de solamente sustituir las clases presenciales por formación en línea.

La importancia de los datos para mejorar el sector educativo

A través de una tecnología educativa innovadora basada en datos e inteligencia artificial se pueden abordar algunos de los desafíos a los que se enfrenta el sistema educativo. Para este informe se han seleccionado 4 de estos retos:

  • Supervisión no presencial de pruebas de evaluación: monitorización y vigilancia de pruebas evaluativas a través de recursos telemáticos.
  • Identificación de problemas de comportamiento o atención: alerta a los docentes sobre actividades y conductas que indiquen problemas de atención, motivación o comportamiento.
  • Programas formativos personalizados y más atractivos: adaptación de las rutas y el ritmo de aprendizaje de los alumnos.
  • Mejora del rendimiento en exámenes estandarizados: uso de plataformas de aprendizaje en línea para mejorar resultados en pruebas estandarizadas, para reforzar el dominio de un tema en particular y para conseguir una evaluación más justa e igualitaria.

Para abordar cada uno de estos cuatro retos, se propone una sencilla estructura dividida en tres apartados:

  1. Descripción del problema, que nos permite poner el desafío en contexto.
  2. Análisis de algunos de los enfoques basados en el uso de datos e inteligencia artificial que se utilizan para ofrecer una solución tecnológica al reto en cuestión.
  3. Ejemplos de soluciones o experiencias relevantes o altamente innovadoras.

El informe también destaca la enorme complejidad que entraña este tipo de cuestiones, por lo que deben abordarse con cautela para evitar consecuencias negativas sobre los individuos, como pueden ser problemas de ciberseguridad, invasión de la privacidad o riesgo de exclusión de algunos colectivos, entre otros. Para ello, el documento finaliza con una serie de conclusiones que convergen en la idea de que el mejor camino para generar mejores resultados para todos los estudiantes, aliviando desigualdades, es combinar excelentes docentes y excelente tecnología que aumente sus capacidades. En este proceso los datos abiertos pueden jugar un papel aún más relevante para mejorar el estado del arte en tecnología educativa y asegurar un acceso más generalizado a determinadas innovaciones que en gran medida están basadas en tecnologías de aprendizaje automático o inteligencia artificial.

En este vídeo, su autor nos cuenta más sobre el informe:

 

calendar icon
Noticia

El año 2020 se ha cerrado con el anuncio de los proyectos ganadores de dos concursos que buscaban impulsar la reutilización de datos abiertos en dos Comunidades Autónomas: Castilla y León y Euskadi. 

Proyectos ganadores del IV Concurso de datos abiertos de la Junta de Castilla y León

Al igual que otros años, la última edición del concurso de datos abiertos de la Junta de Castilla y León tuvo como objetivo el apoyo y reconocimiento a proyectos que suministrasen cualquier tipo de idea, estudio, servicio, sitio web o aplicaciones para dispositivos móviles, sirviéndose para ello de los conjuntos de datos del Portal de Datos Abiertos de la Junta de Castilla y León. 

En total, han sido ocho los proyectos vencedores divididos en diferentes categorías que quedan de la siguiente manera:

Categoría ideas

Esta categoría esta dirigida a aquellos participantes que cuentan con una gran idea a pesar de no tener la capacidad técnica, el tiempo y los recursos necesarios para ejecutarla. 

  • El primer premio fue otorgado a Cristina Pérez Fernández y César González Palomo. Su proyecto Castilla y León en remoto presenta un buscador de “la población ideal” para aquellos profesionales que trabajan en remoto y desean trasladarse a un lugar que les ayude a satisfacer sus deseos de cambio de estilo de vida. Basándose en las preferencias personales de cada usuario, el buscador ofrece las posibilidades que mejor se adaptan a sus necesidades y deseos. Para ello, explota datos como la de disponibilidad de cobertura 4G y/o fibra óptica, número de habitantes de la “población ideal”, distancia a lugares de interés, actividad cultural, entorno natural o precio medio del alquiler/compra por metro cuadrado. 
  • El segundo premio recayó en manos de Juan Carlos Solís Méndez por su proyecto CyL Movilidad. Han llevado a la práctica su idea a través de una primera versión de una web que reúne toda la información recopilada sobre los establecimientos de la comunidad autónoma que se encuentran adaptados a personas de movilidad reducida. Se trata, sin duda, de una idea con un claro valor social ya que favorece la mejora de la calidad de vida de un colectivo vulnerable. 

Categoría productos y servicios 

En esta categoría se buscaban proyectos que proporcionasen estudios, servicios, sitios web o aplicaciones para dispositivos móviles, que utilizasen conjuntos de datos del Portal de Datos Abiertos de la Junta de Castilla y León y que estuvieran accesibles para toda la ciudadanía vía web mediante una URL. 

  • El primer premio fue para el proyecto Escovid19data, una recopilación colaborativa de visualizaciones y datos reutilizables de COVID-19 por provincias en España. Este proyecto ayuda a mejorar los datos e informaciones publicadas por la Administración y fomenta que la ciudadanía tome mayor conciencia del grave problema al que nos enfrentamos. 
  • El segundo premio fue a parar al proyecto Castilla y León Gurú, un asistente basado en un bot conversacional en Telegram que ofrece a los usuarios información turística, cultural y de ocio de la comunidad. 
  • El premio estudiantes recayó en TurisCyL, una app para móviles Android que sirve como guía de viaje de la comunidad autónoma al ofrecer toda la información posible sobre lugares turísticos (restauración, alojamientos, etc.), así como de museos o eventos culturales. 

Categoría Recurso Didáctico 

Dentro de esta sección, se fomenta la creación de recursos didácticos abiertos innovadores (con licencias Creative Commons), que sirvan de apoyo a la enseñanza. 

  • El premio de esta categoría recayó en el proyecto Casual Learn, una aplicación para dispositivos móviles Android que permite aprender historia del arte a partir de los edificios y espacios públicos de Castilla y León. La app sugiere tareas de aprendizaje teniendo en cuenta los intereses y la localización del usuario. Por ejemplo, si el usuario pasa cerca de una iglesia gótica, Casual Learn puede sugerirle tomar una foto a su frontispicio y compararlo con el de una iglesia románica cercana. 

Categoría Periodismo de Datos 

Esta categoría premia piezas periodísticas relevantes publicadas o actualizadas en cualquier soporte, ya sea escrito o audiovisual. 

Ganadores de los Concursos de Ideas y Aplicaciones Open Data Euskadi 2020

Otros de los desafíos que se resolvieron al cierre del año, fueron los concursos de Ideas y de Aplicaciones de Datos Abiertos de Euskadi, con el objetivo de dar a conocer y fomentar la reutilización de datos abiertos en la región, organizados por el Gobierno Vasco junto con las Diputaciones Forales de Álava, Bizkaia y Gipuzkoa y los ayuntamientos de Bilbao, Donostia-San Sebastián y Vitoria-Gasteiz. 

Proyectos ganadores del Concurso de Ideas Open Data Euskadi 2020 

El Concurso de Ideas está dirigido tanto a particulares como a empresas que deseen presentar ideas para crear productos o servicios derivados de datos abiertos de los principales catálogos de datos públicos de Euskadi. La tercera edición admitió 30 candidaturas, de las que fueron premiadas dos: 

  • El primer premio de esta categoría recayó en el proyecto Servicio de Pronóstico de Polen Estacional de Euskadi, de Ortzi Torices Roldán y Hodei Goncalves Barkaiztegi. Se trata de una propuesta de creación de una red neuronal para pronosticar niveles de polen en Euskadi y ofrecer un servicio público para las personas que padecen alergias y afecciones respiratorias. 
  • Por su parte, el segundo premio fue para el proyecto Ongi etorri Euskal Herrira, de Iker Díez Arancibia y Alberto Nieto de Pablos. En él, se propone una aplicación basada en la generación de planes que aglomeren las tipologías de actividades deseadas por cada turista en un espacio geográfico acotado. Ofrece al turista una representación gráfica de los diferentes planes que solicita y permite la reserva conjunta de las actividades que componen el plan. 

Proyectos ganadores del Concurso de Aplicaciones Open Data Euskadi 2020 

Por su parte, el Concurso de Aplicaciones está dirigido tanto a particulares como a empresas que hayan creado o deseen crear productos o servicios derivados de datos abiertos de los principales catálogos de datos públicos de Euskadi. De las 28 candidaturas admitidas, han sido premiadas las siguientes:

  • El primer premio ha sido para Smart Public Tender, de Manuel José García Rodríguez, una plataforma web que incluye las últimas innovaciones en el campo de la contratación pública y que ayuda tanto a las administraciones públicas como a las empresas licitadoras en su toma de decisiones utilizando la metodología de Machine Learning.
  • El segundo premio se otorgó a AvatarParking, de Unai Antero Urruticoechea y Beatriz Arenal Redondo. Es una aplicación que está pensada como asistente para aparcamientos en San Sebastián. Accediendo a la ubicación del usuario en tiempo real, indica el parking más cercano, número de plazas libres de las que dispone, posibles incidencias en el trayecto, así como una estimación del coste de dejar el coche ahí aparcado. La aplicación está pensada para llevar de forma activa en el móvil, y recibir información y comandos mediante voz, por lo que evita distracciones con el móvil durante la conducción.

¡Enhorabuena a todos los premiados!

calendar icon
Blog

Los datos abiertos son un recurso cada vez más utilizado para la formación de estudiantes de diferentes etapas del sistema educativo y para la formación continua de profesionales de todos los sectores. Y es que ya existen pocas dudas acerca de la creciente importancia que están adquiriendo todas las habilidades relacionadas con el análisis de datos y su tratamiento en relación con casi cualquier disciplina del conocimiento. Del mismo modo las habilidades relacionadas con la visualización y la construcción de relatos sobre la base de las conclusiones extraídas de cualquier análisis o modelado de datos son cada vez más necesarias para complementar y extender las siempre necesarias habilidades para comunicar y presentar resultados de cualquier tipo de trabajo.

En todo el proceso de formación de profesionales relacionados con la ciencia de datos y la inteligencia artificial, los datos abiertos constituyen un valioso recurso para adquirir experiencia práctica con las técnicas y herramientas habituales en la profesión. Sin embargo, también comienzan a apreciarse los efectos que tiene el uso de datos, habitualmente abiertos, sobre el aprendizaje de otras materias, en la adquisición de otro tipo de habilidades e incluso en la motivación de los estudiantes hacia el aprendizaje.

Ya en 2013 en una investigación que realizó una comparación cuantitativa detallada de diferentes enfoques educativos adoptados por 39 escuelas en Nueva York se demostró que el uso de datos para guiar el programa educativo era una de las cinco políticas principales que tenía efecto sobre la mejora del desempeño académico.

Aunque el uso de datos abiertos en el aula no se ha estudiado de forma amplia, por el momento las pocas investigaciones realizadas sugieren de entrada que existe una falta de conocimiento de los datos abiertos entre los educadores. Si bien no tenemos un conocimiento consolidado sobre el efecto del uso de los datos abiertos en contextos educativos ya que no son actualmente un recurso educativo generalizado, si parece existir un conjunto de educadores ‘early adopters‘ que hacen un uso sustancial de datos abiertos en sus programas de enseñanza.

La investigación “The use of open data as a material for learning” del Institute of Educational Technology se basa en el análisis cualitativo de la experiencia de un conjunto de estos educadores pioneros para extraer una serie de conclusiones sobre el valor que aporta el uso de datos abiertos en la enseñanza.

Uno de los puntos de partida es que los datos abiertos no parecen ofrecer metodologías educativas o pedagógicas completamente nuevas, sino que su uso complementa conceptos de enseñanza y aprendizaje existentes como el aprendizaje basado en investigación o en proyectos o la personalización del aprendizaje. Destacan dos conclusiones al respecto:

  1. Los conjuntos de datos abiertos que se utilizan como parte de los proyectos de aprendizaje en cualquier materia normalmente son relevantes para el alumno, bien porque describen cuestiones de su entorno geográfico o social, o bien porque tienen relaciones con cuestiones relativas a la actualidad o a sus propias aficiones. La investigación pone de manifiesto que el mero uso de estos conjuntos de datos que despiertan la curiosidad del estudiante durante el aprendizaje de cualquier concepto tiene efectos positivos sobre la motivación de los estudiantes para profundizar en la materia y apreciar su utilidad.

  2. El uso de conjuntos de datos abiertos ofrece la posibilidad de proponer actividades más avanzadas sin aumentar la dificultad del programa formativo. En la investigación se citan ejemplos que van desde el uso de datos abiertos para apoyar la formación en estadística de alumnos de bachillerato hasta el uso de bases de datos científicas abiertas en el área de la genómica para apoyar la enseñanza de conceptos de bioinformática. De este modo los alumnos pueden adquirir conocimientos y habilidades más avanzados que de otro modo probablemente sólo se habrían producido en el ámbito de la actividad profesional o que habrían sido descartadas por no disponer de tiempo suficiente en el programa. Este efecto, sobre todo en los niveles educativos superiores, además contribuiría a cerrar la brecha entre el sistema educativo y la práctica profesional.

Aunque aún no se ha estudiado su efecto, los concursos de datos abiertos son otro vehículo para canalizar la formación práctica de los estudiantes y para crear nuevos recursos educativos. Cada vez es más frecuente que desde universidades o escuelas de enseñanza secundaria se incentive como actividad dentro de algunas asignaturas la formación de equipos que participen en concursos de datos abiertos regionales o nacionales. Algunos concursos, como el concurso de datos abiertos de Castilla y León, incluso tienen una categoría especial con su correspondiente premio que está reservado para la participación de estudiantes.

En la misma línea, el Ayuntamiento de Barcelona lleva cuatro años organizando el Reto Barcelona Dades Obertes, que tiene como finalidad acercar los beneficios de los datos abiertos y promover su uso en los centros educativos de la ciudad. El reto mezcla la competición entre escuelas, que tienen que desarrollar un proyecto basado en datos, con un Plan de Formación específico sobre datos abiertos para el profesorado, para que puedan orientar a sus alumnos.

El hecho que no haya un uso más generalizado de conjuntos de datos abiertos en los programas educativos se puede atribuir a factores como la falta de formación del profesorado o a la dificultad para adaptar los datos existentes. La mayoría de los conjuntos de datos abiertos proceden de entornos profesionales como la investigación científica o la administración de los servicios públicos y es posible que los alumnos y los educadores no tengan la alfabetización o los recursos necesarios para aprovecharlos a pesar de que están surgiendo herramientas que simplifican algunas de las complejidades de trabajar con datos abiertos. En este sentido, una mayor relación y trabajo conjunto entre los educadores y los alumnos y los productores de conjuntos de datos también podría fomentar el despliegue de un mayor número de programas de aprendizaje.

Por ello son interesantes iniciativas como UDIT (Use Open Research Data In Teaching) iniciada en 2017 con el objetivo de fomentar y ayudar a los profesores de educación superior a incorporar datos de investigación abiertos y otros conceptos de la ciencia abierta a su docencia para mejorar el proceso de aprendizaje.

En la Carta Internacional de Datos Abiertos ya se reconoce la importancia de involucrase “con escuelas e instituciones de educación superior para respaldar una mayor investigación de datos abiertos y para incorporar la alfabetización de los datos en los programas educativos”. Y es que el valor de los datos abiertos en el proceso de aprendizaje no está aún lo suficientemente estudiado. Sirva como ejemplo que en el discurso habitual de la comunidad de datos abiertos se destaca siempre el potencial valor económico y social de la reutilización, pero no tanto el potencial de su uso en educación.


Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon