Graddus proporciona una plataforma basada en IA que ayuda a los estudiantes a responder a la pregunta: “¿Qué estudiar después de secundaria?”
El próximo 2 de marzo, tendrá lugar la presentación del proyecto ‘Datos abiertos y mujeres’, impulsado por el Observatorio Valenciano de Datos Abiertos y Transparencia, fruto de la colaboración entre la Conselleria de Participació, Transparencia, Cooperación y Calidad Democrática de la Generalitat y la Universidad Politécnica de València.
El evento que ha sido organizado por la profesora de la Universidad de Sevilla, Lorena R. Romero-Domínguez y la técnica audiovisual de la Universidad Politécnica de Valencia, Lucía García Robledo, con el apoyo de Antonia Ferrer Sapena, directora del Observatorio, y Eloína Coll Aliaga, directora de la Càtedra de Governança de la Ciutat de València, se llevará a cabo en el Salón de actos de Rectorado en la Universitat Politècnica de València.
Desde un inicio, el objetivo de este proyecto ha sido poner el foco en el rol que distintas mujeres del sector profesional desempeñan en el contexto de los datos y, en especial, de los datos abiertos. Así, mediante una serie de entrevistas, las profesionales seleccionadas comparten el transcurso de su trayectoria, explican cómo han crecido profesionalmente en el mundo de los datos y, también, cómo han abordado algunos de los proyectos más significativos de sus carreras a este respecto.
Las entrevistas, que fueron grabadas meses atrás, están disponibles para su visionado desde el canal de Youtube del Observatorio, donde podemos ver cómo cada una de las profesionales interpeladas reflexiona sobre los retos más importantes que afronta el sector, prestando especial atención a la inclusión de la perspectiva de género en los datos.
Presentación del proyecto y mesa redonda con algunas de las protagonistas
En la sesión de presentación del próximo 2 de marzo, se contará con Andrés Gomis, Director General de Transparencia, Atención a la Ciudadanía y Buen Gobierno de la Conselleria de Participación, Transparencia, Cooperación y Calidad Democrática de la Generalitat Valenciana y Elisa Valía, Tenienta Alcalde Participación, Derechos e Innovación de la Democracia. Concejala de Transparéncia y Gobierno Abierto del Ajuntament de València.
Además, también tendrá lugar una mesa de redonda sobre los datos con perspectiva de género que estará moderada por Carmen Montalbá, profesora de la Universitat de València, y en la que participarán las siguientes profesionales cuyas entrevistas forman parte del proyecto:
- Lorena R. Romero, profesora de la Universidad de Sevilla y autora del proyecto.
- Ana Tudela, Cofundadora de Datadista y miembro de la Oxford Climate Journalism Network.
- Silvia Rueda, Directora Territorial en la Conselleria de Innovación, Universidades, Ciencia y Sociedad Digital.
Junto a las ponentes anteriores que estarán presentes en la mesa redonda, el proyecto ‘Datos abiertos y mujeres’ recoge también las entrevistas de Lourdes Muñoz Santamaría, Fundadora y Directora de la Iniciativa Barcelona Open Data; Laura Castro, Diseñadora de visualización de datos en Affective Advisory; Zynnia del Villar, Directora de Investigación de Ciencias de Datos en Data-Pop Alliance; Thais Ruiz de Alda, Fundadora y CEO de Digital Fems. Tech Advisor&Consultant Digital Business; Sonia Castro-García Muñoz, Coordinadora de datos.gob.es (Red.es); Ana Tudela, Cofundadora de Datadista y Eva Méndez Rodríguez, Profesora Titular y Vicerrectora Adjunta de Política Científica de la Universidad Carlos III.
En definitiva, ‘Datos abiertos y mujeres’ es un proyecto que surge de la necesidad de incentivar un debate sobre la incorporación de la perspectiva de género a los datos, una práctica prioritaria para establecer políticas públicas que sean eficientes para combatir las desigualdades que se plantean entre hombres y mujeres.
Precisamente por esta razón, en las entrevistas, se ofrece una gran diversidad de visiones sobre el papel de los datos en los distintos campos profesionales, entre los que destacan, el periodismo de datos, el ámbito científico-tecnológico, el administrativo o las organizaciones internacionales, entre otros.
Por último, las personas interesadas en asistir presencialmente a la presentación del proyecto deberán inscribirse previamente en este formulario y, una vez confirmada su asistencia, acudir al Salón de actos de Rectorado UPV, en el edificio 3ª.
Hablar estos días de GPT-3 no es lo más original del mundo, lo sabemos. Toda la comunidad tecnológica está publicando ejemplos, realizando eventos y pronosticando el final del mundo del lenguaje y la generación de contenidos tal y cómo la conocemos actualmente. En este post, le pedimos a ChatGPT que nos eche una mano para programar un ejemplo de visualización de datos con R partiendo de un conjunto de datos abiertos disponible en datos.gob.es.
Introducción
Nuestro anterior post hablaba sobre Dall-e y la capacidad de GPT-3 para generar imágenes sintéticas partiendo de una descripción de lo que pretendemos generar en lenguaje natural. En este nuevo post, hemos realizado un ejercicio completamente práctico en el que le pedimos a la inteligencia artificial que nos ayude a realizar un sencillo programa en R que cargue un conjunto de datos abierto y genere algunas representaciones gráficas.
Hemos escogido un conjunto de datos abiertos de la plataforma datos.gob.es. En concreto, un conjunto de datos sencillos de uso de portales madrid.es. La descripción del repositorio explica que se incluye la información relativa a usuarios, sesiones y número de visitas a páginas de los siguientes portales del Ayuntamiento de Madrid: Portal Web municipal, Sede Electrónica, Portal de Transparencia, Portal de Datos Abiertos, Bibliotecas y Decide Madrid.
El fichero se puede descargar en formato .csv o .xslx y si lo pre-visualizamos tiene el siguiente aspecto:

Vale, comencemos a co-programar con ChatGPT!
Primero accedemos a la web y nos identificamos con nuestro usuario y contraseña. Es necesario estar registrado en el sitio web de openai.com para poder acceder a las capacidades de GPT-3, entre otras ChatGPT.
Iniciamos nuestra conversación:

Durante este ejercicio hemos intentado mantener una conversación de la misma forma que la tendríamos con un compañero de programación. Así que lo primero que hacemos es saludar y enunciar el problema que tenemos. Cuándo le pedimos a la IA que nos ayude a crear un pequeño programa en R que represente gráficamente unos datos, nos ofrece algunos ejemplos y ayuda con la explicación del programa:

Puesto que no tenemos datos, no podemos hacer nada práctico por el momento, así que le pedimos si nos ayuda a generar unos datos sintéticos.

Como decimos, nos comportamos con la IA como lo haríamos con una persona (tiene buena pinta).

Una vez que parece que la IA responde con facilidad a nuestras preguntas, vamos con el siguiente paso, vamos a darle nosotros los datos. Y aquí empieza la magia… Hemos abierto el fichero de datos que nos hemos bajado de datos.gob.es y hemos copiado y pegado una muestra.
| Nota: ChatGPT no tiene conexión a Internet y por lo tanto no puede acceder a datos externos, así que lo único que podemos hacer es darle un ejemplo de los datos reales con los que queremos trabajar. |


Con los datos copiados y pegados tal cual se los hemos dado, nos escribe el código en R para cargarlos manualmente en un dataframe denominado “datos”. A continuación, nos proporciona el código de ggplot2 (la librería gráfica más conocida en R) para graficar los datos junto con una explicación del funcionamiento del código.

¡Genial! Es espectacular este resultado con un lenguaje totalmente natural y nada adaptado para hablar con una máquina. Veamos que pasa a continuación:

Pero resulta que al copiar y pegar el código en un entorno de RStudio comprobamos que este falla.

Así que le decimos lo que pasa y que nos ayude a solucionarlo.

Probamos de nuevo y ¡en este caso funciona!

Sin embargo, el resultado es un poco tosco. Así que se lo decimos.

A partir de aquí (y tras varios intentos de copiar y pegar más y más filas de datos) la IA cambia ligeramente el enfoque y me proporciona instrucciones y código para cargar mi propio fichero de datos desde mi ordenador en lugar de introducir manualmente los datos en el código.

Le hacemos caso y copiamos un par de años de datos en un fichero de texto en nuestro ordenador. Fijaos, en lo que ocurre a continuación:


Probamos de nuevo:

Como veis, funciona, pero el resultado no es del todo acertado.

Y veamos lo que ocurre.

¡Por fin parece que ya nos ha entendido! Es decir, tenemos un gráfico de barras con las visitas a la web por mes, para los años 2017 (azul) y 2018 (rojo). Sin embargo, no me convencen ni el formato del título del eje ni tampoco se distingue bien la numeración del mismo eje.

Veamos el resultado ahora.

Tiene mucha mejor pinta, ¿verdad? Pero ¿qué tal si todavía le damos una vuelta de tuerca más?

Sin embargo, se ha olvidado de decirnos que debemos instalar el paquete o librería plotly en R. Así que se lo recordamos.

Veamos el resultado:

Como podéis ver, ahora tenemos los controles del gráfico interactivo, de tal modo que podemos seleccionar un año concreto de la leyenda, hacer zoom, etc.
Conclusión
Puede que seas de esos escépticos, conservadores o prudentes que piensan que las capacidades demostradas por GPT-3 hasta el momento (ChatGPT, Dall-E2, etc) son todavía muy infantiles y poco prácticas en la vida real. Todas las consideraciones a este respecto son legítimas y, muchas, probablemente bien fundamentadas.
Sin embargo, algunos hemos pasado buena parte de la vida escribiendo programas, buscando documentación y ejemplos de código que pudiéramos adaptar o en los que inspirarnos; depurando errores, etc. Para todos nosotros (programadores, analistas, científicos, etc.) poder experimentar este nivel de interlocución con una inteligencia artificial en modo beta, puesta a disposición del público de forma gratuita y siendo capaz de demostrar esta capacidad de asistencia en la co-programación, es, sin duda, un salto cualitativo y cuantitativo en la disciplina de la programación.
No sabemos qué va a pasar, pero probablemente estemos a las puertas de un gran cambio de paradigma en la ciencia de la computación, hasta el punto que, quizás, haya cambiado para siempre la forma de programar y aún no nos hayamos dado cuenta.
Contenido elaborado por Alejandro Alija, experto en Transformación Digital.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El Pleno del Consejo de la Comunidad Valenciana ha aprobado un convenio de colaboración entre la Consejería de Participación, Transparencia, Cooperación y Calidad Democrática y la Universidad Politécnica de Valencia (UPV) con el objetivo de fomentar el desarrollo de actividades en materia de transparencia y datos abiertos durante el 2023.
De este modo, la Consejería de Transparencia destinará 65.000 euros para impulsar las actividades del convenio centradas en la apertura y reutilización de los datos presentes en los distintos niveles de las administraciones públicas.
Entre las acciones previstas, destaca la celebración de la tercera edición de Datathon de datos abiertos, un evento que busca incentivar el uso de los datos abiertos para desarrollar aplicaciones y servicios que aporten beneficios para la ciudadanía. Esta colaboración también apostará por promocionar la reutilización de datos relacionados con el ámbito empresarial, fomentando la innovación, difusión y sensibilización en distintos sectores.
De forma paralela, está planificado trabajar de forma conjunta con distintas entidades de la sociedad civil para establecer una serie de sensores inteligentes para recoger datos, a la par que se impulsará la realización de talleres y seminarios sobre periodismo de datos.
A su vez, se incluyen una serie de jornadas divulgativas dirigidas a difundir conocimiento sobre el uso y la compartición de los datos abiertos, la presentación del proyecto Datos y Mujeres o la difusión del depósito de datos abiertos de investigación o de transparencia en los algoritmos.
Igualmente, la colaboración contempla la programación de charlas y talleres para la promoción del uso de datos abiertos en institutos de Educación Secundaria, la integración de los datos abiertos en diferentes asignaturas del doctorado, el grado y el máster sobre Gestión y Administración Pública, el máster de Gestión Cultural y algunas materias trasversales de doctorado.
Por último, esta colaboración entre la universidad y la administración también busca promocionar y tutorizar gran parte de los trabajos en materia de transparencia y datos abiertos, entre los que se incluye la elaboración de una guía de reutilización de datos abiertos dirigida a reutilizadores, así como actividades de difusión de la Alianza para el Gobierno Abierto (OGP) y planes de acción de la Comunitat Valenciana.
Proyectos anteriores relacionados con los datos abiertos
Al margen del plan de actividades diseñado para este 2023 y detallado en las líneas anteriores, esta no es la primera vez que la Universidad Politécnica de Valencia y la Consejería de Participación y Transparencia trabajan conjuntamente en la divulgación y promoción de los datos abiertos. De hecho, para ser exactos, desde el Observatorio de Datos Abiertos y Transparencia perteneciente a la misma universidad, trabajan activamente por promover el valor y la compartición de los datos tanto en el ámbito universitario como social.
Sin ir más lejos, en línea con este trabajo divulgativo, el pasado 2022, desde la propia entidad impulsaron la iniciativa ‘Mujeres y Datos’, un proyecto que logró a reunir a varias mujeres del ámbito de los datos para hablar de su experiencia profesional, los retos y oportunidades que aborda el sector.
Entre las entrevistadas destacaron nombres como Sonia Castro, coordinadora de datos.gob.es, Ana Tudela, cofundadora de Datadista o Laura Castro, diseñadora de visualización de datos en Afective Advisory, entre otras muchas otras profesionales.
Asimismo, la primavera del año pasado y coincidiendo con el Día Internacional de los Datos Abiertos, tuvo lugar la segunda edición del Datathon, cuya finalidad fue impulsar el desarrollo de nuevas herramientas a partir de datos abiertos que estuviesen vinculadas al consumo responsable, el medioambiente o la cultura.
De este modo, esta particular alianza entre la Conselleria de Participación y Transparencia y la Universidad Politécnica de Valencia demuestra que no solo es posible dar a conocer el potencial de los datos abiertos, sino que además las oportunidades de divulgación se multiplican cuando las instituciones y el ámbito académico trabajan de forma coordinada y planificada sobre los mismos objetivos.
El impulso de la llamada economía del dato es una de las grandes prioridades en las que se encuentra trabajando actualmente la Unión Europea, en general, y España, en particular. Disponer de un mercado único digital de intercambio de datos es una de las claves para lograr este impulso entre los Estados miembro, y para ello, entran en juego los espacios de datos.
Data Spaces Business Alliance (DSBA)
Un espacio de datos es un ecosistema capaz de materializar la compartición voluntaria de datos entre sus participantes, respetando su soberanía sobre los mismos, esto es, siendo capaces de fijar las condiciones de su acceso y uso. La DSBA, fundada en 2021, está compuesta por los principales actores en la definición de estándares, modelos y marcos tecnológicos para la construcción y operación de espacios de datos. En concreto, la alianza está compuesta por la Big Data Value Association (BDVA), la Fundación FIWARE y las asociaciones Gaia-X European Association for Data and Cloud AISBL y la International Data Spaces Association (IDSA). El propósito de la alianza es acordar un marco tecnológico común que evite la fragmentación tecnológica de la actividad, así como la armonización en el mensaje y las actividades de difusión.
Technical Convergence Discussion Document
Respecto a la parte tecnológica, la DSBA publicó en septiembre de 2022 una primera aproximación a la deseada convergencia tecnológica.
El documento analiza técnicamente los puntos de anclaje para crear espacios de datos confiables, catálogos federados y mercados compartidos y la capacidad de definir políticas de uso de los datos (en base al uso de un lenguaje común). Esta capacidad para compartir respetando la soberanía del dueño de los datos es lo que hace de estos espacios algo novedoso y verdaderamente disruptor, pues por primera vez ofrece elementos técnicos con que controlar los riesgos asociados a la compartición de información.
Para conseguir la convergencia técnica, la asociación acordó el desarrollo de un marco mínimo viable (MVF, minimal viable framework) basado en tres pilares:
- Interoperabilidad en el intercambio de datos mediante la utilización del protocolo/API estándar de intercambio de datos NGSI-LD y los modelos de datos "Smart Data Models" ampliados para la adopción del modelo de información definido por la arquitectura IDS.
- Soberanía y confianza en el intercambio de datos mediante la adopción de un modelo descentralizado (Self-Sovereign Identity) como el propuesto por Gaia-X (con su Trust Framework) que emplearía la DLT (Distributed Ledger Technologies) impulsada por la Comisión Europea (EBSI). El resultado será un entorno de confianza compatible con la normativa eIDAS 2.0 de la UE.
- Servicios de creación de valor (intermediación) consistentes en un catálogo de datos descentralizado y servicios de comercialización basados en estándares del TM Forum.
La alianza considera que este MVF sería un buen punto de partida sobre el que trabajar para alcanzar la deseada convergencia tecnológica, contando y reutilizando piezas de las actuales soluciones aportadas por los distintos suministradores.
Ejemplo de mercado público de datos
El documento plantea el ejemplo de un proveedor de servicios de datos que ofrece su servicio en un mercado público de datos (Data Marketplace), de modo que los consumidores puedan acceder fácilmente a esta oferta. Además, los proveedores pueden también delegar el acceso a sus usuarios para modificar atributos del servicio que contratan.
Es un ejemplo que puede verse en detalle en el documento, éste resulta interesante porque entran en juego diferentes sistemas de autenticación, políticas de seguridad y acceso y, en definitiva, diferentes sistemas que deben interoperar entre sí.
Adicionalmente, se expone un ejemplo de integración entre el Data Marketplace y un catálogo de datos mediante el enfoque seguido por el proyecto europeo Horizonte 2020 'Digital Open Marketplace Ecosystem' (DOME). De esta manera, se crean las ofertas en el catálogo compartido y pueden ser consultadas posteriormente siguiendo las políticas de acceso definidas.

El documento explica, paso por paso y desde una perspectiva puramente técnica, las acciones a abordar por cada uno de los roles identificados, con el propósito de orientar potenciales escenarios que pudieran producirse en la realidad.
El futuro de la DSBA
La DSBA considera que el mencionado MVF es sólo el primer paso para la convergencia de las diferentes arquitecturas y tecnologías existentes en la construcción de espacios de datos. Los siguientes pasos de la alianza tendrán en cuenta los roles asignados a cada uno de los participantes. Más concretamente:
- IDSA: Desarrolla arquitecturas y estándares de espacios de datos. En particular, un modelo para conectores que garantiza la compartición soberana de datos de forma escalable.
- Gaia-X: Desarrolla y despliega una arquitectura, un modelo de gobernanza acorde a especificaciones de negocio para espacios de datos sectoriales, así como un set de herramientas (Gaia-X Federation Services toolkit) con que instanciar la interoperabilidad, componibilidad y transparencia de los servicios de infraestructura y datos en nube.
- FIWARE: Con un stack tecnológico que viene del mundo de los Gemelos Digitales, la comunidad desarrolla componentes software que permiten llevar a la práctica la construcción de espacios de datos.
Así mismo, la DSBA se marca como objetivos prioritarios:
- La compatibilidad de la arquitectura de IDS con un mecanismo de gestión de identidad basado en identificadores descentralizados.
- La integración de un catálogo federado como el propuesto con el bróker de metadatos propuesto en la arquitectura IDS.
- La definición de un vocabulario común.
- Avanzar conjuntamente con la labor del Data Space Support Center (un programa financiado por la Comisión Europea, y donde estas asociaciones desarrollan un papel protagonista), así como con los esfuerzos de normalización en base al proyecto ‘Smart Middleware Platform’ (SIMPL) de la CE.
Contenido elaborado por Juan Mañes, experto en Data Governance.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
A pesar de que parece un concepto novedoso, el término ‘inteligencia artificial’ ya se acuñó a mediados del pasado siglo. Sin embargo, su popularidad ha experimentado un aumento vertiginoso durante los últimos años gracias al incremento en los volúmenes de datos o la aplicación de algoritmos avanzados en situaciones cotidianas, entre otros aspectos.
La inteligencia artificial permite que las máquinas puedan aprender de la experiencia para realizar diversas tareas al estilo de los seres humanos. Para ello, sus técnicas de entrenamiento recurren con frecuencia al aprendizaje profundo o deep learning y al procesamiento del lenguaje natural (PLN), entre otras. Empleando estas tecnologías al servicio de la IA, las máquinas pueden ser entrenadas para llevar a cabo tareas muy específicas como el procesamiento de grandes cantidades de datos o el reconocimiento de patrones en estos.
¿Qué es la inteligencia artificial?
La Comisión Europea define la inteligencia artificial como la capacidad que presenta una máquina para imitar algunas de las características propias de la inteligencia del ser humano como son el aprendizaje, el razonamiento o la creatividad. Para ello las computadoras analizan la información disponible con el fin de alcanzar unos objetivos específicos.
La inteligencia artificial se encuentra formada a su vez por algunos subcampos basados en tecnologías como el Machine Learning o el Deep Learning. Ambas actividades tienen como fin la construcción de sistemas que tengan la capacidad de resolver problemas sin la necesidad de que un humano intervenga en ellos para solucionarlos.
¿Cuál es el papel que juegan los datos abiertos en la inteligencia artificial?
Para que la inteligencia artificial se desarrolle adecuadamente, los datos abiertos son sumamente importantes. Esto se debe a que sus algoritmos han de ser entrenados con datos de calidad que estén altamente disponibles, tal y como reflejan diversas estrategias y directrices de ámbito estatal y europeo como la Estrategia Nacional de Inteligencia Artificial, el Reglamento Europeo sobre Inteligencia Artificial o el Libro Blanco sobre Inteligencia Artificial.
Ejemplos de casos de uso de la inteligencia artificial
La aplicación de la inteligencia artificial permite que muchos campos puedan lograr mejoras en diversos procesos, servicios o aplicaciones . Algunos ejemplos son:
- Salud: la IA permite identificar diferentes patologías mediante el procesamiento de imágenes médicas, por ejemplo, a través de QMenta, que procesa y visualiza imágenes para realizar análisis de datos cerebrales.
- Medio ambiente: la IA permite realizar una gestión más eficiente de los bosques. Un ejemplo es Forecast, que ofrece herramientas para la toma de decisiones de gestores forestales.
- Economía: se utiliza la IA para optimizar la gestión de licitaciones, como sucede con la herramienta Arbatro Tender, diseñada para encontrar y elegir los concursos públicos más adecuados para cada empresa.
- Turismo: la IA permite el desarrollo de asistentes turísticos virtuales como Castilla y León Gurú, que presenta funciones avanzadas de PLN, detección de puntos de interés en imágenes y uso de contexto geolocalizado.
- Cultura: gracias a la IA es posible generar textos propios y resúmenes de otros ya existentes a través de procesamiento del lenguaje natural. MarIA ha sido la primera inteligencia artificial de la lengua española en lograrlo.
- Publicidad y redacción de contenidos: Sistemas de Inteligencia Artificial como Chat GPT permiten desarrollar textos a partir de peticiones concretas.
Como podemos observar, existen multitud de casos de uso que fusionan la inteligencia artificial y los datos abiertos para contribuir al progreso y bienestar de la sociedad. Te recomendamos que consultes esta práctica infografía en la que te ofrecemos más detalles, así como algunos artículos de interés como este sobre Dall-E para que puedas ampliar tu conocimiento.
Además, si deseas conocer más casos de uso relacionados, descubre el informe “Tecnologías emergentes y datos abiertos: Inteligencia Artificial”, que incluye un caso práctico paso a paso de reconocimiento y clasificación de imágenes.
Haz clic en la infografía para verla a tamaño real y poder acceder a los enlaces:
Puedes ver la infografía en tamaño completo haciendo click aquí.
La demanda de profesionales con habilidades relacionadas con la analítica de datos no deja de crecer y ya se estima que la industria solo en España necesitaría más de 90.000 profesionales en datos e inteligencia artificial para impulsar la economía. Formar profesionales que puedan llenar este hueco es un gran reto que está haciendo incluso grandes compañías tecnológicas como Google, Amazon o Microsoft estén proponiendo programas de formación especializado que en paralelo a los que propone el sistema educativo reglado. Y en este contexto los datos abiertos tienen un papel muy relevante en la formación práctica de estos profesionales, ya que con frecuencia, los datos abiertos son la única posibilidad para realizar ejercicios reales y no solo simulados.
Además, aunque aún no existe un corpus de investigación sólido al respecto, algunos trabajos ya sugieren efectos positivos derivados del uso de datos abiertos como herramienta en el proceso de enseñanza-aprendizaje de cualquier materia y no solo de las relacionadas con la analítica de datos. Algunos países europeos han reconocido ya este potencial y han desarrollado proyectos piloto para determinar la mejor forma de introducir datos abiertos en el currículo escolar.
En este sentido, los datos abiertos se pueden utilizar como una herramienta para la educación y la formación de varias maneras. Por ejemplo, los datos abiertos se pueden utilizar para desarrollar nuevos materiales de enseñanza y aprendizaje, para crear proyectos basados en datos del mundo real para estudiantes o para apoyar la investigación sobre enfoques pedagógicos efectivos. Además, los datos abiertos se pueden utilizar para crear oportunidades de colaboración entre educadores, estudiantes e investigadores con el fin de compartir mejores prácticas y colaborar en soluciones a desafíos comunes.
Proyectos basados en datos del mundo real
Una aportación clave de los datos abiertos es su autenticidad, ya que son una representación de la enorme complejidad e incluso de los defectos del mundo real a diferencia de las construcciones artificiales o los ejemplos de libros de texto que se basan en supuestos muchos más simples.
Un ejemplo interesante en este sentido es el que documentó la Universidad Simon Fraser de Canadá en su Máster en Edición donde la mayor parte de sus alumnos proceden de programas universitarios no STEM y que por tanto tenían unas capacidades limitadas en el manejo de datos. El proyecto está disponible como recurso educativo abierto en la plataforma OER Commons y su objetivo es que los estudiantes comprendan que las métricas y la medición son herramientas estratégicas importantes para comprender el mundo que nos rodea.
Al trabajar con datos del mundo real, los estudiantes pueden desarrollar habilidades de construcción de relatos e investigación, y pueden aplicar habilidades analíticas y colaborativas en el uso de datos para resolver problemas del mundo real. El caso de estudio realizado con la primera edición en la que se utilizó este OER basado en datos abiertos está documentado en el libro “Open Data as Open Educational Resources - Case studies of emerging practice”. En él se muestra que la oportunidad de trabajar con datos pertenecientes a su campo de estudio resultó esencial para mantener a los estudiantes comprometidos con el proyecto. Sin embargo, lidiar con el desorden de los datos del "mundo real" fue lo que les permitió obtener un aprendizaje valioso y nuevas habilidades prácticas.
Desarrollo de nuevos materiales de aprendizaje
Los conjuntos de datos abiertos tienen un gran potencial para ser utilizados en el desarrollo de recursos educativos abiertos (REA) que son materiales de enseñanza, aprendizaje e investigación en soporte digital de carácter gratuito, pues son publicados con una licencia abierta (Creative Commons) que permite su uso, adaptación y redistribución para usos no comerciales de acuerdo con la definición de la UNESCO.
En este contexto, si bien los datos abiertos no siempre son REA, podemos decir que se convierten en REA cuando se usan en contextos pedagógicos. Los datos abiertos cuando se utilizan como recurso educativo facilitan que los estudiantes aprendan y experimenten trabajando con los mismos conjuntos de datos que utilizan investigadores, gobiernos y sociedad civil. Son un componente clave para que los estudiantes desarrollen habilidades de análisis, estadísticas, científicas y de pensamiento crítico.
Es difícil estimar la presencia actual de los datos abiertos como parte de los REA pero no resulta difícil encontrar ejemplos interesantes dentro de las principales plataformas de recursos educativos abiertos. En la plataforma Procomún podemos encontrar interesantes ejemplos como Aprender Geografía a través de la evolución de los paisajes agrarios de España que construye sobre la plataforma ArcGIS Online de la Universidad Complutense de Madrid un Webmap para el aprendizaje de los paisajes agrarios en España. El recurso educativo emplea ejemplos concretos de distintas comunidades autónomas empleando fotografías o imágenes fijas geolocalizadas y datos propios integrados con datos abiertos. De este modo los estudiantes trabajan los conceptos no a través de una mera descripción en texto sino con recursos interactivos que favorecen además la mejora de sus competencias digitales y espaciales
En la plataforma OER Commons encontramos por ejemplo el recurso “De los datos abiertos al compromiso cívico” que está dirigido a públicos a partir de enseñanza secundaria con el objetivo de enseñar a interpretar cómo se gasta el dinero público en un área regional, local, o barrio determinado. Para ello se apoya en los conocidos proyectos para analizar presupuestos públicos “¿Dónde van mis impuestos?”, disponibles en muchas zonas del mundo como fruto de las políticas de transparencia de los poderes públicos. Este recurso que podría ser portado a España con facilidad ya que contamos con numerosos proyectos ¿Donde van mis impuestos?, como el mantenido por Fundación Civio.
Habilidades relacionadas con datos
Cuando nos referimos a la formación y educación en habilidades relacionadas con los datos, en realidad nos estamos refiriendo a un área de gran amplitud que además es muy difícil dominar en todas sus facetas. De hecho, lo habitual es que los proyectos relacionados con datos se aborden en equipos donde cada miembro desempeña un rol especializado en alguna de estas áreas. Por ejemplo, es habitual diferenciar al menos la limpieza y preparación de datos, el modelado de datos y la visualización de datos como las principales actividades que se realizan en un proyecto de ciencia datos e inteligencia artificial.
En todos los casos el uso de datos abiertos está ampliamente adoptado como recurso central de los proyectos que se proponen para la adquisición de cualquiera de estas habilidades. La muy conocida comunidad de ciencia de datos Kaggle organiza competiciones basadas en conjuntos de datos abiertos aportados a la comunidad y que constituyen un recurso esencial para el aprendizaje basado en proyectos reales de quienes quieren adquirir habilidades relacionadas con los datos. Existen otras propuestas basadas en suscripciones como Dataquest o ProjectPro pero en todos los casos utilizan para los proyectos que proponen conjuntos de datos reales obtenidos de los múltiples repositorios de datos abiertos de carácter general o repositorios específicos de un área de conocimiento.
Los datos abiertos, al igual que en otras áreas, aún no han desarrollado todo su potencial como herramienta para la educación y la formación. Sin embargo como puede verse en el programa de la última edición de la OER Conference 2022, cada vez son más los ejemplos en los que los datos abiertos tienen un papel central en la enseñanza, las nuevas prácticas educativas y la creación de nuevos recursos educativos para todo tipo de materias, conceptos y habilidades.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
¿Estás interesado en el análisis de datos? Si la respuesta es sí, te interesará saber que UniversiDATA ha puesto en marcha un datathon para reconocer proyectos de tratamiento de datos abiertos basados en los datasets disponibles en su portal.
Con esta iniciativa se busca no solo premiar el talento, sino también promocionar los contenidos que ofertan y fomentar su uso, inspirando nuevos proyectos gracias a la difusión de casos de referencia. Además, se trata de una oportunidad para conocer a sus reutilizadores y entender mejor sus objetivos, retos y necesidades. Una información de valor que se utilizará para impulsar mejoras en la plataforma.
¿Quién puede participar?
La convocatoria está abierta a cualquier persona física mayor de edad con residencia fiscal en la Unión Europea. Pueden participar estudiantes, desarrolladores, investigadores o cualquier ciudadano interesado en el análisis de datos.
¿Cómo se desarrolla la competición?
La competición se estructura en dos fases:
Fase eliminatoria
Un jurado de expertos evaluará todas las solicitudes recibidas atendiendo a las descripciones de los proyectos realizadas por los participantes en el formulario de inscripción. Para ello se tendrán en cuenta 4 criterios detallados en las bases de la competición: impacto, calidad de la propuesta, usabilidad/presentación y reusabilidad.
Tras la evaluación, un máximo de 10 finalistas pasará a la siguiente fase.
Fase final
Los finalistas tendrán que presentar sus proyectos por videoconferencia ante los miembros del jurado.
Tras la presentación se darán a conocer a los tres ganadores.
¿Cuáles son los requisitos de los proyectos presentados?
Los trabajos presentados deberán cumplir tres obligaciones:
- Es necesario utilizar al menos un conjunto de datos publicado en el portal de datos abiertos UniversiDATA. Estos datasets podrá combinarse con datos secundarios de otras fuentes.
- El uso que se haga de los conjuntos de datos de UniversiDATA debe ser esencial para obtener los resultados del análisis.
- El análisis de los datos debe tener un objetivo o utilidad claro. No se admitirán tratamientos de datos genéricos.
Cabe destacar que se pueden presentar trabajos ya existentes, previamente presentado en otros contextos. Además, no existen limitaciones con respecto a la tecnología a utilizar para el análisis -cada usuario puede usar las herramientas que considere adecuadas- ni relativas al formato del resultado final del análisis. Es decir, se puede concursar con una App móvil, una aplicación web, un análisis de datos en Jupyter o R-Markdown, etc...
¿Cuáles son los premios?
Los tres ganadores recibirán un total de 3.500€, distribuidos de la siguiente manera:
- Primer premio: 2.000 €
- Segundo premio: 1.000 €
- Tercer premio: 500 €
El resto de finalistas recibirán un diploma de reconocimiento
¿Cómo puedo participar?
El plazo de inscripción ya está abierto. La manera más sencilla de participar es rellenar el formulario disponible al final del espacio web de la competición antes del 14 de octubre de 2022.
Antes de inscribirte te recomendamos revisar toda la información completa en las bases del concurso. Si tienes cualquier duda, puedes ponerte en contacto con los organizadores. Próximamente se habilitarán diversos canales para que los participantes puedan plantear dudas relativas no solo a los procedimientos de la competición, sino también a los conjuntos de datos de la plataforma.
Calendario de la competición
- Recepción de candidaturas: hasta el 14 de octubre de 2022
- Publicación de los 10 finalistas: 14 de noviembre de 2022
- Comunicación de los tres ganadores: 16 de diciembre de 2022
Descubre más sobre UniversiDATA
UniversiDATA nació a finales de 2020 con el objetivo de fomentar los datos abiertos en el sector de la educación superior en España de una forma armonizada. Se trata de una iniciativa público-privada que actualmente engloba a la Universidad Rey Juan Carlos, la Universidad Complutense de Madrid, la Universidad Autónoma de Madrid, la Universidad Carlos III de Madrid, la Universidad de Valladolid, la Universidad de Huelva y Dimetrical, The Analytics Lab, S.L.
En 2021 UniversiDATA se hizo con el Primer Premio del III Desafío Aporta por su proyecto UniversiDATA-Lab, un portal público para el análisis avanzado y automático de los datasets publicados por las universidades. Puedes conocer más sobre el proyecto en esta entrevista.
Estudio Alfa es una empresa tecnológica dedicada a ofrecer servicios que favorezcan la imagen de empresas y marcas en Internet, incluyendo el desarrollo de apps. Para llevar a cabo estos servicios utilizan técnicas y estrategias que cumplen con estándares de usabilidad y favorecen el posicionamiento en buscadores web, facilitando así que las páginas de sus clientes reciban más visitantes y con ello potenciales clientes. Cuentan además con especial experiencia en sectores productivos y de turismo.
Las universidades españolas poseen numerosos datos de calidad que cuentan con un gran potencial económico y social. Por ello, hace ya un tiempo que venimos asistiendo a un movimiento de apertura de datos por parte de las universidades en nuestro país, con el objetivo de impulsar el uso y reutilización de la información que generan, así como mejorar su transparencia, entre otros .
Fruto de este movimiento de apertura, han ido surgiendo portales de datos abiertos ligados a universidades, muchos de los cuales se encuentran federados con datos.gob.es, como por ejemplo la Universidad de Cantabria, la Universidad de Extremadura o la Universidad Pablo de Olavide, aunque hay muchas más. Incluso han surgido iniciativas colaborativas como UniversiDATA, que busca fomentar los datos abiertos en el sector de la educación superior de una forma armonizada. UniversiDATA reúne actualmente a 6 universidades, pero su intención es continuar creciendo y actuar como un punto de acceso único donde las diferentes universidades adheridas a la iniciativa pueden compartir sus datos de una manera sencilla. También cabe destacar el papel del Ministerio de Universidades, que actualmente ofrece casi 1.000 datasets a través de datos.gob.es.
Entre los conjuntos de datos que comparten las universidades encontramos datos administrativos, sobre el perfil del alumnado o los distintos itinerarios académicos, aunque también cuentan con un papel relevante en la publicación de los datos de sus grupos de investigación.
Pero el papel de las universidades en el ecosistema de datos abiertos va mucho más allá de meros publicadores, sino que también tienen un rol destacado a la hora de impulsar la apertura de más datos y su reutilización.
Ejemplos de grupos de datos abiertos ligados a universidades
El campo de los datos en general, y el de los datos abiertos en particular, cuenta cada vez con más peso e importancia dentro del ámbito universitario, en materia lectiva pero también en el área de la divulgación. Como consecuencia, hoy en día encontramos diversos ejemplos de grupos, cátedras o profesionales ligados a la educación superior enfocados en el fomento del uso y reutilización de los datos académicos.
A continuación, analizamos algunos grupos de datos abiertos ligados al ámbito de la educación superior en nuestro país:
Cátedra de Transparencia y Datos Abiertos – Observatorio Valenciano de Datos Abiertos y Transparencia
¿Qué es y cuál es su objetivo?
Este organismo ha sido creado por la Generalitat Valenciana y la Universitat Politécnica de Valéncia, a través de su Escuela Superior de Ingeniería Informática y el Máster Universitario de Gestión de la Información, para realizar actividades relacionadas con la transparencia, la participación y el acceso de la ciudadanía a la información pública en el ámbito de la Comunidad Valenciana.
¿Qué funciones lleva a cabo?
La cátedra organiza y desarrolla una serie de actividades relacionadas con el ámbito de la transparencia y los datos abiertos que se pueden clasificar en tres categorías diferentes:
- Actividades de formación: la cátedra colabora en actividades docentes, como el Máster Oficial Universitario en Gestión de la Información; en la puesta en marcha de programas permanentes de formación dirigidos a funcionarios, entidades locales y asociaciones; o la creación de becas y premios para los mejores trabajos de grado en materia de transparencia para alumnos de la UPV.
- Actividades de divulgación técnica, tecnológica y artística: a través de talleres, conferencias y jornadas, se busca impulsar tanto la publicación como la reutilización de los datos abiertos. También desarrollan espacios de trabajo junto al personal técnico de la administración, programadores informáticos y gestores públicos.
- Actividades de investigación y desarrollo: desde la cátedra trabajan en distintas líneas de investigación, especialmente, en materia de datos abiertos procedentes de la web GVAOberta de la Generalitat. También promueven soluciones tecnológicas innovadoras en materia de transparencia, participación y acceso a la información pública.
Próximos pasos
Los datos abiertos conforman el eje central de todas las actividades que celebrarán a lo largo de este año, organizadas por la cátedra. El Datathon 2022 destaca como la actividad más cercana que están coordinando, pues ya se encuentra en marcha. En esta competición participan cuatro universidades públicas de la Comunidad Valenciana, además de las distintas cátedras de la Universitat Politécnica de Valéncia. Este desafío, que empezó el pasado 4 de marzo y se prolongará hasta el 30 de abril, tiene como objetivo que sus participantes resuelvan alguno de los tres retos propuestos (sobre producción y consumo responsable, aspectos medioambientales y cultura) haciendo uso de diferentes herramientas de aprendizaje automático, inteligencia artificial o ciencia de datos.
Además del Datathon, también tienen previsto celebrar una jornada internacional con la colaboración de Open Knowledge Foundation, una serie de talleres de verificación de noticias a través de los datos abiertos junto a Newtral, diversas jornadas de difusión y formación con varias federaciones de empresas, o un workshop sobre datos abiertos desde la perspectiva de género. Entre sus planes también se encuentra el crear un directorio de reutilizadores de la Comunidad Valenciana. Aunque se está trabajando en ellos, estos eventos todavía no cuentan a día de hoy con una agenda y calendario oficiales.
Cátedra Cajasiete de Big Data, Open Data y Blockchain, Universidad de La Laguna
¿Qué es y cuál es su objetivo?
La Universidad de La Laguna y Cajasiete crearon el año pasado la Cátedra Big Data, Open Data y Blockchain (Cátedra Cajasiete BOB), con el propósito de contribuir a la transformación digital y al desarrollo de una economía competitiva en las Islas Canarias, a través de la investigación, la formación y la divulgación en campos como Big Data, Open Data o Blockchain. Esta Cátedra cuenta en su Consejo Asesor con un conjunto de representantes de entidades públicas y privadas del archipiélago, que son actores clave a la hora de fomentar la transformación digital y el desarrollo de los modelos de negocio público-privado de Canarias.
¿Qué funciones lleva a cabo?
Uno de sus proyectos más destacados ha sido “Mapa BOB”, donde analizaron detalladamente la situación de las entidades canarias en materia de digitalización para tomar acciones concretas que ayuden a cumplir su misión. Tras este análisis, desde la cátedra se han centrado en diversas iniciativas con el objetivo de elevar el nivel de digitalización en el archipiélago, muchas de las cuales han estado centradas en los datos abiertos:
- Webinars BOB: han desarrollado seminarios online de temáticas concretas para conocer y difundir buenas prácticas en el ámbito de la tecnología y los datos.
- Encuentros de Administraciones Públicas: también han puesto en marcha espacios para que distintas AA.PP. canarias puedan compartir experiencias sobre temas concretos relacionados con datos. En la última edición presencial hubo una mesa de debate dedicada al análisis de datos abiertos.
- Proyectos: entre los proyectos que han llevado a cabo, destaca “Aplicación práctica de los datos abiertos: actualización y predicción”. Se trata de un Trabajo de Fin de Grado cuyo objetivo se basó en definir un indicador de calidad para, a partir de datos abiertos relacionados con COVID-19, realizar predicciones de la evolución de la incidencia acumulada.
- Cursos de formación: dentro del ámbito de los datos abiertos ha organizado diferentes formaciones como, por ejemplo:
- Curso sobre la plataforma CKAN destinado al Cabildo de Lanzarote.
- Masterclass de Open Data y Big Data destinada a estudiantes del ámbito de empresa de la Universidad de La Laguna.
- Cursos de Open Data destinados a Administraciones Públicas dentro de la iniciativa “Elementos para modernizar la Administración y mejorar la prestación de servicios públicos en el contexto actual” de la Universidad de La Laguna.
- Curso de Python, cuyo proyecto final consistía en analizar datos abiertos de turismo en la isla de Tenerife.
Próximos pasos
Actualmente la Cátedra BOB se encuentra colaborando en la iniciativa “DIGINNOVA”, un programa formativo para capacitar a personas desempleadas en materias de digitalización específicas para las necesidades de las islas. En lo que respecta a 2022, se han planificado diversas actividades de difusión, formación e investigación con las que esperan seguir creciendo y aportando valor, aunque por el momento ninguna de ellas se ha presentado oficialmente aún.
Hablando en data
¿Qué es y cuál es su objetivo?
Se trata de un canal de divulgación destinado a compartir información y conocimiento de interés con la comunidad de científicos de datos. En este espacio podemos encontrar entrevistas, repasar conceptos, noticias o eventos sobre Data Science e Inteligencia Artificial. En este caso no hablamos de un proyecto ligado a una universidad, sino a sus profesionales. Este canal ha sido creado por Abilio Romero Ramos e Iván Robles Agudo, dos científicos de datos con amplia experiencia en el sector que dedican parte de su tiempo profesional a impartir materias relacionadas con el ámbito de los datos en diferentes másteres de centros de educación superior como la Universidad Europea o la Universidad CEU San Pablo.
¿Qué funciones lleva a cabo?
El canal de YouTube de Hablando en Data se ha convertido en el eje central de su proyecto de divulgación. A través de él tratan de acercar y explicar de manera amena y sencilla diversos conceptos necesarios para aprovechar el valor que se esconde en los datos, sobre todo en aquellos que se encuentran disponibles al público.
Por otro lado, en su página web centralizan y recopilan multitud de contenido relacionado con la ciencia de datos. En ella podemos identificar algunas de las funciones que esta iniciativa lleva a cabo como, por ejemplo:
- Divulgación: cuentan con una sección dedicada a la difusión de blogs, webs y canales que cuentan con información de interés sobre esta temática.
- Formación: en su web podemos encontrar una sección dedicada a difundir materiales formativos de interés sobre ciencia de datos, bien sea a través de libros gratuitos, documentales o cursos en línea.
- Data science para la escuela: una iniciativa que trata de acercar los datos a toda la población, especialmente a los estudiantes. Aquí comparten recursos útiles y divertidos para ayudar a los más jóvenes a introducirse en el mundo de la ciencia de datos.
También es especialmente destacable la colaboración que esta iniciativa realiza con SoGoodData, una ONG que ayuda y apoya a proyectos sociales gracias a la combinación de información pública y aquella que comparten las empresas colaboradoras.
Próximos pasos
Los planes de futuro más próximos para esta iniciativa pasan por continuar divulgando conocimiento sobre ciencia de datos entre su comunidad y seguir aprovechando las posibilidades que este campo ofrece. Continuarán difundiendo el uso y la reutilización de datos públicos, no solo desde su canal de YouTube sino también desde los másteres en los que imparten clase y a través de iniciativas como SoGoodData.
Como hemos visto, las entidades universitarias y sus profesionales han adquirido un papel relevante en el sector de los datos abiertos de nuestro país, como publicadores, divulgadores y reutilizadores, aunque eso da para otro artículo. ¿Conoces alguna otra iniciativa de divulgación de datos abiertos en el ámbito universitario? Déjanos un comentario o escríbenos un correo a dinamizacion@datos.gob.es y cuéntanoslo. Estaremos encantados de leerte.
