Gardena-Transparencia es una Plataforma de Transparencia y Buen Gobierno que aglutina toda la información pública relevante:
- Registro Mercantil: Permite realizar una búsqueda filtrada de toda la información del Boletín Oficial del Registro Mercantil (BORME) y fichas completas de todas las empresas registradas y de sus empresarios.
-Contratación Pública: En este apartado, el usuario puede acceder a todas las licitaciones y contratos menores de la Administración Pública, tanto a nivel estatal como local. La aplicación emplea analítica avanzada de datos e inteligencia artificial para identificar desviaciones.
-Altos Cargos: Todo el histórico de cargos políticos de la democracia y más de una década de altos cargos. Se trata de un conjunto de datos de Personas con Responsabilidad Pública (PRPs) muy completo. El apartado recoge también un ranking de retribuciones: salarios de alcaldes y presidentes/as autonómicos.
En la home de la plataforma se puede apreciar un resumen de los datos más destacados como puede ser el presupuesto general licitado el último mes, la evolución de las licitaciones adjudicadas o las empresas con más adjudicaciones de licitaciones en el mes.
La aplicación ha sido desarrolla de forma voluntaria y procuran mantener una periodicidad diaria en la carga de licitaciones y contratos menores. Para ello, se han implementado algoritmos de inteligencia artificial para la mejora de la calidad de la información.
Hablando en data es el primer proyecto de visualización de datos de la Biblioteca y Centro de Documentación del Museo Reina Sofía, en colaboración con la Facultad de Ciencias Sociales de la Universidad de Salamanca. Su objetivo es analizar y visualizar la presencia de mujeres artistas, críticas de arte, comisarias, escritoras y autoras que integran su catálogo bibliográfico. El proyecto busca conectar y recopilar la información disponible sobre estas creadoras en otras bases de datos y dar acceso a estos resultados a través de su página web. Toda la información recopilada está disponible para su consulta, uso o descarga, dejando abierta la posibilidad a otros enfoques y visualizaciones.
Financiado con fondos del Plan de Recuperación, Transformación y Resiliencia de la UE
Durante los últimos años estamos asistiendo a una revolución tecnológica que nos empuja cada vez más a ampliar nuestra formación para adaptarnos a los nuevos dispositivos, herramientas y servicios digitales que ya forman parte de nuestro día a día. En este contexto, la formación en competencias digitales cobra más relevancia que nunca.
El pasado mes de octubre, la Comisión Europea, con su presidenta Ursula Von Der Leyen a la cabeza, puso de manifiesto su intención de hacer de este 2023 el “Año Europeo de las Habilidades”, incluidas las digitales. La razón se encuentra en las dificultades que se han identificado entre la ciudadanía europea para adaptarse a las nuevas tecnologías y aprovechar todo su potencial, especialmente en el ámbito profesional.
La brecha europea de las competencias digitales
Según datos ofrecidos por Eurostat, más del 75% de las empresas de la Unión Europea han informado sobre las dificultades que encuentran a la hora de conseguir profesionales que cuenten con las habilidades necesarias para desarrollar el trabajo que demandan. Es más, la Agencia Laboral Europea alerta de la gran escasez que existe en Europa de especialistas en TIC y trabajadores con formación cualificada en STEM. Este dato se agudiza al observar que actualmente tan solo 1 de cada 6 especialistas en TI pertenece al género femenino.
En lo que respecta a las habilidades digitales, las cifras tampoco son halagüeñas. Y es que, tal y como se apunta en el Índice de Economía y Sociedad Digital (DESI), basado en datos de 2021, solo el 56% de la población europea posee competencias digitales básicas, entre las que se incluyen: habilidades de alfabetización de información y datos, de comunicación y colaboración, de creación de contenido digital, de seguridad y de resolución de problemas.

Ciudadanos de la UE con menos habilidades digitales básicas por país. Fuente: Eurostat, 2022.
Iniciativas europeas para fomentar el desarrollo de competencias digitales
Como mencionamos anteriormente, mejorar la educación y las habilidades digitales es uno de los grandes objetivos que se ha marcado la Comisión Europea para este 2023. Si miramos a largo plazo, el objetivo es más ambicioso: La UE pretende que en 2030 al menos el 80% de los adultos de la UE cuenten con habilidades digitales básicas como las mencionadas anteriormente. En lo que respecta al sector profesional, el objetivo se centra en contar con alrededor de 20 millones de profesionales especialistas en TIC, con un número destacado de mujeres en el sector.
Para llevar a cabo estos objetivos, existe una serie de medidas e iniciativas que se han puesto en marcha a nivel europeo. Una de ellas parte de la Agencia Europea de Habilidades, cuyos puntos de acción 6 y 7 están enfocados a mejorar todas las habilidades relevantes para las transiciones verde y digital, así como a aumentar el número de graduados en TIC.
A través de los fondos NextGenerationEU y su Mecanismo de Recuperación y Resiliencia, los estados miembros de la UE podrán optar a ayudas destinadas a financiar reformas relacionadas con las competencias digitales, ya que se habilitarán 560.00 millones de euros para este cometido.
Además, otros programas de financiación de la Unión Europea como el Programa Europa Digital (DEP) o el Mecanismo Conectar Europa (CEF) ofrecerán respectivamente apoyo económico destinado al desarrollo de programas de educación especializados en habilidades digitales o el lanzamiento de la Plataforma Europea de Empleos y Habilidades Digitales para poner a disposición de la ciudadanía información y recursos relacionados.
Junto a ellas, encontramos también otras iniciativas dedicadas a la formación en habilidades digitales en el Plan de Acción de Educación Digital, que ha creado el Centro Europeo de Educación Digital, o en la misión de la Coalición de Empleos y Habilidades Digitales, cuyo objetivo es concienciar y abordar la brecha de habilidades digitales junto a administraciones públicas, empresas y ONG.
La importancia de los datos abiertos en el ‘Año Europeo de las Habilidades Digitales’
A la hora de fomentar el desarrollo de las competencias digitales por parte de la ciudadanía europea, el portal de datos abiertos europeo lleva a cabo diversas acciones que contribuyen a este fin y donde los datos abiertos juegan un papel fundamental. En esta línea, Data Europa mantiene firme su compromiso por impulsar la formación y la divulgación de los datos abiertos. Así, junto a los objetivos que enumeraremos a continuación, conviene subrayar también el valor a nivel conocimiento que encontramos detrás de cada uno de los talleres y seminarios que programan desde su sección académica, a lo largo del año.
- Apoyar a los Estados miembros en la recopilación de datos y estadísticas sobre la demanda de competencias digitales para desarrollar medidas y políticas específicas.
- Trabajar junto a los portales de datos abiertos nacionales para que los datos estén disponibles y sean fácilmente accesibles y comprensibles.
- Ofrecer apoyo a portales de datos abiertos regionales y locales que presenten una mayor necesidad de ayuda en labores de digitalización.
- Fomentar la alfabetización de datos, así como la recopilación de casos de uso de interés que puedan ser reutilizados.
- Desarrollar entornos colaborativos que faciliten a los proveedores de datos públicos la creación de una sociedad inteligente basada en datos.
Así, del mismo que data.europa academy funciona como un centro de conocimiento creado para que las comunidades de datos abiertos pueden encontrar seminarios web y formaciones relevantes para mejorar sus habilidades digitales, en España, el Instituto Nacional de Formación Pública, incluye entre sus opciones formativas varios cursos sobre datos cuyo cometido es mantener al día de las últimas tendencias en este ámbito, a los trabajadores de las administraciones públicas.
En esta línea, durante la primavera del 2023, tendrá lugar una formación sobre Datos abiertos y Reutilización de la Información, a través de la cual se realizará una aproximación al ecosistema de los datos abiertos y los principios generales de reutilización. Igualmente, desde el 24 de mayo al 5 de junio, el INAP organiza otro curso sobre Fundamentos de Big Data donde se abordarán bloques de conocimiento como la visualización de datos, la computación en la nube, la inteligencia artificial o las distintas estrategias en materia de Gobierno del Dato.
Asimismo, si no eres un trabajador perteneciente al sector público, pero tienes interés en ampliar tus conocimientos sobre datos abiertos, inteligencia artificial, machine learning u otras temáticas vinculadas a la economía del dato, en el blog y la sección de documentación de datos.gob.es podrás encontrar materiales formativos adaptados, monográficos sobre diversas temáticas, casos prácticos, infografías y visualizaciones paso a paso que te ayudarán a comprender de forma más tangible las diferentes aplicaciones teóricas que implican a los datos abiertos.
En datos.gob.es, hemos elaborado publicaciones que recopilan diferentes formaciones gratuitas sobre temáticas y especializaciones diversas. Como, por ejemplo, sobre inteligencia artificial o visualizaciones de datos.
Por último, si conoces más ejemplos u otras iniciativas dedicadas a fomentar las habilidades digitales tanto en el ámbito estatal o europeo, no dudes en hacérnoslo saber a través de nuestro buzón de correo electrónico dinamizacion@datos.gob.es. ¡Esperamos todas tus sugerencias!
Las Jornadas de Geodatos que organiza el Área de Gobierno de Desarrollo Urbano del Ayuntamiento de Madrid, dirigidas por la Subdirección General de Innovación e Información Urbana, se han consolidado como punto de encuentro de profesionales de los datos georreferenciados, la información urbanística, la cartografía y la innovación.
¿Dónde y cuándo se celebra?
Este año, el evento gratuito se inaugurará el miércoles 22 de marzo a las 9.30h en el Auditorio de La Nave en Madrid (metro Villaverde Bajo-Cruce) con una sesión plenaria que se retransmitirá online. Durante la sesión de la tarde de ese mismo día, se presentarán iniciativas innovadoras de tratamiento de datos georreferenciados, así como herramientas gratuitas para asociaciones y entidades.
Como en otras ediciones, las actividades continuarán durante el día siguiente, 23 de marzo, pero en escenario virtual. Desde 10.00h, los asistentes a las Jornadas podrán acceder a una de las cinco salas digitales simultáneas e interactuar con la persona que imparte el taller.
Entre los ponentes, se encuentran profesionales del ámbito de la información geográfica de organizaciones como el Ayuntamiento de Madrid, la Dirección General de Catastro, Universidad Politécnica de Madrid, datos.gob.es, entre otros.
Todos ellos constituyen una agenda de actividades diversa en temáticas entre las que se encuentran talleres y conferencias como: construcción de un escenario 3D, proyecto del Geoportal para conectar con las personas mayores, claves del visor urbanístico o innovación para la construcción del gemelo digital de la ciudad. Puedes leer aquí el programa de las Jornadas de Geodatos.
¿Cómo puedo inscribirme?
Tras la celebración de las Jornadas de Geodatos, las grabaciones de todos los talleres, mesas redondas y conferencias se podrán encontrar en la web oficial del evento, donde también se encuentra el formulario de registro para participar en el encuentro. ¡No pierdas tu cita con la innovación en cartografía y datos georreferenciados!
El próximo 2 de marzo, tendrá lugar la presentación del proyecto ‘Datos abiertos y mujeres’, impulsado por el Observatorio Valenciano de Datos Abiertos y Transparencia, fruto de la colaboración entre la Conselleria de Participació, Transparencia, Cooperación y Calidad Democrática de la Generalitat y la Universidad Politécnica de València.
El evento que ha sido organizado por la profesora de la Universidad de Sevilla, Lorena R. Romero-Domínguez y la técnica audiovisual de la Universidad Politécnica de Valencia, Lucía García Robledo, con el apoyo de Antonia Ferrer Sapena, directora del Observatorio, y Eloína Coll Aliaga, directora de la Càtedra de Governança de la Ciutat de València, se llevará a cabo en el Salón de actos de Rectorado en la Universitat Politècnica de València.
Desde un inicio, el objetivo de este proyecto ha sido poner el foco en el rol que distintas mujeres del sector profesional desempeñan en el contexto de los datos y, en especial, de los datos abiertos. Así, mediante una serie de entrevistas, las profesionales seleccionadas comparten el transcurso de su trayectoria, explican cómo han crecido profesionalmente en el mundo de los datos y, también, cómo han abordado algunos de los proyectos más significativos de sus carreras a este respecto.
Las entrevistas, que fueron grabadas meses atrás, están disponibles para su visionado desde el canal de Youtube del Observatorio, donde podemos ver cómo cada una de las profesionales interpeladas reflexiona sobre los retos más importantes que afronta el sector, prestando especial atención a la inclusión de la perspectiva de género en los datos.
Presentación del proyecto y mesa redonda con algunas de las protagonistas
En la sesión de presentación del próximo 2 de marzo, se contará con Andrés Gomis, Director General de Transparencia, Atención a la Ciudadanía y Buen Gobierno de la Conselleria de Participación, Transparencia, Cooperación y Calidad Democrática de la Generalitat Valenciana y Elisa Valía, Tenienta Alcalde Participación, Derechos e Innovación de la Democracia. Concejala de Transparéncia y Gobierno Abierto del Ajuntament de València.
Además, también tendrá lugar una mesa de redonda sobre los datos con perspectiva de género que estará moderada por Carmen Montalbá, profesora de la Universitat de València, y en la que participarán las siguientes profesionales cuyas entrevistas forman parte del proyecto:
- Lorena R. Romero, profesora de la Universidad de Sevilla y autora del proyecto.
- Ana Tudela, Cofundadora de Datadista y miembro de la Oxford Climate Journalism Network.
- Silvia Rueda, Directora Territorial en la Conselleria de Innovación, Universidades, Ciencia y Sociedad Digital.
Junto a las ponentes anteriores que estarán presentes en la mesa redonda, el proyecto ‘Datos abiertos y mujeres’ recoge también las entrevistas de Lourdes Muñoz Santamaría, Fundadora y Directora de la Iniciativa Barcelona Open Data; Laura Castro, Diseñadora de visualización de datos en Affective Advisory; Zynnia del Villar, Directora de Investigación de Ciencias de Datos en Data-Pop Alliance; Thais Ruiz de Alda, Fundadora y CEO de Digital Fems. Tech Advisor&Consultant Digital Business; Sonia Castro-García Muñoz, Coordinadora de datos.gob.es (Red.es); Ana Tudela, Cofundadora de Datadista y Eva Méndez Rodríguez, Profesora Titular y Vicerrectora Adjunta de Política Científica de la Universidad Carlos III.
En definitiva, ‘Datos abiertos y mujeres’ es un proyecto que surge de la necesidad de incentivar un debate sobre la incorporación de la perspectiva de género a los datos, una práctica prioritaria para establecer políticas públicas que sean eficientes para combatir las desigualdades que se plantean entre hombres y mujeres.
Precisamente por esta razón, en las entrevistas, se ofrece una gran diversidad de visiones sobre el papel de los datos en los distintos campos profesionales, entre los que destacan, el periodismo de datos, el ámbito científico-tecnológico, el administrativo o las organizaciones internacionales, entre otros.
Por último, las personas interesadas en asistir presencialmente a la presentación del proyecto deberán inscribirse previamente en este formulario y, una vez confirmada su asistencia, acudir al Salón de actos de Rectorado UPV, en el edificio 3ª.
Hablar estos días de GPT-3 no es lo más original del mundo, lo sabemos. Toda la comunidad tecnológica está publicando ejemplos, realizando eventos y pronosticando el final del mundo del lenguaje y la generación de contenidos tal y cómo la conocemos actualmente. En este post, le pedimos a ChatGPT que nos eche una mano para programar un ejemplo de visualización de datos con R partiendo de un conjunto de datos abiertos disponible en datos.gob.es.
Introducción
Nuestro anterior post hablaba sobre Dall-e y la capacidad de GPT-3 para generar imágenes sintéticas partiendo de una descripción de lo que pretendemos generar en lenguaje natural. En este nuevo post, hemos realizado un ejercicio completamente práctico en el que le pedimos a la inteligencia artificial que nos ayude a realizar un sencillo programa en R que cargue un conjunto de datos abierto y genere algunas representaciones gráficas.
Hemos escogido un conjunto de datos abiertos de la plataforma datos.gob.es. En concreto, un conjunto de datos sencillos de uso de portales madrid.es. La descripción del repositorio explica que se incluye la información relativa a usuarios, sesiones y número de visitas a páginas de los siguientes portales del Ayuntamiento de Madrid: Portal Web municipal, Sede Electrónica, Portal de Transparencia, Portal de Datos Abiertos, Bibliotecas y Decide Madrid.
El fichero se puede descargar en formato .csv o .xslx y si lo pre-visualizamos tiene el siguiente aspecto:

Vale, comencemos a co-programar con ChatGPT!
Primero accedemos a la web y nos identificamos con nuestro usuario y contraseña. Es necesario estar registrado en el sitio web de openai.com para poder acceder a las capacidades de GPT-3, entre otras ChatGPT.
Iniciamos nuestra conversación:

Durante este ejercicio hemos intentado mantener una conversación de la misma forma que la tendríamos con un compañero de programación. Así que lo primero que hacemos es saludar y enunciar el problema que tenemos. Cuándo le pedimos a la IA que nos ayude a crear un pequeño programa en R que represente gráficamente unos datos, nos ofrece algunos ejemplos y ayuda con la explicación del programa:

Puesto que no tenemos datos, no podemos hacer nada práctico por el momento, así que le pedimos si nos ayuda a generar unos datos sintéticos.

Como decimos, nos comportamos con la IA como lo haríamos con una persona (tiene buena pinta).

Una vez que parece que la IA responde con facilidad a nuestras preguntas, vamos con el siguiente paso, vamos a darle nosotros los datos. Y aquí empieza la magia… Hemos abierto el fichero de datos que nos hemos bajado de datos.gob.es y hemos copiado y pegado una muestra.
| Nota: ChatGPT no tiene conexión a Internet y por lo tanto no puede acceder a datos externos, así que lo único que podemos hacer es darle un ejemplo de los datos reales con los que queremos trabajar. |


Con los datos copiados y pegados tal cual se los hemos dado, nos escribe el código en R para cargarlos manualmente en un dataframe denominado “datos”. A continuación, nos proporciona el código de ggplot2 (la librería gráfica más conocida en R) para graficar los datos junto con una explicación del funcionamiento del código.

¡Genial! Es espectacular este resultado con un lenguaje totalmente natural y nada adaptado para hablar con una máquina. Veamos que pasa a continuación:

Pero resulta que al copiar y pegar el código en un entorno de RStudio comprobamos que este falla.

Así que le decimos lo que pasa y que nos ayude a solucionarlo.

Probamos de nuevo y ¡en este caso funciona!

Sin embargo, el resultado es un poco tosco. Así que se lo decimos.

A partir de aquí (y tras varios intentos de copiar y pegar más y más filas de datos) la IA cambia ligeramente el enfoque y me proporciona instrucciones y código para cargar mi propio fichero de datos desde mi ordenador en lugar de introducir manualmente los datos en el código.

Le hacemos caso y copiamos un par de años de datos en un fichero de texto en nuestro ordenador. Fijaos, en lo que ocurre a continuación:


Probamos de nuevo:

Como veis, funciona, pero el resultado no es del todo acertado.

Y veamos lo que ocurre.

¡Por fin parece que ya nos ha entendido! Es decir, tenemos un gráfico de barras con las visitas a la web por mes, para los años 2017 (azul) y 2018 (rojo). Sin embargo, no me convencen ni el formato del título del eje ni tampoco se distingue bien la numeración del mismo eje.

Veamos el resultado ahora.

Tiene mucha mejor pinta, ¿verdad? Pero ¿qué tal si todavía le damos una vuelta de tuerca más?

Sin embargo, se ha olvidado de decirnos que debemos instalar el paquete o librería plotly en R. Así que se lo recordamos.

Veamos el resultado:

Como podéis ver, ahora tenemos los controles del gráfico interactivo, de tal modo que podemos seleccionar un año concreto de la leyenda, hacer zoom, etc.
Conclusión
Puede que seas de esos escépticos, conservadores o prudentes que piensan que las capacidades demostradas por GPT-3 hasta el momento (ChatGPT, Dall-E2, etc) son todavía muy infantiles y poco prácticas en la vida real. Todas las consideraciones a este respecto son legítimas y, muchas, probablemente bien fundamentadas.
Sin embargo, algunos hemos pasado buena parte de la vida escribiendo programas, buscando documentación y ejemplos de código que pudiéramos adaptar o en los que inspirarnos; depurando errores, etc. Para todos nosotros (programadores, analistas, científicos, etc.) poder experimentar este nivel de interlocución con una inteligencia artificial en modo beta, puesta a disposición del público de forma gratuita y siendo capaz de demostrar esta capacidad de asistencia en la co-programación, es, sin duda, un salto cualitativo y cuantitativo en la disciplina de la programación.
No sabemos qué va a pasar, pero probablemente estemos a las puertas de un gran cambio de paradigma en la ciencia de la computación, hasta el punto que, quizás, haya cambiado para siempre la forma de programar y aún no nos hayamos dado cuenta.
Contenido elaborado por Alejandro Alija, experto en Transformación Digital.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
El Pleno del Consejo de la Comunidad Valenciana ha aprobado un convenio de colaboración entre la Consejería de Participación, Transparencia, Cooperación y Calidad Democrática y la Universidad Politécnica de Valencia (UPV) con el objetivo de fomentar el desarrollo de actividades en materia de transparencia y datos abiertos durante el 2023.
De este modo, la Consejería de Transparencia destinará 65.000 euros para impulsar las actividades del convenio centradas en la apertura y reutilización de los datos presentes en los distintos niveles de las administraciones públicas.
Entre las acciones previstas, destaca la celebración de la tercera edición de Datathon de datos abiertos, un evento que busca incentivar el uso de los datos abiertos para desarrollar aplicaciones y servicios que aporten beneficios para la ciudadanía. Esta colaboración también apostará por promocionar la reutilización de datos relacionados con el ámbito empresarial, fomentando la innovación, difusión y sensibilización en distintos sectores.
De forma paralela, está planificado trabajar de forma conjunta con distintas entidades de la sociedad civil para establecer una serie de sensores inteligentes para recoger datos, a la par que se impulsará la realización de talleres y seminarios sobre periodismo de datos.
A su vez, se incluyen una serie de jornadas divulgativas dirigidas a difundir conocimiento sobre el uso y la compartición de los datos abiertos, la presentación del proyecto Datos y Mujeres o la difusión del depósito de datos abiertos de investigación o de transparencia en los algoritmos.
Igualmente, la colaboración contempla la programación de charlas y talleres para la promoción del uso de datos abiertos en institutos de Educación Secundaria, la integración de los datos abiertos en diferentes asignaturas del doctorado, el grado y el máster sobre Gestión y Administración Pública, el máster de Gestión Cultural y algunas materias trasversales de doctorado.
Por último, esta colaboración entre la universidad y la administración también busca promocionar y tutorizar gran parte de los trabajos en materia de transparencia y datos abiertos, entre los que se incluye la elaboración de una guía de reutilización de datos abiertos dirigida a reutilizadores, así como actividades de difusión de la Alianza para el Gobierno Abierto (OGP) y planes de acción de la Comunitat Valenciana.
Proyectos anteriores relacionados con los datos abiertos
Al margen del plan de actividades diseñado para este 2023 y detallado en las líneas anteriores, esta no es la primera vez que la Universidad Politécnica de Valencia y la Consejería de Participación y Transparencia trabajan conjuntamente en la divulgación y promoción de los datos abiertos. De hecho, para ser exactos, desde el Observatorio de Datos Abiertos y Transparencia perteneciente a la misma universidad, trabajan activamente por promover el valor y la compartición de los datos tanto en el ámbito universitario como social.
Sin ir más lejos, en línea con este trabajo divulgativo, el pasado 2022, desde la propia entidad impulsaron la iniciativa ‘Mujeres y Datos’, un proyecto que logró a reunir a varias mujeres del ámbito de los datos para hablar de su experiencia profesional, los retos y oportunidades que aborda el sector.
Entre las entrevistadas destacaron nombres como Sonia Castro, coordinadora de datos.gob.es, Ana Tudela, cofundadora de Datadista o Laura Castro, diseñadora de visualización de datos en Afective Advisory, entre otras muchas otras profesionales.
Asimismo, la primavera del año pasado y coincidiendo con el Día Internacional de los Datos Abiertos, tuvo lugar la segunda edición del Datathon, cuya finalidad fue impulsar el desarrollo de nuevas herramientas a partir de datos abiertos que estuviesen vinculadas al consumo responsable, el medioambiente o la cultura.
De este modo, esta particular alianza entre la Conselleria de Participación y Transparencia y la Universidad Politécnica de Valencia demuestra que no solo es posible dar a conocer el potencial de los datos abiertos, sino que además las oportunidades de divulgación se multiplican cuando las instituciones y el ámbito académico trabajan de forma coordinada y planificada sobre los mismos objetivos.
El impulso de la llamada economía del dato es una de las grandes prioridades en las que se encuentra trabajando actualmente la Unión Europea, en general, y España, en particular. Disponer de un mercado único digital de intercambio de datos es una de las claves para lograr este impulso entre los Estados miembro, y para ello, entran en juego los espacios de datos.
Data Spaces Business Alliance (DSBA)
Un espacio de datos es un ecosistema capaz de materializar la compartición voluntaria de datos entre sus participantes, respetando su soberanía sobre los mismos, esto es, siendo capaces de fijar las condiciones de su acceso y uso. La DSBA, fundada en 2021, está compuesta por los principales actores en la definición de estándares, modelos y marcos tecnológicos para la construcción y operación de espacios de datos. En concreto, la alianza está compuesta por la Big Data Value Association (BDVA), la Fundación FIWARE y las asociaciones Gaia-X European Association for Data and Cloud AISBL y la International Data Spaces Association (IDSA). El propósito de la alianza es acordar un marco tecnológico común que evite la fragmentación tecnológica de la actividad, así como la armonización en el mensaje y las actividades de difusión.
Technical Convergence Discussion Document
Respecto a la parte tecnológica, la DSBA publicó en septiembre de 2022 una primera aproximación a la deseada convergencia tecnológica.
El documento analiza técnicamente los puntos de anclaje para crear espacios de datos confiables, catálogos federados y mercados compartidos y la capacidad de definir políticas de uso de los datos (en base al uso de un lenguaje común). Esta capacidad para compartir respetando la soberanía del dueño de los datos es lo que hace de estos espacios algo novedoso y verdaderamente disruptor, pues por primera vez ofrece elementos técnicos con que controlar los riesgos asociados a la compartición de información.
Para conseguir la convergencia técnica, la asociación acordó el desarrollo de un marco mínimo viable (MVF, minimal viable framework) basado en tres pilares:
- Interoperabilidad en el intercambio de datos mediante la utilización del protocolo/API estándar de intercambio de datos NGSI-LD y los modelos de datos "Smart Data Models" ampliados para la adopción del modelo de información definido por la arquitectura IDS.
- Soberanía y confianza en el intercambio de datos mediante la adopción de un modelo descentralizado (Self-Sovereign Identity) como el propuesto por Gaia-X (con su Trust Framework) que emplearía la DLT (Distributed Ledger Technologies) impulsada por la Comisión Europea (EBSI). El resultado será un entorno de confianza compatible con la normativa eIDAS 2.0 de la UE.
- Servicios de creación de valor (intermediación) consistentes en un catálogo de datos descentralizado y servicios de comercialización basados en estándares del TM Forum.
La alianza considera que este MVF sería un buen punto de partida sobre el que trabajar para alcanzar la deseada convergencia tecnológica, contando y reutilizando piezas de las actuales soluciones aportadas por los distintos suministradores.
Ejemplo de mercado público de datos
El documento plantea el ejemplo de un proveedor de servicios de datos que ofrece su servicio en un mercado público de datos (Data Marketplace), de modo que los consumidores puedan acceder fácilmente a esta oferta. Además, los proveedores pueden también delegar el acceso a sus usuarios para modificar atributos del servicio que contratan.
Es un ejemplo que puede verse en detalle en el documento, éste resulta interesante porque entran en juego diferentes sistemas de autenticación, políticas de seguridad y acceso y, en definitiva, diferentes sistemas que deben interoperar entre sí.
Adicionalmente, se expone un ejemplo de integración entre el Data Marketplace y un catálogo de datos mediante el enfoque seguido por el proyecto europeo Horizonte 2020 'Digital Open Marketplace Ecosystem' (DOME). De esta manera, se crean las ofertas en el catálogo compartido y pueden ser consultadas posteriormente siguiendo las políticas de acceso definidas.

El documento explica, paso por paso y desde una perspectiva puramente técnica, las acciones a abordar por cada uno de los roles identificados, con el propósito de orientar potenciales escenarios que pudieran producirse en la realidad.
El futuro de la DSBA
La DSBA considera que el mencionado MVF es sólo el primer paso para la convergencia de las diferentes arquitecturas y tecnologías existentes en la construcción de espacios de datos. Los siguientes pasos de la alianza tendrán en cuenta los roles asignados a cada uno de los participantes. Más concretamente:
- IDSA: Desarrolla arquitecturas y estándares de espacios de datos. En particular, un modelo para conectores que garantiza la compartición soberana de datos de forma escalable.
- Gaia-X: Desarrolla y despliega una arquitectura, un modelo de gobernanza acorde a especificaciones de negocio para espacios de datos sectoriales, así como un set de herramientas (Gaia-X Federation Services toolkit) con que instanciar la interoperabilidad, componibilidad y transparencia de los servicios de infraestructura y datos en nube.
- FIWARE: Con un stack tecnológico que viene del mundo de los Gemelos Digitales, la comunidad desarrolla componentes software que permiten llevar a la práctica la construcción de espacios de datos.
Así mismo, la DSBA se marca como objetivos prioritarios:
- La compatibilidad de la arquitectura de IDS con un mecanismo de gestión de identidad basado en identificadores descentralizados.
- La integración de un catálogo federado como el propuesto con el bróker de metadatos propuesto en la arquitectura IDS.
- La definición de un vocabulario común.
- Avanzar conjuntamente con la labor del Data Space Support Center (un programa financiado por la Comisión Europea, y donde estas asociaciones desarrollan un papel protagonista), así como con los esfuerzos de normalización en base al proyecto ‘Smart Middleware Platform’ (SIMPL) de la CE.
Contenido elaborado por Juan Mañes, experto en Data Governance.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
A pesar de que parece un concepto novedoso, el término ‘inteligencia artificial’ ya se acuñó a mediados del pasado siglo. Sin embargo, su popularidad ha experimentado un aumento vertiginoso durante los últimos años gracias al incremento en los volúmenes de datos o la aplicación de algoritmos avanzados en situaciones cotidianas, entre otros aspectos.
La inteligencia artificial permite que las máquinas puedan aprender de la experiencia para realizar diversas tareas al estilo de los seres humanos. Para ello, sus técnicas de entrenamiento recurren con frecuencia al aprendizaje profundo o deep learning y al procesamiento del lenguaje natural (PLN), entre otras. Empleando estas tecnologías al servicio de la IA, las máquinas pueden ser entrenadas para llevar a cabo tareas muy específicas como el procesamiento de grandes cantidades de datos o el reconocimiento de patrones en estos.
¿Qué es la inteligencia artificial?
La Comisión Europea define la inteligencia artificial como la capacidad que presenta una máquina para imitar algunas de las características propias de la inteligencia del ser humano como son el aprendizaje, el razonamiento o la creatividad. Para ello las computadoras analizan la información disponible con el fin de alcanzar unos objetivos específicos.
La inteligencia artificial se encuentra formada a su vez por algunos subcampos basados en tecnologías como el Machine Learning o el Deep Learning. Ambas actividades tienen como fin la construcción de sistemas que tengan la capacidad de resolver problemas sin la necesidad de que un humano intervenga en ellos para solucionarlos.
¿Cuál es el papel que juegan los datos abiertos en la inteligencia artificial?
Para que la inteligencia artificial se desarrolle adecuadamente, los datos abiertos son sumamente importantes. Esto se debe a que sus algoritmos han de ser entrenados con datos de calidad que estén altamente disponibles, tal y como reflejan diversas estrategias y directrices de ámbito estatal y europeo como la Estrategia Nacional de Inteligencia Artificial, el Reglamento Europeo sobre Inteligencia Artificial o el Libro Blanco sobre Inteligencia Artificial.
Ejemplos de casos de uso de la inteligencia artificial
La aplicación de la inteligencia artificial permite que muchos campos puedan lograr mejoras en diversos procesos, servicios o aplicaciones . Algunos ejemplos son:
- Salud: la IA permite identificar diferentes patologías mediante el procesamiento de imágenes médicas, por ejemplo, a través de QMenta, que procesa y visualiza imágenes para realizar análisis de datos cerebrales.
- Medio ambiente: la IA permite realizar una gestión más eficiente de los bosques. Un ejemplo es Forecast, que ofrece herramientas para la toma de decisiones de gestores forestales.
- Economía: se utiliza la IA para optimizar la gestión de licitaciones, como sucede con la herramienta Arbatro Tender, diseñada para encontrar y elegir los concursos públicos más adecuados para cada empresa.
- Turismo: la IA permite el desarrollo de asistentes turísticos virtuales como Castilla y León Gurú, que presenta funciones avanzadas de PLN, detección de puntos de interés en imágenes y uso de contexto geolocalizado.
- Cultura: gracias a la IA es posible generar textos propios y resúmenes de otros ya existentes a través de procesamiento del lenguaje natural. MarIA ha sido la primera inteligencia artificial de la lengua española en lograrlo.
- Publicidad y redacción de contenidos: Sistemas de Inteligencia Artificial como Chat GPT permiten desarrollar textos a partir de peticiones concretas.
Como podemos observar, existen multitud de casos de uso que fusionan la inteligencia artificial y los datos abiertos para contribuir al progreso y bienestar de la sociedad. Te recomendamos que consultes esta práctica infografía en la que te ofrecemos más detalles, así como algunos artículos de interés como este sobre Dall-E para que puedas ampliar tu conocimiento.
Además, si deseas conocer más casos de uso relacionados, descubre el informe “Tecnologías emergentes y datos abiertos: Inteligencia Artificial”, que incluye un caso práctico paso a paso de reconocimiento y clasificación de imágenes.
Haz clic en la infografía para verla a tamaño real y poder acceder a los enlaces:
Puedes ver la infografía en tamaño completo haciendo click aquí.
La demanda de profesionales con habilidades relacionadas con la analítica de datos no deja de crecer y ya se estima que la industria solo en España necesitaría más de 90.000 profesionales en datos e inteligencia artificial para impulsar la economía. Formar profesionales que puedan llenar este hueco es un gran reto que está haciendo incluso grandes compañías tecnológicas como Google, Amazon o Microsoft estén proponiendo programas de formación especializado que en paralelo a los que propone el sistema educativo reglado. Y en este contexto los datos abiertos tienen un papel muy relevante en la formación práctica de estos profesionales, ya que con frecuencia, los datos abiertos son la única posibilidad para realizar ejercicios reales y no solo simulados.
Además, aunque aún no existe un corpus de investigación sólido al respecto, algunos trabajos ya sugieren efectos positivos derivados del uso de datos abiertos como herramienta en el proceso de enseñanza-aprendizaje de cualquier materia y no solo de las relacionadas con la analítica de datos. Algunos países europeos han reconocido ya este potencial y han desarrollado proyectos piloto para determinar la mejor forma de introducir datos abiertos en el currículo escolar.
En este sentido, los datos abiertos se pueden utilizar como una herramienta para la educación y la formación de varias maneras. Por ejemplo, los datos abiertos se pueden utilizar para desarrollar nuevos materiales de enseñanza y aprendizaje, para crear proyectos basados en datos del mundo real para estudiantes o para apoyar la investigación sobre enfoques pedagógicos efectivos. Además, los datos abiertos se pueden utilizar para crear oportunidades de colaboración entre educadores, estudiantes e investigadores con el fin de compartir mejores prácticas y colaborar en soluciones a desafíos comunes.
Proyectos basados en datos del mundo real
Una aportación clave de los datos abiertos es su autenticidad, ya que son una representación de la enorme complejidad e incluso de los defectos del mundo real a diferencia de las construcciones artificiales o los ejemplos de libros de texto que se basan en supuestos muchos más simples.
Un ejemplo interesante en este sentido es el que documentó la Universidad Simon Fraser de Canadá en su Máster en Edición donde la mayor parte de sus alumnos proceden de programas universitarios no STEM y que por tanto tenían unas capacidades limitadas en el manejo de datos. El proyecto está disponible como recurso educativo abierto en la plataforma OER Commons y su objetivo es que los estudiantes comprendan que las métricas y la medición son herramientas estratégicas importantes para comprender el mundo que nos rodea.
Al trabajar con datos del mundo real, los estudiantes pueden desarrollar habilidades de construcción de relatos e investigación, y pueden aplicar habilidades analíticas y colaborativas en el uso de datos para resolver problemas del mundo real. El caso de estudio realizado con la primera edición en la que se utilizó este OER basado en datos abiertos está documentado en el libro “Open Data as Open Educational Resources - Case studies of emerging practice”. En él se muestra que la oportunidad de trabajar con datos pertenecientes a su campo de estudio resultó esencial para mantener a los estudiantes comprometidos con el proyecto. Sin embargo, lidiar con el desorden de los datos del "mundo real" fue lo que les permitió obtener un aprendizaje valioso y nuevas habilidades prácticas.
Desarrollo de nuevos materiales de aprendizaje
Los conjuntos de datos abiertos tienen un gran potencial para ser utilizados en el desarrollo de recursos educativos abiertos (REA) que son materiales de enseñanza, aprendizaje e investigación en soporte digital de carácter gratuito, pues son publicados con una licencia abierta (Creative Commons) que permite su uso, adaptación y redistribución para usos no comerciales de acuerdo con la definición de la UNESCO.
En este contexto, si bien los datos abiertos no siempre son REA, podemos decir que se convierten en REA cuando se usan en contextos pedagógicos. Los datos abiertos cuando se utilizan como recurso educativo facilitan que los estudiantes aprendan y experimenten trabajando con los mismos conjuntos de datos que utilizan investigadores, gobiernos y sociedad civil. Son un componente clave para que los estudiantes desarrollen habilidades de análisis, estadísticas, científicas y de pensamiento crítico.
Es difícil estimar la presencia actual de los datos abiertos como parte de los REA pero no resulta difícil encontrar ejemplos interesantes dentro de las principales plataformas de recursos educativos abiertos. En la plataforma Procomún podemos encontrar interesantes ejemplos como Aprender Geografía a través de la evolución de los paisajes agrarios de España que construye sobre la plataforma ArcGIS Online de la Universidad Complutense de Madrid un Webmap para el aprendizaje de los paisajes agrarios en España. El recurso educativo emplea ejemplos concretos de distintas comunidades autónomas empleando fotografías o imágenes fijas geolocalizadas y datos propios integrados con datos abiertos. De este modo los estudiantes trabajan los conceptos no a través de una mera descripción en texto sino con recursos interactivos que favorecen además la mejora de sus competencias digitales y espaciales
En la plataforma OER Commons encontramos por ejemplo el recurso “De los datos abiertos al compromiso cívico” que está dirigido a públicos a partir de enseñanza secundaria con el objetivo de enseñar a interpretar cómo se gasta el dinero público en un área regional, local, o barrio determinado. Para ello se apoya en los conocidos proyectos para analizar presupuestos públicos “¿Dónde van mis impuestos?”, disponibles en muchas zonas del mundo como fruto de las políticas de transparencia de los poderes públicos. Este recurso que podría ser portado a España con facilidad ya que contamos con numerosos proyectos ¿Donde van mis impuestos?, como el mantenido por Fundación Civio.
Habilidades relacionadas con datos
Cuando nos referimos a la formación y educación en habilidades relacionadas con los datos, en realidad nos estamos refiriendo a un área de gran amplitud que además es muy difícil dominar en todas sus facetas. De hecho, lo habitual es que los proyectos relacionados con datos se aborden en equipos donde cada miembro desempeña un rol especializado en alguna de estas áreas. Por ejemplo, es habitual diferenciar al menos la limpieza y preparación de datos, el modelado de datos y la visualización de datos como las principales actividades que se realizan en un proyecto de ciencia datos e inteligencia artificial.
En todos los casos el uso de datos abiertos está ampliamente adoptado como recurso central de los proyectos que se proponen para la adquisición de cualquiera de estas habilidades. La muy conocida comunidad de ciencia de datos Kaggle organiza competiciones basadas en conjuntos de datos abiertos aportados a la comunidad y que constituyen un recurso esencial para el aprendizaje basado en proyectos reales de quienes quieren adquirir habilidades relacionadas con los datos. Existen otras propuestas basadas en suscripciones como Dataquest o ProjectPro pero en todos los casos utilizan para los proyectos que proponen conjuntos de datos reales obtenidos de los múltiples repositorios de datos abiertos de carácter general o repositorios específicos de un área de conocimiento.
Los datos abiertos, al igual que en otras áreas, aún no han desarrollado todo su potencial como herramienta para la educación y la formación. Sin embargo como puede verse en el programa de la última edición de la OER Conference 2022, cada vez son más los ejemplos en los que los datos abiertos tienen un papel central en la enseñanza, las nuevas prácticas educativas y la creación de nuevos recursos educativos para todo tipo de materias, conceptos y habilidades.
Contenido elaborado por Jose Luis Marín, Senior Consultant in Data, Strategy, Innovation & Digitalization.
Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.
