No hay duda de que la formación en competencias digitales es necesaria hoy en día. Los conocimientos digitales básicos son fundamentales para poder interactuar en una sociedad en la que la tecnología ya juega un papel transversal. En concreto, es importante conocer aspectos básicos de la tecnología para trabajar con datos.
En este contexto, las trabajadoras y trabajadores del sector público también deben mantenerse en constante actualización. Capacitarse en este ámbito es clave para optimizar procesos, garantizar la seguridad de la información y fortalecer la confianza en las instituciones.
En este post, identificamos habilidades digitales relacionadas con los datos abiertos tanto dirigidas a la publicación como al uso de estos. No solo identificamos las competencias profesionales que deben tener y mantener los empleados públicos que trabajan con open data, también recopilamos una serie de recursos formativos que están a su disposición.
Competencias profesionales para trabajar con datos
En el Encuentro Nacional de Datos Abiertos de 2024 se constituyó un grupo de trabajo con un objetivo: identificar las competencias digitales que debían tener los profesionales de la administración pública que trabajasen con datos abiertos. Más allá de las conclusiones de este evento de relevancia nacional, el grupo de trabajo definió perfiles y roles necesarios para la apertura de datos, recogiendo información sobre sus funciones y las capacidades y conocimientos necesarios. Los principales roles identificados fueron:
- Rol responsable: tiene funciones de responsabilidad técnica en el impulso de políticas de datos abiertos y organiza actividades de definición de las políticas y modelos de datos. Algunos conocimientos necesarios son:
- Liderazgo en el impulso de estrategias para impulsar la apertura del dato.
- Impulsar la estrategia del dato para impulsar la apertura con propósito.
- Comprender el marco normativo relacionado con los datos para actuar dentro de la legalidad en todo el ciclo de vida del dato.
- Fomentar el uso de herramientas y procesos para la gestión del dato.
- Capacidad de generar sinergias para consensuar instrucciones transversales a toda la organización.
- Rol técnico de apertura de datos (perfil TIC): desarrolla actividades de ejecución más vinculadas con la gestión de los sistemas, los procesos de extracción, limpieza de datos, etc. Este perfil debe conocer, por ejemplo:
- Cómo estructurar el conjunto de datos, el vocabulario de metadatos, calidad del dato, estrategia a seguir...
- Ser capaz de analizar un conjunto de datos e identificar los procesos de depuración y limpieza de manera rápida e intuitiva.
- Generar visualizaciones de datos, conectando bases de datos de diferentes formatos y orígenes, y así obtener gráficos, indicadores y mapas dinámicos e interactivos.
- Dominar las funcionalidades de la plataforma, es decir, saber aplicar soluciones tecnológicas para la gestión de datos abiertos o conocer técnicas y estrategias para acceder, extraer e integrar datos de diferentes plataformas.
- Rol funcional de apertura de datos (técnico de un servicio): ejecuta actividades más vinculadas con la selección de datos a publicar, la calidad, promoción de los datos abiertos, visualización, analítica de datos, etc. Por ejemplo:
- Manejar herramientas de visualización y dinamización.
- Conocer la economía del dato y conocer la información referente al dato en toda su extensión (generación por las AAPP, datos abiertos, infomediarios, reutilización de la información pública, Big Data, Data Driven, roles implicados, etc.).
- Conocer y aplicar los aspectos éticos y de protección de datos de carácter personal que aplican a la apertura de datos.
- Uso de datos por parte de los trabajadores públicos: este perfil lleva a cabo actividades sobre el uso de los datos para la toma de decisiones, analítica básica de datos, entre otros. Para ello, deberá tener estas competencias:
- Navegación, búsqueda y filtrado de datos.
- Evaluación de datos.
- Almacenamiento y explotación de datos.
- Análisis y explotación de datos.
Además, como parte de este reto para incrementar las capacidades para la apertura de datos, se elaboró un listado de formaciones y guías gratuitas en materia de datos abiertos y análisis de datos. Recopilamos algunas de ellas que están disponibles online y en formato abierto.
| Institución | Recurso | Enlace | Nivel |
|---|---|---|---|
| Centro Knight para el Periodismo en las Américas | Periodismo de datos y visualización con herramientas gratuitas | https://journalismcourses.org/es/course/dataviz/ | Principiante |
| Data Europa Academy | Introducción a los datos abiertos | https://data.europa.eu/en/academy/introducing-open-data | Principiante |
| Data Europa Academy | Comprender el lado legal de los datos abiertos | https://data.europa.eu/en/academy/understanding-legal-side-open-data | Principante |
| Data Europa Academy | Mejorar la calidad de los datos abiertos y los metadatos | https://data.europa.eu/en/academy/improving-open-data-and-metadata-quality | Avanzado |
| Data Europa Academy | Medir el éxito en las iniciativas de datos abiertos | https://data.europa.eu/en/training/elearning/measuring-success-open-data-initiatives | Avanzado |
| Escuela de Datos | Curso de tubería de datos – Data Pipeline | https://escueladedatos.online/curso/curso-tuberia-de-datos-data-pipeline/ | Intermedio |
| FEMP | Guía estratégica para su puesta en marcha – Conjuntos de datos mínimos a publicar | https://redtransparenciayparticipacion.es/download/guia-estrategica-para-su-puesta-en-marcha-conjuntos-de-datos-minimos-a-publicar/ | Intermedio |
| Datos.gob.es | Pautas metodológicas para la apertura de datos | /es/conocimiento/pautas-metodologicas-para-la-apertura-de-datos | Principiante |
| Datos.gob.es | Guía práctica para la publicación de datos abiertos usando APIs | /es/conocimiento/guia-practica-para-la-publicacion-de-datos-abiertos-usando-apis | Intermedio |
| Datos.gob.es | Guía práctica para la publicación de datos espaciales | /es/conocimiento/guia-practica-para-la-publicacion-de-datos-espaciales | Intermedio |
| Junta de Andalucía | Tratar conjuntos de datos con Open Refine | https://www.juntadeandalucia.es/datosabiertos/portal/tutoriales/usar-openrefine.html | Principiante |
Figura 1. Tabla de elaboración propia con recursos formativos. Fuente: https://encuentrosdatosabiertos.es/wp-content/uploads/2024/05/Reto-2.pdf
El Instituto Nacional de Administración Pública (INAP) cuenta con un Programa de Actividades Formativas para 2025, enmarcado en la Estrategia de Aprendizaje del INAP 2025-2028. Este catálogo formativo incluye más de 180 actividades organizadas en diferentes programas de aprendizaje, que se desarrollarán a lo largo del año con el objetivo de fortalecer las competencias del personal público en ámbitos clave como la gestión de datos abiertos y el uso de tecnologías relacionadas.
En el programa formativo de INAP para 2025 se ofrece una amplia variedad de cursos orientados a mejorar las capacidades digitales y la alfabetización en datos abiertos. Algunas de las formaciones destacadas incluyen:
- Fundamentos y herramientas del análisis de datos.
- Introducción a SQL de Oracle.
- Datos abiertos y reutilización de la información.
- Análisis y visualización de datos con Power BI.
- Blockchain: aspectos técnicos.
- Programación en Python avanzado.
Estos cursos, dirigidos a distintos perfiles de empleados públicos, desde responsables de datos abiertos hasta técnicos en gestión de información, permiten adquirir conocimientos sobre extracción, tratamiento y visualización de datos, así como sobre estrategias para la apertura y reutilización de datos abiertos en la Administración Pública. Puedes consultar el catálogo completo aquí.
Otras referencias formativas
Algunas administraciones públicas o entidades disponen de oferta de cursos de formación vinculadas a los datos abiertos. Para más información de su oferta formativa, se facilita el catálogo con la oferta de cursos programados.
- Red de entidades locales por la Transparencia y la Participación Ciudadana de la FEMP: https://redtransparenciayparticipacion.es/
- Gobierno de Aragón. Aragón Open Data: https://opendata.aragon.es/informacion/eventos-de-datos-abiertos
- Escuela de Administración Pública de Catalunya (EAPC): https://eapc.gencat.cat/ca/inici/index.html
- Diputació de Barcelona: http://aplicacions.diba.cat/gestforma/public/cercador_baf_ens_locals
- Instituto Geográfico Nacional (IGN): https://cursos.cnig.es/
En resumen, la formación en competencias digitales, en general, y en datos abiertos, en particular, es una práctica que recomendamos desde datos.gob.es. ¿Necesitas algún recurso formativo en específico? Escríbenos en comentarios, ¡te leemos!
Como cada año, desde el equipo de datos.gob.es te deseamos unas felices fiestas. Si esta Navidad te apetece regalar o autorregalarte conocimiento, te traemos nuestra tradicional carta navideña con ideas para pedir a Papá Noel o a los Reyes Magos.
Tenemos una selección de libros sobre temáticas variadas como la protección de datos, las novedades en IA o los grandes descubrimientos científicos del siglo XX. Todas estas recomendaciones que van del género ensayístico a la novela serán un acierto seguro para colocar debajo del árbol.
Maniac de Benjamín Labatut
- ¿De qué va? Guiado por la figura de John von Neumann, uno de los grandes genios del siglo XX, el libro recorre temas como la creación de las bombas atómicas, la Guerra Fría, el nacimiento del universo digital y el auge de la inteligencia artificial. La historia comienza con el trágico suicidio de Paul Ehrenfest y avanza a través de la vida de von Neumann, quien presagió la llegada de una singularidad tecnológica. El libro culmina con la confrontación entre un hombre y una máquina, en un enfrentamiento épico en el juego de Go, que sirve como advertencia sobre el futuro de la humanidad y sus creaciones.
- ¿A quién va dirigido? Esta novela de ciencia ficción está dirigida a toda persona interesada en la historia de la ciencia, la tecnología y sus implicaciones filosóficas y sociales. Es ideal para quienes disfrutan de narrativas que combinan el thriller con profundas reflexiones sobre el futuro de la humanidad y el avance tecnológico. También es adecuado para aquellos que buscan una obra literaria que se adentre en los límites del pensamiento, la razón y la inteligencia artificial.
Toma el control de tus datos, de Alicia Asin
- ¿De qué va? Este libro recopila recursos para comprender mejor el entorno digital en el que vivimos, utilizando ejemplos prácticos y definiciones claras que facilitan que cualquiera pueda entender cómo las tecnologías afectan nuestra vida personal y social. Además, nos invita a ser más conscientes de las consecuencias del uso indiscriminado de nuestros datos, desde el rastro digital que dejamos o el manejo de nuestra privacidad en las redes sociales, hasta el comercio en la dark web. También alerta sobre el uso legítimo, pero a veces invasivo que muchas empresas hacen de nuestros comportamientos en línea.
- ¿A quién va dirigido? La autora de este libro es CEO de la empresa reutilizadora de datos Libelium que participó en uno de nuestros Encuentros Aporta y es una experta referente en privacidad, uso apropiado de los datos y espacios de datos, entre otros. En este libro ofrece una perspectiva empresarial a través de una obra dirigida al público general.
Gobierno, gestión y calidad de la inteligencia artificial de Mario Geraldo Piattini
- ¿De qué va? La inteligencia artificial está cada vez más presente en nuestra vida diaria y en la transformación digital de empresas y organismos públicos ofreciendo tanto beneficios como posibles riesgos. Para aprovechar correctamente las ventajas de la IA y evitar problemáticas es muy importante contar con sistemas éticos, legales y responsables. En este libro se ofrece una visión general de las principales normas y herramientas para gestionar y asegurar la calidad de los sistemas inteligentes. Para ello, aporta ejemplos claros sobre las mejores prácticas disponibles.
- ¿A quién va dirigido? Aunque cualquier persona puede leerlo, el libro proporciona herramientas para ayudar a las empresas a afrontar los desafíos de la IA, creando sistemas que respeten principios éticos y se alineen con las mejores prácticas ingenieriles.
Nexus, de Yuval Noah
- ¿De qué va? En esta nueva entrega, uno de los escritores de moda, analiza cómo las redes de la información han moldeado la historia humana, desde la Edad de Piedra hasta la era actual. Este ensayo explora la relación entre la información, la verdad, la burocracia, la mitología, la sabiduría y el poder, y cómo diferentes sociedades han utilizado la información para imponer orden, con consecuencias tanto positivas como negativas. En este contexto, el autor plantea las urgentes decisiones que debemos tomar frente a las amenazas actuales, como el impacto de la inteligencia no humana en nuestra existencia.
- ¿A quién va dirigido? Es una obra mainstream, es decir, cualquier persona puede leerlo y lo más probable es que disfrute de su lectura. Es una opción especialmente atractiva para lectores que buscan reflexionar sobre el papel de la información en la sociedad moderna y sus implicaciones para el futuro de la humanidad, en un contexto donde las tecnologías emergentes, como la inteligencia artificial, están desafiando nuestra forma de vida.
Generative Deep Learning: Teaching Machines to Paint, Write, Compose, and Play de David Foster (segunda edición 2024)
- ¿De qué va? Este libro práctico nos sumerge en el fascinante mundo del aprendizaje profundo generativo, explorando cómo las máquinas pueden crear arte, música y texto. A través de sus páginas, Foster nos guía por las arquitecturas más innovadoras como VAEs, GANs y modelos de difusión, explicando cómo estas tecnologías pueden transformar fotografías, generar música e incluso escribir textos. El libro comienza con los fundamentos del deep learning y progresa hacia aplicaciones de vanguardia, incluyendo la creación de imágenes con Stable Diffusion, la generación de texto con GPT y la composición musical con MuSEGAN. Es una obra que combina el rigor técnico con la creatividad artística.
- ¿A quién va dirigido? Este manual técnico está pensado para ingenieros de machine learning, científicos de datos y desarrolladores que quieran adentrarse en el campo del aprendizaje profundo generativo. Es ideal para aquellos que ya tienen una base en programación y machine learning, y desean explorar cómo las máquinas pueden crear contenido original. También resultará valioso para profesionales creativos interesados en entender cómo la IA puede amplificar sus capacidades artísticas. El libro encuentra el equilibrio perfecto entre la teoría matemática y la implementación práctica, haciendo accesibles conceptos complejos mediante ejemplos concretos y código funcional.
Information is beautiful, de David McCandless
- ¿De qué va? Esta guía visual en inglés nos ayuda a entender cómo funciona el mundo a través de impactantes infografías y visualizaciones de datos. Esta nueva edición ha sido completamente revisada, con más de 20 actualizaciones y 20 nuevas visualizaciones. Presenta la información de una manera que se puede hojear fácilmente, pero que también invita a una exploración más profunda.
- ¿A quién va dirigido? Este libro está dirigido a cualquier persona interesada en ver y comprender la información de una manera diferente. Es perfecto para aquellos que buscan una forma innovadora y visualmente atractiva de entender el mundo que nos rodea. Además, es ideal para quienes disfrutan de explorar datos, hechos y sus interrelaciones de una forma entretenida y accesible.
Collecting Field Data with QGIS and Mergin Maps, de Kurt Menke y Alexandra Bucha Rasova.
- ¿De qué va? Este libro en inglés te enseña a dominar la plataforma Mergin Maps para recopilar, compartir y gestionar datos de campo utilizando QGIS. La obra abarca desde los conceptos básicos, como la configuración de proyectos en QGIS y la realización de encuestas de campo, hasta flujos de trabajo avanzados para personalizar proyectos y gestionar colaboraciones. Además, se incluyen detalles sobre cómo crear mapas, configurar capas de encuesta y trabajar con formularios inteligentes para la recolección de datos.
- ¿A quién va dirigido? Aunque es una opción algo más técnica que las propuestas anteriores, el libro está dirigido a nuevos usuarios de Mergin Maps y QGIS. También es útil para quienes ya estén familiarizados con estas herramientas y buscan profundizar en flujos de trabajo más avanzados.
Un verdor terrible de Benjamin Labatut
- ¿De qué va? Este libro es una fascinante mezcla de ciencia y literatura, que narra descubrimientos científicos y sus implicaciones, tanto positivas como negativas. A través de historias impactantes, como la creación del azul de Prusia y su conexión con la guerra química, las exploraciones matemáticas de Grothendieck y la lucha entre científicos como Schrödinger y Heisenberg, el autor, Benjamín Labatut, nos lleva a explorar los límites de la ciencia, las locuras del conocimiento y las consecuencias imprevistas de los avances científicos. La obra convierte la ciencia en literatura, presentando a los científicos como personajes complejos y humanos.
- ¿A quién va dirigido? El libro está dirigido a un público general interesado en la ciencia, la historia de los descubrimientos y las historias humanas detrás de ellos, con un enfoque en aquellos que buscan una aproximación literaria y profunda a temas científicos. Es ideal para quienes disfrutan de obras que exploran la complejidad del conocimiento y sus efectos en el mundo.
Designing Better Maps: A Guide for GIS Users, de Cynthia A. Brewer.
- ¿De qué va? Es una guía en inglés escrita por la experta cartógrafa que enseña a crear mapas exitosos utilizando cualquier herramienta GIS o de ilustración. A través de sus 400 ilustraciones a todo color, el libro cubre las mejores prácticas de diseño cartográfico aplicadas tanto a mapas de referencia como a mapas estadísticos. Los temas incluyen planificación de mapas, uso de mapas base, manejo de escala y tiempo, explicación de mapas, publicación y compartición, uso de tipografía y etiquetas, comprensión y uso del color, y personalización de símbolos.
- ¿A quién va dirigido? Este libro está dirigido a todos los usuarios de sistemas de información geográfica (GIS), desde principiantes hasta cartógrafos avanzados, que deseen mejorar sus habilidades en diseño de mapas.
Aunque en el post vinculamos muchos enlaces de compra. Si te interesa alguna opción, te animamos que preguntes en la librería de tu barrio para apoyar al pequeño comercio durante las fiestas. ¿Conoces algún otro título interesante? Escríbelo en comentarios o envíanoslo a dinamizacion@datos.gob.es. ¡Te leemos!
La ciencia ciudadana se está consolidando como una de las fuentes de referencia más relevantes en la investigación contemporánea. Así lo reconoce el Centro Superior de Investigaciones Científicas (CSIC) que define la ciencia ciudadana como una metodología y un medio para el fomento de la cultura científica en la que confluyen estrategias propias de la ciencia y de la participación ciudadana.
Ya hablamos hace un tiempo de la importancia que la ciencia ciudadana tenía en la sociedad. Hoy en día, los proyectos de ciencia ciudadana no solo han aumentado en número, diversidad y complejidad, sino que también han impulsado un significativo proceso de reflexión sobre cómo la ciudadanía puede contribuir activamente a la generación de datos y conocimiento.
Para llegar a este punto, programas como Horizonte 2020, que reconocía explícitamente la participación ciudadana en ciencia, han jugado un papel fundamental. Más en concreto, el capítulo "Ciencia con y para la sociedad” dio un importante empuje a este tipo de iniciativas en Europa y también en España. De hecho, a raíz de la participación española en dicho programa, así como en iniciativas paralelas, los proyectos españoles han ido aumentando su envergadura y las conexiones con iniciativas internacionales.
Este creciente interés por la ciencia ciudadana también se traduce en políticas concretas. Ejemplo de ello es la actual Estrategia Española de Ciencia, Tecnología e Innovación (EECTI), para el periodo 2021-2027 que incluye “la responsabilidad social y económica de la I+D+I a través de la incorporación de la ciencia ciudadana”.
En definitiva, comentamos hace un tiempo, las iniciativas de ciencia ciudadana buscan incentivar una ciencia más democrática, que responda a los intereses de toda la ciudadanía y que genere información que se pueda reutilizar en pro de la sociedad. A continuación, mostramos algunos ejemplos de proyectos de ciencia ciudadana que ayudan a recolectar datos cuya reutilización puede tener un impacto positivo en la sociedad:
Proyecto AtmOOs Academic: Educación y ciencia ciudadana sobre contaminación atmosférica y movilidad.
En este programa, Thigis desarrolló una prueba piloto de ciencia ciudadana sobre movilidad y medio ambiente con los alumnos de un colegio del distrito del Eixample de Barcelona. Este proyecto, que ya es replicable en otros centros educativos, consiste en recoger datos de patrones de movilidad del alumnado para analizar cuestiones relacionadas con la sostenibilidad.
En la web de AtmOOs Academic se pueden visualizar los resultados de todas las ediciones que llevan realizándose anualmente desde el curso 2017-2018 y muestran información sobre los vehículos que emplean los alumnos para ir a clase o las emisiones generadas según etapa escolar.
WildINTEL: Proyecto de investigación sobre el monitoreo de vida en Huelva
La Universidad de Huelva y la Agencia Estatal de Investigaciones Científicas (CSIC) colaboran para construir un sistema de monitoreo de vida silvestre para obtener las variables esenciales de biodiversidad. Para llevarlo a cabo, se utilizan cámaras de fototrampeo de captura remota de datos e inteligencia artificial.
El proyecto WildINTEL se centra en el desarrollo de un sistema de monitoreo que sea escalable y reproducible, facilitando así la recolección y gestión eficiente de datos sobre biodiversidad. Este sistema incorporará tecnologías innovadoras para proporcionar estimaciones demográficas precisas y objetivas de las poblaciones y comunidades.
A través de este proyecto, que empezó en diciembre de 2023 y seguirá ejecutándose hasta diciembre de 2026, se espera conseguir herramientas y productos para mejorar la gestión de la biodiversidad no solo en la provincia de Huelva sino en toda Europa.
IncluScience-Me: Ciencia ciudadana en el aula para impulsar la cultura científica y la conservación de la biodiversidad.
Este proyecto de ciencia ciudadana que combina educación y biodiversidad surge de la necesidad de abordar la investigación científica en las escuelas. Para ello, el alumnado toma el rol de persona investigadora para abordar un reto real: rastrear e identificar los mamíferos que habitan en sus entornos cercanos para ayudar a la actualización de un mapa de distribución y, por ende, a su conservación.
IncluScience-Me nace en la Universidad de Córdoba y, en concreto, en el Grupo de Investigación en Educación y Gestión de la Biodiversidad (Gesbio), y ha sido posible gracias a la participación de la Universidad de Castilla-La Mancha y el Instituto de Investigación en Recursos Cinegéticos de Ciudad Real (IREC), con la colaboración de la Fundación Española para la Ciencia y la Tecnología - Ministerio de Ciencia, Innovación y Universidades.
La Memoria del Rebaño: Corpus documental de la vida pastoril.
Este proyecto de ciencia ciudadana que lleva activo desde julio de 2023 tiene como objetivo recabar conocimientos y experiencias de pastores y pastoras, en activo y jubilados, sobre el manejo de rebaños y la actividad ganadera.
La entidad responsable del programa es el Institut Català de Paleoecología Humana i Evolució Social aunque también colaboran el Museu Etnogràfic de Ripoll, Institució Milà i Fontanals-CSIC, Universidad Autònoma de Barcelona y Universidad Rovira i Virgili.
A través del programa, se ayuda a interpretar el registro arqueológico y contribuye a conservar los conocimientos de la práctica pastoril. Además, pone en valor la experiencia y los conocimientos de las personas mayores, un trabajo que contribuye a acabar con la connotación negativa de la “vejez” en una sociedad que prima la “juventud”, es decir, que pasen de ser considerados sujetos pasivos a ser considerados sujetos sociales activos.
Plastic Pirates España: Estudio de la contaminación por plástico en ríos europeos.
Es un proyecto de ciencia ciudadana que se ha llevado a cabo durante el último año con jóvenes de entre 12 y 18 años de las comunidades de Castilla y León y Cataluña pretende contribuir a generar evidencias científicas y concienciación ambiental sobre los residuos plásticos en los ríos.
Para ello, grupos de jóvenes de diferentes centros educativos, asociaciones y agrupaciones juveniles, han participado en campañas de muestreo donde se recogen datos de la presencia de residuos y basuras, principalmente plásticos y microplásticos en las riberas y agua de los ríos.
En España este proyecto lo ha coordinado el Centro Tecnológico BETA de la Universidad de Vic - Universidad Central de Cataluña junto a la Universidad de Burgos y la Fundación Oxígeno. Puedes acceder a más información en su página web.
Estos son algunos ejemplos de proyectos de ciencia ciudadana. Puedes consultar más en el Observatorio de Ciencia Ciudadana en España, una iniciativa que recoge múltiples recursos didácticos, informes y más información de interés sobre la ciencia ciudadana y su impacto en España. ¿Conoces algún otro proyecto? Mándanoslo a dinamizacion@datos.gob.es y podemos darlo a conocer a través de nuestros canales de difusión.
La alfabetización en datos se ha convertido en un asunto crucial en la era digital. Este concepto se refiere a la capacidad de las personas para comprender el uso que se hace de los datos, así como para acceder a ellos, crearlos, analizarlos, utilizarlos o reutilizarlos, y comunicarlos.
Vivimos en un mundo donde los datos y los algoritmos influyen en decisiones cotidianas y en las oportunidades que tiene la gente para vivir bien. Su efecto se puede sentir en áreas que incluyen desde la publicidad y la oferta de empleo, hasta la justicia penal y las ayudas sociales. Por ello es fundamental comprender cómo se generan y utilizan los datos.
La alfabetización en datos puede implicar muchas áreas, pero nos vamos a centrar en su relación con los derechos digitales por una parte y la Inteligencia artificial (IA) por otro. Este artículo propone explorar la importancia de la alfabetización en datos para la ciudadanía, abordando sus implicaciones en la protección de los derechos individuales y colectivos y la promoción de una sociedad más informada y crítica en un contexto tecnológico donde la inteligencia artificial cobra cada vez más importancia.
El contexto de los derechos digitales
Cada vez hay más estudios que indican que una participación efectiva en la sociedad actual –impulsada por los datos y presidida por algoritmos— requiere de una alfabetización en datos. Los derechos civiles se traducen cada vez más en derechos digitales a medida que nuestra sociedad se vuelve más dependiente de las tecnologías y entornos digitales. Esta transformación se manifiesta de varias maneras:
- Por un lado, los derechos reconocidos en constituciones y declaraciones de derechos humanos se están adaptando explícitamente al contexto digital. Por ejemplo, la libertad de expresión ahora incluye la libertad de expresión en línea, y el derecho a la privacidad se extiende a la protección de datos personales en entornos digitales. Además, algunos derechos civiles tradicionales se están reinterpretando en el contexto digital. Una muestra de ello es el derecho a la igualdad y no discriminación, que ahora incluye la protección contra la discriminación algorítmica y contra los sesgos en sistemas de inteligencia artificial. Otro ejemplo es el derecho a la educación, que se extiende ahora también al derecho a la educación digital. La importancia de las habilidades digitales en la sociedad se reconoce en varios marcos legales y documentos, tanto a nivel nacional como internacional, como por ejemplo la Ley Orgánica 3/2018 de Protección de Datos Personales y garantía de los derechos digitales (LOPDGDD), en España. Por último, el derecho de acceso a Internet se está considerando cada vez más como un derecho fundamental, similar al acceso a otros servicios básicos.
- Por otro lado, están surgiendo derechos que abordan desafíos únicos del mundo digital, como el derecho al olvido (vigente en la Unión Europea y algunos otros países que han adoptado legislaciones similares1), que permite a las personas solicitar la eliminación de la información personal disponible en línea, bajo ciertas condiciones. Otro ejemplo puede ser el derecho a la desconexión digital (en vigor en varios países, principalmente en Europa2), que garantiza que los y las trabajadoras puedan desconectarse de dispositivos y comunicaciones laborales fuera del horario de trabajo. De la misma forma, existe el derecho a la neutralidad de Internet para asegurar un acceso equitativo a los contenidos en línea sin discriminación por parte de los proveedores de servicios, un derecho que también este derecho está establecido en varios países y regiones, aunque su implementación y alcance pueden variar. La UE tiene regulaciones que protegen la neutralidad de la red, incluido el Reglamento 2015/2120, que establece normas para salvaguardar el acceso abierto a Internet. La Ley de Protección de Datos española contempla la obligación de los proveedores de Internet de proporcionar una oferta transparente de servicios sin discriminación por motivos técnicos o económicos. Además, el derecho de acceso a Internet –relacionado con la neutralidad de la red— está reconocido como un derecho humano por la Organización de las Naciones Unidas (ONU).
Esta transformación de los derechos refleja la creciente importancia de las tecnologías digitales en todos los aspectos de nuestras vidas.
El contexto de la inteligencia artificial
La relación entre el desarrollo de la IA y los datos es fundamental y simbiótica, ya que los datos sirven como base para el desarrollo de la IA de varias maneras:
- Se utilizan datos para entrenar algoritmos de IA, lo que les permite aprender, detectar patrones, hacer predicciones y mejorar su rendimiento con el tiempo.
- La calidad y la cantidad de datos afectan directamente la precisión y la confiabilidad de los sistemas de IA. En general, los conjuntos de datos más diversos y completos conducen a modelos de IA de mejor rendimiento.
- La disponibilidad de datos en varios dominios puede permitir el desarrollo de sistemas de IA para diferentes casos de uso.
Por ello, la alfabetización de datos se ha vuelto cada vez más crucial en la era de la IA, ya que forma la base para aprovechar y comprender de manera eficaz las tecnologías de IA.
Además, el auge de los macrodatos y de los algoritmos ha transformado los mecanismos de participación, presentando tanto desafíos como oportunidades. Los algoritmos, aunque puedan estar diseñados para ser justos, a menudo reflejan los prejuicios de sus creadores o de los datos con los que se entrenan. Esto puede llevar a decisiones que afectan negativamente a grupos vulnerables.
En este sentido, se están llevando a cabo esfuerzos desde el punto de vista legislativo y académico para evitar que esto ocurra. Por ejemplo, la Ley de Inteligencia Artificial (AI Act) europea incluye garantías para evitar sesgos perjudiciales en la toma de decisiones algorítmica. Por ejemplo, clasifica los sistemas de IA según su nivel de riesgo potencial e impone requisitos más estrictos a aquellos de alto riesgo. Además, se exige el uso de datos de alta calidad para entrenar los algoritmos, minimizando los sesgos, y establece mantener documentación detallada sobre el desarrollo y funcionamiento de los sistemas, permitiendo auditorías y evaluaciones con supervisión humana. Asimismo, esta ley refuerza los derechos de las personas afectadas por decisiones de la IA, incluido el derecho a impugnar las decisiones tomadas y su explicabilidad, permitiendo a las personas afectadas entender cómo se llegó a una decisión.
La importancia de la alfabetización digital en ambos contextos
La alfabetización de datos ayuda a la ciudadanía a tomar decisiones informadas y entender todas las implicaciones de sus derechos digitales, que también se consideran, en muchos aspectos, como se ha referido anteriormente, derechos civiles universales. En este contexto, la alfabetización de datos sirve como un filtro crítico para una plena participación cívica que permita a la ciudadanía influir en las decisiones políticas y sociales. Es decir, quienes tienen el acceso a los datos y las habilidades y herramientas para navegar por la infraestructura de datos de manera efectiva pueden intervenir e influir de manera significativa en los procesos políticos y sociales, algo que promueve la Open Government Partnership.
Por otro lado, la alfabetización en datos permite a la ciudadanía cuestionar y entender estos procesos, fomentando una cultura de responsabilidad y transparencia en el uso de la IA. Asimismo, existen barreras para participar en entornos impulsados por datos. Una de estas barreras es la brecha digital (es decir, la privación del acceso a infraestructuras, conectividad y formación, entre otras) y, de hecho, la falta de alfabetización en datos. Por tanto, esta última se presenta como un concepto crucial para superar los desafíos que plantea la datificación de las relaciones humanas y la plataformización de los contenidos y servicios.
Recomendaciones para implementar una sociedad preparada
Parte de la solución para abordar los desafíos que propone el desarrollo de la tecnología digital es incluir la alfabetización en datos en los currículos educativos desde una edad temprana.
Esto debería abarcar:
- Conceptos básicos de datos: comprensión de qué son los datos, cómo se recopilan y se utilizan.
- Análisis crítico: adquisición de las habilidades para evaluar la calidad y la fuente de los datos e identificar sesgos en la información presentada. Se busca reconocer los potenciales sesgos que los datos puedan contener y que se puedan producir en el procesamiento de dichos datos, además de impulsar la capacidad para actuar en favor de la apertura de datos y su uso para el bien común.
- Derechos y regulaciones: información sobre los derechos de protección de datos y cómo las leyes europeas afectan al uso de la IA. Este ámbito abarcaría toda regulación presente y futura que afecte al uso de los datos y su implicación en tecnología como la IA.
- Aplicaciones prácticas: la posibilidad de crear, usar y reusar datos abiertos disponibles en los portales habilitados por gobiernos y administraciones públicas, para generar así proyectos y oportunidades que permitan a las personas trabajar con datos reales, promoviendo un aprendizaje activo, contextualizado y continuo.
Al educar sobre el uso y la interpretación de los datos, se fomenta una sociedad más crítica y capaz de demandar responsabilidad en el uso de la IA. Las nuevas leyes de protección de datos en Europa ofrecen un marco que, junto con la educación, puede ayudar a mitigar los riesgos asociados con el abuso algorítmico y promover un uso ético de la tecnología. En una sociedad datificada, en la que los datos desempeñan un papel fundamental, existe la necesidad de fomentar la alfabetización de datos en la ciudadanía desde edad temprana.
1. El derecho al olvido se estableció por primera vez en mayo de 2014 a raíz de una resolución del Tribunal de Justicia de la Unión Europea. Posteriormente, en 2018, se reforzó con el Reglamento General de Protección de Datos (RGPD), que lo incluye explícitamente en su artículo 17 como "derecho de supresión". En julio de 2015, Rusia aprobó una ley que permite a los ciudadanos solicitar la eliminación de enlaces en los buscadores rusos si la información "infringe la legislación rusa o si es falsa o se ha quedado obsoleta". Turquía ha establecido su propia versión del derecho al olvido, siguiendo un modelo similar al de la UE. Serbia también ha implementado una versión del derecho al olvido en su legislación. En España, la Ley Orgánica de Protección de Datos Personales (LOPD) regula el derecho al olvido, especialmente en lo que respecta a ficheros de morosos. En Estados Unidos, el derecho al olvido se considera incompatible con la Constitución, principalmente debido a la fuerte protección de la libertad de expresión. Sin embargo, existen algunas regulaciones relacionadas, como la Fair Credit Reporting Act de 1970, que permite en ciertas situaciones la eliminación de información antigua o caduca en informes crediticios.
2. Algunos países en los que se ha establecido este derecho incluyen España, regulado por el artículo 88 de la Ley Orgánica 3/2018 de Protección de Datos Personales; Francia, que, en 2017, se convirtió en el primer país en aprobar una ley sobre el derecho a la desconexión digital; Alemania, incluido en la Ley de Horarios de Trabajo y de Descanso (Arbeitszeitgesetz); Italia, dentro de la Ley 81/201, y Bélgica. Fuera de Europa, está, por ejemplo, en Chile.
Contenido elaborado por Miren Gutiérrez, Doctora e investigadora en la Universidad de Deusto, experta en activismo de datos, justicia de datos, alfabetización de datos y desinformación de género. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor
Los datos abiertos deben ser accesibles por naturaleza, es decir, deben estar disponibles de forma gratuita y sin barreras que puedan restringir su acceso y reutilización. La accesibilidad es una cuestión fundamental y compleja, ya que significa que estos conjuntos de datos no solo deben estar disponibles en formatos reutilizables, sino que cualquier persona debe poder acceder a ellos e interpretarlos.
Para que el acceso a la información de los datos abiertos sea democrático, estos deben cumplir unos criterios de accesibilidad fundamentales que afectan tanto al soporte (web) como a la forma en que se muestra su contenido (por ejemplo, a través de visualizaciones). En este contexto, este post profundiza en los principios esenciales para asegurar que los datos abiertos sean inclusivos y útiles para una audiencia diversa. Descubre recomendaciones dirigidas a mejorar la accesibilidad de los portales y plataformas de datos abiertos, así como buenas prácticas para la visualización de datos, con el foco puesto en la importancia de un diseño inclusivo que considere las necesidades de todos los usuarios.
Niveles de accesibilidad web
Si nos centramos en el soporte, los portales de datos abiertos pueden tomar como fuente de referencia en accesibilidad web las especificaciones que identifica World Wide Web Consortium (W3C), principal organización internacional de normalización y la estandarización de la Web, que establece pautas de accesibilidad que debe cumplir una web.
-
Perceptible: La información y los componentes de la interfaz de usuario deben presentarse a los usuarios de forma que puedan percibirlos, independientemente de las dificultades físicas o cognitivas que puedan tener.
-
Operable: Los componentes de la interfaz de usuario y la navegación deben ser manejables. Por lo tanto, los usuarios que utilicen el teclado en lugar del ratón deben poder interactuar correctamente con una página web, no debe imponerse a los usuarios un límite de tiempo para completar las interacciones y deben ofrecerse formas de navegar y encontrar contenidos fácilmente.
-
Comprensible: El texto debe ser claro y fácil de entender, la interfaz de usuario y la navegación deben ser coherentes y predecibles, y las páginas web deben ayudar a los usuarios cuando cometan errores al rellenar un formulario, por ejemplo.
-
Robusta: El contenido debe ser sólido para que lo interpreten con fiabilidad varios navegadores web y otros programas informáticos, como lectores de pantalla.
Para cada pauta existen criterios de conformidad que se pueden comprobar. Estos criterios se clasifican en tres niveles: A, AA, AAA.
Los niveles, de menos a más, son:
A. Mínimo: Todos los contenidos no textuales como imágenes y vídeos deben tener alternativa textual; los vídeos y audios deben tener subtítulos; se debe poder navegar por el contenido de la página sólo con el teclado; la página debe tener un título claro y un idioma asignado.
AA. Aceptable: Además de todos los requisitos del nivel A, se suman otras funcionalidades como, por ejemplo, los vídeos en directo deben tener también subtítulos; la relación de contraste entre el texto y el fondo debe ser al menos de 4,5:1; el texto debe ser redimensionable hasta el 200% sin perder contenido ni funcionalidad; no deben utilizarse imágenes de texto.
AAA. Óptimo: Este nivel exige todas las características de los niveles A y AA, junto a otros requisitos como la interpretación de vídeos en lengua de signos o la relación de contraste entre el texto y el fondo de al menos de 7:1.
Webs y visualizaciones de datos abiertos accesibles
Teniendo en cuenta las condiciones y recomendaciones que marca W3C, el Portal Europeo de Datos abiertos ofrece una Guía de Visualización de Datos que recoge las mejores prácticas de accesibilidad en la visualización de datos. Siguiendo las directrices que marca esta Guía, para respetar la inclusividad desde el diseño, una buena visualización de datos debe cumplir tres condiciones: que se pueda percibir, que se pueda entender y que se pueda adaptar.
- Que se pueda percibir: los colores deben estar adaptados para personas con problemas de visión, la fuente debe tener el tamaño y contraste adecuado.
- Que se pueda entender: la interfaz debe ser amigable para el usuario e intuitiva. Siempre y cuando sea posible, el gráfico debe ser comprensible independientemente de la formación del usuario.
- Que se pueda adaptar: la visualización debe ser responsive, es decir, que se adapte a las dimensiones de cada dispositivo electrónica, flexible, editable o con opciones de visualización para personas con discapacidad cognitiva.
Una vez hemos identificado estas tres condiciones, podemos analizar si nuestro gráfico cumple con ellas prestando atención a cuestiones como el uso de una paleta de color adecuada para personas con problemas de visión, que cuente con buen contraste y un título y texto entendible. También es recomendable que lleven un texto alternativo (adaptado a personas con discapacidad intelectual) e incluso, cuando se considere necesario, una guía de visualización para entender el gráfico.
Herramientas para mejorar la accesibilidad
Para emplear los principios de accesibilidad en la visualización de datos podemos hacer uso de tres recursos:
- Herramientas para auditar la accesibilidad: También es una buena práctica realizar auditorías de accesibilidad, por ejemplo, con Chartability que analiza los sitios web teniendo en cuenta todos los aspectos relacionado con la inclusión.
- HTML: Lenguaje de marcado fundamental de la web se desarrolló pensando en la accesibilidad, por lo que utilizar sus elementos de forma semánticamente correcta es una forma sencilla de garantizar un nivel básico de accesibilidad. Esto se aplica al contexto de una visualización (que debe utilizar elementos como encabezados y párrafos de forma correcta, por ejemplo), a los elementos interactivos (como enlaces, botones y entradas) y a los elementos de una visualización propiamente dicha. Es decir, siempre que sea posible es mejor ofrecer una visualización con html que en formato imagen (jpg o png). Cuando no sea posible, será necesario dotar de una alternativa accesible (un alternative text, como se mencionaba anteriormente).
- SVG: Los gráficos vectoriales escalables o gráficos vectoriales redimensionables (del inglés: Scalable Vector Graphics (SVG) es un formato de gráficos vectoriales bidimensionales, tanto estáticos como animados, en formato de lenguaje de marcado extensible XML (Extensible Markup Language), es decir que se compone por código y cuya especificación es un estándar abierto desarrollado por el W3C para generar gráficos accesibles.
- Datawrapper: Es una, entre numerosas herramientas de visualización de datos, que ofrece la posibilidad de probar paletas de colores accesibles, así como escribir una descripción alternativa, entre otras funciones relacionadas con la accesibilidad.
En resumen, la visualización de datos es un método para hacer más accesible un conjunto de datos y sus visualizaciones. Tener en cuenta estos consejos sobre accesibilidad e incorporarlos por defecto en el diseño a la hora de presentar visualmente un conjunto de datos enriquecerá el resultado y permitirá que llegue a una audiencia más amplia.
Contenido elaborado a partir de la Guía de Visualización de Datos de El Portal Europeo de Datos Abiertos: https://data.europa.eu/apps/data-visualisation-guide/accessibility-of-data-visualisation
El Centro Nacional de Información Geográfica publica los datos geoespaciales abiertos del Sistema Cartográfico Nacional, del Instituto Geográfico Nacional y de otros organismos a través de aplicaciones web y aplicaciones para móvil para facilitar el acceso y la consulta de los datos geográficos a los ciudadanos.
Los datos geoespaciales se publican a través de servicios web y API para su reutilización, por lo que en el caso de los conjuntos de datos de alto valor como los nombres geográficos, hidrografía o las direcciones tal y como establece la UE, ya están puestos a disposición de la ciudadanía antes de junio de 2024 ya que están asociados a grandes beneficios para la sociedad, el medio ambiente y la economía.
Pero en las aplicaciones que a continuación se enumeran, los datos geográficos se visualizan y se consultan a través de servicios web, por lo que para la descarga de los datos, es posible utilizar directamente los servicios web y API, a través de una plataforma accesible para cualquier usuario con una amplia gama de información geográfica, que abarca desde mapas topográficos hasta imágenes satelitales.
Pero no solo los datos se pueden reutilizar, también el software de las aplicaciones es reutilizable, como, por ejemplo, el visualizador del Potencial de Energía Solar de Edificios que se basa en una API de visualizador, llamada API-CNIG y que permite utilizar la misma herramienta para las diferentes temáticas.
Algunos ejemplos de las aplicaciones son:

Potencial de Energía Solar de Edificios
Ofrece la capacidad fotovoltaica de un edificio según su ubicación y características. Además, ofrece la media a lo largo del año y una malla puntual para identificar cuál sería la mejor localización de las placas solares.
Nomenclátor Geográfico Nacional
Es un buscador de topónimos que recoge las denominaciones, oficiales o normalizadas por los correspondientes organismos competentes referenciadas geográficamente.
Calculadora unificada de direcciones postales
Es un conversor que permite conocer las coordenadas geográficas (latitud y longitud en WGS84) de las direcciones postales de un lugar, y viceversa. En ambos casos, el fichero de entrada es un fichero en formato CSV, admitiendo tanto coordenadas como direcciones postales.
Mapas de España Básicos
Facilita la conexión a los servicios del IGN y al centro de descargas del CNIG para obtener mapas y rutas. Con esta aplicación móvil podrás recorrer las rutas de los Parques Nacionales o las etapas del Camino de Santiago. Permite planificar excursiones utilizando mapas, navegar y realizar recorridos guiados, sin necesidad de tener conexión a internet previa descarga de datos.
Mapa a la carta
Permite crear un mapa a medida usando las series impresas del Mapa Topográfico Nacional a escalas 1:25.000 y 1:50.000. Ofrece la posibilidad de definir su área, incorporar contenidos, personalizar la portada, obtener un fichero pdf e incluso adquirir copias en papel vía correo postal.
IGN Terremotos
Permite la recepción y visualización de todos los eventos sísmicos de España y alrededores. Ofrece la distancia al epicentro del evento sísmico y parámetros epicentrales, así como la geolocalización de la posición del usuario y del epicentro.
Mapas de España
Es un visualizador móvil gratuito ideal para senderismo, ciclismo, correr, esquiar, etc., que utiliza como cartografía de fondo los servicios del Instituto Geográfico Nacional y otro conjunto de servicios de otros Ministerios, como por ejemplo la información Catastral de las parcelas proporcionada por la Dirección General de Catastro.
Camino de Santiago
Incluye información de naturaleza cultural y práctica de cada una de las etapas (albergues, monumentos, etc.), así como una completa Guía del Peregrino que detalla lo que debes conocer antes de comenzar a realizar alguno de los Caminos. Esta aplicación se basa en el software de ESRI.
Parques Nacionales
Muestra información sobre la historia, fauna, flora y excursiones de los Parques Nacionales de España. Incluye cientos de puntos de interés como centros de información, alojamientos, miradores, refugios e incluso rutas para recorrer los parques indicando su duración o dificultad. La app está disponible para su descarga en Android e iOS. Esta aplicación se basa en el software de ESRI.
GeoSapiens IGN
Presenta mapas interactivos, de uso libre y gratuito, para estudiar la geografía física y política de España y el mundo. Consta de diferentes juegos relativos a toda España o por comunidades autónomas, el mundo completo y por continente.
Además de las aplicaciones desarrolladas por el CNIG, que también se presentan en este vídeo, existen muchas otras soluciones digitales realizadas por terceros que reutilizan datos abiertos geoespaciales para ofrecer un servicio a la sociedad. Por ejemplo, en la lista de aplicaciones reutilizadoras de datos.gob.es puedes encontrar desde un mapa que muestra los incendios que se encuentran activos en España en tiempo real hasta una app que señala dónde están las plazas de aparcamiento para personas con movilidad reducida de cada localidad.
En definitiva, cualquier persona puede hacer uso de los datos geográficos abiertos del Sistema Cartográfico Nacional, del Instituto Geográfico Nacional y de otros organismos publicados por el CNIG ampliando así las ventajas que ofrece la disponibilidad de datos abiertos geográficos. ¿Conoces alguna otra aplicación fruto de la reutilización de datos abiertos? Nos la puedes enviar a dinamizacion@datos.gob.es
Hoy, 23 de abril, se celebra el Día del Libro, una ocasión para resaltar la importancia de la lectura, la escritura y la difusión del conocimiento. La lectura activa promueve la adquisición de habilidades y el pensamiento crítico, al acercarnos a información especializada y detallada sobre cualquier tema que nos interese, incluido el mundo de los datos.
Por ello, queremos aprovechar la ocasión para mostrar algunos ejemplos de libros y manuales relacionados con los datos y tecnologías relacionadas que se pueden encontrar en la red de manera gratuita.
1. Fundamentos de ciencia de datos con R, editado por Gema Fernandez-Avilés y José María Montero (2024)
Accede al libro aquí.
- ¿De qué trata? El libro guía al lector desde el planteamiento de un problema hasta la realización del informe que contiene su solución. Para ello, explica una treintena de técnicas de ciencia de datos en el ámbito de la modelización, análisis de datos cualitativos, discriminación, machine learning supervisado y no supervisado, etc. En él se incluyen más de una docena de casos de uso en sectores tan dispares como la medicina, el periodismo, la moda o el cambio climático, entre otros. Todo ello, con un gran énfasis en la ética y en el fomento de la reproductibilidad de los análisis.
-
¿A quién va dirigido? Está dirigido a usuarios que quieran iniciarse en la ciencia de datos. Parte de preguntas básicas, como qué es la ciencia de datos, e incluye breves secciones con explicaciones sencillas sobre la probabilidad, la inferencia estadística o el muestreo, para aquellos lectores no familiarizados con estas cuestiones. También incluye ejemplos replicables para practicar.
-
Idioma: Español
2. Contar historias con datos, Rohan Alexander (2023).
Accede al libro aquí.
-
¿De qué trata? El libro explica una amplia gama de temas relacionados con la comunicación estadística y el modelado y análisis de datos. Abarca las distintas operaciones desde la recopilación de datos, su limpieza y preparación, hasta el uso de modelos estadísticos para analizarlos, prestando especial importancia a la necesidad de extraer conclusiones y escribir sobre los resultados obtenidos. Al igual que el libro anterior, también pone el foco en la ética y la reproductibilidad de resultados.
-
¿A quién va dirigido? Es perfecto para estudiantes y usuarios con conocimientos básicos, a los que dota de capacidades para realizar y comunicar de manera efectiva un ejercicio de ciencia de datos. Incluye extensos ejemplos de código para replicar y actividades a realizar a modo de evaluación.
-
Idioma: Inglés.
3. El gran libro de los pequeños proyectos con Python, Al Sweigart (2021)
Accede al libro aquí.
- ¿De qué trata? Es una colección de sencillos proyectos en Python para aprender a crear arte digital, juegos, animaciones, herramientas numéricas, etc. a través de un enfoque práctico. Cada uno de sus 81 capítulos explica de manera independiente un proyecto sencillo paso a paso -limitados a máximo 256 líneas de código-. Incluye una ejecución de muestra del resultado de cada programa, el código fuente y sugerencias de personalización.
-
¿A quién va dirigido? El libro está escrito para dos grupos de personas. Por un lado, aquellos que ya han aprendido los conceptos básicos de Python, pero todavía no están seguros de cómo escribir programas por su cuenta. Por otro, aquellos que se inician en la programación, pero son aventureros, cuentan con grandes dosis de entusiasmo y quieren ir aprendiendo sobre la marcha. No obstante, el mismo autor tiene otros recursos para principiantes con los que aprender conceptos básicos.
-
Idioma: Inglés.
4. Matemáticas para Machine Learning, Marc Peter Deisenroth A. Aldo Faisal Cheng Soon Ong (2024)
Accede al libro aquí.
-
¿De qué trata? La mayoría de libros sobre machine learning se centran en algoritmos y metodologías de aprendizaje automático, y presuponen que el lector es competente en matemáticas y estadística. Este libro pone en primer plano los fundamentos matemáticos de los conceptos básicos detrás del aprendizaje automático
-
¿A quién va dirigido? El autor asume que el lector tiene conocimientos matemáticos comúnmente aprendidos en las materias de matemáticas y física de la escuela secundaria, como por ejemplo derivadas e integrales o vectores geométricos. A partir de ahí, el resto de conceptos se explican de manera detallada, pero con un estilo académico, con el fin de ser precisos.
-
Idioma: Inglés.
5. Profundizando en el aprendizaje profundo, Aston Zhang, Zack C. Lipton, Mu Li, Alex J. Smola (2021, se actualiza continuamente)
Accede al libro aquí.
-
¿De qué trata? Los autores son empleados de Amazon que utilizan la biblioteca MXNet para enseñar Deep Learning. Su objetivo es hacer accesible el aprendizaje profundo, enseñando los conceptos básicos, el contexto y el código de forma práctica a través de ejemplos y ejercicios. El libro se divide en tres partes: conceptos preliminares, técnicas de aprendizaje profundo y temas avanzados centrados en sistemas y aplicaciones reales.
-
¿A quién va dirigido? Este libro está dirigido a estudiantes (de grado o posgrado), ingenieros e investigadores, que buscan un dominio sólido de las técnicas prácticas del aprendizaje profundo. Cada concepto se explica desde cero, por lo que no es necesario tener conocimientos previos de aprendizaje profundo o automático. No obstante, sí son necesario conocimientos de matemáticas y programación básicas, incluyendo álgebra lineal, cálculo, probabilidad y programación en Python.
-
Idioma: Inglés.
6. Inteligencia artificial y sector público: retos límites y medios, Eduardo Gamero y Francisco L. Lopez (2024)
Accede al libro aquí.
-
¿De qué trata? Este libro se centra en analizar los retos y oportunidades que presenta el uso de la inteligencia artificial en el sector público, especialmente cuando se usa como soporte a la toma de decisiones. Comienza explicando qué es la inteligencia artificial y cuáles son sus aplicaciones en el sector público, para pasar a abordar su marco jurídico, los medios disponibles para su implementación y aspectos ligados a la organización y gobernanza.
-
¿A quién va dirigido? Es un libro útil para todos aquellos interesados en la temática, pero especialmente para responsables políticos, trabajadores públicos y operadores jurídicos relacionados con la aplicación de la IA en el sector público.
-
Idioma: español
7. Introducción del analista de negocio a la analítica empresarial, Adam Fleischhacker (2024)
Accede al libro aquí.
-
¿De qué trata? El libro aborda un flujo de trabajo de análisis empresarial completo, que incluye la manipulación de datos, su visualización, el modelado de problemas empresariales, la traducción de modelos gráficos a código y la presentación de resultados ante las partes interesadas. El objetivo es aprender a impulsar cambios dentro de una organización gracias al conocimiento basado en datos, modelos interpretables y visualizaciones persuasivas.
-
¿A quién va dirigido? Según su autor, se trata de un contenido accesible para todos, incluso para principiantes en la realización de trabajos de análisis. El libro no asume ningún conocimiento del lenguaje de programación, sino que proporciona una introducción a R, RStudio y al “tidyverse”, una serie de paquetes de código abierto para la ciencia de datos.
-
Idioma: Inglés.
Te invitamos a ojear esta selección de libros. Asimismo, recordamos que solo se trata de una lista con ejemplos de las posibilidades de materiales que puedes encontrar en la red. ¿Conoces algún otro libro que quieras recomendar? ¡Indícanoslo en los comentarios o manda un email a dinamizacion@datos.gob.es!
La Diputación Foral de Bizkaia, la Universidad del País Vasco (UPV/EHU) y el Ayuntamiento de Bilbao colaboran en el Aula Open data Bilbao Bizkaia, una iniciativa que persigue desarrollar el uso de los datos abiertos de las dos instituciones vizcaínas (Diputación Foral y Ayuntamiento) para su aprovechamiento en proyectos universitarios. El objetivo final es que, gracias a dicha reutilización, se puedan mejorar los servicios públicos que prestan y generar nuevo conocimiento que contribuya a la resolución de problemas sociales.
La iniciativa, dirigida tanto al alumnado universitario como al profesorado y personal de investigación, nació como un convenio de colaboración entre las tres administraciones (Diputación Foral de Bizkaia, Ayuntamiento de Bilbao y UPV/EHU). Para ello se tomaron como referencia otros convenios realizados con la Escuela de Ingeniería de Bilbao para la creación de Aulas de Empresa, pero en este caso siendo un aula de datos abiertos, que fomentará la apertura de datos generados y la reutilización de la información pública.
El Aula Open data Bilbao Bizkaia lleva en marcha desde 2022 y su funcionamiento es similar al de las doce Aulas de Empresa que ya estaban en marcha en la Escuela de Ingeniería de Bilbao. Estas Aulas de empresa son aulas-laboratorio dentro de la escuela, creadas y financiadas por empresas e instituciones para promover sus actividades de I+D+i. En ese sentido, tal y como declaran los organizadores del Aula “son un instrumento eficaz de colaboración entre los Departamentos de la Escuela de Ingeniería de Bilbao y el tejido empresarial, tanto en actividades relacionadas con la investigación, el desarrollo tecnológico y la innovación como en todo lo referente a la formación”.
Datos abiertos para innovar en el aula
En este Aula, además de desarrollarse proyectos basados en la reutilización de datos abiertos que mejoren los servicios forales y municipales, se crean visualizaciones de datos a partir de iniciativas de tratamiento de la información abierta, propuestas por la comunidad universitaria y cuyo fin es la mejora del bienestar de la ciudadanía. Otro de sus ámbitos de trabajo es la puesta en marcha de actividades de formación que contribuyan a la mejora de las habilidades digitales de la comunidad universitaria.
Durante la primera edición del Aula Open Data Bilbao-Bizkaia, del curso 2022-2023, el alumnado desarrolló proyectos de reutilización de datos sobre reciclaje o actividades al aire libre, entre otros. Todos ellos se crearon utilizando datos autonómicos. Puedes consultar aquí los proyectos: https://sites.google.com/view/opendatabilbaobizkaia/home?authuser=0.
¿Cómo puedo entrar en Aula Open Data Bilbao-Bizkaia?
El Aula Open data Bilbao Bizkaia cuenta con un espacio propio en la sede en la Escuela de Ingeniería de Bilbao, en San Mamés. Este espacio se ha acondicionado gracias a una subvención concedida por la Diputación Foral de Bizkaia y el Ayuntamiento de Bilbao, que también colaboran financiando los gastos de gestión del aula.
El programa está enfocado a que alumnos/as de grado y máster en ingeniería realicen sus trabajos de fin de grado/fin de máster respectivamente. No obstante, no es necesario estar en el último curso de Grado o Máster para participar en el Aula. La iniciativa está abierta a cualquier persona con interés en los datos.
Al inicio del curso se imparte formación en Power BI y herramientas para el análisis de datos.
El programa es gratuito, y el alumnado que realiza su trabajo dentro de convenio recibe una retribución. El proceso de selección es mediante CV.
En el siguiente enlace se visualiza toda la información referente al Aula.
PRORROGADO: ¡Puedes enviar tu proyecto hasta el 20 de septiembre!
Ya está abierto el plazo para participar en la II edición del Datathon UniversiData. Esta competición reconoce el valor de proyectos que reutilicen datos abiertos universitarios publicados en el portal UniversiDATA, una iniciativa público-privada que nació a finales de 2020. Su objetivo era, y es, fomentar los datos abiertos en el sector de la educación superior en España de una forma armonizada.
Actualmente, UniversiDATA está integrada por la Universidad Rey Juan Carlos, la Universidad Complutense de Madrid, la Universidad Autónoma de Madrid, la Universidad Carlos III de Madrid, la Universidad de Valladolid y la Universidad de Huelva, en colaboración con la empresa DIMETRICAL, The Analytics Lab, S.L.
¿En qué consiste el Datathon UniversiDATA?
Como se indicaba previamente, los participantes deben presentar un proyecto de tratamiento de datos abiertos utilizando uno o varios de los conjuntos de datos publicados en UniversiDATA. Estos datos podrán ser combinados con otras fuentes de datos, pero siempre teniendo en cuenta que su uso no debe ser secundario o accesorio.
No hay limitaciones en la naturaleza del proyecto, las tecnologías implicadas o los formatos de presentación de los resultados. Se puede concursar con una App móvil, una aplicación web, un análisis de datos en Jupyter o R-Markdown, etc. También son válidos los trabajos ya presentados a otras competiciones, así como prácticas, trabajos fin de máster o grado o artículos de investigación.
Si quieres inspiración, puedes visitar la sección "UniversiDATA-Lab" donde se muestran ejemplos de aplicaciones y análisis de datos. También puedes revisar los proyectos ganadores de la primera edición.
¿Cómo se desarrolla la competición?
El concurso se divide en dos fases:
-
Fase eliminatoria
Aquellas personas interesadas en participar pueden presentar su candidatura desde el pasado día 6 de marzo hasta el 20 de septiembre, a través de este formulario. En dicha solicitud, además de los datos personales, es necesario detallar la siguiente información:
-
Integrantes del proyecto
-
Título del proyecto
-
Problemática a resolver
-
Solución propuesta
-
Identificación de destinatarios
-
Utilidad del proyecto
-
Conjuntos de datos a utilizar
Todos los proyectos presentados serán valorados por un jurado que seleccionará a 10 finalistas, los cuales pasarán a la fase final. La lista de proyectos seleccionados se hará pública el 27 de septiembre de 2024.
-
Fase Final
Una vez seleccionados, los finalistas empezarán a preparar sus proyectos para la presentación al jurado, que tendrá lugar durante una jornada online el 16 de diciembre. En dicha jornada los proyectos se presentarán por videoconferencia.
El 23 de diciembre se harán públicos los ganadores.
¿Quién puede participar?
La competición está abierta a cualquier persona física con residencia fiscal en la Unión Europea, tanto estudiantes como profesionales ya en activo o aficionados.
Se puede participar en grupo o de manera individual.
¿Cuáles son los premios?
Este año se ha incrementado la dotación económica hasta alcanzar un total de 9.000 €, divididos de la siguiente manera:
-
Primer premio: 4.000 €
-
Segundo premio: 3.000 €
-
Tercer premio: 1.500 €
Además de estos premios generales, también se quiere reconocer al mejor proyecto de estudiantes universitarios que haya sido finalista pero no premiado. Para ello se ha creado un accésit específico de 500 €.
En caso de participar en grupo, el premio se dividirá entre todos los integrantes del mismo.
¿Tienes alguna duda?
Antes de participar, es necesario descargar y leer las bases concretas del concurso. Para cualquier duda, se puede contactar con los organizadores a través de este formulario. También se irá informando de cualquier novedad en el perfil de Twitter de UniversiDATA.
Además, durante toda la competición se establecerá un canal de comunicación directo con los participantes, para plantear cualquier pregunta que surja, incluidas las relativas a los conjuntos de datos a utilizar.
El II Datathon UniversiDATA surge a raíz del éxito alcanzado en su primera edición, una experiencia muy positiva que ofrece a los participantes, un año más, la oportunidad no solo de alzarse con un reconocimiento económico, sino también de ganar visibilidad mostrando su talento a la hora de realizar tratamientos de datos que puedan dar respuesta a diversas cuestiones de interés social y económico.