informes | datos.gob.es

La IA como catalizador de un ecosistema de datos de gobierno abierto

Blog

Los datos abiertos de fuentes públicas han evolucionado a lo largo de estos años, pasando de ser simples repositorios de información a constituir ecosistemas dinámicos que pueden transformar la gobernanza pública. En este contexto, la inteligencia artificial (IA) emerge como una tecnología catalizadora que se beneficia del valor de los datos abiertos y potencia exponencialmente su utilidad. En este post veremos cómo es la relación simbiótica de mutuo beneficio entre la IA y los datos abiertos.

Tradicionalmente, el debate sobre datos abiertos se ha centrado en los portales: las plataformas en las que gobiernos publican información para que la ciudadanía, las empresas y las organizaciones puedan acceder a ella. Pero la llamada “Tercera Ola de Datos Abiertos”, término acuñado por el GovLab de la Universidad de Nueva York, enfatiza que ya no basta con publicar datasets a demanda o por defecto. Lo importante es pensar en el ecosistema completo: el ciclo de vida de los datos, su explotación, mantenimiento y, sobre todo, el valor que generan en la sociedad.

¿Qué función pueden tener los datos abiertos aplicados a la IA?

En este contexto, la IA aparece como un catalizador capaz de automatizar tareas, enriquecer los datos abiertos gubernamentales (OGD), facilitar su comprensión y estimular la colaboración entre actores.

Una investigación reciente, desarrollada por universidades europeas, mapea cómo está sucediendo esta revolución silenciosa. El estudio propone una clasificación de los usos según en dos dimensiones:

Perspectiva, que a su vez se divide en dos posibles vías:
1. Inward-looking (portal): el foco está en las funciones internas de los portales de datos.
2. Outward-looking (ecosistema): el foco se amplía a las interacciones con actores externos (ciudadanos, empresas, organizaciones).
Fases del ciclo de vida del dato, las cuales podemos dividir en pre-procesamiento, exploración, transformación y mantenimiento.

En resumen, el informe identifica estos ocho tipos de uso de la IA en los datos abiertos gubernamentales, que se producen al cruzar las perspectivas y las fases en el ciclo de vida del dato.

Figura 1. Ocho uso de la IA para mejorar los datos abiertos gubernamentales. Fuente: presentación "Data for AI or AI for data: artificial intelligence as a catalyser for open government ecosystems", basada en el informe del mismo nombre, de los EU Open Data Days 2025.

A continuación, se detalla cada uno de estos usos:

1. IA como depuradora (portal curator)

Esta aplicación se centra en el pre-procesamiento de datos dentro del portal. La IA ayuda a organizar, limpiar, anonimizar y etiquetar datasets antes de su publicación. Algunos ejemplos de tareas son:

Automatización y mejora de las tareas de publicación de datos.
Realización de funciones de etiquetado automático y categorización.
Anonimización de datos para proteger la privacidad.
Limpieza y filtrado automático de conjuntos de datos.
Extracción de características y manejo de datos faltantes.

2. IA como recolectora de datos del ecosistema (ecosystem data retriever)

También en la fase de pre-procesamiento, pero con un enfoque externo, la IA amplía la cobertura de los portales al identificar y recopilar información de fuentes diversas. Algunas tareas son:

Recuperar datos estructurados desde textos legales o normativos.
Minería de noticias para enriquecer datasets con información contextual.
Integración de datos urbanos procedentes de sensores o registros digitales.
Descubrimiento y enlace de fuentes heterogéneas.
Conversión de documentos complejos en información estructurada.

3. IA como exploradora del portal (portal explorer)

En la fase de exploración, los sistemas de IA también pueden facilitar la búsqueda e interacción con los datos publicados, con un enfoque más interno. Algunos casos de uso:

Desarrollar buscadores semánticos para localizar conjuntos de datos.
Implementar chatbots que guíen a los usuarios en la exploración de datos.
Proporcionar interfaces de lenguaje natural para consultas directas.
Optimizar los motores de búsqueda internos del portal.
Utilizar modelos de lenguaje para mejorar la recuperación de información.

4. IA como recolectora de información en la web (ecosystem connector)

Operando también en la fase de exploración, la IA actúa como un puente entre actores y recursos del ecosistema. Algunos ejemplos son:

Recomendar datasets relevantes a investigadores o empresas.
Identificar socios potenciales a partir de intereses comunes.
Extraer temas emergentes para apoyar la formulación de políticas.
Visualizar datos de múltiples fuentes en paneles interactivos.
Personalizar sugerencias de datos basadas en actividades en redes sociales.

5. IA que referencia el portal (portal linker)

Esta funcionalidad se enfoca en la transformación de datos dentro del portal. Su función es facilitar la combinación y presentación de información para distintos públicos. Algunas tareas son:

Convertir datos en grafos de conocimiento (estructuras que conectan información relacionada, conocidas como Linked Open Data).
Resumir y simplificar datos con técnicas de PLN (Procesamiento del Lenguaje Natural).
Aplicar razonamiento automático para generar información derivada.
Potenciar la visualización multivariante de datasets complejos.
Integrar datos diversos en productos de información accesibles.

6. IA como desarrolladora de valor en el ecosistema (ecosystem value developer)

En la fase de transformación y con mirada externa, la IA genera productos y servicios basados en datos abiertos que aportan valor añadido. Algunas tareas son:

Sugerir técnicas analíticas adecuadas según el tipo de conjunto de datos.
Asistir en la codificación y procesamiento de información.
Crear paneles de control basados en análisis predictivo.
Garantizar la corrección y coherencia de los datos transformados.
Apoyar el desarrollo de servicios digitales innovadores.

7. IA como supervisora del portal (portal monitor)

Se centra en el mantenimiento del portal, con un enfoque interno. Su papel es garantizar la calidad, consistencia y cumplimiento de estándares. Algunas tareas son:

Detectar anomalías y valores atípicos en conjuntos de datos publicados.
Evaluar la consistencia de metadatos y esquemas.
Automatizar procesos de actualización y depuración de datos.
Identificar incidencias en tiempo real para su corrección.
Reducir costes de mantenimiento mediante monitorización inteligente.

8. IA como dinamizadora del ecosistema (ecosystem engager)

Y, por último, esta función opera en la fase de mantenimiento, pero hacia afuera. Busca promover la participación ciudadana y la interacción continua. Algunas tareas son:

Predecir patrones de uso y anticipar necesidades de los usuarios.
Proporcionar retroalimentación personalizada sobre datasets.
Facilitar la auditoría ciudadana de la calidad de los datos.
Incentivar la participación en comunidades de datos abiertos.
Identificar perfiles de usuarios para diseñar experiencias más inclusivas.

¿Qué nos dice la evidencia?

El estudio se basa en una revisión de más de 70 artículos académicos que examinan la intersección entre IA y los datos abiertos gubernamentales (open government data u OGD). A partir de estos casos, los autores observan que:

Algunos de los perfiles definidos, como portal curator, portal explorer y portal monitor, están relativamente maduros y cuentan con múltiples ejemplos en la literatura.
Otros, como ecosystem value developer y ecosystem engager, están menos explorados, aunque son los que más potencial tienen para generar impacto social y económico.
La mayoría de las aplicaciones actuales se centran en automatizar tareas concretas, pero hay un gran margen para diseñar arquitecturas más integrales, que combinen varios tipos de IA en un mismo portal o en todo el ciclo de vida del dato.

Desde un punto de vista académico, esta tipología aporta un lenguaje común y una estructura conceptual para estudiar la relación entre IA y datos abiertos. Permite identificar vacíos en la investigación y orientar futuros trabajos hacia un enfoque más sistémico.

En la práctica, el marco es útil para:

Gestores de portales de datos: les ayuda a identificar qué tipos de IA pueden implementar según sus necesidades, desde mejorar la calidad de los datasets hasta facilitar la interacción con los usuarios.
Responsables políticos: les orienta sobre cómo diseñar estrategias de adopción de IA en iniciativas de datos abiertos, equilibrando eficiencia, transparencia y participación.
Investigadores y desarrolladores: les ofrece un mapa de oportunidades para crear herramientas innovadoras que atiendan necesidades específicas del ecosistema.

Limitaciones y próximos pasos de la sinergia entre IA y open data

Además de las ventajas, el estudio reconoce algunas asignaturas pendientes que, en cierta manera, sirven como hoja de ruta para el futuro. Para empezar, varias de las aplicaciones que se han identificado están todavía en fases tempranas o son conceptuales. Y, quizá lo más relevante, aún no se ha abordado en profundidad el debate sobre los riesgos y dilemas éticos del uso de IA en datos abiertos: sesgos, privacidad, sostenibilidad tecnológica.

En definitiva, la combinación de IA y datos abiertos es todavía un terreno en construcción, pero con un enorme potencial. La clave estará en pasar de experimentos aislados a estrategias integrales, capaces de generar valor social, económico y democrático. La IA, en este sentido, no funciona de manera independiente a los datos abiertos: los multiplica y los hace más relevantes para gobiernos, ciudadanía y sociedad en general.

29/09/2025

Nuevos informes sobre datos abiertos y tecnologías relacionadas: hacia un ecosistema ético y colaborativo

Noticia

Los datos abiertos son un combustible fundamental en la innovación digital contemporánea, creando ecosistemas de información que democratizan el acceso al conocimiento y potencian el desarrollo de soluciones tecnológicas avanzadas.

Sin embargo, la mera disponibilidad de datos no es suficiente. La construcción de ecosistemas robustos y sostenibles requiere marcos normativos claros, principios éticos sólidos y metodologías de gestión que garanticen tanto la innovación como la protección de derechos fundamentales. Por ello, la documentación especializada que orienta estos procesos se convierte en un recurso estratégico para gobiernos, organizaciones y empresas que buscan participar responsablemente en la economía digital.

En este post, recopilamos informes recientes, elaborados por organizaciones de referencia tanto del ámbito público como privado, que ofrecen estas orientaciones clave. Estos documentos no solo analizan los desafíos actuales de los ecosistemas de datos abiertos, sino que proporcionan herramientas prácticas y marcos de trabajo concretos para su implementación efectiva.

Estado y evolución del mercado del open data

Conocer cómo es y qué cambios ha habido en el ecosistema de los datos abiertos a nivel europeo y nacional es importante para tomar decisiones informadas y adaptarse a las necesidades de la industria. En este sentido, la Comisión Europea publica, periódicamente, un informe sobre los mercados de datos, que se actualiza regularmente. La última versión es de diciembre de 2024, aunque periódicamente se van publicando casos de uso que ejemplifican el potencial de los datos en Europa (el último de febrero de 2025).

Por otro lado, desde una perspectiva regulatoria europea, el último informe anual sobre la implementación de la Ley de Mercados Digitales (DMA) aborda una visión integral de las medidas adoptadas para garantizar la equidad y competitividad en el sector digital. Este documento es interesante para comprender cómo se está configurando el marco normativo que afecta directamente a los ecosistemas de datos abiertos.

A nivel nacional, el informe sectorial de ASEDIE sobre la "Economía del Dato en su ámbito infomediario" 2025 proporciona evidencia cuantitativa del valor económico generado por los ecosistemas de datos abiertos en España.

La importancia de los datos abiertos en la IA

Está claro que la intersección entre datos abiertos e inteligencia artificial es una realidad que plantea desafíos éticos y normativos complejos que requieren respuestas colaborativas y multisectoriales. En este contexto, el desarrollo de marcos que guíen el uso responsable de la IA se convierte en una prioridad estratégica, especialmente cuando estas tecnologías se nutren de ecosistemas de datos públicos y privados para generar valor social y económico. Estos son algunos informes que abordan este objetivo:

IA generativa y datos abiertos: directrices y buenas prácticas: el Departamento de Comercio de EE. UU. ha publicado una guía con principios y buenas prácticas sobre cómo aplicar inteligencia artificial generativa de forma ética y efectiva en el contexto de los datos abiertos. El documento ofrece pautas para optimizar la calidad y la estructura de los datos abiertos con el fin de hacerlos útiles para estos sistemas, incluyendo la transparencia y gobernanza.
Guía de buenas prácticas para el uso de la inteligencia artificial ética: esta guía muestra un enfoque integral que combina principios éticos sólidos con preceptos normativos claros y aplicables. Además del marco teórico, la guía sirve de herramienta práctica para implementar sistemas de IA de manera responsable, considerando tanto los beneficios potenciales como los riesgos asociados. La colaboración entre actores públicos y privados garantiza que las recomendaciones sean tanto técnicamente viables como socialmente responsables.
Enhancing Access to and Sharing of Data in the Age of AI: este análisis de la Organización para la Cooperación y el Desarrollo Económicos (OCDE) aborda uno de los principales obstáculos para el desarrollo de la inteligencia artificial: el acceso limitado a datos de calidad y modelos efectivos. A través de ejemplos, se identifican estrategias específicas que los gobiernos pueden implementar para mejorar significativamente el acceso y la compartición de datos y ciertos modelos de IA.
A Blueprint to Unlock New Data Commons for AI: Open Data Policy Lab ha elaborado una guía práctica que se centra en la creación y gestión de bienes comunes de dato (data commons) específicamente diseñados para habilitar casos de uso de inteligencia artificial de interés público. La guía ofrece metodologías concretas sobre cómo gestionar datos de manera que se facilite la creación de estos bienes comunes de dato, incluyendo aspectos de gobernanza, sostenibilidad técnica y alineación con objetivos de interés público.
Guía práctica sobre colaboraciones basadas en datos: la iniciativa Data for Children Collaborative ha publicado una guía paso a paso para desarrollar colaboraciones de datos efectivas, con un enfoque en impacto social. Incluye ejemplos reales, modelos de gobernanza y herramientas prácticas para impulsar alianzas sostenibles.

En resumen, estos informes definen el camino hacia ecosistemas de datos más maduros, éticos y colaborativos. Desde las cifras de crecimiento del sector infomediario español hasta los marcos regulatorios europeos, pasando por las guías prácticas para la implementación de IA responsable, todos estos documentos comparten una visión común: el futuro de los datos abiertos depende de nuestra capacidad para construir puentes entre el sector público y privado, entre la innovación tecnológica y la responsabilidad social.

29/05/2025

Disponible la 13ª edición del Informe del Sector Infomediario de ASEDIE

Noticia

La reutilización de datos sigue creciendo en España, tal y como confirma el último informe de la Asociación Multisectorial de la Información (ASEDIE), que analiza y describe la situación del sector infomediario en el país. El documento, que va por su edición número 13, fue presentado el pasado viernes 4 de abril, en un evento donde se destacó el auge de la economía del dato en el panorama actual.

A continuación, recogemos las principales claves del informe.

Un beneficio general de 146 millones de euros en 2023

Desde 2013, el informe del sector Infomediario de ASEDIE realiza un seguimiento continuo de este sector, compuesto por aquellas empresas y organizaciones que reutilizan datos -generalmente procedentes del sector público, pero también de fuentes privadas- para generar productos o servicios de valor añadido. Bajo el título "Economía del Dato en su ámbito infomediario", el informe de este año subraya la importancia de la colaboración público-privada en el impulso de la economía del dato y presenta datos relevantes sobre el estado actual del sector.

Cabe destacar que la información financiera utilizada para ventas y empleados corresponde al ejercicio 2023, ya que al cierre del informe no estaba disponible aún la información financiera del año 2024. Las principales conclusiones son:

Desde la primera edición del informe, se ha pasado de 444 a 757 empresas infomediarias identificadas, lo que supone un crecimiento del 70%. Este crecimiento refleja su dinamismo, con altas y bajas anuales, mostrando una evolución positiva que consolida su recuperación tras la pandemia, aunque aún con margen de desarrollo.
El sector está presente en todas las Comunidades Autónomas del país, incluida la Ciudad Autónoma de Melilla. La Comunidad de Madrid lidera el ranking con el 38% de las empresas infomediarias, seguida por Cataluña, Andalucía y la Comunidad Valenciana, que representan el 15%, 11% y 9%, respectivamente. El restante 27% se distribuye entre las demás comunidades autónomas.
El 75% de las empresas infomediarias realizan su actividad en los subsectores de información geográfica, estudios de mercado, económico y financiero, e informática de infomediación (centrada en el desarrollo de soluciones tecnológicas para la gestión, análisis, procesamiento y visualización de datos).
El sector infomediario muestra una tendencia de crecimiento y consolidación, con un 66% de empresas operando desde hace menos de 20 años. De este grupo, el 32% tiene entre 11 y 20 años, mientras que el 34% no supera la década de existencia. Además, el aumento en las compañías de entre 11 y 40 años indica que más empresas han logrado mantenerse en el tiempo.
En cuanto a las ventas, el volumen estimado asciende a 2.646 millones de euros y la evolución de la venta media aumenta un 10,4%. La facturación media por empresa es superior a 4,4 millones, mientras que la mediana es 442.000 euros. En comparación con el año anterior, la media ha aumentado en 200.000 euros, mientras que la mediana ha descendido en 30.000 euros.
Se estima que el sector infomediario emplea a unas 24.620 personas, el 64% de las cuales se concentra en tres subsectores. Estos datos suponen un crecimiento de un 6% con respecto al año anterior. Aunque la media general es de 39 empleados por empresa, la mediana por subsector no supera los 6, lo que indica que buena parte del empleo se concentra en un número reducido de grandes empresas. Por su parte, la facturación media por empleado ha sido de 108.000 euros en este año, aumentando un 8% respecto al año anterior.
El capital suscrito del sector asciende a 252 millones de euros. Esto supone una subida del 6%, que rompe con la tendencia negativa de los últimos años.
El 74% de las empresas ha presentado beneficios. El beneficio neto agregado de las 539 empresas de las que se dispone de datos superó los 145 millones de euros.

El siguiente visual resume algunos de estos datos

Título: Cuerpo: • 757 empresas identificadas • 24.620 empleados • 2.646 mill € ventas • 252 mill € capital • 146 mill € euros de beneficio neto Fuente: Informe del Sector Infomediario de Asedie. "Economía del Dato en su ámbito infomediario" (2025).

Figura 1. Fuente: Informe del Sector Infomediario de Asedie. "Economía del Dato en su ámbito infomediario" (2025).

Avances significativos en el Top 10 ASEDIE

El Top 10 de Asedie tiene como objetivo identificar y promover la apertura de determinados conjuntos de datos para su reutilización. Esta iniciativa busca fomentar la colaboración entre el sector público y privado, facilitando el acceso a información que puede generar beneficios económicos y sociales significativos. Su desarrollo ha tenido lugar en tres fases, cada una enfocada en diferentes conjuntos de datos, y cuya evolución se ha analizado en este informe:

Fase 1 (2019), donde se impulsaba la apertura de bases de datos de asociaciones, cooperativas y fundaciones. Actualmente, 16 comunidades autónomas permiten el acceso a las tres bases de datos e incluso 11 ya ofrecen los datos del NIF. Falta que se de acceso a las cooperativas en una comunidad.

Fase 2 (2020), centrada en conjuntos de datos relativos a certificados de eficiencia energética, registros SAT (Sociedades Agrarias de Transformación) y polígonos Industriales. Todas las comunidades han puesto los datos de eficiencia energética a disposición de los ciudadanos, pero falta una en polígonos Industriales y tres en registros SAT.

Fase 3 (2023), enfocada en datasets de agentes económicos, centros de enseñanza, centros de salud y ERES-ERTES (Expediente de Regulación de Empleo y Expediente de Regulación Temporal de Empleo). Se han producido avances con respecto al año pasado, pero se está trabajando en conseguir una mayor uniformidad en la información.

Nuevos casos de éxito y buenas prácticas

El informe finaliza con una sección donde se recopilan diversos casos de éxito de productos y servicios elaborados con información pública y que contribuyen al crecimiento de nuestra economía, como por ejemplo:

Calculadora de mejoras de eficiencia energética: permite identificar las intervenciones necesarias y estimar los costes asociados y el impacto en la certificación de eficiencia energética (CEE).
GEOPUBLIC: es una herramienta pensada para ayudar a las Administraciones Públicas a entender mejor su territorio. Permite analizar fortalezas, oportunidades y retos en comparación con otras regiones, provincias o municipios similares. Gracias a su capacidad de segmentar datos empresariales y sociodemográficos a diferentes escalas, facilita el seguimiento del ciclo de vida de las empresas y su influencia en la economía local.
Nueva web del observatorio sectorial DBK: mejora la búsqueda de información sectorial, gracias al seguimiento continuado de unos 600 sectores españoles y portugués. Publica anualmente más de 300 informes en profundidad y 1.000 fichas de coyuntura de información sectorial.
Servicio de asignación y reparación de datos: facilita la actualización de la información de los clientes de comercializadoras de energía eléctrica al permitir enriquecer dicha información con la referencia catastral asociada al punto de suministro. Con ello se da cumplimiento a un requerimiento de la Agencia Estatal de Administración Tributaria (AEAT).

El informe también incluye buenas prácticas de las administraciones públicas como:

El Callejero Digital de Andalucía Unificado (CDAU), que centraliza, normaliza y mantiene actualizados los datos geográficos y postales de la región.
El Geoportal del Ayuntamiento de Madrid, que integra metadatos, servicios de mapas OGC, un visor de mapas y un geolocalizador que respetan las directivas INSPIRE y LISIGE. Es fácil de usar tanto por profesionales como por la ciudadanía gracias a su interfaz intuitiva y accesible.
El Instituto Canario de Estadística (ISTAC), que ha puesto a disposición de la sociedad un ecosistema tecnológico innovador. En él destaca eDatos, una infraestructura de código abierto para la gestión de datos estadísticos asegurando la transparencia y la interoperabilidad.
El Inventario Forestal Nacional español (IFN) y su aplicación web Descarga IFN, un recurso básico para la gestión, investigación y educación forestal. Permite filtrar fácilmente las parcelas para su descarga.
El Nodo de Interoperabilidad Estadística, que da cobertura legal, organizativa, semántica y técnica para la integración de los diferentes sistemas de información de los distintos niveles de gestión administrativa.
El Open Cohesion School, un programa educativo innovador de la Generalitat de Catalunya dirigido a estudiantes de secundaria. Los estudiantes investigan proyectos financiados con fondos públicos para analizar su impacto, a la vez que desarrollan habilidades digitales, el pensamiento crítico y la participación cívica.
El Sistema Nacional de Publicidad de Subvenciones y Ayudas Públicas, que ha presentado un sitio web completamente rediseñado. Ha mejorado su funcionalidad con consultas y descargas API-REST. Tienes más información aquí.

En conclusión, el sector infomediario en España se consolida como un motor clave para la economía, mostrando una evolución sólida y un crecimiento constante. Con un número récord de empresas y una facturación que superó los 2.600 millones de euros en 2023, el sector no solo genera empleo, sino que se posiciona como un referente de innovación. La información, convertida en un recurso estratégico, impulsa un futuro económico más eficiente y conectado. Su adecuado aprovechamiento, siempre desde una perspectiva ética, promete seguir siendo una fuente de progreso tanto en el ámbito nacional como internacional.

15/04/2025

Guía para el despliegue de portales de datos. Buenas prácticas y recomendaciones

Documentación

Los portales de datos abiertos contribuyen a que los municipios ofrezcan un acceso estructurado y transparente a los datos que generan en el ejercicio de sus funciones y en la prestación de los servicios de su competencia, fomentando además la creación de aplicaciones, servicios y soluciones que generan valor tanto para la ciudadanía y las empresas como para las propias administraciones públicas.

El informe tiene como propósito ofrecer una guía práctica para que las administraciones municipales puedan diseñar, desarrollar y mantener portales de datos abiertos eficaces, integrándolos en la estrategia global de ciudades inteligentes. El documento se estructura en varias secciones que abarcan desde la planificación estratégica hasta las recomendaciones técnicas y operativas necesarias para la creación y mantenimiento de portales de datos abiertos. Algunas de las claves principales son:

Principios fundamentales

El informe destaca la importancia de integrar los portales de datos abiertos en planes estratégicos municipales, alineando los objetivos del portal con las prioridades locales y las expectativas ciudadanas. También recomienda elaborar un Plan de medidas para el impulso de la apertura y reutilización de datos (Plan RISP), que incluya modelos de gobernanza, licencias claras, agenda de apertura de datos y acciones para estimular su reutilización. Finalmente, enfatiza la necesidad de contar con personal capacitado en ámbitos estratégicos, técnicos y funcionales, capaces de gestionar, mantener y promover la reutilización de datos abiertos.

Requisitos generales

En cuanto a los requisitos generales para garantizar el éxito del portal, se destaca la importancia de ofrecer datos de calidad, consistentes y actualizados en formatos abiertos como CSV y JSON, pero también en XLS, favoreciendo la interoperabilidad con plataformas nacionales e internacionales mediante estándares abiertos como DCAT-AP, y garantizando una accesibilidad efectiva del portal mediante un diseño intuitivo, inclusivo y adaptado a diferentes dispositivos. También se señala la obligación de cumplir estrictamente las normativas de privacidad y protección de datos, especialmente el Reglamento General de Protección de Datos (RGPD).

Para promover la reutilización, el informe aconseja fomentar ecosistemas dinámicos a través de eventos comunitarios como hackatones y talleres, destacando ejemplos exitosos de aplicación práctica de los datos abiertos. Además, insiste en la necesidad de proporcionar herramientas útiles como API para consultas dinámicas, visualizaciones de datos interactivas y documentación completa, así como en implementar mecanismos sostenibles de financiación y mantenimiento.

Pautas técnicas y funcionales

Con respecto a las pautas técnicas y funcionales, el documento detalla la importancia de construir una infraestructura técnica robusta y escalable basada en tecnologías en la nube, utilizando sistemas de almacenamiento diversos como bases de datos relacionales, NoSQL y soluciones específicas para series temporales o datos geoespaciales. Destaca además la relevancia de integrar herramientas avanzadas de automatización para garantizar la calidad constante de los datos y recomienda soluciones específicas para gestionar datos en tiempo real provenientes de Internet de las Cosas (IoT).

En relación con la usabilidad y estructura del portal, se enfatiza la importancia de un diseño centrado en el usuario, con navegación clara y un potente motor de búsqueda para facilitar el acceso rápido a los datos. Además, se insiste en la importancia de cumplir con los estándares internacionales de accesibilidad y ofrecer herramientas que simplifiquen la interacción con los datos, incluyendo visualizaciones gráficas claras y mecanismos de soporte técnico eficientes.

El informe también resalta el papel clave de las API como herramientas fundamentales para facilitar el acceso automatizado y dinámico a los datos del portal, ofreciendo consultas granulares, documentación clara, mecanismos robustos de seguridad y formatos estándar reutilizables. Además, sugiere una variedad de herramientas y frameworks técnicos para implementar estas API de forma eficiente.

Otro aspecto crítico destacado en el documento es la identificación y priorización de conjuntos de datos para publicación, ya que la planificación progresiva de la apertura de datos permite ajustar los procesos técnicos y organizativos de manera ágil, comenzando con los datos de mayor relevancia estratégica y demanda ciudadana.

Por último, la guía recomienda establecer un sistema de métricas e indicadores según la norma UNE 178301:2015 para evaluar el grado de madurez y el impacto real de los portales de datos abiertos. Estas métricas abarcan dominios estratégicos, legales, organizativos, técnicos, económicos y sociales, proporcionando un enfoque integral para medir tanto la eficacia en la publicación de los datos como su impacto tangible en la sociedad y la economía local.

Conclusiones

En conclusión, el informe proporciona un marco estratégico, técnico y práctico que sirve de referencia para el despliegue de portales de datos abiertos municipales, para que las ciudades maximicen su potencial como motores de desarrollo económico y social. Además, la integración de inteligencia artificial en diversos puntos de los proyectos de portales de datos abiertos representa una oportunidad estratégica para ampliar sus capacidades y generar un mayor impacto en la ciudadanía.

03/04/2025

Cómo debe ser la gobernanza de datos en los modelos de IA open source

Blog

La inteligencia artificial (IA) de código abierto es una oportunidad para democratizar la innovación y evitar la concentración de poder en la industria tecnológica. Sin embargo, su desarrollo depende en gran medida de la disponibilidad de conjuntos de datos de alta calidad y de la implementación de marcos sólidos de gobernanza de datos. Un informe reciente de Open Future y la Open Source Initiative (OSI) analiza los desafíos y oportunidades en esta intersección, proponiendo soluciones para una gobernanza de datos equitativa y responsable. Puedes leer aquí el informe completo.

En este post, analizaremos las ideas más relevantes del documento, así como los consejos que ofrece para garantizar una correcta y efectiva gobernanza de datos en la inteligencia artificial open source y aprovechar todas sus ventajas.

Los retos de la gobernanza de datos en la IA

A pesar de la gran cantidad de datos disponibles en la web, su acceso y uso para entrenar modelos de IA plantean importantes desafíos éticos, legales y técnicos. Por ejemplo:

Equilibrio entre apertura y derechos: en línea con el Reglamento de Gobernanza de Datos (DGA), se debe garantizar un acceso amplio a los datos sin comprometer derechos de propiedad intelectual, privacidad y equidad.
Falta de transparencia y estándares de apertura: es importante que los modelos etiquetados como “abiertos” cumplan con criterios claros de transparencia en el uso de datos.
Sesgos estructurales: muchos conjuntos de datos reflejan sesgos lingüísticos, geográficos y socioeconómicos que pueden perpetuar desigualdades en los sistemas de IA.
Sostenibilidad ambiental: el uso intensivo de recursos para entrenar modelos de IA plantea desafíos de sostenibilidad que deben abordarse con prácticas más eficientes.
Involucrar a más actores: actualmente, los desarrolladores y las grandes corporaciones dominan la conversación sobre IA, dejando fuera a comunidades afectadas y organizaciones públicas.

Una vez identificados los retos, el informe propone una estrategia para alcanzar el objetivo principal: una gobernanza de datos adecuada en los modelos de IA de código abiertos. Este enfoque está basado en dos pilares fundamentales.

Hacia un nuevo paradigma de gobernanza de datos

En la actualidad, el acceso y la gestión de los datos para entrenar modelos de IA están marcados por una creciente desigualdad. Mientras algunas grandes corporaciones tienen acceso exclusivo a vastos repositorios de datos, muchas iniciativas de código abierto y comunidades marginadas carecen de los recursos para acceder a datos representativos y de calidad. Para abordar este desequilibrio es necesario un nuevo enfoque en la gestión y uso de los datos en la IA de código abierto. El informe destaca dos cambios fundamentales en la manera en que se concibe la gobernanza de datos:

Por un lado, adoptar un enfoque de data commons que no es más que un modelo de acceso que garantiza el equilibrio entre la apertura de datos y la protección de derechos. Para ello, sería importante utilizar licencias innovadoras que permitan compartir datos sin explotación indebida. También es relevante crear estructuras de gobernanza que regulen el acceso y uso de datos. Y, por último, implementar mecanismos de compensación para comunidades cuyos datos son utilizados en inteligencia artificial.

Por otro lado, es necesario trascender la visión centrada en desarrolladores de IA e incluir a más actores en la gobernanza de datos, como:

Propietarios de los datos y comunidades que generan contenido.
Instituciones públicas que pueden promover estándares de apertura.
Organizaciones de la sociedad civil que velen por la equidad y el acceso responsable a los datos.

Al adoptar estos cambios, la comunidad de IA podrá establecer un sistema más inclusivo, en el que los beneficios del acceso a datos se distribuyan de manera equitativa y respetuosa con los derechos de todas las partes interesadas. Según el informe, la implementación de estos modelos no solo aumentará la cantidad de datos disponibles para la IA de código abierto, sino que también fomentará la creación de herramientas más justas y sostenibles para la sociedad en su conjunto.

Consejos y estrategia

Para hacer efectiva una gobernanza de datos robusta en la IA de código abierto, el informe propone seis áreas de acción prioritarias:

Preparación y trazabilidad de datos: mejorar la calidad y documentación de los conjuntos de datos.
Mecanismos de licenciamiento y consentimiento: permitir a los creadores de datos definir su uso de manera clara.
Custodia de datos: fortalecer la figura de intermediarios que gestionen datos de forma ética.
Sostenibilidad ambiental: reducir el impacto del entrenamiento de IA con prácticas eficientes.
Compensación y reciprocidad: garantizar que los beneficios de la IA lleguen a quienes contribuyen con datos.
Intervenciones de política pública: promover regulaciones que incentiven la transparencia y el acceso equitativo a datos.

La inteligencia artificial de código abierto puede impulsar la innovación y la equidad, pero para lograrlo es necesario un enfoque de gobernanza de datos más inclusivo y sostenible. Adoptar modelos de datos comunes y ampliar el ecosistema de actores permitirá construir sistemas de IA más justos, representativos y responsables con el bien común.

El informe que publican Open Future y Open Source Initiative hace una llamada a la acción a desarrolladores, legisladores y sociedad civil para establecer normas compartidas y soluciones que equilibren la apertura de datos con la protección de derechos. Con una gobernanza de datos sólida, la IA de código abierto podrá cumplir su promesa de servir al interés público.

17/02/2025

Novedades del ecosistema de datos en España: segundo semestre de 2024

Noticia

Los últimos días del año siempre son un buen momento para echar la vista atrás y valorar los avances realizados. Si hace unas semanas hacíamos balance de lo sucedido en la iniciativa Aporta, ahora llega el momento de recopilar las novedades relacionadas con la compartición de datos, los datos abiertos y las tecnologías ligadas a ellos.

Hace seis meses, ya hicimos una primera recolección de hitos en el sector. En esta ocasión, vamos a resumir algunas de las innovaciones, mejoras y logros del último semestre del año.

Regulando e impulsando la inteligencia artificial

La inteligencia artificial (IA) continúa siendo uno de los campos donde cada día se aprecian nuevos avances. Se trata de un sector cuyo auge es relativamente nuevo y que necesita regulación. Por ello, la Unión Europea publicó el pasado julio el Reglamento de inteligencia artificial, una norma que marcará el entorno regulatorio europeo y global. Alineada con Europa, España ya presentó unos meses antes su nueva Estrategia de inteligencia artificial 2024, con el fin de establecer un marco para acelerar el desarrollo y expansión de la IA en España.

Por otro lado, en octubre, España asumió la copresidencia de Open Government Partnership (OGP). En su hoja de ruta está promover las ideas innovadoras, aprovechando las oportunidades que brindan los datos abiertos y la inteligencia artificial. Como parte del cargo, España organizará la próxima cumbre mundial de OGP en Vitoria.

Nuevas herramientas innovadoras basadas en datos

Los datos son el motor de una gran cantidad de herramientas tecnológicas disruptivas que pueden generar beneficios para toda la ciudadanía. Algunas de las puestas en marcha por organismos públicos durante estos últimos meses son:

El Ministerio de Transportes y Movilidad Sostenible cumple un año más utilizando tecnología Big Data para analizar el tráfico de las carreteras y mejorar las inversiones y la seguridad vial. Este año han vuelto a compartir datos de movilidad diaria como ya hicieron durante la pandemia de COVID-19, también han desarrollado nuevas herramientas para facilitar la consulta y visualización de estos datos y se han abierto aplicaciones específicas para ayudar a la reutilización de los datos en el contexto de la gestión de la zona afectada por la DANA.
El Principado de Asturias anuncia un plan para el uso de Inteligencia Artificial con el fin de acabar con los atascos durante el verano, a través de la elaboración de un gemelo digital.
El Gobierno de Aragón presentó un nuevo sistema de inteligencia turística, que utiliza Big Data e IA para mejorar la toma de decisiones en el sector.
La Región de Murcia ha lanzado "Murcia Business Insight" un aplicativo de business intelligence que permite realizar análisis dinámicos con datos sobre las empresas de la región: facturación, empleo, localización, sector de actividad, etc.
El Ayuntamiento de Granada ha utilizado Inteligencia Artificial para mejorar el alcantarillado. El objetivo es conseguir una planificación y ejecución "más eficiente" del mantenimiento, con datos in situ.
El Ayuntamiento de Segovia y Visa han firmado un acuerdo de colaboración para desarrollar una herramienta online con datos reales, agregados y anónimos de los patrones de gasto de los titulares extranjeros de tarjetas Visa en la capital. Esta iniciativa ofrecerá información de interés que permitirá adaptar las estrategias para fomentar el turismo internacional.

También los investigadores y estudiantes de diversos centros han comunicado avances fruto del trabajo con datos:

Investigadores del Centro de Regulación Genómica (CRG) de Barcelona, la Universidad del País Vasco (UPV/EHU), el Donostia International Physics Center (DIPC) y la Fundación Biofísica Bizkaia han entrenado un algoritmo para detectar alteraciones de tejidos en los estadios iniciales y mejorar el diagnóstico de cáncer.
Investigadores del Consejo Superior de Investigaciones Científicas (CSIC) y KIDO Dynamics, han puesto en marcha un proyecto para extraer metadatos de las antenas móviles para comprender el flujo de personas en parajes naturales. El objetivo es la identificación y control del impacto del turismo.
Una estudiante de la Universidad de Valladolid (UVa) ha diseñado un proyecto para mejorar la gestión y el análisis de los ecosistemas forestales en España a nivel local. Para ello, convierte los límites municipales a un formato de datos abiertos enlazados. Los resultados están disponibles para su reutilización.

Avances en espacios de datos

Desde el Ministerio para la Transformación Digital y de la Función Pública y, en concreto, desde la Secretaría de Estado de Digitalización e Inteligencia Artificial se continúa avanzando en la implementación de espacios de datos, a través de diversas acciones:

Se ha presentado un Plan de Impulso de los Espacios de Datos Sectoriales para impulsar la compartición segura de los datos.
Se ha puesto en marcha el desarrollo de Espacios de Datos para las Infraestructuras Urbanas Inteligentes (EDINT). Este proyecto, que se llevará a cabo a través de la Federación Española de Municipios y Provincias (FEMP), contempla la creación de un espacio de datos multisectorial que reunirá toda la información recopilada por las entidades locales.
Se han lanzado ayudas, en el ámbito de la digitalización, para la transformación digital de los sectores productivos estratégicos mediante el desarrollo de productos y servicios tecnológicos para espacios de datos.

Funcionalidades que acercan los datos a los reutilizadores

Las plataformas de datos abiertos de los diversos organismos también han presentado novedades, ya sean nuevos conjuntos de datos, funcionalidades, estrategias o informes:

El Ministerio para la Transición Ecológica y el Reto Demográfico ha lanzado una nueva aplicación para la visualización del Índice Nacional de Calidad del Aire (ICA) en tiempo real. Incluye recomendaciones sanitarias para la población general y la población sensible.
La Junta de Andalucía ha publicado una “Guía para el diseño de Estudios Piloto de Políticas Públicas”. En ella propone una metodología para diseñar estudios piloto y un sistema de recogida de evidencias para la toma de decisiones.
La Generalitat de Catalunya ha iniciado los pasos para implantar un nuevo modelo de gobierno del dato que permita mejorar las relaciones con la ciudadanía y las empresas.
El Ayuntamiento de Madrid está implantando una nueva cartografía 3D y un mapa térmico. En el Blog IDEE (Infraestructura de Datos Espaciales de España) nos contaron cómo se ha creado este modelo 3D de la capital utilizando diversas tecnologías de captura de dato.
El Instituto Canario de Estadística (ISTAC) ha publicado 6.527 mapas temáticos con indicadores laborales sobre Canarias en su catálogo de datos abiertos.
Iniciativa Open Data y la Unión Democrática de Pensionistas y Jubilados de España, con apoyo del Ministerio de Derechos Sociales, Consumo y Agenda 2030, presentaron la primera web de Datos del Observatorio de Datos x Mayores. Su objetivo es facilitar el análisis del envejecimiento saludable en España y la toma decisiones estratégicas. La Iniciativa de Barcelona también puso en marcha un reto para identificar 50 datasets relacionados con el envejecimiento saludable, un proyecto que cuenta con el soporte de la Diputación de Barcelona.
El Centro para el Desarrollo Tecnológico y la Innovación (CDTI) ha presentado un dashboard en fase beta con datos abiertos en formato explotable.

Además, se continúa trabajando para favorecer la apertura de datos desde diversas instituciones:

Asedie y la Universidad Rey Juan Carlos (Madrid) han puesto en marcha el Observatorio Open Data Reuse para promover la reutilización de los datos abiertos. Ya cuenta con el compromiso del Ayuntamiento de Madrid y están buscando más instituciones que se unan a su Manifiesto.
El Cabildo de Tenerife y la Universidad de La Laguna han desarrollado una Estrategia de Movilidad Sostenible en la Reserva de la Biosfera Macizo de Anaga. Se busca obtener datos en tiempo real para tomar medidas adaptadas a la demanda.

Concursos de datos y eventos para animar a utilizar datos abiertos

El verano fue la época elegida por distintos organismos públicos para lanzar concursos donde se buscaban productos y/o servicios basados en datos abiertos. Es el caso de:

La Comunidad de Madrid celebró DATAMAD 2024 en la Universidad Rey Juan Carlos de Madrid. El evento incluía un taller sobre cómo reutilizar datos abiertos y un datathon.
Más de 200 estudiantes de inscribieron al I Malackathon, organizado por la Universidad de Málaga, un concurso que premiaba los proyectos que usaban datos abiertos para plantear soluciones en la gestión de recursos hídricos.
La Junta de Castilla y León celebró el VIII Concurso de Datos Abiertos, cuyos ganadores se conocieron en el mes de noviembre.
También se lanzó el II Datathon de UniversiData. Han sido seleccionados 16 finalistas. Los ganadores se conocerán el 13 de febrero de 2025.
El Cabildo de Tenerife también organizó su I Concurso de Datos Abiertos: Ideas de reutilización. Actualmente se encuentran valorando las candidaturas recibidas. Más adelante lanzarán su II Concurso de Datos Abiertos: Desarrollo de APP.
El Gobierno de Euskadi llevó a cabo su V Concurso de datos abiertos. Ya se conocen los finalistas tanto de la categoría de Aplicaciones como de Ideas.

También en estos meses se han celebrado múltiples eventos, que se pueden ver online, como:

Otros ejemplos de eventos que se celebraron pero no están disponibles online son el III Congreso & XIV Jornadas de Usuarios de R, el Congreso de Innovación Pública Novagob 2024, DATAGRI 2024 o la Jornada Gobierno del Dato para Entidades Locales, entre otros.

Estos son solo algunos ejemplos de la actividad realizada durante los últimos seis meses en el ecosistema de datos de España. Te animamos a compartir otras experiencias que conozcas en los comentarios o a través de nuestra dirección de correo electrónico dinamizacion@datos.gob.es

30/12/2024

España, un año más entre los países que marcan tendencia en datos abiertos

Noticia

El portal europeo de datos, data.europa.eu, ha publicado el Open Data Maturity Index de 2024, un informe anual que evalúa el nivel de madurez de los países europeos en materia de datos abiertos.

Para su elaboración, se ha realizado una encuesta a los 34 países participantes, incluidos los 27 Estados miembros de la Unión Europea, cuatro países candidatos (Bosnia y Herzegovina, Albania, Serbia y Ucrania) y tres países de la Asociación Europea de Libre Comercio (Islandia, Noruega y Suiza).

En la edición de este año, España obtiene una calificación total del 95% sobre 100%. Con ello se coloca en la sexta posición general. Tal y como se refleja en la siguiente imagen, un año más, España se sitúa en el grupo de los llamados países marcadores de tendencia (trendsetter) que son aquellos con mejores puntuaciones del ranking, y entre los que también se encuentran Francia, Polonia, Ucrania, Eslovaquia, Irlanda, Lituania, República Checa, Italia, Estonia y Chipre.

Figura 1: Grupos de países participantes en función de su puntuación global de madurez en datos abiertos

Por encima de la media de la UE27 en las cuatro dimensiones analizadas

La Dimensión Política, centrada en las políticas de datos abiertos de los distintos países, analiza la existencia de modelos de gobernanza nacional para la gestión de datos abiertos y las medidas que se han aplicado para implementar las estrategias existentes. En estos aspectos, España ha obtenido un 96% frente a la media europea, que se sitúa en 91%. Los aspectos más positivos que se identifican son:

Alineamiento con las políticas europeas: El informe resalta que España está plenamente alineada con la Directiva europea relativa a los datos abiertos, entre otras de las recientes regulaciones ligadas al ámbito de los datos que han entrado en vigor.
Planes de acción bien definidos: Se subrayan las estrategias desplegadas en diferentes administraciones públicas enfocadas a incentivar la publicación y reutilización de datos generados en tiempo real y datos provenientes de la ciudadanía.
Fortalecimiento de competencias: Se focaliza en cómo España ha desarrollado programas formativos para mejorar las habilidades de los funcionarios públicos en gestión y publicación de datos abiertos, asegurando estándares de calidad y fomentando una cultura del dato en la administración pública.

La Dimensión Impacto analiza las actividades realizadas para supervisar y medir, tanto la reutilización de datos abiertos, como el impacto creado fruto de dicha reutilización. Año tras año, esta viene siendo la dimensión menos madura de toda Europa. Así, frente al 80% de media de la UE, España obtiene una puntuación del 100% por el desarrollo de numerosas actuaciones, entre las que destacan:

Colaboración multisectorial: El informe subraya cómo nuestro país se presenta como ejemplo de interacción entre administraciones públicas, empresas privadas y la sociedad civil, materializada en ejemplos tales como los estrechos lazos ente el sector público y la Asociación Multisectorial de la Información (ASEDIE), que elabora año tras año el informe de ASEDIE sobre reutilización de la información del sector público.
Ejemplos de reutilización en sectores clave: Se pone de manifiesto cómo España ha impulsado numerosos casos de reutilización de datos abiertos en áreas estratégicas como medio ambiente, movilidad y energía.
Innovación en la comunicación: El documento destaca el esfuerzo invertido en estrategias de comunicación innovadoras para concienciar a la ciudadanía sobre el valor de los datos, y de forma especial a audiencias jóvenes. Se destacan, también la producción de podcasts con entrevistas a expertos en datos abiertos, acompañados de videos promocionales cortos

La Dimensión Portal se enfoca en analizar las funcionalidades de la plataforma nacional que permitan a los usuarios acceder a los datos abiertos e interaccionar dentro de la comunidad. Con un 96% frente al 82% de la EU27, España se posiciona como uno de los referentes europeos en la mejora de la experiencia de los usuarios y en la optimización de portales nacionales. Los aspectos más destacados en el informe son:

Sostenibilidad y mejora continua: Según refleja el informe, España ha demostrado un fuerte compromiso con la sostenibilidad de la plataforma nacional de datos abiertos (datos.gob.es) y con su adaptación a las nuevas demandas tecnológicas.

Interacción con los usuarios: Se subraya como una de las grandes fortalezas la promoción activa desde la plataforma de los datasets disponibles y de los canales a través de los cuales los usuarios pueden solicitar datos que no estén disponibles en el Catálogo Nacional.

Por último, la Dimensión Calidad examina los mecanismos para garantizar la calidad de los (meta)datos. Aquí España obtiene un 88% frente al 79% de la UE. España sigue destacando con iniciativas que garantizan la fiabilidad, accesibilidad y estandarización de los datos abiertos. Algunos puntos fuertes que pone de relieve el informe son:

Automatización de metadatos: Se destaca el empleo de técnicas avanzadas para la recolección automática de metadatos, reduciendo la dependencia de procesos manuales y mejorando la precisión y la actualización en tiempo real.
Guías para la calidad de datos y metadatos: España proporciona múltiples guías prácticas para mejorar la publicación y calidad de los datos abiertos, incluyendo técnicas de anonimización, publicación en formatos tabulares (CSV) y el uso de APIs.

Seguir innovando para mantener la posición avanza de España en la madurez de datos abiertos

Si bien España sigue destacando en la UE gracias a su ecosistema de datos abiertos, los esfuerzos deben continuar. Para ello, en el mismo informe se identifican líneas de trabajo para los países que, como España, buscan seguir manteniendo su posición avanzada en la madurez de datos abiertos y seguir innovando. Entre otras, se refieren las siguientes recomendaciones:

Consolidar ecosistemas de datos abiertos: Fortalecer comunidades temáticas de proveedores y reutilizadores priorizando los conjuntos de datos de alto valor (HVDs) en su desarrollo y promoción.
Impulsar la coordinación: Alinear la estrategia nacional con las necesidades de las agencias y autoridades locales.
Desarrollar métricas de impacto específicas por país: Colaborar con universidades, instituciones de investigación y otras entidades para crear marcos de evaluación del impacto.
Medir y divulgar el impacto de los datos abiertos: Realizar evaluaciones periódicas (anuales o bianuales) sobre el impacto económico, ambiental y social de los datos abiertos, promoviendo los resultados para generar apoyo político.
Facilitar la participación de la comunidad de datos abiertos: Garantizar que los proveedores mejoren la publicación de datos según las opiniones y calificaciones de los usuarios.
Incrementar la calidad de los datos y metadatos: Usar herramientas automatizadas y validaciones para mejorar los estándares de publicación, incluso adoptando tecnología de inteligencia artificial para optimizar la calidad de los metadatos.
Promocionar casos de reutilización exitosos: Publicar y promover casos de éxito en el uso de datos abiertos, interactuar con proveedores y usuarios para identificar necesidades y aplicaciones innovadoras.

De manera general, el informe pone de manifiesto el buen avance en materia de datos abiertos en toda Europa. Aunque existen áreas de mejora, el panorama open data europeo se va consolidando, con España en las primeras posiciones de la tabla. Puedes leer el informe completo del Open Data Maturity Index 2024 aquí.

19/12/2024

Data Sandboxes: Explorando el potencial de los datos abiertos en un entorno seguro

Blog

Los data sandboxes son herramientas que nos proporcionan entornos donde poder probar nuevas prácticas y tecnologías relacionadas con los datos, lo que los convierte en poderosos instrumentos a la hora de gestionar y utilizar los datos de manera segura y eficaz. Estos espacios donde operar de forma segura con los datos son de gran utilidad a la hora de determinar si es viable abrir los datos y bajo qué condiciones. Algunos de los beneficios que nos ofrecen son:

Entornos controlados y seguros: proporcionan un espacio de trabajo donde poder explorar la información y evaluar su utilidad y calidad antes de comprometerse a compartirlos de manera más amplia. Esto resulta particularmente importante en sectores sensibles, donde la privacidad y seguridad de los datos son primordiales.
Facilitan la innovación: ofrecen un espacio seguro para la experimentación y el prototipado rápido, permitiendo iterar rápidamente, probando y perfeccionando nuevas ideas y soluciones basadas en datos a modo de banco de pruebas antes de lanzarlas al público.
Colaboración multisectorial: facilitan la colaboración entre diversos actores, incluyendo entidades gubernamentales, empresas privadas, el entorno académico y la sociedad civil. Este enfoque multisectorial ayuda a romper los silos de datos y promueve el intercambio de conocimientos y buenas prácticas entre sectores.
Uso adaptable y escalable: pueden ajustarse para adaptarse a diferentes tipos de datos, casos de uso y sectores, lo que los convierte en una herramienta versátil para diversas iniciativas basadas en datos.
Intercambio de datos transfronterizo: aportan una solución viable para gestionar los desafíos del intercambio de datos entre distintas jurisdicciones, especialmente en lo que respecta a las normativas internacionales de privacidad.

El informe "Data Sandboxes: Managing the Open Data Spectrum" explora el concepto de los data sandboxes como una herramienta para conseguir un equilibrio adecuado entre los beneficios de los datos abiertos y la necesidad de proteger la información sensible.

Propuesta de valor para la innovación

Además de todos los beneficios anteriormente vistos, cabe destacar que los data sandboxes ofrecen también una sólida propuesta de valor para las organizaciones que buscan innovar de manera responsable. Estos entornos nos ayudan a mejorar la calidad de los datos al facilitar que los usuarios puedan identificar inconsistencias y poder así llevar a cabo las mejoras necesarias. También contribuyen a reducir los riesgos al proporcionar entornos seguros para permitir el trabajo con datos sensibles. Al fomentar la experimentación interdisciplinaria, la colaboración y la innovación, contribuyen a aumentar la capacidad de uso de los datos y a desarrollar una cultura impulsada por los datos dentro de las organizaciones. Además, los data sandboxes ayudan a reducir las barreras de acceso a los datos, mejorando la transparencia y la rendición de cuentas, lo que fortalece la confianza de los ciudadanos y da lugar a una expansión en los intercambios de datos.

Tipos de data sandboxes y características

Dependiendo del principal objetivo que tengamos a la hora de implantar un sandbox podemos encontrarnos con tres tipologías distintas:

Regulatory sandboxes, que permiten a las empresas y organizaciones poner a prueba servicios innovadores bajo la estrecha supervisión de los reguladores de un sector o área específico.
Innovation sandboxes, que son frecuentemente utilizados por los desarrolladores a la hora de probar nuevas funcionalidades y obtener una retroalimentación rápida sobre su trabajo.
Research sandboxes, los cuales facilitan que tanto el mundo académico como la industria puedan probar de manera segura nuevos algoritmos o modelos centrándose en el objetivo de sus pruebas, sin tener que preocuparse por incumplir las normativas establecidas.

En cualquier caso, independientemente del tipo de sandbox con el que estemos trabajando, todos ellos se caracterizan por los siguientes aspectos clave comunes:

Características de un data sandbox: adaptable y escalable, controlado, seguro, multisectorial y colaborativo, alta capacidad de computación, temporal. Fuente: adaptado de The Govlab.

Figura 1. Características de un data sandbox. Adaptación de un visual de The Govlab.

A continuación, se describe cada una de ellas:

Controlados: son entornos restringidos donde se puede acceder a los datos sensibles y analizados de manera segura, asegurando el cumplimiento de las regulaciones pertinentes.
Seguros: protegen la privacidad y seguridad de los datos, a menudo utilizando datos anonimizados o sintéticos.
Colaborativos: facilitan la colaboración entre diferentes regiones, sectores y roles, fortaleciendo los ecosistemas de datos.
Alta capacidad de computación: proporcionan recursos computacionales avanzados capaces de realizar tareas complejas con los datos cuando sea necesario.
Temporales: están diseñados para un uso temporal y con un ciclo de vida corto, permitiendo una experimentación rápida y enfocada que o bien concluye una vez logrado su objetivo o se convierte en un nuevo proyecto a largo plazo.
Adaptables: son lo suficientemente flexibles para personalizarse y escalar según las necesidades y los diferentes tipos de datos, casos de uso y contextos.

Ejemplos de data sandboxes

Los data sandboxes llevan ya mucho tiempo implantándose con éxito en múltiples sectores a lo largo de Europa y todo el mundo, por lo que podemos encontrar fácilmente varios ejemplos de su implementación en nuestro continente:

Laboratorio de ciencia de datos en Dinamarca: proporciona acceso a datos administrativos sensibles de utilidad para la investigación, fomentando la innovación bajo estrictas políticas de gobernanza de datos.
TravelTech en Lituania: un sandbox de acceso abierto que ofrece datos turísticos para mejorar el desarrollo empresarial y de la fuerza laboral en el sector.
Sandbox para datos abiertos de la iniciativa INDIGO: promueve el intercambio de datos entre sectores para mejorar las políticas sociales, enfocándose en crear un entorno seguro para las iniciativas de intercambio de datos bilaterales.
Sandbox de ciencia de datos de salud en Dinamarca: una plataforma de formación para investigadores que permite practicar análisis de datos utilizando datos biomédicos sintéticos sin tener que preocuparse por la estricta regulación.

Dirección futura y desafíos

Como hemos visto, los data sandboxes pueden resultar una herramienta poderosa a la hora de fomentar la apertura de datos, la innovación y la colaboración, asegurando al mismo tiempo la privacidad y seguridad de la información. Gracias a que proporcionan un entorno controlado para la experimentación con datos, permiten que los todos aquellos interesados puedan explorar nuevas aplicaciones y conocimientos de manera fiable y segura. Los sandboxes pueden por tanto ayudar a superar las barreras iniciales de acceso a los datos y contribuir a fomentar un uso más informado y con un propósito mejor definido de los mismos, promoviendo así el uso de soluciones basadas en datos para los problemas de ámbito público.

Sin embargo, a pesar de sus múltiples beneficios, los data sandboxes presentan también varios desafíos a la hora de su implementación. Los principales problemas con los que nos podríamos encontrar a la hora de llevarlos a la práctica incluyen:

Relevancia: conseguir que el sandbox contenga datos de alta calidad y relevantes, y que estos se mantengan actualizados.
Gobernanza: establecer reglas claras y protocolos para el acceso, uso y compartición de datos, así como los mecanismos de monitorización y cumplimiento de los mismos.
Escalabilidad: exportar con éxito las soluciones desarrolladas dentro del sandbox y poder trasladarlas a aplicaciones prácticas dentro del mundo real.
Gestión de riesgos: abordar de forma integral todos los riesgos asociados con la reutilización de datos a lo largo de su ciclo de vida y sin comprometer su integridad.

No obstante, a medida que las tecnologías y políticas continúan evolucionando, está claro que los data sandboxes están llamados a ser una herramienta útil y representar un papel relevante en la gestión del espectro de apertura de los datos, impulsando así el uso de los datos para la resolución de problemas cada vez más complejos. Así mismo, el futuro de los data sandboxes estará influenciado por los nuevos marcos regulatorios (como los Reglamentos de Datos y Gobernanza de Datos) que refuerzan la seguridad de los datos y promueven su reutilización, y por la integración con las tecnologías de preservación y mejora de la privacidad que nos permiten utilizar los datos sin necesidad de exponer ninguna información sensible. Juntas, estas tendencias impulsarán una innovación de datos más segura dentro de los entornos proporcionados por los data sandboxes.

Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

27/09/2024

El estado de la innovación y la transformación digital en España

Noticia

La transformación digital se ha convertido en un pilar fundamental para el desarrollo económico y social de los países en el siglo XXI. En España, este proceso ha cobrado una relevancia especial en los últimos años, impulsado por la necesidad de adaptarse a un entorno global cada vez más digitalizado y competitivo. La pandemia de COVID-19 actuó como un catalizador, acelerando la adopción de tecnologías digitales en todos los sectores de la economía y la sociedad.

Sin embargo, la transformación digital no solo implica la incorporación de nuevas tecnologías, sino también un cambio profundo en la forma en que las organizaciones operan y se relacionan con sus clientes, empleados y socios. En este contexto, España ha realizado importantes avances, situándose como uno de los países líderes en Europa en varios aspectos de la digitalización.

A continuación, se presentan algunos de los informes más destacados que analizan este fenómeno y sus implicaciones.

Informe sobre el estado de la Década Digital 2024

El informe sobre el estado de la Década Digital 2024 examina la evolución de las políticas europeas dirigidas a alcanzar los objetivos y metas acordados para el éxito de la transformación digital. Para ello evalúa el grado de cumplimiento en base a diversos indicadores, incluidos en cuatro grupos: infraestructura digital, transformación digital de los negocios, habilidades digitales y servicios públicos digitales.

Figura 1. Balance de los avances hacia los objetivos de la Década Digital fijados para 2030, "Informe sobre el Estado de la Década Digital 2024", Comisión Europea.

En los últimos años, la Unión Europea (UE) ha mejorado considerablemente su actuación mediante la aprobación de medidas reguladoras -con 23 nuevos avances legislativos, que incluyen, entre otros, el Reglamento de gobernanza de datos y el Reglamento de datos- para dotarse de un marco de gobernanza global: el Programa de política de la Década Digital para 2030.

El documento incluye una evaluación de las hojas de ruta estratégicas de los diversos países de la Unión. En el caso de España, se destacan dos principales fortalezas:

El avance en el uso de inteligencia artificial por parte de las empresas (9,2% frente al 8,0% europeo), donde el crecimiento anual de España (9,3%) es cuatro veces superior al de la UE (2,6%).
La gran cantidad de ciudadanos con capacidades digitales básicas (66,2%), frente al promedio europeo (55,6%).

Por otro lado, los principales retos a superar son la adopción de los servicios en la nube (27,2% versus 38,9% de la UE) y el número de especialistas en tecnologías de la información y la comunicación o TIC (4,4% frente al 4,8% europeo).

En la siguiente imagen se puede observar la previsión en España de evolución de los indicadores clave analizados para 2024, en comparación con las metas fijadas por la UE para 2030.

Figura 2. Indicadores clave de rendimiento de España, "Informe sobre el Estado de la Década Digital 2024", Comisión Europea.

Se espera que España alcance el 100% en prácticamente todos los indicadores para 2030. Para ello, el país tiene previsto asignar un presupuesto estimado de 26.700 millones de euros (1,8 % del PIB), sin tener en cuenta inversiones privadas. Esta hoja de ruta demuestra el compromiso para alcanzar los objetivos y metas de la Década Digital.

Además de la inversión, para conseguir el objetivo, en el informe se recomienda focalizar esfuerzos en tres áreas: la adopción de tecnologías avanzadas (IA, análisis de datos, nube) por parte de pymes; la digitalización y promoción del uso de servicios públicos; y la atracción y retención de especialistas TIC a través del diseño de planes de incentivos.

European Innovation Scoreboard 2024

El European Innovation Scoreboard realiza de manera anual una evaluación comparativa de los avances en investigación e innovación en diversos países, no solo europeos. El informe clasifica a las regiones en cuatro grupos de innovación que van de más a menos: Líderes en innovación, Innovadores fuertes, Innovadores moderados e Innovadores emergentes.

España se encuentra liderando el grupo de Innovadores moderados, con un rendimiento del 89,9% del promedio de la UE. Esto representa una mejora en comparación con años anteriores y supera el promedio de otros países de su misma categoría, que es del 84,8%. Nuestro país se sitúa por encima de la media comunitaria en tres indicadores: digitalización, capital humano y financiación y soporte. Por otro lado, las áreas en las que más debe mejorar son el empleo en innovación, la inversión empresarial y la innovación en pymes. Todo ello se recoge el siguiente gráfico:

Figura 3. Bloques que componen el índice sintético de la innovación en España, European Innovation Scorecard 2024 (adaptado de la Fundación COTEC).

Informe de la Sociedad Digital en España 2023

La Fundación Telefónica también realiza de manera periódica un informe donde se analizan los principales cambios y tendencias que está experimentando nuestro país a raíz de la revolución tecnológica.

La edición actualmente disponible es la de 2023. En él se destaca que “España sigue profundizando en su proceso de transformación digital a buen ritmo y ocupa un puesto destacado en este aspecto entre los países europeos”, resaltando sobre todo el área de conectividad. No obstante, siguen existiendo brechas digitales, principalmente por motivo de edad.

También se avanza en la relación de los ciudadanos con las administraciones digitales: el 79,7 % de las personas de entre 16 y 74 años utilizaron en 2022 páginas web o aplicaciones móviles de alguna administración. Por otro lado, el tejido empresarial español avanza en su digitalización, incorporando herramientas digitales, sobre todo en el ámbito del marketing. No obstante, aún queda margen de mejora en aspectos de análisis de macrodatos y la aplicación de inteligencia artificial, actividades que actualmente han implementado, en general, solo las grandes empresas.

Informe sobre el talento en inteligencia artificial y datos

IndesIA, una asociación que promueve el uso de la inteligencia artificial y el Big Data en España, ha realizado un análisis cuantitativo y cualitativo del mercado de talento en datos e inteligencia artificial en 2024 en nuestro país.

De acuerdo con el informe, el mercado de talento de datos e inteligencia artificial representa casi un 19% del total de profesionales TIC de nuestro país. En total, son 145.000 profesionales (+2,8% de 2023), de los cuales solo el 32% son mujeres. Aun así, existe un gap entre oferta y demanda, sobre todo en ingenieros de procesamiento del lenguaje natural. Para resolver esta situación el informe analiza seis áreas de mejora: estrategia y planificación de plantillas, identificación de talento, activación de talento, engagement, formación y desarrollo, y cultura data-driven.

Otros informes de interés

La Fundación COTEC también realiza de manera periódica diversos informes sobre la materia. En su web encontramos documentos sobre la ejecución presupuestaria de la I+D en el sector público, la percepción social de la innovación o el mapa del Talento autonómico.

Por su parte, la Fundación Orange en España y la consultora Nae han realizado un informe para analizar la evolución digital en los últimos 25 años, el mismo periodo que lleva en nuestro país dicha Fundación. El informe destaca que, entre 2013 y 2018, el sector digital ha contribuido en unos 7.500 millones de euros anuales al PIB del país.

En definitiva, todos ellos destacan la situación de España entre los líderes europeos a nivel de transformación digital, pero con la necesidad de avanzar en innovación. Para ello, no solo es necesario impulsar las inversiones económicas, sino también promover un cambio cultural que fomente la creatividad. Una mentalidad más abierta y colaborativa permitirá a las empresas, administraciones y a la sociedad en general adaptarse rápidamente a los cambios tecnológicos y aprovechar las oportunidades que estos brindan para asegurar un futuro próspero para España.

¿Conoces más informes sobre la materia? Déjanos un comentario o escríbenos a dinamizacion@datos.gob.es.

02/09/2024

Principios globales del periodismo con IA

Blog

Marcos éticos generales

La ausencia de un marco ético, común y unificado para el uso de la inteligencia artificial en el mundo es solo aparente y, en cierto modo, un mito. Existen multitud de cartas, manuales y conjuntos de normas supranacionales que recogen principios de uso ético, si bien algunos de ellos han tenido que actualizarse con la aparición de nuevas herramientas y usos. La guía de la OCDE de estándares éticos para el uso de la inteligencia artificial, publicada en 2019 pero actualizada en 2024, incluye principios basados en valores y también recomendaciones para los responsables de políticas públicas. El Observatorio Global de Ética y Gobernanza de la IA de la UNESCO publicó en 2021 un material llamado Recomendación sobre la ética de la IA, adoptado en el mismo año por 193 países, y basado en cuatro principios básicos: los derechos humanos, la justicia social, la diversidad e inclusividad, y el respeto al ecosistema ambiental. También en 2021 la OMS recogía específicamente un documento de Ética y gobernanza de la IA para la salud, donde indicaba la necesidad de establecer responsabilidades para las organizaciones en el uso de la IA cuando esta afectase a pacientes y a trabajadores sanitarios. Sin embargo, diversas entidades y sectores a distintos niveles han tomado la iniciativa de establecer sus propias normativas y guías éticas, más ajustadas a su contexto. Por ejemplo, en febrero de 2024, el Ministerio de Cultura en España elaboraba una guía de buenas prácticas para establecer, entre otras directrices, que no podrían ser galardonadas las obras creadas exclusivamente con IA generativa.

Por tanto, el reto no está en la ausencia de guías éticas globales, sino en la excesiva globalidad de estos marcos. Con el legítimo objetivo de que resistan el paso del tiempo, sean válidos para la situación específica de cualquier país del mundo y se mantengan operativos ante nuevas disrupciones, estos estándares generales acaban recurriendo a conceptos que ya conocemos, como los que podemos leer en esta otra guía ética del Foro Económico Mundial: explicabilidad, transparencia, fiabilidad, robustez, privacidad, seguridad. Conceptos demasiado altos, predecibles, y que casi siempre miran la IA desde el punto de vista del desarrollador y no del usuario.

Manifiestos de los medios

En esta línea, los grandes grupos de comunicación han invertido sus esfuerzos en desarrollar principios éticos específicos para el uso de la IA en la creación y difusión de contenidos, que constituye por ahora un vacío significativo en los grandes marcos e incluso en el propio Reglamento europeo. Estos esfuerzos se han materializado en ocasiones de manera individual, en forma de manifiesto, pero también en un nivel superior como colectivo. Entre los manifiestos más relevantes destacan el de Le Figaro, en el que su redacción establece que no publicará ningún artículo o contenido visual generado con IA, o el de The Guardian que, actualizado en 2023, afirma que la IA es una herramienta habitual en las redacciones, pero únicamente como asistencia para asegurar la calidad de su trabajo. Por su parte, los medios españoles no han emitido manifiestos propios, pero sí han apoyado diferentes iniciativas colectivas. El Grupo Prisa, por ejemplo, aparece en la lista de organizaciones que suscriben el Manifiesto por una IA responsable y sostenible, publicado por Forética en 2024. También son interesantes las declaraciones de los responsables de innovación y estrategia digital de El País, El Español, El Mundo y RTVE que encontramos en una entrevista publicada en Fleet Street en abril de 2023. Ante la pregunta de si existen en sus medios líneas rojas específicas en el uso de la IA, todos declaran tener una actitud abierta de exploración y no haber delimitado demasiado el uso. Tan solo RTVE, se desmarca con una afirmación: “Entendemos que es algo complementario y para ayudarnos. Cualquier cosa que haga un periodista no queremos que la haga una IA. Tiene que estar bajo nuestro control”.

Principios globales del periodismo

En el contexto editorial encontramos por tanto un panorama de normativas múltiples en tres niveles posibles: manifiestos propios de cada medio, iniciativas colectivas del sector y la adhesión a códigos éticos generales a nivel nacional. En este escenario, a finales de 2023 la News Media Alliance publicaba los Principios globales de la IA en el periodismo, un documento firmado por grupos editoriales a nivel internacional que recoge, a modo de decálogo, 12 principios éticos fundamentales divididos en 8 bloques:

Figura 1. Principios globales de la IA en el periodismo, News Media Alliance.

Cuando los revisamos en profundidad, encontramos en ellos algunos de los grandes conflictos que están marcando el desarrollo de la inteligencia artificial moderna, conexiones con el Reglamento Europeo de IA y reivindicaciones que son constantes por parte de los creadores de contenido:

Bloque 1: Propiedad intelectual. Es el primer bloque y el más completo, desarrollado específicamente en cuatro principios éticos complementarios. Aunque parece el principio más evidente, está orientado a poner el foco en uno de los principales conflictos de la IA moderna: el uso indiscriminado de contenido publicado en internet (texto, imagen, vídeo, música) para entrenar modelos de aprendizaje sin consultar ni remunerar a los autores. El primer principio ético manifiesta el deber, por parte de los desarrolladores de sistemas de IA, de respetar las restricciones o limitaciones impuestas por los titulares de derechos de autor sobre el acceso y uso de los contenidos. El segundo expresa la capacidad de estos autores y grupos editoriales para negociar una remuneración justa por el uso de su propiedad intelectual. El tercero, legitima el copyright como base suficiente ante la ley para proteger los contenidos de un autor. El cuarto reclama reconocer y respetar los mercados existentes para la concesión de licencias, esto es: crear contratos, acuerdos y modelos de mercado eficientes para que los sistemas de IA puedan entrenarse con contenido de calidad, pero legítimo, autorizado y licenciado.
Bloque 2: Transparencia. El segundo bloque es una continuación lógica del anterior, y aboga por la transparencia en el funcionamiento, una característica que aporta valor tanto a los autores de contenido como a los usuarios de los sistemas IA. Este principio coincide con la obligación central que el Reglamento Europeo establece para los sistemas de IA generativa: deben ser transparentes desde un principio y declarar con qué contenidos han entrenado, con qué procedimientos los han conseguido y en qué medida cumplen con los derechos de propiedad intelectual de los autores. Esta transparencia es esencial para que los creadores y grupos editoriales puedan hacer valer sus derechos, y se establece además que este principio deba cumplirse con carácter universal, independientemente de la jurisdicción en la que se realicen el entrenamiento o las pruebas.
Bloque 3: Responsabilidad. En inglés accountability, una palabra que recoge la capacidad para rendir cuentas sobre una acción. El principio expresa que los desarrolladores y operadores de sistemas de IA deben ser responsables de los resultados (outputs) generados por sus sistemas, por ejemplo, en el caso de atribuir contenidos a los autores que no son reales, o si contribuyen a la desinformación o a socavar la confianza en la ciencia o los valores democráticos.
Bloque 4: Calidad e integridad. La base del principio es que los contenidos generados por IA deben ser precisos, correctos y completos, y no deben distorsionar las obras originales. Sin embargo, sobre esta idea superficial se construye una más ambiciosa: la de que los grupos editoriales y de comunicación deben ser garantes de esta calidad e integridad, y por tanto proveedores oficiales de los desarrolladores y proveedores de sistemas de IA. El argumento fundamental es que la calidad del contenido para el entrenamiento definirá la calidad de los resultados del sistema.
Bloque 5: Justicia. La palabra fairness en español puede traducirse también como equidad o imparcialidad. El principio recoge en su titular que el uso de IA no debe crear injusticias en los mercados, prácticas anticompetitivas o competencia desleal, lo que quiere decir que no debe permitirse su uso para fomentar abusos de dominio ni excluir a rivales del mercado. Este principio no va orientado a regular la competencia entre los desarrolladores de IA, sino entre estos y los proveedores de contenido: el texto, la música o las imágenes generadas con IA no deberían competir nunca en igualdad de condiciones con el contenido generado por los autores.
Bloque 6: Seguridad. Se compone de dos principios éticos. Redundando en los anteriores, el primer principio de seguridad establece que los sistemas de IA generativa deben ser confiables en cuanto a las fuentes de información que utilizan y promueven, las cuales no deben alterar ni representar de manera incorrecta los contenidos, preservando su integridad original. Lo contrario podría traducirse en un debilitamiento de la confianza del público en las obras originales, en los autores e incluso en los grandes grupos de comunicación. Este principio aplica en gran medida a los nuevos motores de búsqueda asistidos por IA, como la nueva búsqueda en Google (SGE), el nuevo SearchGPT o el propio Copilot de Microsoft, que recopilan y refunden información de diferentes fuentes en un solo párrafo generado. El segundo punto unifica en un solo principio las problemáticas de privacidad de datos del usuario y, en apenas una frase, se refiere a los sesgos discriminatorios. Los desarrolladores deben poder explicar cómo, cuándo y para qué utilizan los datos de los usuarios, y deben asegurar que los sistemas no producen, multiplican o cronifican sesgos de discriminación a personas o colectivos.
Bloque 7: Diseño ético. Se trata de un metaprincipio que engloba a todos los demás, y que establece que todos los principios deben incorporarse desde el diseño en todos los sistemas de IA, generativa o no. Históricamente se ha considerado la ética al final del proceso de desarrollo, como una cuestión secundaria o menor, por lo que el principio defiende que la ética debe ser una preocupación significativa y fundamental desde el mismo proceso de diseño del sistema. Tampoco puede relegarse la auditoría ética únicamente a aquellos casos en que los usuarios presentan una reclamación.
Bloque 8: Desarrollo sostenible. Aparentemente es un principio global, de alto alcance, que establece que los sistemas de IA deben estar alineados con los valores humanos y operar de acuerdo con las leyes globales, con el fin de beneficiar a toda la humanidad y a las generaciones futuras. Sin embargo, en la última frase encontramos la orientación real del principio, una conexión con los grupos editoriales como proveedores de datos para los sistemas IA: “La financiación a largo plazo y otros incentivos para los proveedores de datos de entrada de alta calidad puede ayudar a alinear los sistemas con los objetivos sociales y extraer el conocimiento más importante, actualizado y procesable.”

El documento está firmado por 31 asociaciones de grupos editoriales de países como Dinamarca, Corea, Canadá, Colombia, Portugal, Brasil, Argentina, Japón o Suecia, por asociaciones a nivel europeo, como European Publishers Council o News Media Europe, y asociaciones a nivel mundial como WAN-IFRA (World Association of News Publishers). Entre los grupos españoles destacan la Asociación de Medios de Información (AMI) y la Asociación de Revistas (ARI).

La ética como instrumento

Los principios globales del periodismo promovidos por la News Media Alliance son particularmente precisos al proponer soluciones aterrizadas a dilemas éticos muy representativos de la situación actual, como es el uso del contenido de autor para la explotación comercial de los sistemas de IA. Son útiles a la hora de intentar establecer un marco ético sólido y, sobre todo, unificado y global que propone soluciones consensuadas. Al mismo tiempo, en el documento podemos percibir la ausencia de otros conflictos que afectan a la profesión y que también tendrían cabida en este decálogo. Es posible que la omnipresencia del conflicto de licenciamiento de datos, al que se hace referencia constante, haya dejado en un segundo plano otras inquietudes como la nueva velocidad de la desinformación, la capacidad de la investigación periodística para verificar contenido auténtico o el impacto de las fake news y los deepfakes en procesos democráticos. Los principios se han centrado en exponer las obligaciones que deberían tener las grandes tecnológicas en lo que respecta al uso de los contenidos, pero quizá sería esperable una extensión que abordase las responsabilidades éticas desde el punto de vista de los medios, como por ejemplo, en qué modelo ético debe basarse la integración de la IA en la actividad de las redacciones y cuál es la responsabilidad de los periodistas en este nuevo escenario. Por último, en el documento se pone de manifiesto una dualidad habitual: la canalización, a través de la propuesta ética, de la sugerencia de soluciones concretas que apuntan incluso a posibles acuerdos comerciales y de mercado. Es un reflejo claro de la capacidad potencial de la ética para ser mucho más que un marco moral, y convertirse en un instrumento multidimensional para orientar la toma de decisiones e influir en la creación de políticas públicas.

Contenido elaborado por Carmen Torrijos, experta en IA aplicada al lenguaje y la comunicación. Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

28/08/2024