Blog

Durante más de una década, las plataformas de datos abiertos han medido su impacto a través de indicadores relativamente estables: número de descargas, visitas a la web, reutilizaciones documentadas, aplicaciones o servicios creados en base a ellos, etc. Estos indicadores funcionaban bien en un ecosistema donde los usuarios - empresas, periodistas, desarrolladores, ciudadanos anónimos, etc. - accedían directamente a las fuentes originales para consultar, descargar y procesar los datos.

Sin embargo, el panorama ha cambiado radicalmente. La irrupción de los modelos de inteligencia artificial generativa ha transformado la forma en que las personas acceden a la información. Estos sistemas generan respuestas sin necesidad de que el usuario visite la fuente original, lo que está provocando una caída global del tráfico web en medios, blogs y portales de conocimiento.

En este nuevo contexto, medir el impacto de una plataforma de datos abiertos exige repensar los indicadores tradicionales para incorporar a las métricas ya utilizadas otras nuevas que capturen también la visibilidad e influencia de los datos en un ecosistema donde la interacción humana está cambiando.

Un cambio estructural: del clic a la consulta indirecta

El ecosistema web está experimentando una transformación profunda impulsada por el auge de los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés). Cada vez más personas formulan sus preguntas directamente a sistemas como ChatGPT, Copilot, Gemini o Perplexity, obteniendo respuestas inmediatas y contextualizadas sin necesidad de recurrir a un buscador tradicional.

Al mismo tiempo, quienes continúan utilizando motores de búsqueda como Google o Bing también experimentan cambios relevantes derivados de la integración de la inteligencia artificial en estas plataformas. Google, por ejemplo, ha incorporado funciones como AI Overviews, que ofrece resúmenes generados automáticamente en la parte superior de los resultados, o el Modo IA, una interfaz conversacional que permite profundizar en una consulta sin navegar por enlaces. Esto genera un fenómeno conocido como Zero-Click: el usuario realiza una búsqueda en un motor como Google y obtiene la respuesta directamente en la propia página de resultados. En consecuencia, no tiene necesidad de hacer clic en ningún enlace externo, lo cual limita las visitas a las fuentes originales de las que está extraída la información.

Todo ello implica una consecuencia clave: el tráfico web deja de ser un indicador fiable de impacto. Una página web puede estar siendo extremadamente influyente en la generación de conocimiento sin que ello se traduzca en visitas.

: Métricas para medir el impacto de los datos abiertos en la era de la IA   Share of Model (SOM): mide con qué frecuencia los modelos de IA mencionan o utilizan una fuente.  Análisis de sentimiento: evalúa si las menciones que hace la IA son positivas, neutras o negativas.  Categorización de prompts: identifica en qué temas o áreas los modelos de IA consideran más relevante una fuente.  Tráfico procedente de IA: cuantifica las visitas y clics que llegan a una web desde respuestas generadas por IA.  Reutilización algorítmica: analiza hasta qué punto los datos abiertos se usan para entrenar modelos o alimentar aplicaciones.  Fuente: elaboración propia - datos.gob.es.

Figura 1. Métricas para medir el impacto de los datos abiertos en la era de la IA. Fuente: elaboración propia.

Nuevas métricas para medir el impacto

Ante esta situación, las plataformas de datos abiertos necesitan nuevas métricas que capturen su presencia en este nuevo ecosistema. A continuación, se recogen algunas de ellas.

  1. Share of Model (SOM): presencia en los modelos de IA

Inspirado en métricas del marketing digital, el Share of Model mide con qué frecuencia los modelos de IA mencionan, citan o utilizan datos procedentes de una fuente concreta. De esta forma, el SOM ayuda a ver qué conjuntos de datos concretos (empleo, clima, transporte, presupuestos, etc.) son utilizados por los modelos para responder preguntas reales de los usuarios, revelando qué datos tienen mayor impacto.

Esta métrica resulta especialmente valiosa porque actúa como un indicador de confianza algorítmica: cuando un modelo menciona una página web, está reconociendo su fiabilidad como fuente. Además, contribuye a aumentar la visibilidad indirecta, ya que el nombre de la web aparece en la respuesta incluso cuando el usuario no llega a hacer clic.

  1. Análisis de sentimiento: tono de las menciones en IA

El análisis de sentimiento permite ir un paso más allá del Share of Model, ya que no solo identifica si un modelo de IA menciona una marca o dominio, sino cómo lo hace. Habitualmente, esta métrica clasifica el tono de la mención en tres categorías principales: positivo, neutro y negativo.

Aplicado al ámbito de los datos abiertos, este análisis ayuda a comprender la percepción algorítmica de una plataforma o conjunto de datos. Por ejemplo, permite detectar si un modelo utiliza una fuente como ejemplo de buenas prácticas, si la menciona de forma neutral como parte de una respuesta informativa o si la asocia a problemas, errores o datos desactualizados.

Esta información puede resultar útil para identificar oportunidades de mejora, reforzar la reputación digital o detectar posibles sesgos en los modelos de IA que afecten a la visibilidad de una plataforma de datos abiertos.

  1. Categorización de prompts: en qué temas destaca una marca

Analizar las preguntas que hacen los usuarios permite identificar en qué tipos de consultas aparece con mayor frecuencia una marca. Esta métrica ayuda a entender en qué áreas temáticas -como economía, salud, transporte, educación o clima- los modelos consideran más relevante una fuente.

Para las plataformas de datos abiertos, esta información revela qué conjuntos de datos están siendo utilizados para responder preguntas reales de los usuarios y en qué dominios existe mayor visibilidad o potencial de crecimiento. También permite detectar oportunidades: si una iniciativa de datos abiertos quiere posicionarse en nuevas áreas, puede evaluar qué tipo de contenido falta o qué conjuntos de datos podrían reforzarse para aumentar su presencia en esas categorías.

  1. Tráfico procedente de IA: clics desde resúmenes generados

Muchos modelos ya incluyen enlaces a las fuentes originales. Aunque muchos usuarios no hacen clic en dichos enlaces, algunos sí lo hacen. Por ello, las plataformas pueden empezar a medir:

  • Visitas procedentes de plataformas de IA (cuando estas incluyen enlaces).
  • Clics desde resúmenes enriquecidos en buscadores que integran IA.

Esto supone un cambio en la distribución del tráfico que llega a las webs desde los distintos canales. Mientras el tráfico orgánico —el que proviene de los motores de búsqueda tradicionales— está disminuyendo, empieza a crecer el tráfico referido desde los modelos de lenguaje.

Este tráfico será menor en cantidad que el tradicional, pero más cualificado, ya que quien hace clic desde una IA suele tener una intención clara de profundizar.

Es importante que se tengan en cuenta estos aspectos a la hora de fijar objetivos de crecimiento en una plataforma de datos abiertos.

  1. Reutilización algorítmica: uso de datos en modelos y aplicaciones

Los datos abiertos alimentan modelos de IA, sistemas predictivos y aplicaciones automatizadas. Conocer qué fuentes se han utilizado para su entrenamiento sería también una forma de conocer su impacto. Sin embargo, pocas soluciones proporcionan de manera directa esta información. La Unión Europea está trabajando para promover la transparencia en este campo, con medidas como la plantilla para documentar los datos de entrenamiento de modelos de propósito general, pero su implantación -y la existencia de excepciones a su cumplimiento- hacen que el conocimiento sea aún limitado.

Medir el incremento de accesos a los datos mediante API podría dar una idea de su uso en aplicaciones para alimentar sistemas inteligentes. Sin embargo, el mayor potencial en este campo pasa por colaboración con empresas, universidades y desarrolladores inmersos en estos proyectos, para que ofrezcan una visión más realista del impacto.

Conclusión: medir lo que importa, no solo lo que es fácil de medir

La caída del tráfico web no significa una caída del impacto. Significa un cambio en la forma en que la información circula. Las plataformas de datos abiertos deben evolucionar hacia métricas que reflejen la visibilidad algorítmica, la reutilización automatizada y la integración en modelos de IA.

Esto no significa que las métricas tradicionales deban desaparecer. Conocer los accesos a la web, los conjuntos de datos más visitados o los más descargados sigue siendo una información de gran valor para conocer el impacto de los datos proporcionados a través de plataformas abiertas. Y también es fundamental monitorizar el uso de los datos a la hora de generar o enriquecer productos y servicios, incluidos los sistemas de inteligencia artificial. En la era de la IA, el éxito ya no se mide solo por cuántos usuarios visitan una plataforma, sino también por cuántos sistemas inteligentes dependen de su información y la visibilidad que ello otorga.

Por eso, integrar estas nuevas métricas junto a los indicadores tradicionales a través de una estrategia de analítica web y SEO * permite obtener una visión más completa del impacto real de los datos abiertos. Así podremos saber cómo circula nuestra información, cómo se reutiliza y qué papel juega en el ecosistema digital que hoy da forma a la sociedad.

*El SEO (Search Engine Optimization) es el conjunto de técnicas y estrategias destinadas a mejorar la visibilidad de un sitio web en los motores de búsqueda.

calendar icon
Blog

Tanto las administraciones públicas como los organismos internacionales están utilizando cada vez en mayor medida nuevos enfoque más prácticos y creativos para la resolución de problemas, centrados en datos reales y en cómo entender mejor las necesidades de las personas. De este modo podrán proponer soluciones que satisfagan dichas necesidades de forma más directa y eficaz, en lugar de diseñar políticas o productos de forma totalmente aislada e independiente, e intentando luego que sean los destinatarios los que se amolden a ellos.

Un buen ejemplo de esta tendencia es la creciente popularidad de las metodologías de diseño centrado en las personas como por ejemplo el design thinking tanto entre legisladores y diseñadores de servicios públicos como entre los innovadores en políticas públicas. Así pues, podemos ver cómo instituciones como las Naciones Unidas o gobiernos como el de Australia o Hong-Kong llevan ya algún tiempo explorando las oportunidades y ventajas que el diseño centrado en sus usuarios les ofrece.

Este cambio de mentalidad tiene también como consecuencia que la forma en la que tradicionalmente se han ido presentado los análisis y resultados de estas políticas públicas a través de macro-informes esté también evolucionando para adaptarse a las nuevas necesidades del desarrollo participativo y colaborativo. A continuación, veremos tres ejemplos actuales de cómo este cambio de filosofía se está llevando ya a la práctica. 

¿Cómo dar un mayor valor a tus informes?  Incluyendo materiales complementarios, como por ejemplo: 1. Análisis: Ejemplos destacados de buenas prácticas, Casos de estudio, Investigaciones a fondo, Métodos y metodologías, Datos en crudo. 2. Exploración:Informes interactivos, Historias de datos, Perfiles demográficos, Cuadros de mando. 3. Diálogo e interacción: Seminarios online, Conferencias, Foros, Redes sociales, Programas de formación. 4. Presentación: Visualizaciones, Mapas interactivos, Infografías,  Elementos Multimedia.

Informe sobre el Desarrollo Global del Banco Mundial 

Hace aproximadamente un año compartíamos el primer borrador del informe del Banco Mundial sobre el Desarrollo y ya entonces llamaba la atención el hecho de que hubiesen preparado una serie de consultas públicas a través de las cuáles se pretendía dar respuesta a las principales incógnitas que se presentaban en ese borrador inicial. Ahora, una vez terminadas las rondas de consultas y unos meses después de la publicación y presentación de la versión final del informe, es grato también observar cómo el Banco Mundial vuelve a ir un paso más allá a la hora de presentar los resultados y nos ofrece todo un rango de opciones que incluyen: 

  • Casos de estudio: Donde se irán incorporando casos reales en los que el Banco Mundial trabaja con los distintos países para facilitar la implementación de sistemas de gobernanza de datos adecuados, aunque por el momento sólo cuente con un único caso de estudio sobre el ecosistema de los datos en Jordania. 

Por otro lado, podemos ver también cómo esa tendencia hacía el diseño y desarrollo colaborativo no sólo parece que se consolida, sino que incluso se refuerza y se extiende a través toda una serie de seminarios online en los que el Banco Mundial ha venido colaborando con otras entidades y organizaciones como el G20, la OECD, las Naciones Unidas, Paris21, Internet Society, el Open Institute o Data2X para seguir analizando los resultados del estudio desde diferentes puntos de vista. 

Objetivos de Desarrollo Sostenible de las Naciones Unidas 

Otro buen ejemplo de esta tendencia lo podemos ver en el ambicioso proyecto de los Objetivos de Desarrollo Sostenible promovido por las Naciones Unidas, el cual, debido a su tamaño y complejidad, necesita apoyarse en otras variadas herramientas más allá de los tradicionales informes mundiales sobre desarrollo sostenible que también siguen publicando de forma regular. Es por ello que nos ofrecen una cantidad ingente de documentación adicional que incluye información detallada sobre cada uno de los 17 objetivos de desarrollo, resúmenes de cada objetivo a través de infografías e información detallada sobre sus metas y acciones, así como cientos de publicaciones relacionadas con cada objetivo en particular.

Pero eso no es todo, ya que cuentan también con multitud de conferencias, eventos y seminarios online para que cualquiera que quiera aprender más sobre los objetivos o involucrarse más activamente en su desarrollo e implementación pueda contar con una oportunidad para hacerlo. Existen además foros específicos de alto nivel para la participación directa de los países miembro responsables finales de la implementación de los objetivos, así como programas de formación y capacitación específicos para ellos. Y, por supuesto, tienen su propia presencia en redes sociales a través de Facebook y Twitter, donde se va dando cuenta de forma regular de todos los avances y novedades de posible interés para el público en general.

Por último, y además de todo lo anterior, las Naciones Unidas ponen también a nuestra disposición toda una serie de recursos para el seguimiento escrupuloso de las conversaciones y diálogos de los países miembro en torno a los objetivos, así como del grado de cumplimiento de los mismos en cada momento. Entre estas herramientas de seguimiento cabe destacar también los distintos exploradores de datos, mapas interactivos, perfiles de países o historias contadas a través de los datos que nos ofrecen toda una variedad de información y visualizaciones tanto promovidas directamente por la propia agencia o por la comunidad, como llevadas a cabo por otras instituciones especializadas en temáticas más concretas como la energía o la agricultura. 

Indicadores de Desarrollo Digital de la ITU 

Finalmente, un tercer buen ejemplo de cómo ir un paso más allá del informe tradicional lo podemos ver en las estadísticas que publica la Unión de Telecomunicación Internacional (ITU) regularmente a través de sus informes de medición de desarrollo digital, los cuales no se limitan nuevamente a la publicación de los tradicionales informes, sino que nos ofrecen todo un rango de alternativas complementarias incluyendo informes interactivos, un completo kit multimedia para ayudarnos a difundir los principales hallazgos del informe y toda una serie de eventos mediante los que poder profundizar en distintos aspectos de los resultados y que abarcan desde simposios internacionales, seminarios online, reuniones de grupos de expertos o cursos.

Además, la ITU ha creado una serie de sitios web interactivos a través de los cuales se puede acceder a los principales indicadores de desarrollo digital y comprobar su evolución durante los últimos años en los distintos países, o revisar algunos indicadores más específicos como los relacionados con el coste de los servicios digitales, incluyendo nuevamente series históricas y comparaciones entre distintos países. Por último, también nos ofrecen un completo portal de datos dedicado a recoger todos los datos históricos de las principales estadísticas e indicadores con los que cuenta la institución. Y por supuesto, seguimos contando también con la opción de acceder a los datos en crudo incluyendo varias series históricas específicas e indicadores secundarios para poder hacer nuestros propios análisis.

Los ejemplos anteriores nos muestran cómo este cambio de mentalidad a la hora de plantear políticas públicas de alto impacto más allá de los informes pone a nuestra disposición todo un nuevo rango de herramientas y métodos. Éstos a su vez nos ayudarán a dar una nueva vida a los datos con los que trabajamos, pasando de los procedimientos unidireccionales y los meros informes hacia procesos cada vez más colaborativos en los que los datos fluirán entre todos los participantes de las distintas fases del proceso, desde la generación de evidencia acerca del problema que queremos resolver, la creación de alianzas para la búsqueda de soluciones, el desarrollo colaborativo de dichas soluciones y, finalmente, la canalización de las acciones necesarias para llevarlas a la práctica.


Contenido elaborado por Carlos Iglesias, Open data Researcher y consultor, World Wide Web Foundation.

Los contenidos y los puntos de vista reflejados en esta publicación son responsabilidad exclusiva de su autor.

calendar icon
Aplicación

En la actualidad contiene más de 75.000 indicadores indexados, procedentes de las siguientes fuentes de datos:

- Base de datos de Series de Indicadores de Coyuntura Económica: Datos obtenidos del Ministerio de Economía y Competitividad, Secretaría de Estado de Economía y apoyo a la empresa, Dirección General de Análisis Macroeconómico y Economía Internacional.

- Síntesis de indicadores económicos: Subdirección General de Análisis Coyuntural y Previsiones Económicas de la Dirección General de Análisis Macroeconómico y Economía Internacional.

- Base de datos económicos del Sector Público Español: Datos obtenidos del Instituto de Estudios Fiscales.

- Boletín económico del Banco de España: Datos obtenidos del Banco de España.

- Boletín de estadísticas e informes del MITYC: Datos obtenidos del Ministerio de Industria, Energía y Turismo. Subdirección General de Tecnologias de la Información y Comunicaciones.

- Cambio de divisas: Datos obtenidos del Banco Central Europeo (BCE).

calendar icon