La Asociación Multisectorial de la Información (ASEDIE) ha publicado la duodécima edición de su “Informe sobre el Sector Infomediario”, en el que hace un repaso a las iniciativas de impulso de la economía del dato en el país. Además, esta edición conmemora los 25 años de trayectoria de la asociación en el sector.
En el 12º Informe sobre la Economía del Dato en el ámbito infomediario, ASEDIE ofrece cifras exactas sobre el sector en España para continuar su labor anual de poner en valor y transmitir su tamaño e importancia. La presentación de esta edición tuvo lugar en el salón de actos de Madrid International Lab el pasado 20 de marzo.
A continuación, se resumen las principales conclusiones del estudio.
Más de 23.000 personas trabajan en el sector infomediario en España
En el documento, ASEDIE mide la salud del sector de las 756 empresas reutilizadoras de datos públicos que se han identificado como activas. Estas compañías emplean a casi 23.300 personas en España, lo que se traduce en un aumento del 3,6% en comparación con las cifras del informe anterior. Las empresas reutilizadoras analizadas en el informe aprovechan la información tanto pública como privada para crear productos de valor añadido dirigidos a otras empresas y a la sociedad en general.
Además, el estudio señala “el crecimiento continuo del sector infomediario, con la incorporación de nuevos actores año tras año, mejorando los intercambios de información inherentes al sector y aumentando la confianza de los usuarios”. Como reflejo de esta tendencia positiva, el sector ha generado una facturación global de 2,331 millones de euros, que supone un aumento del 2,4% respecto al anterior ejercicio.
Para identificar estos resultados, ASEDIE lleva a cabo una metodología de análisis también descrita en su informe que pasa por subdividir los sectores que participan. Entre las empresas analizadas, la mayoría pertenece al sector de Información Geográfica (22%), Estudios de Mercado (19%), Económico Financiero (19%) e Informática de Infomediación (17%). En total, estos tres sectores aglutinan al 76% de las empresas del sector.
De todas las empresas analizadas el 63% fueron creadas hace más de 10 años, aunque en el último año se han creado 51 empresas. Y la mitad de las empresas infomediarias facturan más de 473.000 euros, según datos del informe. Un segundo grupo de dos subsectores (Consultoría Técnica y Editoriales) aportan un 14% más, dejando al resto de subsectores (Cultura, Directoriales, Meteorológicas y Turismo), con una representación del 9%.

Resultados de la encuesta realizada a CC.AA. y sector académico
Otro contenido revelador que incluye el 12º Informe de ASEDIE es un resumen de los primeros pasos realizados del recién creado TOP 10 ASEDIE, así como el análisis de una encuesta realizada a dos grupos principales: los responsables de las 17 CC.AA. en temas relacionados con la transparencia y datos abiertos y al sector académico.
El TOP ASEDIE es una iniciativa de colaboración público-privada, apoyada por las 17 Comunidades Autónomas, que busca impulsar la apertura de determinados conjuntos de datos y que se ha venido realizando de manera periódica. La iniciativa surgió en 2019 con el llamado TOP 3, que impulsó la apertura de las bases de datos de Asociaciones, Cooperativas y Fundaciones. Dos años después se lanzó un segundo Top 3 ASEDIE Certificados de Eficiencia Energética, Registros SAT y Polígonos Industriales), que ahora es un TOP 10 con cuatro nuevas bases de datos: agentes económicos, centros de enseñanza, centros de salud y ERES-ERTES.
En la encuesta, también se extrajeron una serie de conclusiones como:
- El 75% de los encuestados indica que está satisfecho con la capacidad tecnológica que tienen respecto a la apertura de datos.
-
El 63% de los encuestados no son conscientes del impacto socioeconómico que ocasiona la apertura de sus bases de datos.
-
El 50% de los encuestados no conoce el perfil de sus usuarios y clientes. No obstante, el 75% cuenta con sistemas para medir el acceso, descarga y visitas a los conjuntos de datos que publica.
-
El 89% de las instituciones académica afirma que los datos públicos les permite desarrollar soluciones útiles.
Casos de éxito: empresas infomediarias ejemplares
Además de ofrecer resultados sobre el estado del sector infomediario en España y las conclusiones de las encuestas realizadas a las CC.AA. y al ámbito académico, el informe pone en valor algunos casos de uso que destaca como exitosos en la tarea de obtener valor a partir de la reutilización de datos. A continuación, resumimos algunos de ellos:
-
Conector API con Salesforce y Microsoft Dynamics: una solución que permite integrar de manera automática los datos de 7,6 millones de empresas y autónomos de España y Portugal, en Salesforce y Microsoft Dynamics, los dos principales CRM del mercado.
-
GEOCODE Fraude de CTI Soluciones: una solución de validación de datos y gestión de alertas para la detección de operaciones irregulares.
-
Geomarketing Worldwide de inAtlas: una herramienta basada en tecnologías avanzadas de Analítica de Localización y Visualización de Geodatos, para buscar clientes y lugares óptimos donde expandir los negocios.
En resumen, a través de su informe, ASEDIE revela la creciente importancia de la economía del dato y refleja claramente la transición de España hacia una sociedad más informada y transparente, evidenciando el papel fundamental que juega el sector infomediario. Observamos la necesidad de superar los desafíos existentes a través de una mayor colaboración entre todos los actores involucrados, para asegurar un futuro donde los datos se manejen de manera más abierta, accesible, efectiva y segura.
Los datos abiertos ofrecen información de interés sobre el estado y evolución de diferentes sectores, entre ellos, el empleo. Los datos de empleo suelen incluir estadísticas sobre la población activa e información sobre los empleados, así como datos económicos, demográficos o relacionados con prestaciones, entrevistas, salarios, vacantes, etc.
Gracias a esta información podemos tener una visión clara de la salud económica de un país y del bienestar de sus ciudadanos, fomentando la toma de decisiones informadas. Además, también pueden servir de base para la creación de soluciones innovadoras que ayuden en diversas tareas.
En este artículo repasaremos algunas fuentes de las que obtener datos abiertos de calidad de empleo, así como ejemplos de uso para mostrar los potenciales beneficios de su reutilización.
¿Dónde localizar datos de empleo?
En datos.gob.es hay disponible una gran cantidad de conjuntos de datos sobre empleo, destacando como publicador a nivel nacional el Instituto Nacional de Estadística (INE). Gracias a los datos del INE podemos conocer los ocupados por sector de actividad, tipos de estudios o jornada, así como los motivos para tener jornada parcial. Los datos proporcionados por esta entidad también nos permiten conocer la situación laboral de las personas con discapacidad o por sexo.
Otras fuentes de datos donde localizar información de interés es el Servicio Público de Empleo Estatal (sepe.es), donde podemos encontrar datos estadísticos sobre demandantes de empleo, puestos de trabajo y colocaciones, desde mayo de 2005 hasta la actualidad. A ello hay que sumar los organismos autonómicos, muchos de los cuales han puesto en marcha su propio portal de datos abiertos de empleo. Es el caso de la Junta de Andalucía.
Si estamos interesados en realizar una comparación entre países, también podemos acudir a los datos de la OCDE, Eurostat o el Banco Mundial.
Todos estos datos pueden ser de gran interés para:
- Los responsables políticos, para comprender mejor la dinámica del mercado laboral y reaccionar ante ella.
- Los empleadores, para optimizar sus actividades de contratación.
- Los demandantes de empleo, para tomar mejores decisiones profesionales.
- Los centros de educación y formación, para adaptar los planes de estudios a las necesidades del mercado laboral.
Casos de uso de datos abiertos en el sector empleo
Tan relevante es contar con fuentes de datos abiertos de empleo como saber interpretar la información que ofrecen sobre el sector. Es aquí donde entran los reutilizadores que aprovechan esta materia prima para crear productos de datos que permitan dar respuesta a distintas necesidades. Veamos algunos ejemplos:
- Toma de decisiones e implantación de políticas activas. Las políticas activas de empleo son herramientas que los gobiernos utilizan para intervenir directamente en el mercado laboral, a través de capacitación, orientación, incentivos a la contratación, etc. Para ello, necesitan conocer las tendencias y necesidades del mercado. Esto ha llevado a numerosos organismos públicos a poner en marcha observatorios, como el del SEPE o el Principado de Asturias. También encontramos observatorios específicos por áreas como el de Igualdad y Empleo. A nivel europeo, destaca la propuesta de Eurostat: establecer requisitos para crear un sistema paneuropeo de elaboración de estadísticas oficiales y análisis políticos específicos usando para ello datos abiertos relativos a ofertas de empleo online. Este proyecto se ha llevado a cabo utilizando la plataforma BDTI. Pero este campo no está limitado al sector público, sino que otros actores también pueden presentar sus propuestas. Es el caso de Iseak, entidad sin ánimo de lucro que impulsa un centro de investigación y transferencia en economía. Entre otras cuestiones, en Iseak buscan dar respuesta a preguntas como ¿provoca la subida del salario mínimo una destrucción del empleo? o ¿por qué existe una brecha de género en el mercado?
- Rendición de cuentas. Toda esta información no es solo útil para los organismos públicos, sino también para la ciudadanía, a la hora de valorar si las políticas de empleo de sus gobernantes están funcionando. Por ello, muchos gobiernos ponen estos datos a disposición de los ciudadanos a través de visualizaciones sencillas de comprender, como Castilla y León. Asimismo, en este campo tiene un papel protagonista el periodismo de datos, con piezas que acercan la información al gran público como estos ejemplos, relativos a los salarios o el nivel de desempleo por zonas. Si quieres saber cómo realizar este tipo de visualizaciones, te los explicamos en este ejercicio paso a paso que caracteriza la demanda de empleo y contratación registrada en España.
- Impulso de oportunidades laborales. Para acercar los datos de interés a los ciudadanos que se encuentran en búsqueda activa o de nuevas oportunidades laborales, existen herramientas, como esta app de convocatorias de empleo público o de ayudas, basadas en datos abiertos. También hay ayuntamientos que crean soluciones para impulsar el empleo y la economía en su localidad como la APP Paterna Empléate. Estas apps suponen una forma de consumo de datos mucho más sencilla y amigable que los tradicionales portales de búsqueda de empleo. Un paso más allá ha ido la Diputación de Barcelona. Con su Buscador de Información y Documentación Oficial (CIDO).Esta herramienta utiliza IA aplicada a los datos abiertos para, entre otras finalidades, ofrecer servicios personalizados para individuos, empresas y sectores rurales, así como acceso a convocatorias de empleo. La información que ofrece procede tanto de tablones de anuncios, como del Perfil del contratante y diversas páginas webs municipales.
- Desarrollo de soluciones avanzadas. Los datos de empleo también se pueden utilizar para potenciar una amplia variedad de casos de uso de aprendizaje automático. Un ejemplo es esta plataforma estadunidense para el análisis financiero que proporciona datos e información a inversores y empresas. Para ello utiliza datos de tasas de desempleo de EE.UU, combinado con otros como códigos postales, datos demográficos o datos meteorológicos.
En definitiva, gracias a este tipo de datos nos solo podemos conocer más sobre la situación laboral de nuestro entorno, sino también alimentar soluciones que ayuden a impulsar la economía o que faciliten el acceso a oportunidades laborales. Se trata, por tanto, de una categoría de datos cuya publicación deben impulsar organismos públicos de todos los niveles.
La Asociación Multisectorial de la Información (ASEDIE) ha publicado la undécima edición de su Informe sobre el Sector Infomediario, en el que hace un repaso a la salud de las empresas que generan aplicaciones, productos y/o servicios a partir de información del sector público, teniendo en cuenta que es el poseedor de los datos más valiosos.
Muchos de los conjuntos de datos que permiten al sector infomediario desarrollar soluciones están incluidos en las listas de conjuntos de datos de alto valor (HVDS, por sus siglas en inglés) que la Unión Europea ha publicado recientemente. Una iniciativa que reconoce el potencial de la información pública y se suma al propósito de impulsar la economía del dato en línea con la propuesta de Ley de Datos del Parlamento Europeo.
ASEDIE agrupa a empresas de diferentes sectores que impulsan la economía del dato, que se nutren fundamentalmente de los datos que proporciona el sector público. Entre sus objetivos se encuentra impulsar el sector y contribuir a concienciar a la sociedad de sus beneficios e impacto. No en vano, se estima que la economía del dato genere 270.000 millones de euros de PIB adicional para los Estados miembros de la UE en 2028.
La presentación de esta edición del informe, bajo el título ‘Economía del Dato en el ámbito infomediario’ tuvo lugar el pasado 22 de marzo en la sala Enredadera de Red.es. En la edición del informe presentada este año han sido identificadas 710 empresas activas, con una facturación de más de 2.278 millones de euros. Hay que destacar que el primer informe en 2013 contó con 444 empresas. Por tanto, el sector ha crecido un 60% en una década.
Principales conclusiones del informe
- El sector infomediario ha crecido un 12,1%, un dato por encima del crecimiento del PIB nacional que fue de un 7,6%. Estos datos se extraen del análisis de las 472 empresas (un 66% de la muestra) que presentaron sus cuentas en los ejercicios anteriores.
- El número de empleados es de 22.663. Los trabajadores se encuentran muy concentrados en pocas empresas: el 62% de ellas tiene menos de 10 trabajadores. El subsector que aglutina un mayor número de profesionales es el de Información geográfica, con un 30% del total. Junto con los subsectores Económico financiero, Consultoría técnica y Estudios de mercado, agrupan al 75% de los empleados.
- El empleo en las empresas del Sector Infomediario crece un 1,7%, frente a la caída de 1,1% en el año anterior. Todos los subsectores han crecido, excepto Turismo y Cultura que se mantienen, y Consultoría técnica y Estudios de mercado, que decrecen.
- La facturación media por empleado supera los 100.00 euros, incrementándose un 6,6% respecto al ejercicio previo. Por otra parte, el gasto medio por empleado fue de 45.000 euros.
- El importe de la cifra de negocio agregada es de 2.279.613.288 euros. Los subsectores de Información geográfica y Económico Financiero aglutinan el 46% de las ventas.
- El capital suscrito agregado es de 250.115.989 euros. Los tres subsectores más capitalizados son Estudios de mercado, Económico Financiero e Información geográfica, que aglutinan el 66% de la capitalización.
- El resultado neto supera los 180 millones de euros, 70 millones más que el año pasado. El subsector Económico financiero reúne un 66% del total de beneficios.
- Los subsectores de Información geográfica, Estudios de mercado, Económico financiero e Informática de Infomediación aglutinan al 76% de las empresas infomediarias, contabilizando un total de 540 empresas de las 710 activas.
- La Comunidad de Madrid es la que acoge a un mayor número de empresas del sector, con un 39%, seguida de Cataluña (13%), Andalucía (11%) y Comunidad Valenciana (9%).
Tal y como recoge el informe, la llegada de nuevas empresas impulsa el desarrollo de un sector que factura ya cerca de 2.300 millones de euros al año, y que crece a un ritmo superior al de otros indicadores macroeconómicos del país. De estos datos se desprende no solo que el Sector Infomediario goza de buena salud, sino también su capacidad de resiliencia y potencial de crecimiento.
Avances del Estudio del impacto de los datos abiertos en España
El informe recoge también los resultados de una encuesta realizada a los diferentes actores que conforman el ecosistema de los datos, en colaboración con la Facultad de Ciencias de la Información de la Universidad Complutense de Madrid. Esta encuesta se presenta como el primer ejercicio de un estudio más ambicioso que pretende conocer el impacto de los datos abiertos en España e identificar las principales barreras en su acceso y puesta a disposición. Para ello, se ha enviado un cuestionario a miembros del sector público, sector privado y sector académico. Entre las principales conclusiones de este primer sondeo, podemos destacar:
- Como principales barreras a la hora de publicar información, el 65% de los encuestados del sector público menciona la falta de recursos humanos, el 39% la falta de liderazgo político y el 38% la poca calidad de los datos.
- El mayor obstáculo en el acceso a los datos públicos para su reutilización es para los encuestados del sector público que la información proporcionada en los datos no es homogénea (41,9%). Los encuestados del sector académico señalan la falta de calidad de los datos (43%) y desde el sector privado se cree que la principal barrera es la falta de actualización (49%).
- En cuanto a la frecuencia de utilización de los datos públicos, el 63% de los participantes asegura usar los datos todos los días o al menos una vez a la semana.
- El 61% de los encuestados utiliza los datos publicados en el portal datos.gob.
- Los encuestados creen de forma mayoritaria que el impacto de la apertura de los datos en el sector privado es positivo. Así, el 77% de los encuestados del sector privado indica que acceder a los datos públicos es económicamente viable y el 89% de ellos manifiesta que los datos públicos les permiten desarrollar soluciones útiles.
- El 95% de los encuestados reclama un compendio de las normativas que afectan al acceso, publicación y reutilización de los datos del sector público.
- El 27% de los encuestados del sector público afirma no conocer las seis categorías de datos de alto valor establecidas en el Reglamento de ejecución (EU) 20137138 de la Comisión.
Vemos así que la mayoría de los encuestados son conscientes del potencial del sector y del impacto de los datos del sector público, aunque indican que es necesario salvar algunos obstáculos para su reutilización y creen que un compendio de las diferentes normativas existentes facilitaría su puesta en práctica y ayudaría al desarrollo del sector.
Top 3 ASEDIE
Como en ediciones anteriores, el informe incluye la situación del Top 3 ASEDIE, una iniciativa que pretende que todas las Comunidades Autónomas abran de manera completa tres conjuntos de datos, siguiendo unos criterios unificados que faciliten su reutilización, y que se incluye en el IV plan de Gobierno Abierto. En 2019, se propuso la apertura de las bases de datos de Cooperativas, Asociaciones y Fundaciones y actualmente ya hay 16 Comunidades Autónomas en las que se puede acceder de manera completa. Además, en ocho de ellas es posible acceder al NIF con identificador único, algo que permite mejorar la transparencia y que la información sea más veraz.
Teniendo en cuenta los buenos resultados de la primera propuesta, en 2020 se lanzó una nueva petición de apertura de datos, el Segundo Top 3 ASEDIE, en este caso de Certificados de Eficiencia Energética, Registros SAT (Sociedades Agrarias de Transformación) y Polígonos Industriales, cuya evolución ha sido también muy positiva. En el siguiente mapa se puede ver la situación de apertura de estas tres nuevas bases de datos en 2023.

La iniciativa del Top 3 ASEDIE ha sido un éxito y se ha convertido en una referencia en el sector, impulsando la apertura de bases de datos de una manera conjunta y demostrando que es posible armonizar fuentes de datos públicas para ponerlas al servicio de la sociedad.
Los siguientes pasos en este sentido serán hacer un seguimiento de las bases de datos ya abiertas y realizar una difusión a todos los niveles, incluyendo la identificación de buenas prácticas de la Administración y la selección de ejemplos para incentivar la colaboración público-privada en datos abiertos. Además, se identificará un nuevo top 3 para avanzar en la apertura de nuevas bases de datos, y se lanzará una nueva iniciativa que alcance a los organismos de la Administración General del Estado, con la identificación de un nuevo Top 3 AGE.
Casos de éxito
El informe incluye también una serie de casos de éxito de productos y servicios desarrollados con datos del sector público, como API Market de Iberinform que facilita el acceso y la integración de 52 conjuntos de datos de empresas y autónomos en los sistemas de gestión de las empresas. Otro caso exitoso es el de Geocode, una solución centrada en procesos de estandarización, validación, corrección, codificación y geolocalización de direcciones postales en España y Portugal.
Geomarketing permite aumentar la velocidad de cálculo de datos geoespaciales e Infoempresa.com ha mejorado sus informes de actividad de las empresas españolas, haciéndolos más visuales, completos e intuitivos. Por último, Pyramid Data posibilita el acceso a los Certificados de Eficiencia Energética (CEE) de una cartera inmuebles determinada.
Como ejemplos de buenas prácticas en el sector público, el informe de ASEDIE destaca los datos estadísticos abiertos como motor de la Economía del Dato del Instituto Canario de Estadística (ISTAC) y la tecnología para la apertura de datos del Portal de Datos Abiertos de la Junta de Andalucía.
Como novedad, se ha incorporado la categoría de ejemplos de buenas prácticas en el sector académico, que reconoce el trabajo realizado por el Código Geoespacial y el Informe sobre el estado de los datos abiertos en España III, de la Universidad Rey Juan Carlos y Fundación FIWARE.
El 11º Informe ASEDIE sobre la Economía del Dato en el ámbito infomediario se puede descargar en la web de Asedie en español. También están disponibles las presentaciones de los indicadores económicos y el Top 3 y del Ecosistema de Datos.
En resumen, el informe recoge la buena salud de la industria que confirma su recuperación tras la pandemia, su capacidad de resiliencia y el potencial de crecimiento y, además, se observan los buenos resultados de la colaboración público-privada y su impacto en la economía del dato.
ASEDIE (la Asociación Multisectorial de la Información) acaba de publicar una nueva edición de su Informe sobre el Sector Infomediario, que analiza el valor real, económico y social de las empresas reutilizadoras de datos procedentes del sector público y/o privado para desarrollar productos de valor añadido. La presentación tuvo lugar en un acto en el Instituto Geográfico Nacional, en el que también participó la Oficina del Dato.
Este año es especial porque el informe cumple su 10ª edición. A lo largo de estos años, los diferentes informes han ido mostrando el crecimiento y consolidación del sector. En concreto, para esta edición se han identificado 701 empresas, lo que supone un crecimiento del 58% respecto al primer informe, elaborado en 2013. Sin embargo, la cifra es muy similar a la ya analizada en 2021.
La edición de este año lleva como subtítulo “Economía del Dato en el ámbito Infomediario”. La economía del dato ya cuenta con un gran peso en los ecosistemas productivos europeos y se espera que continúe creciendo: para 2025, se estima que aportará un 4% al PIB.
En este contexto, ASEDIE se ha fijado entre sus objetivos no sólo impulsar el sector infomediario y la Economía del Dato, sino también contribuir a concienciar a la sociedad sobre sus beneficios. Para ello elabora este informe con diversos indicadores que dan a conocer el impacto del sector.
Principales conclusiones del informe
A continuación, desglosamos las principales conclusiones extraídas del informe:
- La 10º edición del informe muestra un volumen de ventas de más de 2.000 millones de euros, ofreciendo empleo a casi 23.000 profesionales.
- El 44% de las empresas infomediarias consultadas utilizan la IA para crear productos de valor añadido o como herramienta. El 72% de los encuestados afirman utilizar tanto datos públicos como privados para la creación de sus productos y/o servicios. Por su parte, el 17% de las empresas indican que tan solo utilizan información privada frente al 11% que solo se sirven de datos públicos.
- Existen 3 sectores que continúan concentrando la mayor parte de la actividad, destacando la información geográfica. La mayoría de las empresas infomediarias están especializadas en “información geográfica” (24%), “estudios de mercado” (20%) y el subsector “económico y financiero” (19%).
- Tan solo 2 de los subsectores aglutinan casi la mitad de las ventas totales (49%), estos son: “información geográfica” y “económico y financiero”. Sin embargo, “Editoriales”, a pesar de ser el 6º sector en número de empresas, es el que más venta media (6M€) y mediana (917.000€) presenta. Respecto a esta última, prácticamente dobla al siguiente en importancia ("Directoriales") que tiene un valor cercano a los 503.000€, muy por encima del resto de sectores.
- Gran parte de las empresas se ubican en la Comunidad de Madrid (38%), Cataluña (13%) y Andalucía (11%). Al igual que en años anteriores, el Sector Infomediario se encuentra representado en todas las Comunidades Autónomas.
- El 71% de las empresas infomediarias han sido creadas hace menos de 20 años. De ellas, un 36% tienen entre 11 y 20 años y un 35% menos de 10. El promedio de antigüedad continúa siendo de 16 años, siendo el subsector Editorial el más longevo y subsector Turismo el más joven.
- La media de empleados por empresa del Sector Infomediario asciende a 43, hasta alcanzar los 22.638 trabajadores. Al igual que en la facturación, el subsector que presenta una cifra más alta es el de “información geográfica” con un 30% del total.
- El capital suscrito agregado alcanza los 273.789.439 €, lo que supone un decrecimiento del 12,2% respecto a la edición anterior. Además, los tres subsectores más capitalizados son “estudios de mercado”, “económico y financiero” e “información geográfica”.
- El beneficio neto generado este año supera los 110 millones de euros, lo que representa un ligero descenso respecto al año anterior. “Cultura” y “Directoriales” han sido los únicos dos subsectores cuyas empresas no han ofrecido un beneficio positivo durante este año.
- El informe señala a la apertura de nuevas fuentes públicas, a la digitalización del Sector Público y a la interoperabilidad de las fuentes como los principales retos a resolver. Por su parte, la actualización y la calidad de la información son algunas de las barreras que dificultan el acceso y reutilización de la información.
- El 94% de los encuestados considera una oportunidad para el sector geoespacial la creación de la Oficina del Dato. Esperan que este organismo ayude en la coordinación, centralización e integración de datos, y promueva la apertura y homogenización de la disposición de fuentes públicas.

Top 3 ASEDIE y casos de éxito
El informe incluye un repaso a la situación del Top 3 ASEDIE, la iniciativa de ASEDIE para promover que todas las Comunidades Autónomas abran de manera completa tres conjuntos de datos, siguiendo unos criterios unificados que faciliten su reutilización. En 2019, se propuso la apertura de las bases de datos de Cooperativas, Asociaciones y Fundaciones. La iniciativa fue un éxito, y actualmente todas las Comunidades ya han abierto al menos dos de las tres bases de datos propuestas. Esta iniciativa está incluida en el compromiso 9 del IV plan de Gobierno abierto.
Dada la buena acogida, en 2020 se lanzó un nuevo Top 3, dirigido a que aquellas autonomías que ya tenían abiertas las tres primeras bases de datos, para que pudieran seguir avanzado en la apertura de nuevos conjuntos de datos relativo a: Registro de Certificados de Eficiencia Energética, Polígonos Industriales y Registros SAT (Sociedades Agrarias de Transformación). La evolución en la apertura de estas bases de datos en el último año también ha sido notable, como muestra la siguiente imagen.

El informe concluye con varios casos de éxito de empresas infomediarias y ejemplos de los productos y servicios que elaboran, como la Extensión del navegador web para obtener información empresarial de Infoempresa o la plataforma de Axesor (Investiga Pro) que permite consultar online las Bases de Datos de Titularidad Real tanto del Registro Mercantil, como del Consejo General del Notariado.
El informe está disponible en la página web de ASEDIE en español, junto con el video de la presentación del informe. Próximamente lo estará en inglés junto a un resumen ejecutivo en francés y portugués.
En conclusión, nos encontramos ante un sector con buena salud, pero que este año ha presentado un ligero decrecimiento del 4,6% en tiempos de pandemia. Sin embargo, estas cifras están por encima de la media española (el PIB de España cayó casi un 10% en el mismo periodo). Aunque el 55% de los encuestados ha notado el efecto de la Covid-19 en el acceso de las empresas o ciudadanos a sus datos, el hecho de que el 92% de los encuestados afirmen sentirse satisfechos con el nivel de digitalización del que disponen, hace confiar en una mejora de los resultados en un futuro próximo.
Los datos abiertos pueden ser de gran utilidad a la hora de fomentar aspectos como la salud y el bienestar de la ciudadanía o la protección del medio ambiente, así como el crecimiento de las economías. La apertura de información fomenta la innovación, la creación y la adaptación de empresas y organismos en torno a servicios y tecnologías capaces de generar rentabilidad y ofrecer soluciones a problemas actuales a partir de la reutilización de datos.
Pero, además, los datos de carácter económicos contribuyen a que muchas organizaciones puedan realizar una mejor toma de decisiones. Las estadísticas e indicadores económicos nos permiten conocer cómo evoluciona un determinado mercado o país, descubrir tendencias y actuar en consecuencia.
Si estas interesado en acceder a este tipo de datos, a continuación, recogemos 10 ejemplos de repositorios relacionados con la economía a nivel internacional:

-
Publicador: World Bank
Se trata de un sitio web que pertenece al World Bank. Esta plataforma cuenta con una completa oferta de datos económicos que se actualiza con frecuencia y permite el acceso a información abierta que elabora el propio Banco Mundial. Entre el tipo de datos que ofrece se encuentran estadísticas de deuda internacional, indicadores del desarrollo mundial o bases de datos sobre los patrones de consumo en los hogares de todo el mundo, entre muchos otros.
Destacan dos secciones interesantes. Una es su catálogo de datos, donde se puede encontrar información acerca de temas económicos como indicadores de desempeño estadístico o datos sobre la COVID-19, por ejemplo. Otra es su sección de microdatos, que ofrece una colección de conjuntos de datos del Banco Mundial y otras organizaciones internacionales, regionales y nacionales.
Gran parte de estos datos se ofrecen en los formatos más populares (HTML, JSON, PDF, CSV, …). Además, cuenta con un espacio para reutilizadores, con información sobre APIs.
-
Publicador: IMF (Internationaly Monetary Fund)
El Fondo Monetario Internacional (FMI) es una organización integrada por 190 países que trabaja para fomentar la cooperación monetaria mundial, asegurar la estabilidad financiera o facilitar el comercio internacional, entre otros aspectos.
Este portal contiene conjuntos de datos del FMI (IMF por sus siglas en inglés) acerca de la estabilidad financiera mundial, la economía regional, las estadísticas financieras mundiales y las perspectivas económicas, entre otras. Los datos se pueden descargar en distintos formatos, incluyendo XLSX y XLS.
-
Publicador: OCDE (Organización para la Cooperación y el Desarrollo Económicos)
La OCDE es una organización internacional de la que forman parte 38 países, entre ellos España, cuyo objetivo es hacer frente a los desafíos económicos, sociales y de buen gobierno.
El catálogo de datos de la OCDE dispone de una clasificación por sectores, entre los que se encuentra el económico. Ofrece la posibilidad de filtrar los datos según cuenten o no con acceso a la API. Además, este portal permite realizar consultas en grandes bases de datos en su almacén de datos OECD.Stat.
Especialmente interesantes son sus visualizaciones de datos, como estas desarrolladas para mostrar información acerca de las tasas de empleo a nivel mundial, así como otros indicadores relacionados con el empleo.
-
Publicador: UNECE (Comisión Económica de las Naciones Unidas para Europa)
Creada en 1947 y compuesta por 56 Estados miembros, se trata de una de las 5 comisiones regionales de la ONU. Entre sus objetivos se encuentra promover la integración económica paneuropea y apoyar a los países con economías en transición.
En su portal de información pública, se pueden encontrar diversos conjuntos de datos, en su mayoría económicos, ligados a los distintos países de Europa. Ofrece también otros conjuntos de datos sobre población y transporte y algunos recursos alternativos como visualizaciones o mapas de datos.
Los datos se muestran en cuatro formas diferentes: gráficos, clasificaciones, tablas y mapas. En este ejemplo se puede consultar información acerca de la tasa de desempleo juvenil a nivel mundial a través de los 4 medios anteriormente citados. Los datos se pueden descargar en CSV, TSV o JSON.
-
Publicador: Comisión Económica para América Latina y el Caribe (CEPAL, Naciones Unidas)
CEPALSTAT es el portal donde se encuentra toda la información estadística de los países de América Latina y el Caribe, recolectada, sistematizada y publicada por la Comisión Económica para América Latina (CEPAL).
Este portal recoge bases de datos y publicaciones estadísticas, así como conjuntos de datos económicos de América Latina y el Caribe, a menudo acompañados por otros recursos como visualizaciones de datos o mapas. Además, permite acceder a estos datos a través de una API para agilizar y facilitar el proceso de búsqueda de datos a sus usuarios. Los datos se pueden descargar en XML, JSON o XLXS.
-
Publicador: BCE (Banco Central Europeo)
El BCE, en colaboración con los bancos centrales nacionales y otras autoridades nacionales (estadísticas y de supervisión) de la Unión Europea, ofrece un servicio de desarrollo, recopilación, compilación y difusión de estadísticas en formato abierto.
El Statistical Data Warehouse ofrece indicadores de la zona del euro, incluyendo en algunos casos desgloses a nivel nacional. Cada una de las estadísticas ofrecidas en este portal cuenta con una breve descripción introductoria a los temas que tratan. Todos los datos están disponibles para su descarga en formato Excel y CSV.
-
Publicador: Organización Mundial del Comercio (OMC)
La Organización Mundial del Comercio (OMC) es una organización internacional que se ocupa de las normas que rigen el comercio entre los países. Su principal objetivo reside en ayudar a los productores de bienes y servicios, los exportadores y los importadores a llevar a cabo sus actividades de manera óptima.
Esta organización ofrece el acceso a una selección de bases de datos de relevancia que ofrecen estadísticas e información sobre diferentes medidas relacionadas con el comercio. Esta información se encuentra clasificada en cuatro grandes bloques: mercancías, servicios, propiedad intelectual, estadísticas y otras temáticas, facilitando así la búsqueda de datos a los usuarios.
En esta página puedes consultar los sistemas en línea de la OMC (bases de datos/sitios web) que se encuentran activos. Algunos de ellos necesitan registro.
-
Publicador: Organización de las Naciones Unidas para el Desarrollo Industrial (UNIDO)
La ONUDI (UNIDO por sus siglas en inglés) es un organismo especializado de las Naciones Unidas que se encarga de promover el desarrollo industrial para reducir la pobreza, promover la globalización inclusiva y la sostenibilidad ambiental.
Este organismo publica, ente otros, conjuntos de datos sobre desarrollo industrial, producción manufacturera e inversiones. En su portal, cuenta con un buscador de información sobre indicadores como el crecimiento de la población o del PIB por países. Estos datos pueden visualizarse a través de un gráfico que se actualiza con la información seleccionada, ofreciendo también la posibilidad de comparar datos de diferentes países dentro del mismo.
Al acceder a la sección DataBase, se puede descargar cada conjunto de datos en formato excel y CSV.
-
Publicador: UNCTAD (Conferencia de las Naciones Unidas sobre el Comercio y Desarrollo)
La UNCTAD (por sus siglas en inglés) es una organización encargada de ayudar a los países en desarrollo a aprovechar el comercio internacional, la inversión, los recursos financieros y la tecnología para alcanzar un desarrollo sostenible e inclusivo.
En su portal de datos en abierto, recoge series estadísticas por países y productos, poniendo especialmente el foco en países con una economía en desarrollo y en transición. Economía digital, comercio internacional de servicios, transporte marítimo o inflación y tipos de cambio son solo algunas de las temáticas que se pueden consultar en esta plataforma.
Además, para usuarios que no estén acostumbrados a navegar en este tipo de portales, UNCTAD pone a su disposición una serie de tutoriales en vídeo que introducen al usuario en el centro de datos y le enseñan, entre otros aspectos, cómo exportar la información de esta plataforma (se pueden descargar en CSV o XLSX).
-
Publicador: BID (Banco Interamericano de Desarrollo)
El Banco Interamericano de Desarrollo (IDB por sus siglas en inglés) es una organización financiera internacional cuyo principal objetivo consiste en la financiación de proyectos viables de desarrollo económico, social e institucional, además de promover la integración comercial en América Latina y el Caribe.
En su sección dedicada a los datos, ofrece indicadores de desarrollo por país relacionados con su perfil macroeconómico, su integración global y sus perspectivas sociales. Además, en esta sección se pueden encontrar algunos recursos adicionales como gráficos y visualizaciones que permiten filtrar la información de acuerdo a diferentes indicadores o cursos para aumentar el conocimiento en materia económica a partir de los datos.
La mayoría de los datos se pueden descargar en CSV, JSON o RDF.
Esta ha sido tan solo una pequeña selección de repositorios de datos relacionados con el sector económico que pueden ser de tu interés. ¿Conoces alguno más de relevancia relacionado con este campo? Déjanos un comentario o envíanos un correo electrónico a dinamizacion@datos.gob.es
1. Introducción
La visualización de datos es una tarea vinculada al análisis de datos que tiene como objetivo representar de manera gráfica información subyacente de los mismos. Las visualizaciones juegan un papel fundamental en la función de comunicación que poseen los datos, ya que permiten extraer conclusiones de manera visual y comprensible permitiendo, además, detectar patrones, tendencias, datos anómalos o proyectar predicciones, entre otras funciones. Esto hace que su aplicación sea transversal a cualquier proceso en el que intervengan datos. Las posibilidades de visualización son muy amplias, desde representaciones básicas, como puede ser un gráfico de líneas, barras o sectores, hasta visualizaciones complejas configuradas desde dashboards interactivos.
Antes de lanzarnos a construir una visualización efectiva, debemos realizar un tratamiento previo de los datos, prestando atención a la obtención de los mismos y validando su contenido, asegurando que no contienen errores y se encuentran en un formato adecuado y consistente para su procesamiento. Un tratamiento previo de los datos es esencial para abordar cualquier tarea de análisis de datos que tenga como resultado visualizaciones efectivas.
Se irán presentando periódicamente una serie de ejercicios prácticos de visualización de datos abiertos disponibles en el portal datos.gob.es u otros catálogos similares. En ellos se abordarán y describirán de manera sencilla las etapas necesarias para obtener los datos, realizar las transformaciones y análisis que resulten pertinentes para la creación de visualizaciones interactivas, de las que podamos extraer la máxima información resumida en unas conclusiones finales. En cada uno de los ejercicios prácticos se utilizarán sencillos desarrollos de código que estarán convenientemente documentados, así como herramientas de uso libre y gratuito. Todo el material generado estará disponible para su reutilización en el repositorio Laboratorio de datos en Github.

Captura del vídeo que muestra la interacción con el dashboard de la caracterización de la demanda de empleo y la contratación registrada en España disponible al final de este artículo
2. Objetivos
El objetivo principal de este post es realizar una visualización interactiva partiendo de datos abiertos. Para ello se han utilizado conjuntos de datos que contienen información relevante sobre la evolución de la demanda de empleo en España a lo largo de los últimos años. A partir de estos datos se determina el perfil que representa la demanda de empleo en nuestro país, estudiando específicamente cómo afecta la brecha de género al colectivo y la incidencia de variables como la edad, la prestación por desempleo o la región.
3. Recursos
3.1. Conjuntos de datos
Para este análisis se han seleccionado conjuntos de datos publicados por el Servicio Público de Empleo Estatal (SEPE), coordinado por el Ministerio de Trabajo y Economía Social, que recogen series temporales de datos con diferentes desagregaciones que facilitan el análisis de las características que presentan los demandantes de empleo. Estos datasets se encuentran disponibles en datos.gob.es con las siguientes características:
- Demandantes de empleo por municipio: contiene el número de demandantes de empleo desagregado por municipio, edad y sexo, desde 2006 hasta 2020.
- Gasto de prestaciones por desempleo por Provincia: serie temporal desde 2010 hasta 2020 sobre el gasto en prestaciones por desempleo, desagregado por provincia y el tipo de prestación.
- Contratos registrados por el Servicio Público de Empleo Estatal (SEPE) por municipio: estos conjuntos de datos contienen el número de contratos registrados tanto a demandantes como a no demandantes de empleo, desagregados por municipio, sexo y tipo de contrato, desde 2006 hasta 2020.
3.2. Herramientas
Para la realización de este análisis (entorno de trabajo, programación y redacción del mismo) se ha utilizado R (versión 4.0.3) y RStudio con el complemento de RMarkdown.
RStudio es un entorno de desarrollo open source integrado para el lenguaje de programación R, dedicado al análisis estadístico y la creación de gráficos.
RMarkdown permite la realización de informes integrando texto, código y resultados dinámicos en un único documento.
Para la creación de los gráficos interactivos se ha utilizado la herramienta Kibana.
Kibana es una aplicación de código abierto que forma parte del paquete de productos Elastic Stack (Elasticsearch, Beats, Logstasg y Kibana) que proporciona capacidades de visualización y exploración de datos indexados sobre el motor de analítica Elasticsearch. Las principales ventajas de esta herramienta son:
- Presenta la información de manera visual a través de dashboards interactivos y personalizables mediante intervalos temporales, filtros facetados por rango, cobertura geoespacial, entre otros.
- Dispone de un catálogo de herramientas de desarrollo (Dev Tools) para interactuar con los datos almacenados en Elasticsearch.
- Cuenta con una versión gratuita para utilizar en tu propio ordenador y una versión enterprise que se desarrolla en un cloud propio de Elastic u otras infraestructuras en cloud como Amazon Web Service (AWS).
En la propia web de Elastic encontramos manuales de usuario para la descarga e instalación de la herramienta, o cómo crear gráficos o dashboards, entre otros. Además ofrece vídeos cortos en su canal de youtube y organiza webinars donde explican diversos aspectos relacionados con Elastic Stack.
Si quieres saber más sobre estas herramientas u otras que pueden ayudarte en el procesado de datos, puedes ver el informe \"Herramientas de procesado y visualización de datos\", actualizado recientemente.
4. Tratamiento de datos
Para la realización una visualización, es necesario preparar los datos de la forma adecuada realizando una serie de tareas que incluyen el preprocesado y el análisis exploratorio de los datos (EDA, por sus siglas en inglés), con el fin de conocer la realidad de los datos a los que nos enfrentamos. El objetivo es identificar características de los datos y detectar las posibles anomalías o errores que pudieran afectar a la calidad de los resultados. Un tratamiento previo de los datos es esencial para que los análisis o las visualizaciones que se realicen posteriormente sean consistentes y efectivas.
Para favorecer el entendimiento de los lectores no especialistas en programación, el código en R que se incluye a continuación, al que puedes acceder haciendo clik en \"Código\", no está diseñado para su eficiencia sino para su fácil comprensión, por lo que es posible que lectores más avanzados en este lenguaje de programación consideren una forma de codificar algunas funcionalidades de forma alternativa. El lector podrá reproducir este análisis si lo desea, ya que el código fuente está disponible en cuenta en Github de datos.gob.es. La forma de proporcionar el código es a través de un documento de RMarkdown. Una vez cargado en el entorno de desarrollo podrá ejecutarse o modificarse de manera sencilla si se desea.
4.1. Instalación y carga de librerías
El paquete base de R, siempre disponible desde que abrimos la consola en RStudio, incorpora un amplio conjunto de funcionalidades para cargar datos de fuentes externas, llevar a cabo análisis estadísticos y obtener representaciones gráficas. No obstante, hay multitud de tareas para las que necesitamos recurrir a paquetes adicionales incorporando al entorno de trabajo las funciones y objetos definidos en ellas. Algunos de ellos ya están instalados en el sistema, pero otros será preciso descargarlos e instalarlos.
#Instalación de paquetes \r\n #El paquete dplyr presenta una colección de funciones para realizar de manera sencilla operaciones de manipulación de datos \r\n if (!requireNamespace(\"dplyr\", quietly = TRUE)) {install.packages(\"dplyr\")}\r\n #El paquete lubridate para el manejo de variables tipo fecha \r\n if (!requireNamespace(\"lubridate\", quietly = TRUE)) {install.packages(\"lubridate\")}\r\n#Carga de paquetes en el entorno de desarrollo \r\nlibrary (dplyr)\r\nlibrary (lubridate)\r\n4.2. Carga y limpieza de datos
a. Carga de datasets
Los datos que vamos a utilizar en la visualización se encuentran divididos por anualidades en ficheros .CSV y .XLS. Debemos cargar en nuestro entorno de desarrollo todos los ficheros que nos interesan. El siguiente código muestra como ejemplo la carga de un único fichero .CSV en una tabla de datos para que la lectura de este post sea más comprensible.
Para agilizar el proceso de carga en el entorno de desarrollo, es necesario descargar en el directorio de trabajo los conjuntos de datos necesarios para esta visualización, que se encuentran disponibles en la cuenta de Github de datos.gob.es.
#Carga del datasets de demandantes de empleo por municipio de 2020. \r\n Demandantes_empleo_2020 <- \r\n read.csv(\"Conjuntos de datos/Demandantes de empleo por Municipio/Dtes_empleo_por_municipios_2020_csv.csv\",\r\n sep=\";\", skip = 1, header = T)\r\nUna vez que tenemos todos los conjuntos de datos cargados como tablas en el entorno de desarrollo, debemos unificarlos para así tener un único dataset que integre todos los años de la serie temporal, por cada una de las características relacionadas con los demandantes de empleo que se quiere analizar: número de demandantes de empleo, gasto por desempleo y nuevos contratos registrados por el SEPE.
#Dataset de demandantes de empleo\r\nDatos_desempleo <- rbind(Demandantes_empleo_2006, Demandantes_empleo_2007, Demandantes_empleo_2008, Demandantes_empleo_2009, \r\n Demandantes_empleo_2010, Demandantes_empleo_2011,Demandantes_empleo_2012, Demandantes_empleo_2013,\r\n Demandantes_empleo_2014, Demandantes_empleo_2015, Demandantes_empleo_2016, Demandantes_empleo_2017, \r\n Demandantes_empleo_2018, Demandantes_empleo_2019, Demandantes_empleo_2020) \r\n#Dataset de gasto en prestaciones por desempleo\r\ngasto_desempleo <- rbind(gasto_2010, gasto_2011, gasto_2012, gasto_2013, gasto_2014, gasto_2015, gasto_2016, gasto_2017, gasto_2018, gasto_2019, gasto_2020)\r\n#Dataset de nuevos contratos a demandantes de empleo\r\nContratos <- rbind(Contratos_2006, Contratos_2007, Contratos_2008, Contratos_2009,Contratos_2010, Contratos_2011, Contratos_2012, Contratos_2013, \r\n Contratos_2014, Contratos_2015, Contratos_2016, Contratos_2017, Contratos_2018, Contratos_2019, Contratos_2020)b. Selección de variables
Una vez que tenemos las tablas con las tres series temporales (número de demandantes de empleo, gasto por desempleo y nuevos contratos registrados), crearemos una nueva tabla que incluirá las variables que interesan de cada una de ellas.
En primer lugar, agregaremos por provincia las tablas de demandantes de empleo (“datos_desempleo”) y contratos nuevos contratos registrados (“contratos”) para facilitar la visualización y que coincidan con la desagregación por provincia de la tabla de gasto en prestaciones por desempleo (“gasto_desempleo”). En este paso, seleccionamos únicamente las variables que interesen de los tres conjuntos de datos.
#Realizamos un group by al dataset de \"datos_desempleo\", agruparemos las variables numéricas que nos interesen, en función de varias variables categóricas\r\nDtes_empleo_provincia <- Datos_desempleo %>% \r\n group_by(Código.mes, Comunidad.Autónoma, Provincia) %>%\r\n summarise(total.Dtes.Empleo = (sum(total.Dtes.Empleo)), Dtes.hombre.25 = (sum(Dtes.Empleo.hombre.edad...25)), \r\n Dtes.hombre.25.45 = (sum(Dtes.Empleo.hombre.edad.25..45)), Dtes.hombre.45 = (sum(Dtes.Empleo.hombre.edad...45)),\r\n Dtes.mujer.25 = (sum(Dtes.Empleo.mujer.edad...25)), Dtes.mujer.25.45 = (sum(Dtes.Empleo.mujer.edad.25..45)),\r\n Dtes.mujer.45 = (sum(Dtes.Empleo.mujer.edad...45)))\r\n#Realizamos un group by al dataset de \"contratos\", agruparemos las variables numericas que nos interesen en función de las varibles categóricas.\r\nContratos_provincia <- Contratos %>% \r\n group_by(Código.mes, Comunidad.Autónoma, Provincia) %>%\r\n summarise(Total.Contratos = (sum(Total.Contratos)),\r\n Contratos.iniciales.indefinidos.hombres = (sum(Contratos.iniciales.indefinidos.hombres)), \r\n Contratos.iniciales.temporales.hombres = (sum(Contratos.iniciales.temporales.hombres)), \r\n Contratos.iniciales.indefinidos.mujeres = (sum(Contratos.iniciales.indefinidos.mujeres)), \r\n Contratos.iniciales.temporales.mujeres = (sum(Contratos.iniciales.temporales.mujeres)))\r\n#Seleccionamos las variables que nos interesen del dataset de \"gasto_desempleo\"\r\ngasto_desempleo_nuevo <- gasto_desempleo %>% select(Código.mes, Comunidad.Autónoma, Provincia, Gasto.Total.Prestación, Gasto.Prestación.Contributiva)En segundo lugar, procedemos a unir las tres tablas en una que será con la que trabajemos a partir de este punto.
Caract_Dtes_empleo <- Reduce(merge, list(Dtes_empleo_provincia, gasto_desempleo_nuevo, Contratos_provincia))
c. Transformación de variables
Una vez tengamos la tabla con las variables de interés para el análisis y la visualización, debemos transformar algunas de ellas a otros tipos más adecuados para futuras agregaciones.
#Transformación de una variable fecha\r\nCaract_Dtes_empleo$Código.mes <- as.factor(Caract_Dtes_empleo$Código.mes)\r\nCaract_Dtes_empleo$Código.mes <- parse_date_time(Caract_Dtes_empleo$Código.mes(c(\"200601\", \"ym\")), truncated = 3)\r\n#Transformamos a variable numérica\r\nCaract_Dtes_empleo$Gasto.Total.Prestación <- as.numeric(Caract_Dtes_empleo$Gasto.Total.Prestación)\r\nCaract_Dtes_empleo$Gasto.Prestación.Contributiva <- as.numeric(Caract_Dtes_empleo$Gasto.Prestación.Contributiva)\r\n#Transformación a variable factor\r\nCaract_Dtes_empleo$Provincia <- as.factor(Caract_Dtes_empleo$Provincia)\r\nCaract_Dtes_empleo$Comunidad.Autónoma <- as.factor(Caract_Dtes_empleo$Comunidad.Autónoma)d. Análisis exploratorio
Veamos qué variables y estructura presenta el nuevo conjunto de datos.
str(Caract_Dtes_empleo)\r\nsummary(Caract_Dtes_empleo)La salida de esta porción de código se omite para facilitar la lectura. Las características principales que presenta el conjunto de datos son:
- El rango temporal abarca desde enero de 2010 hasta diciembre de 2020.
- El número de columnas (variables) es de 17.
- Presenta dos variables categóricas (“Provincia” y “Comunidad.Autónoma”), una variable tipo fecha (“Código.mes”) y el resto son variables numéricas.
e. Detección y tratamiento de datos perdidos
Seguidamente analizaremos si el dataset presenta valores perdidos (NAs). El tratamiento o la eliminación de los NAs es esencial, ya que si no es así no será posible procesar adecuadamente las variables numéricas.
any(is.na(Caract_Dtes_empleo)) \r\n#Como el resultado es \"TRUE\", eliminamos los datos perdidos del dataset, ya que no sabemos cual es la razón por la cual no se encuentran esos datos\r\nCaract_Dtes_empleo <- na.omit(Caract_Dtes_empleo)\r\nany(is.na(Caract_Dtes_empleo))4.3. Creación de nuevas variables
Para realizar la visualización, vamos a crear una nueva variable a partir de dos variables que se encuentran en la tabla de datos. Esta acción es muy común en el análisis de datos ya que en ocasiones interesa trabajar con datos calculados (por ejemplo, la suma o la media de diferentes variables) en lugar de los datos de origen. En este caso vamos a calcular el gasto medio en prestaciones por desempleo para cada demandante de empleo. Para ello utilizaremos las variables de gasto total por prestación (“Gasto.Total.Prestación”) y el total de demandantes de empleo (“total.Dtes.Empleo”).
Caract_Dtes_empleo$gasto_desempleado <-\r\n (1000 * (Caract_Dtes_empleo$Gasto.Total.Prestación/\r\n Caract_Dtes_empleo$total.Dtes.Empleo))4.4. Guardar el dataset
Una vez que tenemos la tabla con las variables que nos interesan para los análisis y las visualizaciones, la guardaremos como archivo de datos en formato CSV para posteriormente realizar otros análisis estadísticos o utilizarlo en otras herramientas de procesado o visualización de datos. Es importante utilizar la codificación UTF-8 (Formato de Transformación Unicode) para que los caracteres especiales sean identificados de manera correcta por cualquier herramienta.
write.csv(Caract_Dtes_empleo,\r\n file=\"Caract_Dtes_empleo_UTF8.csv\",\r\n fileEncoding= \"UTF-8\")5. Creación de la visualización sobre la caracterización de la demanda de empleo en España usando Kibana
El desarrollo de esta visualización interactiva se ha realizado usando Kibana en nuestro entorno local. Tanto para la descarga del software, como para la instalación del mismo, hemos recurrido al tutorial realizado por la propia compañía, Elastic.
A continuación se adjunta un vídeo tutorial donde se muestra todo el proceso de realización de la visualización. En el vídeo podrás ver la creación de un cuadro de mando (dashboard) con diferentes indicadores interactivos mediante la generación de representaciones gráficas de diferentes tipos. Los pasos para obtener el dashboard son los siguientes:
- Cargamos los datos en Elasticsearch y generamos un índice que nos permita interactuar con los datos desde Kibana. Este índice permite la búsqueda y gestión de datos en los archivos cargados, prácticamente en tiempo real.
- Generación de las siguientes representaciones gráficas:
- Gráfico de líneas para representar la serie temporal sobre los demandantes de empleo en España desde 2006 hasta 2020.
- Gráfico de sectores de los demandantes de empleo desagregados por Provincia y Comunidad Autónoma.
- Mapa temático, mostrando el número de contratos nuevos registrados en cada Provincia del territorio. Para la creación de este visual es necesaria la descarga de un dataset de la georeferenciación de las Provincias publicado en el portal de datos abiertos Open Data Soft.
- Construcción del dashboard.
Seguidamente mostraremos un vídeo tutorial interactuando con la visualización que acabamos de crear:
6. Conclusiones
Observando la visualización de los datos sobre el perfil de los demandantes de empleo en España en el periodo 2010 hasta 2020, se pueden obtener, entre otras, las siguientes conclusiones:
- Existen dos incrementos significativos en el número de demandantes de empleo. El primero aproximadamente en 2010, que coincide con la crisis económica. El segundo, mucho más pronunciado en 2020, que coincide con la crisis derivada de la pandemia.
- Se observa que existe una brecha de género en el colectivo de demandantes de empleo: el número de mujeres demandantes de empleo es mayor a lo largo de toda la serie temporal, principalmente en los grupos de edad de mayores de 25.
- A nivel regional, Andalucía, seguida de Cataluña y Comunidad Valenciana, son las Comunidades Autónomas con mayor número de demandantes de empleo. En contraste, Andalucía, es la Comunidad Autónoma con menor gasto por desempleo, mientras que Cataluña, es la que presenta mayor gasto por desempleo.
- Los contratos de tipo temporal son los prioritarios y las provincias que generan mayor número de contratos son Madrid y Barcelona, que coinciden con las provincias con mayor número de habitantes, mientras que en el lado opuesto, las provincias que menos número de contratos realizan son Soria, Ávila, Teruel o Cuenca, que coincide con las zonas más despobladas de España.
Esta visualización nos ha ayudado a sintetizar gran cantidad de información y darle sentido pudiendo obtener unas conclusiones y si fuera necesario tomar decisiones en función de los resultados. Esperemos que os haya gustado este nuevo post y volveremos para mostraros nuevas reutilizaciones de datos abiertos. ¡Hasta pronto!
Ya está disponible la nueva edición del Informe sobre el Sector Infomediario de ASEDIE (Asociación Multisectorial de la Información), en el que se analiza el valor real, económico y social de las empresas reutilizadoras de datos procedentes del sector público y/o privado para desarrollar productos de valor añadido.
En la 9ª edición de este informe se han analizado 700 empresas, que muestran un sector estable. En concreto, en el año 2019 el Sector Infomediario creció un 6,4%, una evolución por encima de la del Producto Interior Bruto, que fue del 3,4%.
Además, arroja datos acerca de cómo las empresas infomediarias cerraron el año 2019 con un volumen de ventas de más de 2.543 millones de euros y ofreciendo empleo a casi 22.000 empleados.
A continuación, desglosamos las principales conclusiones extraídas del informe:
- 3 sectores siguen concentrando la mayor parte de la actividad, destacando la información geográfica. La mayoría de las empresas infomediarias están especializadas en “información geográfica” (24%), “estudios de mercado” (21%) y el subsector “económico y financiero” (18%).
- La mitad de los subsectores aglutinan el 85% de las ventas totales. Destaca especialmente la Información Geográfica con más de 600 millones de euros de facturación (23,6%).
- El 61% de las empresas infomediarias consultadas utilizan la IA para crear productos de valor añadido o como herramienta. El 70% de los encuestados afirman que también reutilizan los datos para uso interno, frente al 30% que indican que el uso es exclusivamente externo.
- Más de la mitad de las empresas se ubican en la Comunidad de Madrid (38%), Cataluña (13%) y Andalucía (11%). Como en años anteriores, el Sector Infomediario se encuentra representado en todas las Comunidades Autónomas.
- Casi el 40% de las compañías del Sector han sido creadas en los últimos 10 años. El promedio de antigüedad es de 16 años, siendo el subsector Editorial el más longevo y subsector Turismo el más joven.
- La media de empleados por empresa del Sector Infomediario asciende a 37, hasta alcanzar los 21.988 trabajadores. Al igual que en la facturación, el subsector que presenta una cifra más alta es el de “información geográfica” con un 30,5% del total.
- El capital suscrito agregado supera los 310 millones de euros, casi 11 millones más que en la edición anterior. Además, los tres subsectores más capitalizados son “estudios de mercado”, “económico y financiero” e información geográfica.
- Todos los subsectores cuentan con un 65% o más de empresas en beneficios. Al igual que en años anteriores, el beneficio neto generado ha superado los 125 millones de euros.
- El análisis de datos y la apertura de nuevas bases de datos destacan esta vez como los principales retos del Sector Infomediario, seguidos muy de cerca por la Digitalización. Por su parte, la falta de una “cultura del dato” y la poca calidad de los mismos son algunas de las barreras que dificultan el acceso y reutilización de la información.
El informe incluyen un repaso a la situación del Top 3 Asedie, la iniciativa de ASEDIE para promover que todas las Comunidades Autónomas abran de manera completa tres conjuntos de datos -Cooperativas, Asociaciones y Fundaciones -, siguiendo unos criterios unificados que faciliten su reutilización. Actualmente, ya son 15 la Comunidades que han abiertos al menos dos de las tres bases de datos propuestas.
Concluye el documento con varios casos de éxito de empresas infomediarias y ejemplos de los productos y servicios que elaboran, como el Directorio de empresas innovadoras de España de Infoempresa o el uso que Iberimform está haciendo de IBM Watson.
El informe está disponible en la página web de Asedie en español e inglés, y próximamente lo estará en francés. También está disponible el vídeo de la presentación del informe.
En conclusión, nos encontramos ante un sector con buena salud, que presenta un crecimiento destacado. Aunque el 74% de los encuestados creen que la pandemia afectará directamente a la evolución del Sector este año, el hecho de que el 96% de los encuestados utilizan datos para crear sus productos o servicios de valor añadido hacen confiar en unas perspectivas positivas a largo plazo.

¿Cuál es el valor de los datos abiertos? Hace unas semanas, con el objetivo de contribuir a dar respuesta a esta pregunta, publicamos un artículo donde se presentaban los principales hallazgos de uno de los últimos informes publicados por la Comisión Europea y el Portal Europeo de Datos: “El impacto económico de los datos abiertos: oportunidades de creación de valor en Europa (2020)” en el cual se analizaban de una forma completa y exhaustiva el valor, tanto económico como social, creado por los datos abiertos en toda Europa.
Siguiendo esta misma línea, en este post nos hacemos eco del artículo “Open Data Index: 10 Insights on the Value of Open Data” escrito por Stefaan Verhulst, Michelle Winowatan, Andrew Young, Andrew J. Zahuranec y Alexandra Shaw con motivo del lanzamiento del Open Data Policy Lab. Los autores, a partir de una exhaustiva revisión bibliográfica de fuentes que refieren evidencias estadísticas y numéricas en estudios de relativos a EE.UU, Australia, Reino Unido, África y la Unión Europea, identifican 10 aportes de valor derivados de la apertura de datos.
Veamos estos 10 aportes clave derivados de la apertura de datos:
1. LOS DATOS ABIERTOS IMPULSAN EL CRECIMIENTO ECONÓMICO
- En el Reino Unido se estima que el aumento del PIB derivado de la apertura de datos públicos se sitúa entre el 0,4-1,4%.
- Los beneficios sociales y económicos indirectos derivados de la información del sector público en el Reino Unido se estiman en 6.800 millones de libras.
- El valor directo de la información del sector público (abierta) en el Reino Unido es de 1.800 millones de libras.
- En Canadá el crecimiento medio anual de la inversión en datos entre 2015 y 2018 fue del 6,2%, superior al crecimiento medio anual de otros sectores como el de la maquinaria y equipos (+2,2%), edificios no residenciales (+2,0%), obras de ingeniería (-4,7%) o la I+D (+0,5%).
- El valor anual global de los datos abiertos que podría generarse en siete sectores clave ( educación, transporte, productos de consumo, electricidad, petróleo y gas, atención a la salud y financiación al consumo) se estima en 3 billones de dólares.
- En Canadá el valor del volumen de datos, las bases de datos y la ciencia de los datos en 2018 es de 217.000 millones de dólares.
- En la UE27 se estima que los beneficios económicos agregados directos e indirectos derivados de la información del sector público abierta en 2008 es de 200.000 millones de euros.
- La contribución de las políticas de datos abiertos al crecimiento acumulado del PIB de Australia es de 16.000 millones de dólares anuales.
2. LOS DATOS ABIERTOS FAVORECEN LA RENDICIÓN DE CUENTAS POR PARTE DE LAS INSTITUCIONES
- Se estima que los datos abiertos pueden contribuir a reducir en un 10% los costes que acarrean la corrupción, tanto por la disminución de los beneficios privados que se generarían, como por la mayor facilidad de su detección.
- El 66% de los estadounidenses creen que los datos abiertos mejorarán la rendición de cuentas del gobierno.
- El análisis de los datos abiertos del Departamento de Policía de la ciudad de Nueva York ha permitido descubrir multas expedidas de manera ilegal cuyo valor asciende a los 1,7 millones de dólares.
- Tras la apertura de los datos de las contrataciones públicas en Eslovaquia, la cobertura de prensa a la supervisión de las adquisiciones públicas se ha incrementado en un 25%.
- En Brasil, la publicación de los informes de auditoría sobre corrupción impacta directamente en la probabilidad de reelección de los alcaldes. En concreto, los alcaldes tienen un -7% de media de probabilidad de ser reelegidos, cifra que asciende al -14% para los municipios con tres delitos.
3. LOS DATOS ABIERTOS MEJORAN LOS SERVICIOS PÚBLICOS
- El aumento de un punto en el Barómetro de Datos Abiertos implica un aumento de 0,375 puntos en el Índice Mo Ibrahim de Gobernanza Africana relativo a rendición de cuentas.
- El aumento de un punto en el Barómetro de Datos Abiertos implica un aumento de 0,201 puntos en la prestación de servicios de educación, según el Índice Mo Ibrahim de Gobernanza Africana.
- En Uganda el aumento del acceso a la información y de reporte en el programa de mortalidad infantil redujo las muertes infantiles en un 36%.
- Se estima entre 54.000–202.000 el número de vidas salvadas en el EU28+ gracias a una respuesta de emergencia más rápida derivada de la disponibilidad de datos abiertos de los mapas y del tráfico en tiempo real.
4. LOS DATOS ABIERTOS AUMENTAN LOS INGRESOS PÚBLICOS
- Se estima que el ahorro de costes en el sector público de la Unión Europea como resultado del uso de datos abiertos en el desarrollo de la traducción automática neuronal es de 1.100 millones de euros.
- El valor económico estimado de la apertura de los datos y las publicaciones de la Oficina de Estadística de Australia es de 25 millones de dólares.
- Tras la apertura de los datos de movilidad en tiempo real, la ciudad de San Francisco ahorra 1 millón de dólares al año.
- En la UE la apertura de datos en tiempo real sobre el transporte público ha permitido ahorrar 27 millones de horas en los desplazamientos.
5. LOS DATOS ABIERTOS MEJORAN LA SALUD Y EL SECTOR SANITARIO
- En Reino Unido la apertura de las estadísticas de infección hospitalaria, incluidas las relativas a los hospitales con las peores métricas en cuanto a infecciones, ha logrado disminuir anualmente la tasa de infección de 5.000 pacientes a menos de 1.200.
- En los Estados Unidos, tras la aplicación de la obligación de informar públicamente sobre las infecciones adquiridas en los hospitales, se redujeron en un 46% las infecciones sanguíneas asociadas a catéteres venosos centrales (central line-associated bloodstream infections, en inglés).
- El tiempo necesario para producir el informe de vigilancia de la obesidad infantil a nivel de distrito se redujo de dos a un año después de que los funcionarios de salud de Nueva York abrieran los datos del Informe sobre el peso de los estudiantes.
- El valor anual estimado de los conjuntos de datos de los Servicios Nacionales de Salud de Reino Unido para el país es de 5.000 millones de libras.
- El valor anual estimado de los conjuntos de datos de los Servicios Nacionales de Salud del Reino Unido para los pacientes es de 4.600 millones de libras esterlinas.
- En la UE28+ gracias a las aplicaciones de orientación de reanimación cardiopulmonar basadas en datos abiertos se han ahorrado entre 312.000-400.000 euros en asistencia sanitaria debido a la rapidez de respuesta en los primeros auxilios por parte de los transeúntes.
6. LOS DATOS ABIERTOS CREAN EMPLEOS Y DISMINUYEN LOS COSTES DE LA MANO DE OBRA
- Se estima que en la UE28+ se han creado 25.000 nuevos puestos de trabajo en el sector de los datos abiertos entre 2016 y 2020.
- En la UE28+ el ahorro de costes laborales debido a la reducción del tiempo de los atascos, gracias a la utilización de sistemas de navegación de tráfico en tiempo real basada en datos abiertos es de entre 13,7-20 mil millones de euros.
7. LOS DATOS ABIERTOS PUEDEN AUMENTAR LA EFICIENCIA ENERGÉTICA
- La energía que se podría ahorrar en la UE28+ por la apertura de los datos de consumo de energía es de 5,8 millones de toneladas de equivalente en petróleo.
- El valor potencial de los datos abiertos a la hora de impulsar el uso adecuado de los paneles solares en los tejados es de 79.600 millones de euros.
8. LOS DATOS ABIERTOS MEJORAN EL VALOR DE LA INVESTIGACIÓN
- En la Unión Europea, el coste del tiempo invertido en la búsqueda de datos de investigación que no son Encontrables, Accesibles, Interoperables y Reutilizables (FAIR) asciende a los 4.500 millones de euros al año.
- El coste por el almacenamiento redundante de datos de investigación no FAIR se sitúa en los 5.300 millones de euros al año.
- El coste asociado a licencias de los datos de investigación no FAIR alcanza los 360 millones de euros al año.
- El coste de las investigaciones que no son FAIR es de 4,4 millones de euros al año.
- El Instituto Europeo de Bioinformática calcula que el valor anual, para los usuarios y financiadores, derivado de disponer la información científica accesible libremente para la comunidad científica mundial asciende a los 1.300 millones de euros.
- Los trabajos que disponen en abierto los datos sobre los que se fundamenta la investigación obtienen un 25% más de citas que los trabajos de investigación que no lo hacen.
- El valor anual estimado generado por el Portal de Acceso a Datos de la Organización de Investigación Científica e Industrial de la Commonwealth de Australia es de 67 millones de dólares anuales.
- El valor anual de los datos de la investigación pública de Australia, basado en el presupuesto y la actividad de 2011, es de entre 1.900-6.000 millones de dólares.
9. LOS DATOS ABIERTOS CREAN VALOR ECONÓMICO EN EL SECTOR GEOESPACIAL
- El valor económico del uso de los datos de la la agencia nacional de cartografía del Reino Unido (Ordenance Survey) es de 100.000 millones de libras.
- En Europa, se estima que los ingresos anuales obtenidos por los impuestos aplicados a la comercialización de los datos ofrecidos por los servicios meteorológicos asciende a 300 millones de euros.
- En Dinamarca se estima que el beneficio económico para su ciudadanía derivado de la apertura de datos de las direcciones postales en el periodo 2005-2009 se sitúa en los 62 millones de euros.
- El beneficio económico anual estimado para los Estados Unidos si los datos obtenidos por los satélites Landsat se ofrecieran en abierto sería de 1.800 millones de dólares.
- La tasa de crecimiento anual de las empresas de arquitectura e ingeniería en los países en que se dispone de datos geográficos a precios de coste marginal o gratuitos, es un 15% superior al de las empresas de los países que no disponen de datos geográficos abiertos.
10. LOS DATOS ABIERTOS FACILITAN LA JUSTICIA SOCIAL
- Los residentes afroamericanos de Zanesville, Ohio, fueron indemnizados con 10,9 millones de dólares después de que los datos abiertos GIS ayudaran a probar que el acceso al agua limpia era inequitativo por motivos raciales.
- Más de 49 millones de detenciones policiales se han hecho transparentes gracias a los datos abiertos proporcionados por OpenDataPolicing.com, lo que ha dado lugar a una disminución del número de detenciones y del uso de la fuerza en las detenciones.
- Beyond the Bell, una organización de educación y justicia social de Australia, ha logrado recaudar 450.000 dólares, documentando los cambios en las necesidades de la comunidad desde 2012 mediante aplicaciones de datos abiertos.
Estas cifras evidencian el gran valor de los datos abiertos como herramienta para la buena gobernanza, la participación y la seguridad ciudadana, así como para la investigación y el desarrollo; y apuntan a la importancia de la apertura de datos de alto valor, como son los datos generados en los sectores sanitario, geoespacial o energético, entre otros.
Finalmente, tal y como apunta el Barómetro de los Datos Abiertos, el potencial de los datos abiertos es enorme. A pesar de que la mayoría de los datos gubernamentales a nivel mundial siguen cerrados, es posible identificar casos, como los referidos anteriormente, en los que esta materia prima resulta muy valiosa desde el punto de vista económico, social y cultural.
La Asociación Multisectorial de la Información, ASEDIE, acaba de publicar la 8ª edición del Informe sobre el Sector Infomediario, en el que participan 764 empresas, un 10% más que en la edición anterior, y que describe un sector en aumento, tanto el número de empresas y empleados que se dedican a esta actividad, como la evolución del volumen de negocio total de las empresas que realizan actividad infomediaria en España, y que crece en un 13,8% respecto al último periodo.
Al crecimiento reflejado en las gráficas anteriores, y referido en las sucesivas ediciones del Informe, se suman los resultados del análisis del resultado entre pérdidas y ganancias de las compañías analizadas. De acuerdo a este parámetro cabe indicar que la proporción de empresas con beneficios y de empresas con pérdidas se ha mantenido estable durante todo el periodo, con aproximadamente un 70% de empresas con beneficios y un 30% con pérdidas, y un balance de 92 millones de euros de beneficio neto generado en el Sector, correspondiente principalmente a empresas pertenecientes al subsector "Económico y Financiero".

Como complemento al análisis de las empresas reutilizadoras, y con el fin de tener una visión global del ecosistema de la información y de las partes que lo integran, esta nueva edición incluye además los resultados de una encuesta enviada a los representantes de las 17 CCAA encargados de la apertura y acceso de los datos, así como un análisis del grado de compromiso de las CCAA en la apertura de tres conjuntos de datos que ASEDIE ha identificado como los Top 3 Asedie, y que se refieren a datos de Asociaciones, Cooperativas y Fundaciones.
En relación con la encuesta a las CCAA, las preguntas han ido dirigidas fundamentalmente a identificar cómo y qué nuevos conjuntos de datos tienen las CCAA intención de publicar en 2020, y cuáles son y cómo tratan de superar las barreras que se encuentran a la hora de abrir datos, apuntan las siguientes conclusiones:
- La demanda, tanto interna como externa, la regulación vigente y la calidad de los datos son los principales determinantes para decidir qué conjuntos de datos abrir.
- De forma general, las CCAA afrontan el 2020 con la determinación de tener en cuenta el interés, tanto para la ciudadanía como para el Sector Infomediario, a la hora de abrir datos. Con esta premisa en mente, el 31% de los responsables entrevistados apostará por la apertura de fuentes de datos relativas a temas sociales y sanitarios, y el 25% datos relacionados con el medio ambiente.
- La mayor parte de las CCAA coinciden en que la difusión de casos de éxito y la publicidad ayudan a movilizar equipos para abrir nuevas fuentes. La formación y el apoyo técnico son también actuaciones claves para fomentar la apertura de datos.
- En la actualidad, 41% de las CCAA cuenta con un grupo de trabajo dedicado a la apertura de datos, y este ratio aumentará a corto plazo tal y como apuntan los responsables entrevistados.
- En el camino hacia la apertura de bases de datos, la principal barrera para 11 de 17 CCAA es fundamentalmente técnica, si bien se apuntan otras como la falta de claridad normativa o de liderazgo político.
En cuanto al fruto de la colaboración público-privada entre ASEDIE y las CCAA, dirigida a trabajar conjuntamente en la puesta a disposición de los datos de Asociaciones, Cooperativas y Fundaciones, cabe destacar el alto grado de compromiso 8 CCAA que ya ofrecen en abierto esta información. Estas son: Aragón, Baleares, Castilla la Mancha, Catalunya, Euskadi, Junta de Castilla y León, Madrid y Murcia.
Un año más, los resultados recogidos en el informe ofrecen una visión detallada de un sector en alza, en línea con las cifras del último informe de la Comisión Europea sobre el impacto económico de los datos abiertos, y en el que se refleja claramente cómo los datos abiertos suponen un elemento clave en la economía de la Unión Europea.
El informe se ha presentado este año de la mano del presidente de la comisión de fuentes de información de Asedie, Luis Hernández Cuadrado, acompañado por Emilio López, director del Centro Nacional de Información Geográfica; Joaquín Meseguer de la Junta de Castilla y León, y Barbara Ubaldi de la Organización para la Cooperación y el Desarrollo Económicos. En su intervención, Emilio López destacó la situación envidiable en España en materia de información geográfica, ofrecida bajo la licencia CC BY 4.0. Por su parte, Joaquín Meseguer resaltó los fuertes compromisos de la Junta en materia de datos abiertos, y que tendrán reflejo en la Ley de transparencia y acceso a la información pública en Castilla y Léon que están redactando y que verá la luz en breve. Por último, Barbara Ubaldi, de la OCDE resumió las conclusiones de edición 2019 del OURdata Index on Open Government Data, destacando la falta de gobernanza del dato en los gobiernos especialmente en lo que respecta a la apertura del datos de mayor valor para los reutilizadores, en buena medida por la falta de fortaleza en la idea clave de considerar a los datos como infraestructura básica.
La intervención de los tres expertos en datos abiertos sirvió como perfecta antesala de las conclusiones de este estudio, convertido ya en un referente nacional e internacional.
Las nuevas tecnologías están cambiando el mundo en el que vivimos. Cambia la sociedad, cambia la economía, y con ello, los puestos de trabajo. La incorporación de tecnologías como la Inteligencia Artificial, el Big Data o el Internet de las Cosas están impulsando la demanda de nuevos perfiles profesionales que hace una década ni siquiera concebíamos. A ello hay que sumar las posibilidades de automatizar tareas actualmente desarrolladas por humanos, ejecutándolas de manera más rápida y eficiente, lo que lleva a algunos profesionales a pensar que su puesto de trabajo puede peligrar. Dar respuesta a esta situación es uno de los grandes retos que tenemos por delante.
De acuerdo con el informe It´s learning. Just not as we know. How to accelerate skills acquisition in the age of intelligent technologies, realizado por G20 Young Entrepreneurs’ Alliance y Accenture, si no se desarrollan las habilidades necesarias para este cambio, las economías de los países del G20 podrían perder hasta 11,5 billones de euros en el crecimiento acumulado del PIB en los próximos diez años.
Pero este cambio no es sencillo. No se trata solo de la aparición de nuevas profesiones y la desaparición de las viejas, sino de la evolución de los roles tradicionales. De acuerdo con el estudio, el 90% del tiempo de cada trabajador se verá afectado por las nuevas tecnologías. Tomando la media de todos los sectores, el 38% del tiempo laboral lo dedicamos actualmente a tareas que serán automatizadas, mientras que el 51% son actividades que podrán ser “mejoradas”, utilizando nuevas tecnologías que nos ayuden a aumentar nuestras habilidades. En definitiva, la solución no es solo formar a más ingenieros o analistas de datos, ya que incluso estos perfiles tendrán que evolucionar para adaptarse a un futuro que está más próximo de los que parece.
Para conocer cómo va a afectar este cambio a los distintos perfiles profesionales, el informe lleva a cabo un análisis de las tareas y habilidades necesarias para realizar los trabajos actuales, determinando cómo van a evolucionar en el futuro. Para facilitar el análisis, se han agrupado las profesiones en torno a 10 roles distintos. El siguiente cuadro muestra el resultado del estudio:
| Roles | Actividades representativas | Ejemplos de profesiones | Ejemplo de cómo evolucionaría su actividad |
|---|---|---|---|
| Dirección & Liderazgo | Supervisan y toman decisiones. | Directivos y educadores. | Los directivos de marketing manejan los datos ellos mismos y toman decisiones basadas en información procedente de las redes sociales y las métricas web. |
| Empatía & Soporte | Ofrecen apoyo experto y orientación. | Psiquiatras y enfermeras. | Las enfermeras pueden concentrarse en la atención al paciente en lugar de en tareas administrativas. |
| Ciencia & Ingeniería | Realizan análisis técnicos. | Ingenieros químicos y programadores informáticos. | Los investigadores se centran en compartir, explicar y aplicar su trabajo, reduciendo el tiempo que pasan en el laboratorio. |
| Procesos & Análisis | Procesan y analizan la información. | Auditores y empleados bancarios. | Los contables pueden garantizar el control de calidad en lugar de analizar datos. |
| Expertos en analítica | Examinan y aplican su experiencia ante sistemas complejos. | Controladores de tráfico aéreo y técnicos en ciencias forenses. | Los analistas especializados en seguridad pueden ampliar y profundizar sus búsquedas, con el apoyo de simulaciones basadas en AI. |
| Expertos en relaciones | Aplican su experiencia en entornos que exigen interacción humana. | Equipos médicos e intérpretes. | Los gestores de ambulancias pueden centrarse en la evaluación y el apoyo necesarios, en lugar de en los detalles logísticos. |
| Mantenimiento de equipos técnicos | Instalan y realizan el mantenimiento de equipos y maquinaria. | Mecánicos y trabajadores de mantenimiento. | Los mecánicos trabajan con datos para predecir fallos y realizar reparaciones preventivas. |
| Operaciones con maquinas & Maniobras | Opera maquinaria y conducen vehículos. | Conductores de camiones y operarios de grúas. | Los operarios de tractores pueden garantizar un tratamiento de los cultivos guiado, preciso y personalizado, mientras “conducen”. |
| Trabajos físicos / manuales | Realiza tareas físicas y agotadoras en ambientes concretos. | Trabajadores de la construcción y el paisajismo. | Los trabajadores de la construcción reducen la repetición del trabajo, ya que la tecnología predice la ubicación y la naturaleza de los obstáculos físicos. |
| Servicios físicos | Realizan servicios que exigen actividad física. | Peluqueros y cocineros. | Los asistentes de transporte pueden centrarse en las necesidades y el servicio del cliente en lugar de tareas técnicas. |
Los resultados muestran cómo algunas habilidades, como la gestión administrativas, disminuirán en importancia. Sin embargo, para casi todas las funciones descritas en la tabla anterior, será necesaria una combinación de habilidades de razonamiento complejo, creatividad, inteligencia socioemocional y percepción sensorial.
El problema es que este tipo de habilidades se adquieren con la experiencia. Los sistemas actuales de educación y aprendizaje, tanto reglado como corporativo, no están pensados para abordar esta revolución en la demanda de habilidades, por lo que va a ser necesario que ellos también evolucionen. Para facilitar esta transición, el informe proporciona una serie de recomendaciones:
-
Impulsar el aprendizaje experiencial: La enseñanza se ha basado tradicionalmente en un modelo pasivo, consistente en absorber el conocimiento escuchando o leyendo. Sin embargo, cada vez cobra más fuerza el aprendizaje experimental, es decir, a través de la aplicación práctica de los conocimientos. Sería el caso de los pilotos de avión, que aprenden a través de programas de simulación de vuelo. Las nuevas tecnologías, como la realidad aumentada o la inteligencia artificial, ayudan a que estas soluciones basadas en la experiencia sean más personalizadas y accesibles, abarcando un mayor número de sectores y puestos de trabajo.
-
Mover el foco de la organización a los individuos: En un equipo de trabajo es habitual que existan personas con distintas capacidades y habilidades, de tal forma que se complementen, pero, como hemos visto, también es necesario poner un mayor énfasis en ampliar la variedad de habilidades de cada trabajador individual, incluyendo nuevas habilidades como las capacidades de creatividad e inteligencia socioemocional. El sistema actual no potencia el aprendizaje de estas materias, por lo que es necesario diseñar métricas e incentivos que fomenten la mezcla de habilidades en cada persona.
-
Apoyar a los trabajadores más vulnerables: El aprendizaje debe ser accesible para todos, para así poder cerrar la brecha de habilidades que existe actualmente. De acuerdo con el estudio, y de manera general, los trabajadores más vulnerables al cambio tecnológico son los menos cualificados, debido a que sus puestos de trabajos suelen ser más fáciles de automatizar. Sin embargo, también suelen ser los que menos formación reciben por parte de la empresa, algo que debe cambiar. Otros colectivos a los que es importante prestar atención es a los trabajadores de mayor edad y a los de empresas pequeñas, con menos recursos. Cada vez más empresas recurren a cursos modulares y gratuitos, tipo MOOC, para facilitar la adquisición de habilidades de manera igualitaria entre toda la plantilla. Además, algunos gobiernos, como el de Francia o Singapur, están proporcionando ayudas a la formación.
En definitiva, estamos en un momento de cambio, en el que es necesario pararse a reflexionar sobre cómo va a cambiar nuestro entorno laboral para poder adaptarnos a ello, adquiriendo nuevas habilidades que nos aporten ventajas competitivas en nuestro futuro profesional.
