¿Cómo afrontar un proyecto de análisis de datos?
Fecha del documento: 10-03-2022
Gracias al análisis de los datos podemos descubrir patrones significativos y obtener un mayor conocimiento que nos lleva a una toma de decisiones informada. Pero un buen análisis de datos necesita ser metódico y seguir una serie de pasos de forma ordenada. En este vídeo te damos algunas pistas de los pasos a seguir:
La importancia del trabajo previo al análisis
El primer paso es tener claro el objetivo final. Debe ser concreto, claro y directo, identificando un problema a resolver. Una forma de plantearse el objetivo es dar forma a una pregunta concreta a responder, como cuántos accidentes de tráfico hay o cómo evolucionará la calidad del aire.
También es importante conocer el estado previo de la cuestión. Es probable que otras personas y organizaciones se hayan planteado nuestras mismas dudas previamente. Por ello es importante investigar qué proyectos anteriores existen sobre la temática elegida. En plataformas como data.europa.eu o datos.gob.es tienes secciones donde se recogen casos de uso como aplicaciones y empresas. También es recomendable examinar las propuestas presentadas a hackathons, retos y concursos, nacionales e internacionales, así como seguir de cerca la actividad de empresas y start-ups centradas en el ámbito de estudio.
Para poder abarcar tantos frentes, es recomendable contar con un equipo multidisciplinar con distintos puntos de vista, integrando científicos de datos, ingenieros, analistas de negocio, comunicadores, etc. Las habilidades llamadas “blandas”, como el pensamiento crítico, la comunicación efectiva o el conocimiento del sector, son tan importantes como las técnicas si queremos alcanzar el éxito.
¿Dónde localizar los datos?
Con el objetivo final claro, será más fácil determinar qué datos necesitamos para dar respuesta a la pregunta inicial. Lo más habitual es combinar distintas fuentes de información, pública y/o privada, para enriquecer el análisis y alcanzar un nivel de profundidad adecuado.
Además de la multitud de catálogos de datos nacionales existentes, también puedes buscar en repositorios especializados en ámbitos concretos como el medio ambiente, la salud y el bienestar o la economía.
El proceso de análisis
Una vez disponemos de los datos, es el momento de comenzar el análisis, siguiendo el siguiente flujo de trabajo:
- Fase 1: Importación y limpieza. Antes del análisis, hay que depurar los datos para conseguir una estructura homogénea, libre de errores y en el formato adecuado. Para ello se recomienda realizar un Análisis Exploratorio de Datos (EDA en sus siglas en inglés). Así obtendremos unos datos limpios, libres de errores y homogéneos.
- Fase 2: Exportación y modelo. Según la pregunta a responder determinaremos el tipo de análisis a llevar a cabo: análisis descriptivo (¿qué ha pasado?), diagnóstico (¿por qué ha pasado?), predictivo (¿qué va a pasar) o prescriptivo (¿qué hago para que vuelva -o no- a pasar?).
- Fase 3: Comunicar. Una vez analizados los datos habremos obtenido nuevo conocimiento, que deberemos comunicar a nuestro público objetivo de forma fácil de comprender. Para ello se pueden usar técnicas de data storytelling, visualizaciones, aplicaciones web o móvil, servicios o productos comerciales, según los objetivos iniciales.
Para poder llevar a cabo estas 3 fases, contamos con distintas herramientas a nuestro alcance. Puedes ver algunos ejemplos en el informe “Herramientas de procesado y visualización de datos”.
Desde datos.gob.es te animamos a que practiques con los datos de nuestro catálogo y pongas en marcha distintos análisis. Puedes compartir los resultados de tus análisis con nosotros a través del buzón de correo electrónico dinamizacion@datos.gob.es.