Entrevista a Marc Coca, creador de la Encuesta de Morbilidad Hospitalaria, segundo premio del IV Desafío Aporta

Data: 16-12-2022

Izena: Mar Coca

Sektorea: Zientzia eta teknologia

Mar Coca

La Encuesta de Morbilidad Hospitalaria fue el proyecto ganador del segundo premio del IV Desafío Aporta, centrado en el valor del dato para la salud y el bienestar de los ciudadanos. Se trata de un entorno web para el análisis y la visualización interactiva de los microdatos de la Encuesta de Morbilidad Hospitalaria. Su creador es Mar Coca nos ha contado cómo desarrolló su proyecto.  

Entrevista completa

1. ¿Cómo funciona la Encuesta de Morbilidad Hospitalaria?

La Encuesta de Morbilidad Hospitalaria es una base de datos del INE y el Ministerio de Sanidad, donde se recogen casi todas las altas que se producen en los hospitales de España (un 99% del total de altas). Cada Comunidad Autónoma dispone de una base de datos propia para las altas hospitalarias: el CMBD. El INE se encarga de fusionar esta información y de aquí surge la EMH. Esta base de datos se ofrece de forma pública en su versión de microdatos en la web del INE, previa aceptación de condiciones. Es uno de los conjuntos de datos abiertos más voluminosos y de mayor alcance territorial. La EMH constituye una de las bases de datos de referencia para conocer la actividad hospitalaria y la morbilidad poblacional.

2. ¿Qué mejoras aporta su proyecto, basado en datos abiertos, al sector de la salud y el bienestar?

Como se ha dicho, la EMH contiene una ingente cantidad de datos y esto supone que su análisis puede ser costoso en tiempo y recursos. EMHProject ofrece en forma de web un entorno automatizado para el análisis de estos datos de forma rápida y con la posibilidad que el usuario escoja de forma interactiva el territorio que desea. Es, en definitiva, una herramienta de BI (Business Intelligence) que ofrece una respuesta rápida a aquellos análisis clásicos de morbilidad: recuento crudo de actividad, benchmarking estandarizado de indicadores hospitalarios y flujos territoriales entre lugar de residencia del paciente y lugar de atención.

3. ¿Cómo fue el proceso de desarrollo del prototipo? ¿Qué retos se encontraron y cómo los solucionaron?

El desarrollo del prototipo fue todo un reto: por un lado, quería obtenerse un entorno modular, personalizable y configurable al 100% tanto en lo que respecta el aspecto visual como las capacidades analíticas; por el otro, se ha querido realizar todo esto con herramientas Open Source y gratuitas. La solución ha pasado por la creación de un entorno híbrido que combina JavaScript, para el entorno visual y web, y Python para la parte analítica.

Escoger las herramientas fue fácil: son tecnologías líderes en su sector y totalmente consolidadas y de probada calidad. El reto principal han sido los recursos: para desplegar e implementar la solución se ha requerido de servicios cloud que, por un lado, permitiesen la creación de un entorno servidor capaz de soportar la fusión entre los dos lenguajes de programación; por el otro, no se disponían de recursos económicos y, por lo tanto, base de datos y servidor tenían que ser también gratuitas –ni que fuera temporalmente.

Existen muchas soluciones cloud de almacenamiento y servidor que ofrecen periodos de pruebas, pero en este caso se daba además la dificultad añadida del volumen de datos: unos 22 millones de registros. Todo ello se consiguió “solucionar” mediante una distribución estratégica de las cargas de trabajo de la aplicación para conseguir desplegar el producto mínimo viable con los recursos existentes. Esto implica ciertas estrategias en la programación y en el código que quizás no sean las más apropiadas, pero que se adaptan a los recursos existentes. En definitiva, hay mucho margen de mejora en el código, nuevos entornos que explorar y mucha optimización que hacer y se anima a quién esté interesado a participar: el código y el proyecto pueden encontrarse en GitHub.

4. ¿Cómo ha sido su experiencia en el Desafío Aporta? ¿Qué recomendaría a aquellas personas que estén pensando en participar en la próxima edición?

Ha sido una experiencia tremendamente interesante y singular: en ningún momento pensaba que podría haber llegado a la final y menos aún llegar al podio. También, ha sido muy enriquecedora la experiencia de haber desarrollado un proyecto web de principio a fin.

5. ¿Cuáles son sus próximos pasos? ¿Tienen pensado continuar trabajando en este u otros proyectos relacionados con los datos abiertos?

Me gustaría que el proyecto continuase e, incluso, que la estrategia utilizada sirviese para otros proyectos basados en datos distintos. Tengo distintos proyectos en mente que me gustaría desarrollar con esta metodología y con la idea de hacer herramientas de BI más abiertas, configurables y que incorpore la posibilidad de análisis más avanzados basados en Machine Learning.

Me gustaría continuar EMHProject, pero ahora mismo tiene fecha de caducidad: una de las condiciones de utilizar los micradatos de EMH es borrarlos en un período determinado de tiempo. Por ese motivo, el escenario ideal sería que los propietarios de los datos “acogieran” el proyecto.