10 repositorios de datos públicos relacionados con la salud y el bienestar

Fecha de la noticia: 21-10-2021

10 repositorios de datos públicos relacionados con la salud y el bienestar

Una de las líneas de acción de la Comisión Europea para los próximos meses, es la creación de un espacio europeo de datos sanitarios. Siguiendo los pasos de Europa, el Gobierno español también tiene entre sus planes poner en marcha un data lake sanitario con una gran cantidad de datos en bruto a disposición de los investigadores y administraciones, entre otros colectivos.

El interés de los gobiernos por promover la apertura de datos en este sector no es casual. Los datos sobre salud y bienestar son fundamentales para mejorar la asistencia médica, la investigación y la elaboración de políticas sanitarias. Además, el acceso a este tipo de datos permite poner en marcha soluciones basadas en tecnologías innovadoras, como la inteligencia artificial, que transformen los sistemas sanitarios, impulsando mejoras en la salud y calidad de vida de toda la ciudadanía.

Aunque en los repositorios generalistas es común encontrar datos de este tipo (por ejemplo, en datos.gob.es hay actualmente disponibles más de 16.000 conjuntos de datos en las categorías salud y bienestar), cada vez surgen más iniciativas, tanto privadas como públicas, especializadas en la publicación de datos de investigación, resultados médicos o estadísticas sobre salud. Este tipo de datos se comparten de forma anonimizada y garantizando la privacidad de los pacientes. A continuación, recogemos 10 ejemplos a nivel internacional.

10 repositorios de datos relacionados con la salud y el bienestar: CDC Wonder, Organización Mundial de la Salud, HealthData.gov, Broad Institute, GDC Data Portal, PhysioNet, NHS Digital, Global Health Data Exchange (GHDx), OpenNeuro y CMS.gob.

CDC Wonder

  • Publicador: Centro de Control y Prevención de Enfermedades de EE.UU.

Los usuarios pueden acceder a datos de investigación estadística publicados o alojados por el Centro de Control y Prevención de Enfermedades a través de un sistema de consultas ad-hoc. También ofrece materiales de referencia, informes y directrices sobre temas relacionados con la salud y la investigación epidemiológica.

Entre otros, se pueden consultar conjuntos de datos de uso público sobre mortalidad, incidencia del cáncer, VIH y SIDA, tuberculosis, vacunas, natalidad, datos censales, etc. Los datos solicitados se resumen y muestra fácilmente, con estadísticas, gráficos y mapas calculados dinámicamente. Estos datos están disponibles para su descarga. CDC Wonder también cuenta con una API para las consultas de datos automatizadas en formato XML.

Organización Mundial de la Salud

  • Publicador: Organización Mundial de la Salud

La Organización Mundial de la Salud (OMS) tiene entre sus objetivos impulsar que los estados recopilen, gestionen, analicen y utilicen datos sanitarios tanto de la población (encuestas de hogares, sistemas de registro civil de acontecimientos vitales, etc.) como institucionales (actividades administrativas y operativas de las instituciones, como los centros sanitarios). En este sentido ofrece una serie de herramientas de recolección y análisis de datos, como SCORE, un paquete de herramientas, recursos, metodologías e intervenciones armonizadas para reforzar los datos sanitarios de cada país.

En su web, la OMS ofrece acceso centralizado a diversas colecciones de datos sobre enfermedades como la tuberculosis, o temas relacionados como la seguridad alimentaria, que se pueden descargar en formato CSV. También ofrece visualizaciones y una serie de cuadros de mando para acercar de forma sencilla a la ciudanía datos sobre coronavirus, el seguimiento de la labor de la OMS o las diferencias entre países respecto a la mortalidad.

HealthData.gov

  • Publicador: Gobierno de EE.UU.

En el portal de datos de Salud del Gobierno de EE.UU. podemos encontrar conjuntos de datos sobre una amplia gama de temas, como la salud ambiental, los dispositivos médicos, la atención médica, los servicios sociales, la salud mental o el abuso de sustancias.

Los datos se recogen y suministran desde agencias del Departamento de Salud y Servicios Sociales de los Estados Unidos, así como desde centros y agencias especializadas. Se pueden descargar en formato CSV (algunos también están disponibles en RDF) o usando consultas SoQL.

Broad Institute

  • Publicador: Broad Institute

Los investigadores del Broad Institute generan del orden de 20 terabytes de secuencias de datos cada día. En su web ofrecen resultados de investigaciones científicas y de salud relacionadas con la biología humana, la salud y las enfermedades. También ofrecen herramientas open source para trabajar con los datos.

Navegando a través de sus diversos programas podemos encontrar y descargar datos relacionados con el cáncer -aquí se descargan- o el epigenoma, entre otros.

GDC Data Portal

  • Publicador: National Cancer Institute

Esta web permite la búsqueda dirigida de una amplia variedad de conjuntos de datos disponibles públicamente relacionados con el cáncer. Incluye más de 600.000 archivos relativos a 85.000 casos, con información sobre genes y mutaciones.

En la web se pueden explorar los datos, ver visualizaciones y analizar la información a través de diversas herramientas. Los usuarios pueden descargar la información en formato JSON y TSV o acceder a ellos a través de una API.

PhysioNet

  • Publicador: Physionet

PhysioBank contiene más de 36.000 grabaciones de señales fisiológicas y series temporales anotadas y digitalizadas. Muchos de los datos son libres y se pueden descargar en CSV, pero otros tienen un uso restringido.

Un factor diferencial de PhysioNet es que colabora en la organización y difusión de retos donde los participantes deben abordar cuestiones de interés clínico no resueltas utilizando los datos.

También ofrece una colección de programas informáticos para la visualización, el análisis y la modelización de señales fisiológicas y las series temporales. Se trata de una serie de programas de código abierto que pueden estudiarse, verificarse y modificarse para adaptarlos a las necesidades específicas de cada usuario. En su web pueden encontrar varios tutoriales para saber cómo trabajar con Physionet y sus herramientas asociadas.

NHS Digital

  • Publicador: UK National Health Services.

NHS Digital alberga los conjuntos de datos relacionados con salud y bienestar del Reino Unido, y algunos a nivel mundial. Incluye datos sobre gastos, tiempo de espera, enfermedades o hábitos de vida (como el consumo de alcohol y drogas, o la obesidad). Es necesario registrarse para poder acceder a la información.

También ofrece cuadros de mando interactivos sobre temas de interés como la medicina general o la salud mental en Inglaterra. En su web cuenta con un área para desarrolladores con información sobre su API.

Global Health Data Exchange (GHDx)

  • Publicador: Institute for Health Metrics and Evaluation (IHME)

El Institute for Health Metrics and Evaluation (IHME), un centro independiente de investigación en salud global de la Universidad de Washington, proporciona mediciones comparables de los problemas de salud más importantes del mundo y evalúa las estrategias utilizadas para abordarlos. Esa información se comparte en abierto a través del portal GHDx, donde los usuarios pueden encontrar conjuntos de datos de encuestas, censos, estadísticas vitales, etc.

Los datos pueden ser utilizados, compartidos, modificados o desarrollados por usuarios con fines no comerciales a través de la licencia de atribución Open Data Commons.

OpenNeuro

  •  Publicador: cualquier investigador que quiera abrir los datos de su investigación.

OpenNeuro es una plataforma pensada para compartir datos de resonancias magnéticas, magnetoencefalografía (MEG), electroencefalogramas, etc. El nuevo material es agregado a medida que los investigadores abren sus propios datos.

Actualmente hay más de 600 datasets. Los conjuntos de datos están disponibles públicamente para fomentar la investigación y conseguir mejores diagnósticos en formato Brain Imaging Data Structure (BIDS) y bajo una licencia Creative Commons CC0.

Cabe destacar que OpenNeuro ha integrado los datos de OpenfMRI.

CMS.gob

  • Publicador: U.S. Centers for Medicare & Medicaid Services.

CMS.gob es un buscador que ofrece acceso a conjuntos de datos relacionados con los servicios proporcionados por las instituciones que aceptan Medicare. Medicare es un programa de cobertura de seguridad social administrado por el gobierno de EE.UU., el cual provee atención médica a todas las personas mayores de 65 años o de cualquier edad con alguna discapacidad o enfermedad grave.

A través de este repositorio se comparten datos sobre doctores, hospitales, instalaciones que ofrecen determinados servicios como la diálisis o rehabilitación, asistencia a domicilio, etc. Los datos se pueden descargar en formato CSV o a través de su API.

 

Gracias a los datos de todos estos repositorios, se pueden llevar a cabo análisis e investigaciones que sirvan para predecir y detectar enfermedades, así como mejorar la atención proporcionada a los pacientes.

¿Conoces más repositorios internacionales con datos de salud? Déjanos un comentario o mándanos un email a dinamizacion@datos.gob.es.