Corpus of Clinical Trials for Evidence-Based-Medicine in Spanish version 3 (CT-EBM-SP v3)

Name: Corpus of Clinical Trials for Evidence-Based-Medicine in Spanish version 3 (CT-EBM-SP v3)
Creator: Agencia Estatal Consejo Superior de Investigaciones Científicas
License: https://creativecommons.org/licenses/by/4.0/
Keywords: None

Publicador Agencia Estatal Consejo Superior de Investigaciones Científicas

Nivel de administración Administración do Estado

Entidade

Pública

Licenza

https://creativecommons.org/licenses/by/4.0/

Descrición

Esta es la versión 3 del corpus CT-EBM-SP de 1200 ensayos clínicos (292 173 tokens), anotado con 23 tipos de entidades y 18 tipos de relaciones, que abarca grupos semánticos del Sistema Unificado de Lenguaje Médico (UMLS), información relacionada con medicamentos, datos temporales y negación/especulación. Incluye 11 atributos codificados (por ejemplo, temporalidad del evento y estado del experimentador) y entidades normalizadas a los identificadores únicos de conceptos del UMLS. El corpus contiene 87 037 entidades, incluidas entidades anidadas y discontinuas, 16 597 atributos y 68 206 relaciones. La concordancia entre anotadores (IAA) alcanzó valores F1 medios de 0,861 (entidades), 0,810 (atributos) y 0,791 (relaciones). El 81,75 % de las entidades se normalizaron (IAA: F1 = 0,966). El repositorio incluye el código para comparar este conjunto de datos mediante el ajuste de los modelos Transformer para la extracción de relaciones y la normalización de conceptos médicos. En la tarea de extracción de relaciones, el F1 medio osciló entre 0,858 y 0,879. En la tarea de normalización de conceptos médicos, la precisión en el rango 1 fue de 0,896.

Datos

Información

Show technical data sheet of the dataset.

Ficha técnica

Distribucións(2)

Identificación Interoperabilidade

URL do punto de acceso	https://digital.csic.es/bitstream/10261/416915/1/CT-EBM-SP-v3.zip

Formato	ZIP

Identificación Interoperabilidade

URL do punto de acceso	https://digital.csic.es/bitstream/10261/416915/3/README.txt

Formato	plain

Palabras clave
Etiquetas	Clinical trials Evidence-Based Medi... Inter-Annotator Agr... Natural Language Pr... Semantic Annotation
Categorías
Categorías	Ciencia e tecnoloxía Saúde
Language
Idiomas	Inglés

Identificación
Identificador	http://hdl.handle.net/10261/416915
Data da última actualización	4/02/2026 07:44 (UTC)
Data de creación	2/02/2026 23:00 (UTC)
Referencias
Outros recursos	http://hdl.handle.net/10261/285045 http://hdl.handle.net/10261/400983 https://scielo.org/es/) https://www.clinicaltrialsregister.eu/ctr-search/search) http://doi.org/10.1038/s41597-026-06608-6 https://github.com/lcampillos/ct-ebm-sp-v3 https://doi.org/10.5281/zenodo.18048413

Idioma

You are here

Corpus of Clinical Trials for Evidence-Based-Medicine in Spanish version 3 (CT-EBM-SP v3)