CT-EBM-SP - Corpus de ensayos clínicos para la medicina basada en la evidencia en español
CT-EBM-SP - Corpus of Clinical Trials for Evidence-Based-Medicine in Spanish
Colección de 1200 textos (292 173 tokens) sobre estudios de ensayos clínicos y anuncios de ensayos clínicos en español: - 500 resúmenes de revistas publicadas bajo licencia Creative Commons disponibles, por ejemplo, en PubMed o Scientific Electronic Library Online (SciELO). - 700 anuncios de ensayos clínicos publicados en el Registro Europeo de Ensayos Clínicos y el Repositorio Español de Estudios Clínicos. Los textos fueron anotados con entidades de los grupos semánticos del Sistema Unificado de Lenguaje Médico: anatomía (ANAT), sustancias farmacológicas y químicas (CHEM), patologías (DISO) y pruebas de laboratorio, procedimientos diagnósticos o terapéuticos (PROC). Se anotaron 46 699 entidades (13,98% son entidades anidadas). El 10% del corpus fue doblemente anotado y la concordancia entre anotadores (IAA) logró una medida F media del 85,65% (±4,79, coincidencia estricta) y una medida F media del 93,94% (±3,31, coincidencia relajada).
A collection of 1200 texts (292 173 tokens) about clinical trials studies and clinical trials announcements in Spanish: - 500 abstracts from journals published under a Creative Commons license, e.g. available in PubMed or the Scientific Electronic Library Online (SciELO). - 700 clinical trials announcements published in the European Clinical Trials Register and Repositorio Español de Estudios Clínicos. Texts were annotated with entities from the Unified Medical Language System semantic groups: anatomy (ANAT), pharmacological and chemical substances (CHEM), pathologies (DISO), and lab tests, diagnostic or therapeutic procedures (PROC). 46 699 entities were annotated (13.98% are nested entities). 10% of the corpus was doubly annotated, and inter-annotator agreement (IAA) achieved a mean F-measure of 85.65% (±4.79, strict match) and a mean F-measure of 93.94% (±3.31, relaxed match).
Anotación semántica
Ensayos clínicos
Evidencia médicas
Procesamiento del Lenguaje Natural
Clinical trials
Evidence-Based Medicine
Inter-Annotator Agreement
Natural Language Processing
Semantic Annotation
http://hdl.handle.net/10261/285045
2021-02-22T00:00:00+01:00
2021-02-22T00:00:00+01:00
2026-05-15T22:01:16.786437+02:00
2026-04-21T10:07:56.365522+02:00
Agencia Estatal Consejo Superior de Investigaciones Científicas
EA0041268
ZIP
application/x-zip-compressed
CT-EBM-SP.zip
CT-EBM-SP.zip
2642411
https://digital.csic.es/bitstream/10261/285045/1/CT-EBM-SP.zip
plain
text/plain
README.txt
README.txt
8263
https://digital.csic.es/bitstream/10261/285045/2/README.txt