DCAT es una ontología orientada a describir conjuntos de datos de todo tipo dispuestos para su reutilización a través de catálogos de datos -generalistas mayoritariamente-. Para ello utiliza un conjunto de propiedades que toman valores en rangos definidos (taxonomías, listas de nombres o tesauros) mantenidos por organismos como la Oficina de Publicaciones Europea, entre otros, asegurando de esta forma interoperabilidad semántica y técnica entre ellos. Aunque estas propiedades permiten describir atributos correspondientes a determinadas etapas del ciclo de vida de los datos (procedencia, versionado, estructura, conformidad a estándares, formatos, etc.), Datasheets for datasets es un modelo descriptivo mucho más exhaustivo que, utilizando preguntas y respuestas abiertas (en lenguaje natural), detalla ampliamente características de cada etapa del ciclo de vida del dato. Algunas de estas preguntas/respuestas pueden ser compatibles con propiedades/rangos DCAT y ser ajustadas utilizando vocabularios controlados y esto es algo que probablemente ocurrirá. No obstante, el objetivo en Datasheets y DCAT es algo distinto: Datasheets persigue generar una documentación exhaustiva que permita a los reutilizadores descubrir detalles relevantes sobre los datos. Datasheets, en resumen, es un mecanismo de documentación de datasets muy completo y por tanto muy útil, sobre todo en determinados ámbitos de aplicación como la descripción de datos para la IA pero, de momento, conlleva un coste alto debido fundamentalmente a la falta de integración con herramientas de gestión de ciclo de vida de datos que automaticen su generación.
Estimado Alberto,
DCAT es una ontología orientada a describir conjuntos de datos de todo tipo dispuestos para su reutilización a través de catálogos de datos -generalistas mayoritariamente-. Para ello utiliza un conjunto de propiedades que toman valores en rangos definidos (taxonomías, listas de nombres o tesauros) mantenidos por organismos como la Oficina de Publicaciones Europea, entre otros, asegurando de esta forma interoperabilidad semántica y técnica entre ellos. Aunque estas propiedades permiten describir atributos correspondientes a determinadas etapas del ciclo de vida de los datos (procedencia, versionado, estructura, conformidad a estándares, formatos, etc.), Datasheets for datasets es un modelo descriptivo mucho más exhaustivo que, utilizando preguntas y respuestas abiertas (en lenguaje natural), detalla ampliamente características de cada etapa del ciclo de vida del dato. Algunas de estas preguntas/respuestas pueden ser compatibles con propiedades/rangos DCAT y ser ajustadas utilizando vocabularios controlados y esto es algo que probablemente ocurrirá. No obstante, el objetivo en Datasheets y DCAT es algo distinto: Datasheets persigue generar una documentación exhaustiva que permita a los reutilizadores descubrir detalles relevantes sobre los datos. Datasheets, en resumen, es un mecanismo de documentación de datasets muy completo y por tanto muy útil, sobre todo en determinados ámbitos de aplicación como la descripción de datos para la IA pero, de momento, conlleva un coste alto debido fundamentalmente a la falta de integración con herramientas de gestión de ciclo de vida de datos que automaticen su generación.
Con respecto al ejemplo, puedes encontrar el enlace en el texto: https://dl.acm.org/action/downloadSupplement?doi=10.1145%2F3458723&file…;
Un cordial saludo,