¿Qué mecanismos de calidad tiene el catálogo de datos?

El catálogo de datos realiza un análisis exhaustivo de los conjuntos de datos antes de incorporarlos al catálogo. Se comprueban todos los metadatos de todos los conjuntos de datos, deteniendo su incorporación al Catálogo si no están presentes los metadatos obligatorios o si alguno de los metadatos no tiene un tipo o rango válido.

Se informa al usuario publicador de los errores detectados mediante un mensaje por pantalla, si el alta es manual o mediante el informe de federación, si se está realizando por federación.

Además, a continuación, se comprueban si las distribuciones de los conjuntos de datos están accesibles. El resultado de esta comprobación está accesible para todos los usuarios mediante un código de iconos que aparece junto a los botones de acceso/descarga de las distribuciones.

Esta comprobación se hace cada vez que se hay un alta o modificación de un conjunto de datos pero también, semanalmente, para detectar aquellos datos que dejen de estar accesibles por falta de actualización. Esta revisión genera un informe que está disponible para los usuarios publicadores desde el área de gestión y muestra en detalle todas las distribuciones que están fallando, el conjunto de datos al que pertenece y el detalle del error:

En función de la razón del fallo en la comprobación de cada distribución, de si la comprobación ha dado como resultado una URL inaccesible o la imposibilidad de verificar que está funcionando correctamente, se mostrará o no icono junto a la distribución correspondiente en el catálogo de datos.

A continuación, se muestra detalle de los posibles fallos detectados en este análisis:

Razón de error Descripción Icono
Connection timeout after 30s or Connect timeout=30 Representa un periodo de inactividad de conexión (connection time out) que surge al comprobar que la conexión de mutuo acuerdo TCP (TCP handshake) entre el servidor web y Cloudflare no está funcionando. No muestra ícono de comprobación
Error downloading: No connection adapters were found for (url) Mensaje de error para esquemas no compatibles.  La comprobación en sólo válida para recuperar recursos http o https. Por ejemplo, los recursos FTP no son compatibles. No muestra ícono de comprobación
Server reported status error: {502 ; 400; 404; 500; 403; 499; 401; 503}

Si algo sale mal durante el proceso de comprobación, el servidor envía un código de estado HTTP al navegador indicando que algo ha fallado:

  • error 502 Bad Gateway: el servidor está actuando como un proxy o gateway y ha recibido una respuesta inválida del otro servidor.
  • error 400 Bad Request: la petición ha fallado.
  • error 404 Not Found: el recurso no está disponible en el servidor. Quizá lo estuvo en el pasado y ha sido borrado o quizá has escrito la dirección url.
  • error 500 Internal Server Error: es un error genérico que indica que hay un problema en el servidor. El problema puede ser de cualquier tipo, desde que esté sobrecargado hasta que esté en ese momento realizando algunos cambios internos de modo que algo haya dejado de funcionar.
  • error 403 Forbidden: la petición es correcta pero el servidor se niega a ofrecerte el recurso. Es posible que necesites una cuenta en el servicio e iniciar sesión antes de poder acceder.
  • error 401 Unauthorized: no tienes permiso para recibir ese contenido.

error 503 Service Unavailable: establece que el servidor no está disponible en ese momento. Puede que sea porque está sobrecargado con demasiadas peticiones o porque en ese momento está con tareas de mantenimiento.

"Connection error: HTTPConnectionPool(

O "Connection error: HTTPSConnectionPool(

Se ha agotado el tiempo de espera de lectura del recurso (tiempo de espera de lectura = 30s)
"Server content contained an API error message: <ows:ExceptionReport "  

"Connection error: ('Connection aborted.', gaierror(-2, 'Name or service not known'))"

Error cuando intenta obtener un nombre de dominio que no existe (o su servidor DNS está teniendo problemas).
URL parsing failure - did not find a host name" Error de análisis de URL: no se encontró el host especificado
Content-length XXXXXXX exceeds maximum allowed value 0 Cuando el tamaño del recurso excede el límite máximo del recurso que se desea obtener (límite del recurso 50MB)
Too many redirects El error " Too many redirects " significa que la url del recurso está siendo redirigido entre diferentes direcciones de manera que nunca se completará. A menudo, esto es el resultado de redireccionamientos competitivos, uno tratando de forzar HTTPS (SSL) y otro redirigiendo de nuevo a HTTP (no SSL), o entre las formas www y no www de la URL.

"Error with the download: IncompleteRead(0 bytes read)"

"Error with the download: timed out"

"Error with the download:

Error en la descarga del recurso porque no terminó la lectura del recurso ya sea porque se agotó el tiempo límite o por error en la descarga

 

Adicionalmente, se realiza un análisis periódico sobre el nivel de declaración de los metadatos de los conjuntos de datos publicados en el catálogo. Los resultados de la evaluación correspondiente a 2024 están disponibles en este enlace. Para el desarrollo de este análisis se han utilizado las consultas SPARQL disponibles aquí.