¿Qué mecanismos de validación de calidad tiene el catálogo de datos?
El catálogo de datos realiza un análisis exhaustivo de los conjuntos de datos antes de incorporarlos al catálogo. Se comprueban todos los metadatos de todos los conjuntos de datos, deteniendo su incorporación al Catálogo si no están presentes los metadatos obligatorios o si alguno de los metadatos no tiene un tipo o rango válido.
Se informa al usuario publicador de los errores detectados mediante un mensaje por pantalla, si el alta es manual o mediante el informe de federación, si se está realizando por federación.
Además, a continuación, se comprueban si las distribuciones de los conjuntos de datos están accesibles. El resultado de esta comprobación está accesible para todos los usuarios mediante un código de iconos que aparece junto a los botones de acceso/descarga de las distribuciones.
Esta comprobación se hace cada vez que se hay un alta o modificación de un conjunto de datos pero también, mensualmente, para detectar aquellos datos que dejen de estar accesibles por falta de actualización. Esta revisión genera un informe que está disponible para los usuarios publicadores desde el área de gestión y muestra en detalle todas las distribuciones que están fallando, el conjunto de datos al que pertenece y el detalle del error:
En función de la razón del fallo en la comprobación de cada distribución, de si la comprobación ha dado como resultado una URL inaccesible o la imposibilidad de verificar que está funcionando correctamente, se mostrará o no icono junto a la distribución correspondiente en el catálogo de datos.
A continuación, se muestra detalle de los posibles fallos detectados en este análisis:
Razón de error
Descripción
Icono
Connection timeout after 30s or Connect timeout=30
Representa un periodo de inactividad de conexión (connection time out) que surge al comprobar que la conexión de mutuo acuerdo TCP (TCP handshake) entre el servidor web y Cloudflare no está funcionando.
No muestra ícono de comprobación
Error downloading: No connection adapters were found for (url)
Mensaje de error para esquemas no compatibles. La comprobación en sólo válida para recuperar recursos http o https. Por ejemplo, los recursos FTP no son compatibles.
No muestra ícono de comprobación
Server reported status error: {502 ; 400; 404; 500; 403; 499; 401; 503}
Si algo sale mal durante el proceso de comprobación, el servidor envía un código de estado HTTP al navegador indicando que algo ha fallado:
error 502 Bad Gateway: el servidor está actuando como un proxy o gateway y ha recibido una respuesta inválida del otro servidor.
error 400 Bad Request: la petición ha fallado.
error 404 Not Found: el recurso no está disponible en el servidor. Quizá lo estuvo en el pasado y ha sido borrado o quizá has escrito la dirección url.
error 500 Internal Server Error: es un error genérico que indica que hay un problema en el servidor. El problema puede ser de cualquier tipo, desde que esté sobrecargado hasta que esté en ese momento realizando algunos cambios internos de modo que algo haya dejado de funcionar.
error 403 Forbidden: la petición es correcta pero el servidor se niega a ofrecerte el recurso. Es posible que necesites una cuenta en el servicio e iniciar sesión antes de poder acceder.
error 401 Unauthorized: no tienes permiso para recibir ese contenido.
error 503 Service Unavailable: establece que el servidor no está disponible en ese momento. Puede que sea porque está sobrecargado con demasiadas peticiones o porque en ese momento está con tareas de mantenimiento.
"Connection error: HTTPConnectionPool(
O "Connection error: HTTPSConnectionPool(
Se ha agotado el tiempo de espera de lectura del recurso (tiempo de espera de lectura = 30s)
"Server content contained an API error message: <ows:ExceptionReport "
"Connection error: ('Connection aborted.', gaierror(-2, 'Name or service not known'))"
Error cuando intenta obtener un nombre de dominio que no existe (o su servidor DNS está teniendo problemas).
URL parsing failure - did not find a host name"
Error de análisis de URL: no se encontró el host especificado
Content-length XXXXXXX exceeds maximum allowed value 0
Cuando el tamaño del recurso excede el límite máximo del recurso que se desea obtener (límite del recurso 50MB)
Too many redirects
El error " Too many redirects " significa que la url del recurso está siendo redirigido entre diferentes direcciones de manera que nunca se completará. A menudo, esto es el resultado de redireccionamientos competitivos, uno tratando de forzar HTTPS (SSL) y otro redirigiendo de nuevo a HTTP (no SSL), o entre las formas www y no www de la URL.
"Error with the download: IncompleteRead(0 bytes read)"
"Error with the download: timed out"
"Error with the download:
Error en la descarga del recurso porque no terminó la lectura del recurso ya sea porque se agotó el tiempo límite o por error en la descarga
Adicionalmente, se realiza un análisis periódico sobre el nivel de declaración de los metadatos de los conjuntos de datos publicados en el catálogo. Los resultados de la evaluación correspondiente a 2024 están disponibles en este enlace. Para el desarrollo de este análisis se han utilizado las consultas SPARQL disponibles aquí.
Frequently asked questions
¿Qué puede solicitarse a través de la sección Solicitud de datos?
A través de la sección “Solicitud de datos” se puede solicitar tanto la incorporación de conjuntos de datos que actualmente no se encuentran publicados en el Catálogo de datos.gob.es como solicitar acceso a datos protegidos a través del Punto Único de Información Nacional (NSIP) . El objetivo es unificar estas solicitudes a través de un canal único.
Frequently asked questions
¿Qué recursos ofrece el Catálogo?
Actualmente, datos.gob.es da acceso a través del Catálogo de Información Pública a múltiples servicios y conjuntos de datos del sector público . Desde ellos se ofrece toda una amplia gama de informaciones (censos, directorios, imágenes…) de áreas de gestión o categorías diferentes.
Dada la multiplicidad de fuentes, tipos de recursos, formatos y organismos editores, los datos pueden estar en niveles distintos de desarrollo dentro de la escala de clasificación del World Wide Web Consortium (W3).
Frequently asked questions
¿Qué roles posee el publicador de conjuntos de datos?
El publicador es la entidad competente en la gestión de los datos publicados. Concretamente, es el organismo o unidad orgánica o delegada que interactúa con los conjuntos de datos publicados.
Cada publicador tendrá al menos un gestor autorizado para interactuar con los servicios que ofrece el portal. Cada gestor autorizado debe poseer una cuenta de usuario. Cada publicador puede tener tantos gestores autorizados como sea necesario.
Cada gestor autorizado puede ejercer uno o varios de los siguientes roles:
Creador: quien inicialmente da de alta un conjunto de datos en el catálogo de datos.gob.es
Responsable de mantenimiento: quien puede ser contactado para responder cuestiones relacionadas con los conjuntos de datos publicados
Editor: quien es responsable de mantener actualizados los conjuntos de datos publicados.
Frequently asked questions
¿Qué secciones ofrece datos.gob.es? [TEST-GMV] *TEXTO INGLÉS*
El portal datos.gob.es está diseñado como punto de encuentro entre los diferentes actores –usuarios, infomediarios y organismos públicos- involucrados en la cultura de datos abiertos. Punto de acceso único a los conjuntos de datos de las Administraciones Públicas, el canal también es un catalizador de iniciativas de reutilización de la información o casos de éxito a través de la sección Impacto.
Noticias, entrevistas o eventos nacionales e internacionales tienen cabida en la sección Actualidad, concebida para acercar a todos los públicos las últimas noticias en materia de apertura y reutilización de la información pública. Además, desde el apartado Documentación de la sección Interactúa, se puede acceder a materiales formativos, estrategias RISP nacionales, guías y normativas.
Si quiere enriquecer su iniciativa de datos abiertos, tiene a su disposición los siguientes elementos gráficos que podrá integrar en su web institucional. Con ellos puede enlazar a los contenidos relacionados (casos de uso, guías, noticias, eventos, etc.) publicados en los espacios comunes de datos.gob.es.
Banners de casos de uso - datos.gob.es
Banners de guías - datos.gob.es
Banners de visualizaciones -datos.gob.es
Frequently asked questions
¿Qué significan los estados de la sección Solicitud de datos?
Las consultas de la sección Disponibilidad de datos están claficadas en función de su estado de tramitación. Los estados disponibles y su significados son los siguientes:
Recibido: se ha recibido una consulta nueva. La consulta aún no es pública y está pendiente de revisión y asignación por el equipo de datos.gob.es
Asignado: el equipo de datos.gob.es ha identificado que organismo o entidad tiene competencias en la materia a la que se refiere la consulta, la asigna a dicho organismo y se publica en el portal en la sección Solicitud de datos.
En estudio: el organismo responsable está revisando la consulta.
Programado: el organismo responsable ha planificado la publicación de los datos de la consulta.
No viable: los datos de la consulta no se pueden publicar y el organismo incluirá las restricciones existentes en la respuesta la consulta.
Publicado: los datos ya han sido publicados, se indica en la respuesta dónde están disponibles.
En este documento se puede saber más sobre cómo gestionar peticiones de datos.
Frequently asked questions
¿Qué son los datos abiertos?
Son aquellos datos que cualquiera es libre de utilizar, reutilizar y redistribuir, con el único límite, en su caso, del requisito de atribución de su fuente o reconocimiento de su autoría.
Las administraciones públicas españolas tiene a su disposición un logotipo de datos abiertos para identificar los espacios web o catálogos donde publican su relación de datos abiertos disponibles. A continuación, está disponible el logotipo de datos abiertos para su descarga:
Descargar logotipo
Descargar manual de identidad
Frequently asked questions
¿Qué tipo de agentes publican conjuntos de datos?
En el proceso de publicación de conjuntos de datos existen dos tipos de agentes:
Organización es la entidad titular de los conjuntos de datos que se publican en datos.gob.es.
Publicador es la unidad orgánica vinculada a una Organización que se encarga de publicar y mantener los datos publicados en datos.gob.es.
Es habitual que ambos agentes coincidan, salvo en Organizaciones que delegan en unidades orgánicas u organismos dependientes la gestión de la publicación de conjuntos de datos. Por lo tanto, una organización tendrá uno o más publicadores.
Tanto las Organizaciones como los Publicadores del sector público utilizarán para su identificación el código alfanumérico único para cada órgano/unidad/oficina definido en el Directorio Común de Unidades Orgánicas y Oficinas (DIR3). Las Organizaciones o Publicadores de instituciones privadas utilizarán para su identificación un código alfanumérico único proporcionado por el equipo de soporte de la Iniciativa.
Frequently asked questions
¿Qué tipo de aplicaciones existen?
Hay tantas clases de aplicaciones sobre datos abiertos del sector público como tipos de informaciones y potenciales usuarios puedan describirse.
En todo caso, los productos y servicios más populares son los derivados de la reutilización de información del ámbito empresarial-económico; geográfico-cartográfico; jurídico-legal; de transportes; sociodemográfico-estadístico; y meteorológico, entre otros.
Frequently asked questions
¿Qué tipo de organizaciones pueden publicar conjuntos de datos?
Mayoritariamente, los publicadores en el Catálogo de información pública reutilizable albergado en datos.gob.es forman parte de organismos pertenecientes al sector público. No obstante, tienen cabida publicadores pertenecientes a ciertas instituciones privadas, inicialmente fundaciones, asociaciones, universidades y colegios profesionales, que generen datos fruto de proyectos financiados con fondos públicos. Esta amplia tipología de publicadores viene avalada por la normativa vigente:
Ley 18/2015, de 9 de julio, por la que se modifica la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público,
Real Decreto 1495/2011, de 24 de octubre, por el que se desarrolla la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público, para el ámbito del sector público estatal.
Frequently asked questions