Belén 27/01/2022 - 14:41

Está muy bien todo el tema de la minería de datos, pero falta un componente importante: la calidad de los datos. Hablo de calidad no como la credibilidad de la fuente que proporciona los datos, sino al formato en que aparecen los mismos, es decir a su normalización en la estructura y carga. Es decir, que si tengo una cifra que mide una distancia, que esté expresada siempre de la misma forma, no que tenga un resultado en metros y otro en kilómetros, porque así no hay manera de trabajar. Y si hablamos de datos textuales lo mismo, si tengo por ejemplo nombres de empresas, no es lo mismo el nombre completo que la abreviatura.
¿Quién se ocupa de estas cuestiones? Los especialistas en información, es decir, los documentalistas, bibliotecarios y archiveros. Llevamos toda la vida trabajando con conceptos como "control de autoridades", "tesaruos", "taxonomías", "normalización de los datos" y son cosa que NUNCA se tienen en cuenta a la hora de trabajar con información. Somos los mayores especialistas y estamos completamente olvidados.

* Indica los campos obligatorios
El contenido de este campo se mostrará públicamente
Introduce un correo electrónico válido. Ejemplo: ejemplo@test.com
El contenido de este campo se mantiene privado y no se mostrará públicamente.
Datos.gob.es quiere favorecer la participación de los usuarios a través de comentarios que contribuyan a enriquecer los contenidos publicados en la web. Los comentarios recibidos serán revisados y aprobados por el equipo gestor del portal para garantizar la calidad. Se reserva el derecho de eliminar los comentarios que considere inadecuados. No se publicarán, por tanto, comentarios que incluyan insultos, descalificaciones o consideraciones no relacionadas con el contenido en cuestión. Tampoco se publicarán comentarios que incluyan datos personales o que permitan identificar a personas fallecidas.