Está muy bien todo el tema de la minería de datos, pero falta un componente importante: la calidad de los datos. Hablo de calidad no como la credibilidad de la fuente que proporciona los datos, sino al formato en que aparecen los mismos, es decir a su normalización en la estructura y carga. Es decir, que si tengo una cifra que mide una distancia, que esté expresada siempre de la misma forma, no que tenga un resultado en metros y otro en kilómetros, porque así no hay manera de trabajar. Y si hablamos de datos textuales lo mismo, si tengo por ejemplo nombres de empresas, no es lo mismo el nombre completo que la abreviatura.
¿Quién se ocupa de estas cuestiones? Los especialistas en información, es decir, los documentalistas, bibliotecarios y archiveros. Llevamos toda la vida trabajando con conceptos como "control de autoridades", "tesaruos", "taxonomías", "normalización de los datos" y son cosa que NUNCA se tienen en cuenta a la hora de trabajar con información. Somos los mayores especialistas y estamos completamente olvidados.
Está muy bien todo el tema de la minería de datos, pero falta un componente importante: la calidad de los datos. Hablo de calidad no como la credibilidad de la fuente que proporciona los datos, sino al formato en que aparecen los mismos, es decir a su normalización en la estructura y carga. Es decir, que si tengo una cifra que mide una distancia, que esté expresada siempre de la misma forma, no que tenga un resultado en metros y otro en kilómetros, porque así no hay manera de trabajar. Y si hablamos de datos textuales lo mismo, si tengo por ejemplo nombres de empresas, no es lo mismo el nombre completo que la abreviatura.
¿Quién se ocupa de estas cuestiones? Los especialistas en información, es decir, los documentalistas, bibliotecarios y archiveros. Llevamos toda la vida trabajando con conceptos como "control de autoridades", "tesaruos", "taxonomías", "normalización de los datos" y son cosa que NUNCA se tienen en cuenta a la hora de trabajar con información. Somos los mayores especialistas y estamos completamente olvidados.