GNOSS es una empresa española que trabaja, diseña y desarrolla tecnología sobre los estándares y herramientas de la Web Semántica, en el marco del gran proyecto internacional Linked (Open) Data. GNOSS integra personas y sistemas mediante el uso de modelos de representación del conocimiento basados en datos estructurados semánticamente.
GNOSS acompaña a las organizaciones en los procesos de gestión del cambio que son necesarios para: integrar sus funciones de inteligencia y aprendizaje, mejorar la gestión de su conocimiento, hacerlo en un entorno de red con el fin de producir inteligencia colectiva y acelerar el proceso de aprendizaje.
GNOSS ofrece soluciones bajo estándares de web semántica vinculando datos de diferentes fuentes ¿Qué ventajas presenta la plataforma GNOSS para el usuario final?
GNOSS es una plataforma semántica que genera de forma nativa datos representados semánticamente en RDF/OWL cuando un usuario publica información. Además, dichos datos trabajan atendiendo a las necesidades del usuario ofreciéndole: mejores sistemas de recuperación de la información mediante búsquedas facetadas que emulan el razonamiento humano; generación de contextos pertinentes, personales y documentales para una determinada información y avanzados sistemas de recomendación.
GNOSS facilita una eficaz integración de cualquier conjunto de datos: empresariales, educativos, culturales, turísticos, sanitarios; datos no estructurados, semiestructurados y estructurados, que en la mayor parte de las organizaciones se encuentran aislados, dispersos, fragmentados y ubicados en diversos sistemas y repositorios. La representación semántica de los mismos permite, sin ser invasivos, ni intrusivos, generar una “capa espejo por encima” de datos que conforman un grafo, abriendo nuevas posibilidades de explotación de los mismos que no son posibles con los métodos tradicionales de integración de datos. De esta forma, se hacen realidad las promesas vinculadas a la portabilidad e interoperabilidad semántica de los datos, y su vinculación y enlazado entre sí y con los intereses de las personas (linked data).
Los beneficios de la adopción de GNOSS incluyen ahorros significativos de tiempo en el acceso y gestión de la información, una mejor y más eficaz creación y gestión del conocimiento, una comunicación y marketing más efectivo, y por ende, una mayor productividad.
GNOSS es Linked Data, por tanto, es capaz de enlazar datos abiertos, entre ellos, datos públicos reutilizables ¿Qué papel juegan los datos abiertos por las Administraciones para la evolución de su negocio?
Los datos abiertos juegan un papel clave en una economía del conocimiento que basa parte del aumento de su productividad en una explotación más intensa y eficaz de los datos. En concreto, para una empresa tecnológica como GNOSS que integra, transforma y explota datos, la apertura de datos por parte de las AAPP es un primer paso pero conviene precisar que no es lo mismo el open data, es decir, la publicación de los datos por parte de la Administración Pública, que el Linked (Open) Data. Este último exige que los datos no solo se abran, sino que sean publicados en RDF/OWL, siguiendo unos determinados estándares, consensos y acuerdos. De esta forma, se facilita transitar de la actual web de documentos a una web de datos, datos que se conectan con datos (linked data) permitiendo a los usuarios aprovechar todas las ventajas vinculadas a la explotación de la información.
Las empresas y organizaciones privadas nos beneficiamos de este modo de publicación, en primer lugar porque podemos integrar el conocimiento de la propia organización, y en segundo lugar, porque podemos enlazarnos con datos públicos o con datos comercializados por terceros, lo que impacta de un modo muy sustantivo en los procesos de aprendizaje, cambio, gestión del conocimiento, analíticos y de inteligencia de negocio.
¿Cuáles son, según su opinión, las tareas pendientes en materia linked data en España? ¿Qué medidas son necesarias para mejorar la interoperabilidad de los datos?
Además de la necesidad de incrementar el ritmo en la publicación y apertura de datos que actualmente están ocultos, asilados, fragmentados y ubicados en heterogéneos sistemas de información de las AAPP, es necesario que dichos datos se publiquen siguiendo los estándares y recomendaciones del W3C para su mayor reutilización y aprovechamiento. Esto le permitirá a la Administración obtener retornos y beneficios en menor tiempo y podrá ver compensado el coste que este trabajo conlleva encontrando incentivos para acelerar el proceso.
Al mismo tiempo, es aconsejable el establecimiento de un marco legal claro para la explotación y reutilización por parte de terceros que permita una seguridad jurídica a la hora de generar nueva economía sobre datos.
Es necesario que dichos datos se publiquen siguiendo los estándares y recomendaciones de W3C para su mayor reutilización y aprovechamiento.
¿Qué conjuntos de datos públicos le gustaría que estuvieran a disposición para su reutilización y cómo beneficiaría a GNOSS si se dispusiese de dichos datos?
GNOSS es una plataforma social y semántica que explota cualquier tipo de datos: educativos, culturales, turísticos, sanitarios o judiciales. Los casos de uso premiados internacionalmente se han centrado en proyectos educativos como www.didactalia.net que cuenta con más de 200.000 usuarios y más de 100.000 recursos educativos o www.mismuseos.net con más de 17.000 obras de arte de museos españoles.
A partir de aquí, estamos aplicado la tecnología a variados sectores: proyectos universitarios (http://dkh.deusto.es), turísticos (www.lariojaturismo.com) o contenidos de la propia administración, como el portal de trámites http://tramites.administracion.gob.es.
Cualquier tipo de dato que la administración publique es una buena materia prima sobre la que aplicar las ventajas tecnológicas de GNOSS.
¿Cuáles son las dos principales barreras que, de acuerdo con su actividad profesional, cree que restan potencial a la información del sector público?
Un hecho evidente es la fragmentación y dispersión existente en la información pública. Nos encontramos con proyectos donde su objetivo es la integración en un punto de acceso único de toda la información educativa, cultural, turística, sanitaria de una determinada administración. Los años de bonanza han llevado a la generación de múltiples espacios web muchas veces solapados, con escasa masa crítica para convertirse en espacios de referencia digital. Es necesario integrar datos y generar un espacio de acceso único a la información con sistemas de recuperación de la misma mucho más eficaces que lo que Google nos ofrece en la actualidad.
Por otro lado, nos encontramos todavía con cierta inseguridad jurídica a la hora de llevar a cabo una reutilización intensa de los datos de las AAPP. Es preciso definir con claridad el tipo de licencia que afecta al conjunto de datos que la AAPP pone a disposición del sector infomediario y dar estabilidad al marco normativo.
“Es preciso definir con claridad el tipo de licencia que afecta al conjunto de datos... y dar estabilidad al marco normativo”
¿Qué posibilidades de colaboración contemplan con la Administración?
En los últimos años estamos proveyendo a las diferentes administraciones públicas (estatal, regional, local) de tecnología semántica. La aplicación de GNOSS les está permitiendo dar salida a muchos proyectos web donde el problema principal era o está siendo implementar un adecuado sistema de recuperación de la información; integrar de una forma competitiva y eficaz datos asilados en diversos sistemas y BBDD; incorporar un gran volumen de contenidos a un espacio social, conformando ecosistemas de conocimiento; generar sistemas de análisis de datos más flexibles y eficaces (semantic business intelligence) o generar una estrategia digital que permita hacer lucir el trabajo y el esfuerzo que se ha acometido y que “brilla” poco y mal entre toneladas de contenidos y documentación (semantic SEO).
¿En qué punto cree que se encuentra la reutilización de la información pública en España y qué expectativas alberga sobre el sector de los datos para los próximos años?
La reutilización de la información pública en España está en sus albores. Es un sector incipiente y prometedor donde es posible generar grandes beneficios, sobre todo si se toma conciencia de la oportunidad que se abre a la hora de generar una industria en toda la cadena de valor de los datos, desde la digitalización hasta la explotación eficaz para el usuario final pasando por la representación e integración semántica. En nuestro caso, como país, nada está ganado, depende de lo que hagamos. Debería ser una apuesta sostenida y persistente en el tiempo.
En EE.UU, Reino Unido o Alemania grandes sectores como Mass Media, Educación, Farmacia o Medicina están avanzando a pasos agigantados y es “estrategia país”, no hace falta hacer la labor pedagógica o apostólica de los beneficios del open data, el linked data y la web semántica. Son plenamente conscientes del valor de los datos y saben y comprenden las posibilidades de la nueva economía que emerge al explotarlos de forma mucho más intensa y eficaz.
Consciente del potencial de los datos abiertos e interesada en potenciar la reutilización de los mismos, la Universidad de Alicante ha organizado su 1º concurso de ideas de aplicaciones de datos abiertos. A través de este evento, la institución pretende estimular el emprendimiento y cumplir su compromiso de transparencia con la sociedad en general y con la comunidad académica en particular.
El concurso está abierto hasta el 30 de septiembre e invita a participar a todas las personas físicas o jurídicas que lo deseen, tanto de forma individual como agrupadas, sin restricción alguna. Los participantes deberán presentar una idea original y de utilidad a partir de los datos abiertos en el portal open data de la Universidad o de cualquier otro conjunto de datos de la entidad que resulte interesante abrir.
Los premios consistirán en 800 euros para la idea ganadora y cuatro accésits de 300 euros, los cuales se otorgarán a la propuesta en sí, independientemente del número de personas involucradas en su desarrollo.
Las bases completas del concurso están publicadas en el Boletín Oficial de la UA o se pueden consultar en el portal de datos abiertos de la UA. Las ideas deben enviarse en formato pdf a la dirección de correo electrónico datos@ua.es y es posible recibir las últimas novedades a través de la lista de distribución ideaUAdata@listas.ua.es o través de la cuenta de Twitter @datosUA.
En www.porcentual.es hacemos una clara apuesta por la comunicación de datos y la hacemos en un doble sentido: desde el punto de vista periodístico y también desde la vertiente empresarial. En el primer caso, elaboramos gráficos dinámicos e interactivos con los datos de actualidad que cada día se publican, recogiéndolos de varias fuentes institucionales y empresariales. Estos gráficos están alojados en nuestra web. Los editores pueden acceder a ella desde su zona privada mediante una suscripción económica y conseguir un código embebed que les permitirá insertarlo en su web.
Además, también damos acceso al software que hemos diseñado y que permite generar este tipo de gráficos con los datos que cada agente disponga. En este sentido se muestra como una herramienta muy útil para todas aquellas organizaciones que tienen que manejar un alto volumen de datos y que tienen que explicar situación apoyándose en ellos. Todo el trabajo que realizamos está hecho en HTML5, por lo que se consigue que estos gráficos dinámicos puedan ser visualizados en cualquier tipo de plataforma móvil.
Mari Luz Congosto es licenciada en Informática por la Universidad Politécnica de Madrid y Máster en Telemática por la Universidad Carlos III.
Ha trabajado en entornos de investigación en Telefónica I+D, ELIOP y Fujitsu y participado en la creación plataformas sociales dedicadas a la divulgación científica.
Actualmente es investigadora del Departamento de Telemática de la Universidad Carlos III. Está especializada en minería y visualización de datos.
¿Qué es, en su opinión, el periodismo de datos y la visualización de datos y en qué se diferencia de otros modelos de información?
El periodismo de datos se diferencia fundamentalmente en las fuentes. En el periodismo tradicional las fuentes suelen ser personas; en el de investigación, documentos que no se pueden procesar automáticamente. En el periodismo de datos las fuentes son datos que pueden ser procesados automáticamente hasta obtener información. La automatización permite escalar el volumen de datos hasta niveles inimaginables.
La visualización es hija del periodismo infográfico del que hereda el lenguaje visual y la capacidad de síntesis para transmitir información. A diferencia de la infografía, la visualización se desarrolla en un medio digital, lo que le permite ser dinámica, interactiva y multimedia.
El periodismo de datos y la visualización pertenecen al mundo digital, se complementan y se realimentan. La visualización permite sintetizar los datos de forma visual y facilita descubrir nuevos patrones que mejoren el proceso de los datos.
El periodismo de datos y la visualización pertenecen al mundo digital, se complementan y se realimentan…"
¿Qué papel entiende que guardan los profesionales de este ámbito respecto de la información del sector público?
El sector público es depositario de una gran cantidad y variedad de datos de interés común. La explotación de estos datos por el sector público está enfocada al área administrativa pero puede tener muchísimas más aplicaciones y en ese punto el periodismo de datos puede generar información de valor.
¿Cómo surgió su interés por esta actividad?
Para mi Tesis empecé a trabajar con datos de la Red, primero en blogs y después en Twitter y utilicé la visualización como una herramienta de análisis que me ayudaba a mejorar el proceso de datos y a comprender mejor la información que estaba manejando.
¿Qué conocimientos, habilidades o herramientas precisa el tratamiento periodístico de los datos del sector público?
Hay tres conocimientos básicos: periodismo para saber comunicar información; programación para poder procesar datos automáticamente; y diseño para ser capaces de sintetizarlos de una forma visual.
Es muy difícil que una sola persona posea estos tres conocimientos aunque puede ser fuerte en uno de ellos y tener nociones de los otros dos. Lo más práctico es que haya equipos multidisciplinares que hablen un lenguaje común, como ocurre en The New York Times, que son líderes en periodismo de datos.
Lo más práctico es que haya equipos multidisciplinares que hablen un lenguaje común..."
¿Qué perfiles profesionales serían, a su juicio, los mejor situados para trabajar en el Periodismo o en la visualización de datos?
Hay tres perfiles profesionales: los periodistas, los informáticos y los diseñadores. Ellos son fuertes en uno de los conocimientos básicos; sólo tienen que complementar los dos restantes.
En su opinión, ¿cuál sería un buen ejemplo de lo que es este modelo de periodismo y de trabajo en el área del Open Data?
En España, el periódico La Información tiene un buen equipo de periodismo de datos y ha hecho trabajos muy interesantes, como los Presupuestos Generales del Estado, a través de los años; la evolución del paro; el patrimonio de los diputados; comparativas de IRPF por comunidades, etc. También existen iniciativas particulares como la Fundación CIVIO con Dónde van mis impuestos y España en llamas -con 10 años de incendios forestales-.
Todos estos ejemplos aportan información de valor basada en datos públicos y son de interés general.
En España, el periódico La Información tiene un buen equipo de periodismo de datos…"
¿Qué haría falta para que el conjunto de la sociedad, incluidos los gobiernos, valorasen todavía más el papel de los datos públicos?
Los ciudadanos deben tomar conciencia de que los datos públicos han sido generados con el dinero de los impuestos y, por tanto, son un bien común. Los gobiernos necesitan transmitir confianza a los ciudadanos y una manera de hacerlo es mediante una gestión transparente que incluya los datos abiertos.
Por otro lado, los datos públicos pueden ser una fuente de riqueza generadora de nuevos servicios para los ciudadanos.
Los gobiernos necesitan transmitir confianza a los ciudadanos…"
Si fuera una administración local, regional o nacional, ¿qué información consideraría más interesante para su apertura?
Debería ser obligatorio que todas las administraciones proporcionasen de una manera accesible las partidas presupuestarias desglosadas al máximo detalle y la ejecución del presupuesto indicando qué cantidades se han adjudicado en las distintas formas de licitación.
Además de los datos económicos, deberían irse incorporando datos como los de tráfico, transporte público, medio ambiente, sanidad, seguridad oferta cultural, etc., que pueden generar nuevas servicios de información que ayuden a la toma de decisiones.
datos como los de tráfico, transporte público, medio ambiente, sanidad, seguridad... pueden generar nuevos servicios de información que ayuden a la toma de decisiones…"
¿Por qué habría un lector de interesarse por este tipo de noticias basadas en los datos que custodian las administraciones?
Porque los lectores pueden acceder de una manera más relacionada, comprensible y sintetizada a una enorme cantidad de datos que ahora está oculta, dispersa o publicada en medios tan poco atractivos como los boletines oficiales.
¿Cómo ves ahora mismo el estado del Open Data en el ámbito estatal y en el conjunto de España?
En el ámbito estatal me parece una buena iniciativa datos.gob.es por su labor de catalogación de datos y de difusión de información relacionada con el Open Data. La mayoría de las administraciones autonómicas ha abierto su portal de Open Data siguiendo el camino de autonomías pioneras. La Administración Local está aún por desplegar.
De todas estas iniciativas echo en falta un criterio común en la forma de llevar a cabo la apertura de datos tanto en la prioridad de los temas como en los formatos de datos y en los métodos de acceso.
Un handicap para los portales de Open Data es la velocidad con que se desarrolla la tecnología y la rapidez con que unos formatos de datos pasan a ser obsoletos mientras que otros adquieren mucho auge. Por otro lado, la forma de acceder vía fichero puede ser insuficiente para cierto tipo de tratamientos de datos que requieran de información muy específica en tiempo real y en este punto los portales de Open Data deberían ir incorporando una alternativa de acceso a los datos vía APIs (application programming interface), como ya han empezado a realizar algunos portales.
No dudo de que la apertura de datos irá a más y a mejor, porque es algo beneficioso para todos.
Los portales de Open Data deberían ir incorporando una alternativa de acceso a los datos vía API's…"
El Club de Innovación, en colaboración con el Instituto Nacional de Administración Pública (INAP), organiza este 18 de diciembre en Madrid, de 9:30 a 15:00 horas, la jornada “Open Meeting Gobierno Abierto”, dedicada a analizar la implantación y las oportunidades de desarrollo en el ámbito del sector público de los principios de transparencia, participación y colaboración.
A tal efecto, participarán en dicha sesión -prevista en la sede del INAP (C/ Atocha 106)-, algunos de los principales expertos en la materia de nuestro país, así como los representantes de las iniciativas españolas punteras dentro de este campo y, también, del Open Data (ver programa).
La cita cuenta con el apoyo, además, de la Federación Española de Municipios y Provincias (FEMP), la Fundacion ASTIC y RMD de Castilla y León, y con el patrocinio de Telefónica.
Más información, en la página oficial del encuentro y en Twitter con la etiqueta #RunOgov.
Asunción Gómez-Pérez es ingeniera informática, máster en Ingeniería del Conocimiento, doctorado en Informática y máster en Dirección y Administración de Empresas.
Ha publicado más de 150 artículos y es autora y coautora de varios libros sobre Ingeniería Ontológica e Ingeniería del Conocimiento. Ha sido directora del comité de programa de ASWC'09, ESWC'05 y EKAW'02 y coorganizadora de numerosos talleres en ontologías.
En la actualidad, dirige el Departamento de Inteligencia Artificial y el Ontology Engineer Group (Grupo de Ingeniería Ontológica) de la Universidad Politécnica de Madrid (UPM).
Participa, también, en iniciativas de Datos enlazados (Linked Data) de instituciones como la Biblioteca Nacional de España.
--
Oscar Corcho, por su parte, es Profesor Titular de Universidad en el citado Departamento de Inteligencia Artificial y miembro, también, del Grupo de Ingeniería Ontológica.
Ha trabajado como investigador Marie Curie en la Universidad de Manchester y como gestor de investigación en la empresa iSOCO. Es licenciado en informática, Máster en Ingeniería del Software y Doctor en Ciencias de la Computación e Inteligencia Artificial por la UPM.
Sus actividades de investigación se centran en la e-Ciencia Semántica, la Web Semántica y la Ingeniería Ontológica. Entre otros numerosos proyectos de relieve, ha participado en el International Classification for Patient Safety (ICPS), financiado por la Organización Mundial de la Salud.
Ha publicado más de 100 artículos en revistas, conferencias y workshops y es autor de varios libros, entre ellos el manual de referencia “Ontological Engineering".
¿Cómo definiríais el papel que desarrolla el Ontology Engineering Group respecto de la información del sector público?
Nuestro grupo de investigación ha sido pionero en España en la generación y publicación de Linked Data de calidad de varios conjuntos de datos del sector público estatal. Concretamente, somos responsables de la publicación de Linked Data de conjuntos de datos del Instituto Geográfico Nacional (a través de la Web), la Biblioteca Nacional y la Agencia Estatal de Meteorología.
En todos estos casos, hemos trabajado con miembros de estas organizaciones durante el proceso de generación de vocabularios, generación de datos en RDF y publicación de los datos como Linked Data.
También hemos participado en iniciativas trasnacionales, como la del observatorio Otalex con Portugal. En todas estas iniciativas se han utilizado vocabularios consensuados por las comunidades implicadas, tecnologías propuestas por el W3C, y un mismo enfoque metodológico.
Se destaca la inclusión de contenidos de “provenance” y licencias de uso en todas ellas.
Asimismo, somos miembros activos del grupo de trabajo del W3C sobre Linked Data gubernamental y hemos propuesto, entre otros, un documento de buenas prácticas sobre la generación de Linked Data en el sector público.
Igualmente, hemos participado en otros grupos de trabajo que de forma indirecta son de utilidad para el sector público. A modo de ejemplo, hemos participado en el Semantic Sensor Network Incubator Group que ha desarrollado una ontología de sensores que es de gran utilidad para representar datos dinámicos como pueden ser datos metereológicos, tráfico en ciudades, niveles de polución, etc. Además, ha participado en el Library Linked Data incubator group proporcionando soluciones para Bibliotecas.
Finalmente, el grupo lidera la Red temática española de Linked Data para la que uno de los objetivos primordiales es dar a conocer iniciativas de publicación de Linked Data de los sectores público y privado.
… hemos propuesto, entre otros, un documento de buenas prácticas sobre la generación de Linked data en el sector público…"
¿Qué valores encarna, en vuestra opinión y desde el punto de vista de la investigación, la actividad de apertura de datos?
En el contexto de la investigación, la apertura de datos nos permite en muchos casos poder llevar a cabo investigaciones o evaluaciones sobre nuestras investigaciones que no serían posibles o serían más costosas si no dispusiéramos de estos datos.
Por ejemplo, en nuestro grupo hemos utilizado datos públicos para estudiar el grado de reutilización de vocabularios en la nube, técnicas y métodos que permitan mejorar la calidad de los datos, para proponer técnicas para el acceso a datos dinámicos procedentes de redes sociales y sensores, mecanismos de consultas a datos distribuidos, desarrollar nuevos procesos en los que los especialistas de dominio participan en la apertura (como ocurrió en la transformación de los datos de la Biblioteca Nacional), etc.
… nos permite llevar a cabo investigaciones… que no serían posibles o serían más costosas si no dispusiéramos de estos datos".
¿Cómo surgió el interés por los datos públicos?
En primer lugar, nuestro interés surgió desde la perspectiva tecnológica y desde el punto de vista de los vocabularios que se pueden utilizar para representar y compartir mejor estos datos. Tratándose de un grupo de investigación que lleva trabajando en el área de los vocabularios (ontologías) desde el 1995, nos resulta muy interesante trabajar para conseguir que las distintas administraciones acuerden los vocabularios a utilizar para compartir sus datos. Asimismo, también podemos proporcionar los vocabularios en varios idiomas utilizando técnicas automáticas, evaluar y explotar nuestra experiencia en las tecnologías semánticas y de la Web de datos.
… nos resulta muy interesante trabajar para que las administraciones acuerden vocabularios para compartir sus datos…"
¿Cuáles son los actores, niveles o fases con los que identificaríais el sector?
Hay muchos tipos de actores involucrados en este sector. Desde las administraciones públicas, responsables de los datos en última instancia, hasta los usuarios finales, pasando por los agentes reutilizadores y los facilitadores tecnológicos. Nuestra experiencia nos dice que todos ellos son importantes.
Sobre las fases para generar y publicar Linked Data de calidad, hemos propuesto guías de buenas prácticas que se pueden seguir para llevar a cabo este proceso de manera sistemática (https://dvcs.w3.org/hg/gld/raw-file/default/bp/index.html).
Hemos propuesto guías de buenas prácticas para llevar a cabo este proceso de manera sistematica..."
¿Qué escenario ideal imaginaríais a partir de la información del sector público?
El sector público debe proveer los datos en tiempo, forma y con la calidad adecuada. Un escenario en el que los datos que se publican son ampliamente reutilizados para fines que no se habían previsto inicialmente, y que redundan de nuevo en la mejora de la calidad de los datos originales, y por tanto son útiles también para la propia administración pública.
… datos reutilizados para fines no previstos inicialmente y que redundan en la mejora de los datos originales… y son útiles para la propia administración… "
¿Qué acciones inmediatas tomaríais para fomentar esta actividad?
La creación de un instituto como el Open Data Institute del Reino Unido podría ser una muy buena iniciativa a tener en cuenta para aglutinar y fomentar la sostenibilidad de este modelo de publicación de datos.
La creación de un Plan Estratégico que refleje cuál será la estrategia a seguir por la Administración en los próximos años. Dicho plan debería incluir:
- La creación de una metodología común para todas las administraciones públicas (nacional, autonómica y local). De la misma forma que se construyó Métrica para el desarrollo de software en la Administración, debiera crearse una metodología específica que sistematice los procesos a seguir en la apertura de datos y su exposición como datos enlazados.
- Acordar los modelos a utilizar por las administraciones públicas para representar: personas, organismos, estructuras organizativas, información estadística, geográfica, documental, licencias, `datos de “provenance”, etc.
- Analizar los vocabularios que otras iniciativas europeas están utilizando con el fin de preparar las bases para un futuro intercambio de datos entre administraciones e instituciones europeas y de otros países.
- Cursos de Capacitación en sus distintas modalidades de presencia para la Administración General del Estado, autonomías y ayuntamientos sobre: aspectos legales, estándares y de normativa del W3C, procesos de liberación de datos, tecnologías semánticas relacionadas con la Web de Datos, etc.
- Cursos de formación en apertura de datos y tecnologías semánticas dentro de los estudios de Informática.
- La creación de un Observatorio que monitorice el impacto de la apertura de datos en el mercado y su creación de valor, así como la calidad de las diferentes iniciativas.
Como profesionales pero, también, como usuarios, ¿qué responsabilidad tiene el conjunto de la sociedad en esta materia Open Data?
La sociedad tiene tanta responsabilidad como las administraciones públicas en este proceso. Los ciudadanos no son sólo los usuarios finales potenciales de esta actividad de generación y publicación de Linked Data, sino también responsables de mejorar su calidad en caso de que esto sea posible.
Los ciudadanos no son sólo los usuarios finales… sino también responsables…"
Si fuera una administración pública, ¿qué información entendéis que debería ser abierta?
En general, debería ser abierta toda la información que esté disponible en la administración y que no afecte a la Seguridad Nacional o a la Privacidad de las personas físicas o jurídicas.
La Administración pública debe proporcionar mecanismos para proporcionar datos en diferentes formatos estandarizados que fomenten la interoperabilidad, incluyendo en todos ellos el “provenance” del dato y las licencias de uso.
Y si fuera una empresa, ¿qué datos esperaríais y para qué aplicación concreta?
Estamos seguros de que cualquier fuente de datos puede ser reutilizada incluso aunque a priori la administración pública correspondiente no pensara que pudiera ser reutilizada.
En nuestra opinión, lo mejor es disponer de estos datos de manera abierta, para que las empresas puedan dedicarse a obtener el máximo valor añadido de los mismos. Incluso las propias administraciones pueden ser las primeras beneficiarias de estos datos abiertos.
¿Cómo veis ahora mismo el estado del Open Data en el ámbito estatal y en el conjunto de España?
A pesar de que existen iniciativas como datos.gob.es y también iniciativas puntuales autonómicas y locales bastante importantes, queda mucho camino por realizar en España para conseguir estar a la altura de los procesos de apertura de datos de otros países de nuestro entorno, como por ejemplo el Reino Unido.
Los pasos que se están dando son adecuados, aunque muy lentos e insuficientes. Se echa en falta directrices más detalladas que vayan más allá de reales decretos y normativas y una voluntad expresa de muchas instituciones de publicar datos de mayor utilidad.
Los pasos que se están dando son adecuados, aunque muy lentos e insuficientes…"
Alberto Cairo enseña infografía y visualización de datos en la Universidad de Miami.
Es autor de The Functional Art: An Introduction to Information Graphics and Visualization (2012).
¿Qué es, en su opinión, el Periodismo de datos y en qué se diferencia de otros modelos de información?
Lo que se conoce hoy como Periodismo "de datos" es un agregado de varias tradiciones clásicas del periodismo: el data-driven journalism, el database journalism, el periodismo de precisión y la visualización de información. En resumen, el Periodismo de datos consiste en el uso sistemático de métodos de investigación (principalmente cuantitativa, pero no sólo) para generar datos, analizarlos, filtrarlos, organizarlos, extraer sentido de ellos y presentarlos por medio de historias periodísticas, gráficos, mapas, etc. Con ese fin, toma prestadas herramientas y técnicas de las ciencias sociales, el periodismo y el diseño gráfico y de interacción.
... generar datos, analizarlos, filrarlos, organizarlos, extraer sentido de ellos y presentarlos por medio de historias periodísticas..."
¿Qué papel entiende que guardan los profesionales de este ámbito respecto de la información del sector público?
El periodista es un mediador entre fuentes y público, un facilitador de la comunicación entre individuos y entidades. El sector público puede (y debe), ciertamente, poner datos a disposición del público, y es seguro que muchos ciudadanos accederán a dichos datos en su forma bruta. Pero el papel del profesional especializado en leer esos datos y darles una forma digerible por los ciudadanos sin tiempo (o sin conocimientos) para hacerlo por su cuenta es imprescindible.
... leer esos datos y darles una forma digerible para los ciudadanos sin tiempo (o conocimientos)... es imprescindible."
¿Cómo surgió su interés por esta actividad?
Soy periodista de formación e infografista por vocación. Siempre me ha inquietado la desconfianza que muchos colegas muestran por las matemáticas, la estadística y el método científico. Esa desconfianza conduce a una profunda ignorancia y a un mal servicio a los ciudadanos. En un mundo en el que la cantidad de información se duplica cada poco tiempo, el periodista debe aprender a manejar las mejores herramientas para domarla.
¿Qué conocimientos, habilidades o herramientas precisa el tratamiento periodístico de los datos del sector público?
Conceptuales (estadística, métodos de investigación) y tecnológicos (herramientas de software: OpenOffice, Excel, R, Tableau...). De todas formas, no hay que mitificar la tecnología. Se pueden conseguir buenos resultados utilizando herramientas rudimentarias, siempre que se dominen los fundamentos.
¿Qué perfiles profesionales serían, a su juicio, los mejor situados para trabajar en el Periodismo de datos?
Profesionales de las ciencias de la computación con interés en comunicación, periodistas con conocimientos de métodos de investigación cuantitativa y diseñadores e infografistas de perfil técnico, no tan artístico como es tradicional en la profesión.
... interés en comunicacion... investigación cuantitativa... diseñadores e infografistas de perfil técnico..."
En su opinión, ¿cuál sería un buen ejemplo de lo que es este modelo de periodismo?
The Guardian (con ciertas reservas), NPR, ProPublica y The New York Times, pero hay muchos otros. En América Latina, por ejemplo, tenemos a La Nación (Costa Rica), que tiene un equipo de periodismo de investigación muy fuerte, La Nación (Argentina), que está explorando el periodismo de datos, Estado de São Paulo, que acaba de abrir un pequeño grupo formado por periodistas, programadores y diseñadores, etc.
¿Qué haría falta para que el conjunto de la sociedad, incluidos los gobiernos, valorasen todavía más el papel de los datos públicos?
La existencia de más historias y herramientas que ayudasen a los ciudadanos a descubrir realidades que a veces permanecen ocultas. Un buen ejemplo es España en llamas, que no ha recibido toda la publicidad que se merece: http://www.espanaenllamas.es/ o el Manifestómetro, una iniciativa ignorada por todos los medios de comunicación porque va en contra de sus intereses ideológicos: http://manifestometro.blogspot.com/
... Un buen ejemplo es España en llamas, que no ha recibido toda la publicidad que se merece."
Si fuera una administración local, regional o nacional, ¿qué información consideraría más interesante para su apertura?
En general, cualquiera relacionada con el control social de los representantes políticos: gastos, actividades, agenda, etc.
¿Por qué habría un lector de interesarse por este tipo de noticias basadas en los datos que gestionan las administraciones?
Porque le ayuda a controlar mejor a quien le representa y le ayuda a confirmar (o desmentir) intuiciones. Le doy un ejemplo: hace más de un año, cuando todavía trabajaba en Brasil, para la revista semanal Época, hicimos un gráfico que mostraba cuánto cada diputado gasta en llamadas telefónicas por mes. Esos datos están disponibles en la Web del Congreso, pero no en un formato que sea legible por los ciudadanos, lo que es un problema común en muchos países. Nosotros tomamos ese banco de datos, lo analizamos y creamos el siguiente interactivo:
http://revistaepoca.globo.com/diagrama/noticia/2011/10/diagrama-298-anos-de-falacao.html
El éxito fue enorme.
... ayuda a controlar mejor a quien le representa y le ayuda a confirmar (o desmentir) intuiciiones..."
El grupo Opendata Sevilla y la Universidad Pablo de Olavide organizan los próximos días 23 y 24 de noviembre de 2012 sus II Jornadas sobre Gobierno Abierto y Open Data.
Acudirán a la cita, que se celebrará en la sede de la mencionada institución académica, algunos de los principales especialistas en apertura y reutilización de la información del sector público nacional, así como representantes de varias de las iniciativas públicas punteras en la materia dentro de nuestro país (entre ellas, Open Data Euskadi, Open Data Navarra o la propia datos.gob.es).
Además, participarán en las diferentes sesiones reconocidos expertos en áreas cada véz más pujantes como el periodismo de datos, la visualización de información o el desarrollo de aplicaciones basadas en datos libres (ver ponentes).
Las jornadas incluyen desde conferencias y mesas redondas sobre Gobierno Abierto, Transparencia, Acceso a la Información y experiencias Open Data, hasta talleres prácticos sobre herramientas de gestión de datos.
Las sesiones se completan con un hackaton (concurso colaborativo de programadores) destinado a la creación de aplicaciones informáticas a partir de los datos que publicará la propia Universidad a lo largo del encuentro y de los contenidos en el proyecto adoptaunaplaya.es (ver programa).
Sobre los organizadores
Opendata Sevilla es un grupo de trabajo surgido a raíz del I Encuentro Opendata Sevilla con el objetivo de difundir el potencial social y económico de la apertura y reutilización de los datos públicos.
La Universidad Pablo de Olavide se considera, en palabras de los organizadores, "la primera universidad pública española en proclamar el Gobierno Abierto como aspiración de modelo de gestión y acción, apostando por el Open Data".
El Ayuntamiento de Barcelona y la escuela IESE organizan el próximo martes, 30 de octubre, un sesión sobre Open Data dirigida a profesionales, infomediarios y empresarios del sector de las Tecnologías de la Información y de las Comunicaciones (TIC).
Este encuentro, que se celebrará en la capital condal, tiene un doble objetivo:
- Explicar los avances realizados y la estrategia seguida por la iniciativa Open Data de Barcelona.
- Generar oportunidades y conocer las necesidades de negocio de los interesados en la apertura y reutilización de la información del sector público.
La cita, que coordina el Public-Private Sector Research Center, contará con la participación del comisionado de Participación Ciudadana y Asociacionismo, Carles Agustí, y del director de Información de Base y Cartografía, Lluis Sans.
Medialab-Prado, espacio cultural y de investigación orientado a la producción de contenidos digitales, organiza en Madrid del 14 de junio al 1 de julio de 2011 el taller y seminario internacional "Visualizar'11: comprender las infraestructuras".
Esta iniciativa, dirigida por José Luis de Vicente en colaboración con EOI Escuela de Organización Industrial, gira en torno a la visualización -a partir de los datos- de infraestructuras físicas (líneas eléctricas, oleoductos, pantanos); de información (emisiones de radio, cables submarinos); de transporte (rutas marítimas y aéreas); y de tipo legal y financiero (que rigen el comercio y los mercados mundiales).
Como en anteriores ediciones, esta cuarta convocatoria de Visualizar contine un taller de desarrollo colaborativo de proyectos, unseminario teórico y la posterior muestra de los proyectos realizados.