Interview with Fernanda Peset, professor of the Universidad Politécnica de Valencia, Department of Communication Studies, Documentation and History of Art.
Analyze the current situation of open publication of scientific results in Spain. In comparison to other countries, what point has been reached?
In the case of scientific results, two major groups have to be distinguished: publications and data. This was already pointed out in 2012, when the European Commission implemented a survey on digital preservation, which, in the case of publications, had advanced enormously and, in the case of the data underlying the research, was just beginning.
Which are the main obstacles that hinder the opening of data by the scientific community?
In the survey carried out during the project DATASEA, researchers suggest that the reasons of concern are: the misuse or interpretation and legal questions about confidentiality and intellectual property rights. Some also said they were losing time making them available or they feared that others take the lead in research thanks to their data. In general, we try to squeeze the samples as much as possible, but critics are also feared.
What measures are considered necessary to promote and boost the culture of open data in the research field?
Undoubtedly, recognition of the release of scientific results is essential to generalize it. Parameters of the assessment of a scientific are very clear in calls for career advancement and in the organizations themselves. Under pressure, researchers choose to monetize their work, which means spend as much time as possible for publications in refereed journals or obtaining patents. This would be the way of incentives, but also the obligations undertaken to obtain financing or publish in a particular journal can be decisive to invest the necessary time to open them up. Ideally, both routes are combined, which always require data literacy and support of organizations, something that is now beginning in Spain.
Under pressure, researchers choose to monetize their work, which means spend as much time as possible for publications in refereed journals or obtaining patents.
Under the framework of Horizon2020 program, a pilot project was launched in 2013 to improve and maximize the reuse of research data. Which are the conclusions three years later?
We are not aware that the European Commission has published evidences in this field. However, it could be said that the pilot plan has encouraged researchers, being or not part of it, to view their research from this perspective. Although it is not compulsory, including in the Impact section how they will get, manage and release the data, always contributes to a better evaluation of their proposals.
Moreover, both research management offices and information services are preparing for a demand for advice on it. For example, the translation of requirements H2020 in the DMP (Data management plan) tool, called PAGODA, by Madroño consortium has been a strategic positioning.
Finally, the draft of the open science agenda provides explicitly for the development of an open data policy, and for this purpose a panel of experts is being formed.
What is the OAI, Open Archive Initiative, and which are the main features of its protocol OAI-PMH?
At the philosophical level, it is the first big step to break with traditional forms of access to science. The increase in journal prices in the 80s was getting worse the gap among countries and organizations of first and second order. Thereafter, the green and gold ways to open access -listings and magazines, respectively- make up what we are currently living. The orders derived from Open Access movement have been essential in the opening up of scientific information. However, from my point of view, the model has been distorted, as it is shown by the high cost invested to pay the golden via. The research funding is being earmarked in part to the publication, and, therefore, sometimes to support the publishing industry. But it is not possible to adopt extreme positions, without this industry we would not have the services that we currently have access...
As regards the main features of the protocol I think its design and ease of implementation have been the determining factors for its success. Dividing the provision of information on data providers and service providers which can reap the metadata of the first revolutionized the scene and saved costs worldwide.
The orders derived from Open Access movement have been essential in the opening up of scientific information.
What would it be necessary to make the scientific and research community value the role of open data and its reuse?
After having experienced personally the open access movement since its inception, I think some issues will happen again. In fact some statements about open access already included data. And from that experience it is worth stressing the need of apostolate of the different agents involved: the scientific sector itself, from the academic and political authorities and support services. The support is essential to reach a successful end and, in this regard, the education –data literacy- will be increasingly necessary.
Last Wednesday the conference Open Data for European Entrepreneurs was held in Pamplona gathering the FIWARE community. The event was organized by FINODEX accelerator that provides support services to European ICT industry building technological solutions re-using open data and making use of the open platform FIREWARE.
The roadshow was divided into different panels focussing on two main areas: FIWARE technology, a simple set of APIs that ease the development of smart applications in multiple vertical sectors, and open data entrepreneurship.
Based on both thematic lines, the fist panel offered to the assistants the opportunity to know real stories of entrepreneurs who, using the potential of open data, have developed innovative solutions such as the start-ups belonging to FINODEX Project. In fact, the three finalists of this program attended the event to share their experience with the public.
Linkovate, first finalist, has developed a search engine that helps manufacturing and R&D equipment in companies to find technologies and partners. The second prize went to Xpressomics, who has also created a seeker but, in this case, of genetic information aimed at pharmaceutical industry and medical researchers. Lastly, Geezar and its Fruitwatcher was also present with a device that monitors the conditions of fruit in trucks to guarantee it reaches its destinations in perfect conditions.
Later, it was accelerators’ turn, companies that provide financial support and advice to entrepreneurs on their way to success and, after this round table, the expert from FIREWARE Foundation, Juanjo Hierro gave a talk as well as the Executive Officer at CDTI who underlined the role of public sector in technological innovation.
Moreover, lastly the conference was attended by representatives of Iniciativa Aporta -public sector programme to promote the re-use of open data in Spain- who presented the global open data meeting: the International Open Data Conference, held in Madrid by early October. A new opportunity to know how open data can become the raw material for new products and services as those developed within FINODEX Project.
CRAs Aragón permite conocer la distribución y evolución de los Colegios Rurales Agrupados de Aragón. Esta iniciativa recibió el premio “Idea más novedosa” y “Votación de los Participantes” durante el Jacathon 2014.
Javier Rubio, en representación de su equipo (formado por Dani Latorre, Jesús Varón y Rafael Ramos) ha compartido su visión personal sobre las oportunidades y desafíos de sector open data en España.
Como miembros de los equipos ganadores del evento Jacathon, conocéis de cerca el mundo de los datos abiertos y su reutilización. ¿Qué oportunidades ofrece el open data para el desarrollo empresarial en España y qué aspectos son necesarios mejorar para seguir avanzando en la apertura de la información?
Desde mi punto de vista, para avanzar es necesario un cambio de mentalidad a varios niveles. Para poder crear un impacto real que abra la puerta al desarrollo de nuevas oportunidades empresariales (actualmente difícil, debido en parte a la mala calidad, en forma y fondo, de los datos publicados), no es necesario que las entidades involucradas reinventen la rueda, basta con aprender de las lecciones de otros países:
- Cambiar de mentalidad sobre la granularidad (por la privacidad). Hay una obsesión generalizada con no publicar ciertos datos llegando a un nivel de granularidad útil. Por ejemplo, es imposible encontrar datos sobre educación que sirvan para algo, con el pretexto de proteger la privacidad de los menores o no crear escuelas malas. Si observáramos más las experiencias en otros países, aprenderíamos que es factible publicar datos útiles granulares totalmente anónimos, sin invadir la privacidad, y lo que es más, podríamos analizar el impacto positivo que causa en las escuelas la necesidad de mejorar. Pero no conozco entidades involucradas en open data que se atrevan si quiera a plantear un estudio profundo de ciertas experiencias de otros países.
Ejemplos de datos que ahora mismo nadie se atreve a publicar y sí se está haciendo en otros países serían delitos geolocalizados a diario, resultados de notas granularizados por escuela, registros de visitas de edificios públicos (como ciudadano me interesa saber si un dirigente político se reunió con un empresario y al mes legislaron cambiando las normas del sector al que pertenecía el empresario, por ejemplo), registro de la propiedad, registro mercantil (ambos sin tasas)... Algún link a proyectos.
- Ejemplo de proyecto de estudio de publicación de resultados escolares en Londres berglondon.comprojectsschooloscope
- Ejemplo de granularidad de crímenes en USA, que permitió un desarrollo empresarial aquí impensable por la falta de granularidad y periodicidad de publicación de datos similares trulia.comrealestateNeorkNeorkcrime.
- Cambiar de mentalidad sobre las dimensiones de los datos a publicar. Los logros en open data a nivel local suelen situarse dentro de la dimensión de servicios al ciudadano y, en concreto, de transporte público (publicación de horarios en tiempo real de autobuses y otros medios de transporte, por ejemplo). Sin embargo los avances en las otras dimensiones del open data, como la publicación de contratas públicas o la transparencia en general, son irrisorios. La variedad de formatos de publicación debido a la fragmentación es tal, que supone un esfuerzo titánico el plantear que alguien intente procesar tales datos y, por tanto, frena cualquier posible innovación empresarial alrededor.
- Cambiar de mentalidad sobre cumplir la ley (y punto). Lo que he observado, y esto sí es más una percepción personal, es que ahora mismo todo el open data en España depende del esfuerzo de funcionarios entregados, que entienden el impacto brutal que puede llegar a lograrse. Es decir, sin esas personas, no hay open data a ese nivel local (y la Ley de Transparencia no soluciona esto). Lo que es todavía peor, cuando se realizan estos proyectos, otras personas involucradas de la administración, que llevan el tema de informática, sólo se preocupan de cumplir la ley (y punto), es decir, si la ley no les obliga a publicar la información de una manera estructurada y fácil de consumir, entonces qué más da. Parece que lo importante sea publicar sets de datos, sin importar su calidad de contenido (y entre miles de sets inútiles, encontrar los interesantes es buscar una aguja en un pajar) ni su calidad de forma (como un pdf que es un escaneo en imagen y no texto), para así autocolgarse medallas vacías y salir en la foto. Así, es imposible un desarrollo empresarial sobre el mundo del open data.
Como usuarios y reutilizadores de los datos abiertos ¿Qué barreras os habéis encontrado a la hora de reutilizar la información pública y qué medidas creéis que deben adoptarse a medio plazo para impulsar la reutilización en España?
La barrera fundamental es, como ya he introducido en parte en la pregunta anterior, la mala calidad de los datos publicados, su poca utilidad en muchos casos (cantidad sobre calidad es la realidad actual), su fragmentación en docenas de microportales y APIs, y la desidia por cumplir los estándares existentes de estructuración y publicación de datos que facilitan su uso y consumo.
En cuanto a las medidas de impulso, creo que se ha desperdiciado una oportunidad de oro con la Ley de Transparencia (si bien aún se puede mejorar con las leyes autonómicas que están en proceso de publicación). La Ley de Transparencia no sólo no obliga a publicar los datos de forma adecuada, (que habría eliminado ese problema de raíz), sino que tampoco soluciona la fragmentación, permite excepciones para no publicar datos que resultan increíbles, obliga a un proceso farragoso para pedir nuevos datos al gobierno (DNI electrónico, más cantidad de formularios…).
Una buena medida sería prohibir la venta de datos públicos, obligando a que dichos datos que actualmente son de pago, se publiquen gratuitamente y con libre licencia de redistribución y uso. En concreto, hablo del Registro de la Propiedad, o el Registro Mercantil, o el Cendoj, controlados actualmente por lobbies de registradores que se lucran vendiendo datos que son libres a todos los niveles en otros países. Estos datos incluyen cosas como la información sobre las empresas públicas y privadas, o en el caso del Cendoj, todas las sentencias del Supremo (actualmente consultables con un buscador propio, pero de pago para su reutilización). Esto claramente frena la innovación y el desarrollo de iniciativas empresariales (por no hablar del derecho del ciudadano a conocer libremente dichos datos).
“La mala calidad de los datos publicados, su poca utilidad en muchos casos (…) y su fragmentación en docenas de microportales y APIs”.
Los hackathones se han convertido en la ocasión perfecta para que desarrolladores, emprendedores e infomediarios puedan conocer a representantes de entidades privadas y organismos públicos que apoyen sus proyectos. ¿Qué oportunidades os ofrece haber sido uno de los ganadores de Jacathon y cuáles serán vuestros siguientes pasos?
Lo bueno de los hackatones es que generan prototipos funcionales en muy breve tiempo, así que son una semilla de innovación, y por otro lado, obligan a una serie de profesionales de múltiples disciplinas a indagar y aprender sobre el open data español. Personalmente, el ganar el Jacathon me ha hecho abrir los ojos y me ha ofrecido por ejemplo la oportunidad de hablar con entidades relacionadas (como es el caso de esta entrevista), que tienen en su mano el mejorar la situación actual. Por desgracia un hackathon rara vez da lugar a continuar la idea, si no se teje una red alrededor de organizadores y participantes, que intente crear continuidad o generar proyectos paralelos posteriores.
No tengo claros los siguientes pasos porque realizar aplicaciones sobre el open data actual es francamente difícil y arriesgado si se trata de un proyecto empresarial, sin embargo sé que seguiré estudiando las fuentes de datos, proponiendo mejoras, siendo crítico (y ser crítico no significa no apreciar el esfuerzo que se ha hecho a múltiples niveles) y colaborando en la medida de mis posibilidades con el mundo del open data, que tanto impacto social puede llegar a causar si se potencia adecuadamente.
En el primer cuatrimestre de 2015, la comunidad open data global tiene la oportunidad de disfrutar de dos eventos a escala internacional los cuales promueven el acceso abierto a la información pública para su transformación en soluciones prácticas para la ciudadanía.
El primero de ellos se celebrará el próximo 21 de febrero, con motivo del Día Mundial de los Datos Abiertos. Organizado por la OKFN España, el Hackatón Internacional de Datos Abiertos tendrá lugar en la misma fecha y espacio que el acto de entrega del II Premio al Conocimiento Abierto, Open Data y Transparencia organizado también por la misma entidad.
El encuentro estará abierto a reutilizadores open data de toda índole –ciudadanos, desarrolladores, periodistas, diseñadores,…- para que desarrollen aplicaciones, herramientas y visualizaciones de datos abiertos; demostrando así el potencial que encierran este recurso para el avance socioeconómico global.
El acceso al evento será libre y gratuito, poniendo a disposición de la comunidad open data internacional diferentes canales para que puedan compartir sus ideas con el resto de participantes. Gracias al streaming de vídeo, hangouts, chats y wiki cualquier miembro en el mundo tendrá la oportunidad de seguir el evento y los diferentes proyectos que se presenten durante la cita.
Asimismo, el próximo 4 de marzo tendrá lugar en Quito (Ecuador) el IEEE Hack Ecuador Challenge 2015, hackathon organizado IEEE STC e-Government e IEEE Computer Society a través de IEEE Ecuador.
El objetivo de este encuentro será el desarrollo de una visualización o aplicación que, reutilizando datos abiertos, optimice los portales electrónicos del gobierno de Ecuador, mejorando y promoviendo los servicios digitales en el sector público del país.
El plazo de inscripción se abrirá el 20 de febrero para todos aquellos interesados que, en grupos compuestos por al menos dos personas, deseen participar en este concurso de datos abiertos.
Tras la celebración del hackathon el 4 de marzo, los participantes tendrán hasta el día 18 del mismo mes para enviar la demo funcional de las aplicaciones desarrolladas durante el encuentro. Un jurado de expertos seleccionará a los finalistas y se anunciarán los ganadores el 8 de abril para, una jornada más tarde, hacer la entrega de premios en la capital ecuatoriana.
A través de sendos hackathons, la comunidad internacional de datos abiertos pretende fomentar la apertura de la información e involucrar a organizaciones cívicas y entidades privadas en la cultura open data para que contribuyan en la generación de soluciones innovadoras a partir de datos abiertos.